Você está na página 1de 38

Estadística.

DISTRIBUCIONES EN
EL MUESTREO

Suitberto Cabrera García.

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 1
Distribuciones en el muestreo.

1- Distribución de las características muestrales.

1.1.- Conceptos generales.

1.2.- Estadísticos.

1.2.- Distribución de X

1.3.-Distribución de S2

2- Muestreo de poblaciones normales.

2.1.- Generalidades

2.2.- Distribución GI-DOS

2.3.- Distribución t de Student

2.4.- Distribución F de Snedecor

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 2
1.1.- Conceptos generales.

1.- Distribución de las características muestrales.

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 3
1.1.- Conceptos generales.

Una máquina llenadora de bolsas de malla de naranjas, de las que se


usan en los almacenes de confección de esta fruta, se regula para
obtener un peso de 2000 gramos.

Debido a una serie de causas de variabilidad:


– variación en el calibre de las frutas
– imprecisión en las pesadas automáticas
– etc

¡ es imposible obtener constantemente bolsas que pesen exactamente


2000 gramos ¡

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 4
1.1.- Conceptos generales.

 El peso obtenido es realmente una variable aleatoria, definida


sobre la población de todas las bolsas que se confeccionan.

 Se considera que la máquina está bien regulada si la media de


dicha variable aleatoria es 2000.

 Para controlar si esto es así se ha tomado al azar una muestra de


15 bolsas, cuyos pesos son:

1989 2015 1962 2013 1983 1989 1992 2011 1958 2023 1980
1977 1994 2017 2001

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 5
1.1.- Conceptos generales.

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 6
1.1.- Conceptos generales.

AUTOEVALUACION : la media muestral ha resultado igual a


1993.6, y es, por tanto, diferente de 2000

¿quiere ello decir que la máquina llenadora se ha desajustado y que,


por tanto, hay que detener la producción y proceder a reajustar la
máquina?

¡ NO NECESARIAMENTE!

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 7
1.1.- Conceptos generales.

La diferencia entre 1993.6 y 2000 puede deberse al azar del


muestreo, de hecho nunca saldrá exactamente igual a 2000

Necesitamos algún procedimiento que nos permita obtener


conclusiones sobre el valor de m en la población a partir de la
información que hemos obtenido en la muestra

Inferencia Estadística

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 8
1.1.- Conceptos generales.

R (m, ) muestreo
x  1993.69 gr.
s  19.8 gr.

MUESTRA

¿Es razonable que m =2000 gr.?


POBLACIÓN
DE BOLSAS
¿Es razonable que  = 15 gr.?

Depende de ...

Hasta qué punto la media ( x ) y la desviación típica (s) de una


muestra puede diferir de la media (m) y la desviación típica () de la
población, respectivamente.
Departamento de Estadística e Investigación ESTADISTICA 2013
Estadística. UPV
Operativa Aplicadas y Calidad. 9
1.1.- Conceptos generales.

m.a.s.
POBLACIÓN

X, S

¿m? ¿? INFERENCIA


¿m=m0? ó
¿m m0?
¿ = 0?
Departamento de Estadística e Investigación
Estadística. UPV
Operativa Aplicadas y Calidad. 10
1.1.- Conceptos generales.

POBLACIÓN
x
m.a.s1 s 2
X: ( m , 2
)

Constantes desconocidas

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 11
1.1.- Conceptos generales.
N

m.a.s1
x1
POBLACIÓN DE
2
s 1 POSIBLES
MUESTRAS
POBLACIÓN N
X: ( m , 2 x2
m.a.s2
) 2
s 2


…N
Constantes desconocidas
xi
m.a.si
s i2

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 12
1.2.- Estadísticos.

MUY IMPORTANTE

 Cualquier característica muestral es una variable aleatoria:


– Tendrá sus parámetros (centralización, dispersión,…)
– Seguirá una distribución población original

 ESTADÍSTICO: cualquier función de los valores muestrales:

S X  1993'6
3X , X  4, , ...
10 19 '8
15

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 13
1.2.- Estadísticos.

 Cualquier ESTADÍSTICO es una variable aleatoria:


– Tendrá sus parámetros (centralización, dispersión,…)
– Seguirá una distribución 
 Distribución población original

 Tamaño de la muestra (N)

 Base Inferencia Estadística: conocimiento de las relaciones


que ligan la distribución de los estadísticos muestrales con
– La distribución de la población
– Características de la distribución

Departamento de Estadística e Investigación ESTADISTICA 2013


Estadística. UPV
Operativa Aplicadas y Calidad. 14
1.3.- Distribución de X .
La media muestral se define por la expresión:
X1  X 2  ...  X N  X i
X 
N N

cada una de esas xi que constituye la muestra, será el valor


observado de una variable aleatoria con media m y varianza 2 

 X1  X 2  ...  X N  m  m  ...  m
E(X)  E   m
 N  N

 X 1  X 2  ...  X N  1 N 2  2
 (X)      2 ( ( X 1 )  ...   ( X N ))  2 
2 2 2 2

 N  N N N

independencia
Departamento de Estadística e Investigación
Estadística. UPV
Operativa Aplicadas y Calidad. 15
1.3.- Distribución de X .

 La media de la media muestral es la media poblacional:

E(X)  m

 La varianza de la media muestral es la varianza de la población


dividida por el tamaño N de la muestra:

 2
 2 (X) 
N

X es suma de v.a. independientes con la misma distribución

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 16
1.3.- Distribución de X .

 2
X  N ( E ( X )  m, ( X )  2
)
N  N
(TCL )

x(N2  N1 )
x(N1 )
X

m
Departamento de Estadística e Investigación
Estadística. UPV
Operativa Aplicadas y Calidad. 17
1.4 – Distribución de S2

s 
2 (X1  X) 2
 ....  (X N  X) 2

 (X i  X) 2

N 1 N 1
   
 
E  ( X i  m)  ( X  m)  ...  
2
( X X ) 1
E (s )  E
2  i
 
2 2
 N 1 
  N 1

 La media de la varianza muestral es la varianza de la


población:

E(S )   2 2

 La varianza de la varianza muestral es la varianza de la


población:
 (s ) 
2
N 
2
0
Departamento de Estadística e Investigación
Estadística. UPV
Operativa Aplicadas y Calidad. 18
1.4 – Distribución de S2

Población de posibles muestras N X


x1
m.a.s1
s12 m

POBLACIÓN N
x(N1 )
X Normal( m , 2 ) x2
m.a.s2
2
s 2
… m

…N
Constantes desconocidas x(N2  N1 )
 2 xi
XN(m, ) m.a.si
N s i2
s2
( N  1) 2N-1 m
 2

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 19
2.- Muestreo de poblaciones normales.

2.- Muestreo de poblaciones normales

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 20
2.1.- Generalidades

 Los resultados expuestos en la Secciones anteriores son


completamente generales son válidos sea cual sea la
distribución de la población muestreada.
 Cuando dicha población es Normal es posible establecer ciertos
resultados adicionales de gran importancia dentro de la
metodología de la Inferencia Estadística.

1.- La media muestral se distribuirá normalmente, por ser una


transformada lineal de un conjunto (X1,...,XN) de variables
normales independientes:

X m
 Normal (0,1)

N
Departamento de Estadística e Investigación
Estadística. UPV
Operativa Aplicadas y Calidad. 21
2.1.- Generalidades

2) Otros estadísticos importantes en Inferencia siguen


otras distribuciones

En el estudio de las pautas de variabilidad de estadísticos que


aparecen en el muestreo de poblaciones normales:

Es necesario conocer tres nuevas distribuciones de


probabilidad:

 GI-DOS
 t DE STUDENT
 F DE SNEDECOR

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 22
2.1.- Generalidades

NOTA IMPORTANTE:

 Estas distribuciones no modelizan la pauta de


variabilidad de ninguna variable real;

 Son distribuciones que surgen en el proceso de


inferencia estadística.

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 23
2.1- La distribución GI-DOS.

 Importante en el estudio de la S2 de una muestra de una


población normal
 Se define:
n
 n2   X i2 ; Xi  N (0,1) independie ntes
i 1

E (  n2 )  n  2(  n2 )  2n

 Sólo toma valores positivos (lo que era obvio por tratarse de una
suma de cuadrados) y es asimétrica positiva.

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 24
2.1- La distribución GI-DOS.

 La asimetría decrece a medida que aumentan los grados de


libertad de la variable.

Chi-Square Distribution
0,16 Deg. of freedom
5
0,12
density

0,08

0,04

0
0 4 8 12 16 20 24
x

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 25
2.1- La distribución GI-DOS.

 n2  n 
n
 N (0,1) (para n>50, buena aproximación)
2n

Chi-Square Distribution
0,05 Deg. of freedom
50
0,04
density

0,03

0,02

0,01

0
0 20 40 60 80 100
x

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 26
2.1- La distribución GI-DOS.

AUTOEVALUACION:
• Demostrar que E(2n)=n

• Calcular la mediana de una 25 y de una 250

• ¿Cuánto es la probabilidad de obtener una varianza muestral


superior a 10 al sacar una muestra de tamaño 20 de una
población normal de varianza igual a 5?

La Tabla de la hoja siguiente da para diferentes valores de 


y de μ el valor x tal que la probabilidad de que una Gi-dos
con μ grados de libertad sea mayor que x es igual a  .

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 27
2.3.- La distribución t de Student.

tn 
N (0,1)
independientes E (tn )  0
 n2
n
n  2(tn )  (n  2)
n2
n
tn 
 N (0,1) (para n>30, buena
aproximación)
Prob. Density Fcn. n=5
Student's t n=50
0.4

0.3
prob. density

0.2

0.1

0
-7 -4
Departamento de Estadística e Investigación -1 2 5 8
Estadística. UPV
Operativa Aplicadas y Calidad. X
28
2.3.- La distribución t de Student.
Obtener un valor x tal que la probabilidad de que una t de Student con 10
grados de libertad sea en valor absoluto mayor que x sea igual al 5%.
IMPORTANCIA DE ESTA DISTRIBUCIÓN:

Si X y s son la media y la desviación típica de una muestra de


tamaño N extraída de una población normal (m , 2) , el estadístico:

Xm  t
NOTA IMPORTANTE: N-1
s/ N
APRÉCIESE LA ANALOGÍA ENTRE:

Xm Xm
 N(0,1) Y t
/ N s/ N N-1

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 29
2.4.- La distribución F de Snedecor.

 n2
n2
independientes E ( Fn1 ,n2 )  (n 2  2)
1
n1
Fn1 ,n2 
 n2 n2  2
2
n2

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 30
2.4.- La distribución F de Snedecor.

Objeto de la distribución F en la Inferencia

Comparar la variabilidad debida a diferentes fuentes.

Si s12 es la varianza en una muestra de tamaño N1 extraída de


una población normal de varianza σ12

s22 es la varianza de una mues-tra de tamaño N2 extraída de una


población normal de varianza σ22

son independientes

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 31
2.4.- La distribución F de Snedecor.

s1 /  1
2 2
En particular
F = 2 2  F( N1 1),( N2 1)
s 2/  2

Si las dos varianzas poblacionales (  2


1
y  2
2
) son iguales

2
s1
2
 F( N1 1),( N2 1)
s2

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 32
2.4.- La distribución F de Snedecor.

- Justificar intuitivamente que E(FN1 , N2 )  1


- Calcular un valor F tal que la probabilidad de que una variable F con 4 y 8
grados de libertad sea menor que F sea igual al 5%

IMPORTANCIA DE ESTA DISTRIBUCIÓN:


Comparar la variabilidad debida a diferentes fuentes.

Si s12 es la varianza de una muestra de tamaño N1 extraída de una


población normal (12)
Y s22 es la varianza de una muestra de tamaño N2 extraída de una
población normal (22)

Y ambas muestras son independientes: s12  2

 FN 1, N
1
2 1
s 22  2
2
1

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 33
2.4.- La distribución F de Snedecor.

AUTOEVALUACIÓN:
¿Cuál es la probabilidad de que al extraer dos muestras de tamaño 10 de
una misma población normal, la segunda varianza muestral resulta más
del doble de la primera?

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 34
3. Conclusiones.

RESULTADOS IMPORTANTES:

s2
( N  1)   n21
 2

X m
 t N 1
S
N

s12
 12
2
 F( N1 1),( N2 1)
s2
 22
Departamento de Estadística e Investigación
Estadística. UPV
Operativa Aplicadas y Calidad. 35
Fuentes:
1. Rafael Romero Villafranca, Luisa Zuñica Ramajo. ”Introducción a la
Estadística”. Valencia. Editorial UPV , 2007.
2. Nieves Martínez Alzamora, Gonzalo Clemente Marín , José Sanz Juan
“Métodos estadísticos en la ingeniería”. Valencia : Editorial UPV , 2010.
3. Nieves Martínez Alzamora, Susana San Matías Izquierdo, Suitberto
Cabrera García. “Prácticas con Statgraphics”. Universidad Politécnica de
Valencia Departamento de Estadística e Investigación Operativa Aplicadas y
Calidad. Valencia. Editorial UPV, 2010.
4. Material docente elaborado por el colectivo de profesores del
Departamento de Estadística Investigación Operativa Aplicadas y Calidad de la
UPV que imparte la asignatura en la Escuela Superior de Diseño de la UPV.

Algunos derechos reservados:


creativecommons.org/licenses/by-nc-sa/3.0/deed.es

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad.
Estadística.

DISTRIBUCIONES EN EL MUESTREO.

GRACIAS

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 37
Estadística.

DISTRIBUCIONES EN
EL MUESTREO

Suitberto Cabrera García.

Departamento de Estadística e Investigación


Estadística. UPV
Operativa Aplicadas y Calidad. 38

Você também pode gostar