Você está na página 1de 43

Distribuciones Muestrales y Teorema del Lmite

Central
Erika Valeria Rivera Jimenez Julian Felipe Tiria Bulla.
Universidad Distrital
7 de septiembre de 2014
Ejemplo
Denicin
Un estadstico es una funcin de las variables aleatorias observables en una
muestra y de constantes conocidas.
Example
Un dado sin cargar se lanza tres veces. Sean Y
1
, Y
2
y Y
3
el nmero de
puntos vistos en la cara superior para los tiros 1, 2 y 3, respectivamente.
Suponga que estamos interesados en Y =
(y
1
+y
2
+y
3
)
3
,el nmero promedio
de puntos vistos en una muestra de tamao 3. Cules son la media
Y
y
la desviacin estndar
Y
, de Y? Cmo podemos determinar la
distribucin muestral de Y?
Solucin
Se tiene que = E(Y
i
) = 3,5 y
2
= V(Y
i
) = 2,9167 Entonces E(Y) =
= 3,5 V(Y)

2
3
=
2,9167
3
= 0,9722
Y
=

0,97220,9860 Los posibles
valores de la variable aleatoria W = Y
1
+ Y
2
+ Y
3
son 3, 4, 5, ..., 18 y
Y = W/3 como el dado esta equilibrado, es decir, no cargado, cada uno
de los 6
3
= 216 valores distintos de la variable aleatoria multivariante
(Y
1
, Y
2
, Y
3
) son igualmente probables y
P(Y
1
= y
1
, Y
2
= y
2
, Y
3
= y
3
) = p(y
1
, y
2
, y
3
) = 1/216,
Y
1
= 1, 2, ..., 6 i = 1, 2, 3.
Por tanto
P(Y = 1) = P(W = 3) = p(1, 1, 1) = 1/216
P(Y = 4/3) = P(W = 4) = p(1, 1, 2) + p(1, 2, 1) + p(2, 1, 1) = 3/216
P(Y = 5/3) = P(W = 5) = p(1, 1, 3) +p(1, 3, 1) +p(3, 1, 1) +p(1, 2, 2)
+p(2, 1, 2) + p(2, 2, 1) = 6/216.
Las probabilidades P(Y = i /3), i = 7, 8, ..., 18 se obtienen igual
Distribucin de muestreo simulado para el ejemplo 7.1
Distribuciones muestrales relacionadas con la distribucin
normal
Teorema
Sean Y
1
, Y
2
, ..., Y
n
una muestra aleatoria de tamao n de una distribucin
normal con media y varianza
2
. Entonces
Y =
1
n
n

i =1
Y
i
est distribuida normalmente con media
Y
= y varianza
2
Y
=
2
/n.
Demostracin
Como Y
1
, Y
2
, ..., Y
n
es una muestra aleatoria de una distribucin normal
con media y varianza
2
, Y
i
, i = 1, 2, ..., n son variables independientes
distribuidas normalmente, con E(Y
i
) = y V(Y
i
) =
2
. Adems
Y =
1
n
n

i =1
Y
i
=
1
n
(Y
1
) +
1
n
(Y
2
) +... +
1
n
(Y
n
)
= a
1
Y
1
+ a
2
Y
2
+... + a
n
Y
n
donde a
i
=
1
n
; i = 1, 2, ..., n
As Y es una combinacin lineal de y
1
, Y
2
, ..., Y
n
de donde podemos con-
cluir que Y y se puede aplicar el Teorema 6.3
Demostracin
para concluir que Y est distribuida normalmente con
E(Y) = E
_
1
n
(Y
1
) +
1
n
(Y
2
) +... +
1
n
(Y
n
)
_
=
1
n
()+
1
n
()+...+
1
n
() =
y
V(Y) = V
_
1
n
(Y
1
) +
1
n
(Y
2
) +... +
1
n
(Y
n
)
_
=
1
n
2
(
2
)+
1
n
2
(
2
)+...+
1
n
2
(
2
) =
f
rac
2
n
Esto es, la distribucin muestral de Y es normal con media
Y
= y
varianza
2
Y
=

2
n
Example
Una mquina embotelladora puede ser regulada para que descargue un
promedio de onzas por botella. Se ha observado que la cantidad de
lquido dosi cado por la mquina est distribuida normalmente con
= 1,0 onza. Una muestra de n = 9 botellas se selecciona
aleatoriamente de la produccin de la mquina en un da determinado
(todas embotelladas con el mismo ajuste de la mquina) y las onzas de
contenido lquido se miden para cada una.
Determine la probabilidad de que la media muestral se encuentre a no
ms de .3 onza de la verdadera media para el ajuste seleccionado de la
mquina.
Solucin
Si Y
1
, Y
2
, ..., Y
9
denota el contenido en onzas de las botellas que se van
a observar, entonces sabemos que las Y
i
estn distribuidas normalmente
con mediab y varianza
2
= 1 para i = 1, 2, ..., 9. Por tanto, por el
Teorema 7.1, Y posee una distribucin muestral normal con media
T
=
y varianza
2
Y
=

2
n
=
1
9
. Deseamos hallar
P(|Y | 0,3) = P(0,3 (Y ) 0,3)
= P
_
0,3
/

n

Y
/

n

0,3
/

n
_
Como (Y )/
Y
= (Y )/(/

n) tiene una distribucin normal


estndar, se deduce que
P(|Y | 0,3) = P
_
0,3
1/

9
Z
0,3
1/

9
_
Solucin
Usando la tabla 4 encontramos
P(0,9 Z 0,9) = 1 2P(Z > 0,9) = 1 2(0,1841) = 0,6318
Por consiguiente, la probabilidad es slo .6318 de que la media muestral
se encuentre a no ms de .3 onza de la verdadera media poblacional.
Ejemplo
Example
Consulte el Ejemplo 7.2. Cuntas observaciones deben estar incluidas en
la muestra si deseamos que Y se encuentre a no ms de .3 onza de con
probabilidad de .95?
Solucin
Ahora buscamos
P(

Y ,3

) = P
_
,3 (Y ) ,3

= 0,95
Si dividimos cada termino de la desigualdad entre
Y
= /

n (recuerde
que = 1),tenemos
P
_
,3
/

n

_
Y
/

n

,3
/

n
__
= P(,3

n Z ,3

n) = ,95
Pero con el uso de la Tabla 4, Apendice 3, obtenemos
P(1,96 Z 1,96) = ,95
Solucin
Esto nos dice que
,3

n = 1,96
o bien, lo que es equivalente, n = (
1,96
,3
)
2
= 42,68
Desde una perspectiva practica, es imposible tomar una muestra de tamao
42,68. Nuestra solucion indica que una muestra de tamao 42 no es su-
cientemente grande para llegar a nuestro objetivo. Si n = 43, P(

,3) es ligeramente mayor que ,95


Teorema 7.2
Teorema
Si Y
1
, Y
2
, ...Y
n
, est denida como en el Teorema 7.1 entonces Z
i
=
Y
i

son variables aleatorias normales estndar e independientes, i = 1, 2, ..., n


y
n

i =1
Z
2
i
=
n

i =1
_
Y
i

_
2
tienen una distribucin
2
con n grados de libertad.
Demostracin
Como Y
1
, Y
2
, ...Y
n
es una muestra aleatoria de una distribucin normal con
media y varianza
2
, Z
i
=
Y
i

tiene una distribucin normal estndar


para i = 1, 2, ..., n. Adems, las variables aleatorias Z
i
son independientes
porque las Y
i
de las variables aleatorias son independientes, i = 1, 2, ..., n
El hecho de que

n
i =1
Z
2
i
tiene una distribucin
2
con n grados de libertad
se deduce directamente del Teorema 6.4.
Ejemplo
Example
Si Z
1
, Z
2
, ..., Z
6
denota una muestra aleatoria proveniente de la
distribucin normal estndar, encuentre un nmero b tal que
P
_
6

i =1
Z
2
i
b
_
= 0,95
Solucin
Por el Teorema 7.2,

6
i =1
Z
2
i
tiene una distribucin
2
con 6 grados de
libertad. Si vemos la Tabla 6, Apndice 3, en la la con encabezado 6 gl
y la columna con encabezado
2
0,5
vemos el nmero 12.5916. Por tanto,
P
_
6

i =1
Z
2
i
_
> 12,5916 = 0,05
o bien, lo que es equivalente
P
_
6

i =1
Z
2
i
_
12,5916 = 0,95
y b = 12,5916 es el cuantil 0,95 (95o. percentil) de la suma de los cua-
drados de seis variables aleatorias normales estndar e independientes.
Teorema 7.3
Teorema
sea Y
1
, Y
2
, ..., Y
n
una muestra aleatoria de una distribucin normal con
media y varianza
2
entonces
(n 1)S
2

2
=
1

2
n

i =1
(Y
i
Y)
2
tiene una distribucin
2
con (n - 1) grados de libertad. Tambin, Y y S
2
son variables aleatorias independientes
Demostracin
Consideramos para el caso n = 2 y demostraremos que (n 1)S
2
/
2
tiene
una distribucion X
2
con 1 grado de libertad. En el caso de n=2,
Y = (1/2)(Y
1
+ y
2
),
y por tanto,
S
2
=
1
2 1
2

i =1
(Y
i
Y)
2
=
_
Y
1

1
2
(Y
1
+ Y
2
)
_
2
+
_
Y
2

1
2
(Y
1
+ Y
2
)
_
2
=
_
1
2
(Y
1
Y
2
)
_
2
+
_
1
2
(Y
2
Y
1
)
_
2
= 2
_
1
2
(Y
1
Y
2
)
_
2
=
(Y
1
Y
2
)
2
2
Demostracin
Se deduce que, cuando n=2,
(n 1)S
2

2
=
(Y
1
Y
2
)
2
2
2
=
_
Y
1
Y
2

2
2
_
2
Demostraremos que esta cantidad es igual al cuadrado de una variable
aleatoria normal estandar; es decir, se trata de una variable Z
2
que, como
ya hemos demostrado en el ejemplo 6.11, posee una distribucion X
2
con 1
grado de libertad. Como Y
1
Y
2
es una combinacion de variables aleatorias
independientes distribuidas normalmente (Y
1
Y
2
= a
1
Y
1
+a
2
Y
2
con a
1
=
1 y a
2
= 1),El teorema 6.3 nos dice que Y
1
Y
2
tiene una distribucion
normal con media 1 1 = 0 y varianza (1)
2

2
+ (1)
2

2
= 2
2
. Por
tanto,
Z =
Y
1
Y
2

2
2
Tiene una distribucion normal estandar. Como para n = 2
(n 1)S
2

2
=
_
Y
1
Y
2

2
2
_
2
= Z
2
Demostracin
se deduce que (n 1)S
2
/
2
tiene una distribucion X
2
con 1 grado de
libertad. En el ejemplo 6.13 demostramos que U
1
= (Y
1
+ Y
2
)/ y U
2
=
(Y
1
Y
2
)/ son variables aleatorias independientes. Observe que, debido
a que n=2,
Y =
Y
1
+ Y
2
2
=
U
1
2
y
S
2
=
(Y
1
Y
2
)
2
2
=
(U
2
)
2
2
Como Y solo es una funcion de U
1
y S
2
es una funcion de U
2
, la indepen-
dencia de U
1
y U
2
implica la independencia de Y y S
2
.
Ejemplo 7.5
Example
En el ejemplo 7.2, se supone que las onzas de liquido que viere la
maquina embotelladora tienen una distribucion normal con
2
= 1.
Suponga que planeamos seleccionar una muestra aleatoria de diez
botellas y medir la cantidad de liquido en cada una. Si estas diez
observaciones se usan para calcular S
2
, podria ser util especicar un
intervalo de valores que incluiran S
2
con una probabilidad alta. Encuentre
numeros b
1
, b
2
tales que
P(b
1
S
2
b
2
) = ,90
Solucin
Observe que
P(b
1
S
2
b
2
) =
_
(n1)b
1

2

(n1)S
2

2

(n1)b
2

2
_
Debido a que
2
= 1, se deduce que (n 1)S
2
/
2
= (n 1)S
2
tiene una
distribucion X
2
con (n 1) grados de libertad. Por tanto, podemos usar
la tabla 6, Apendice 3, para hallar dos numeros a
1
, a
2
tales que
Solucin
P[a
1
(n 1)S
2
a
2
] = ,90
Un metodo para hacer esto es encontrar el valor de a
2
que delimite un area
de .05 en la cola superior y el valor de a
1
que delimite .05 en la cola inferior
( .95 en la cola superior). Como hay n 1 = 9 grados de libertad, la tabla
6 del apendice 3 indica que a
2
= 16,919 y a
1
= 3,325. En consecuencia,
los valores para b
1
y b
2
que satisfacen nuestras condiciones estan dados
por
3,325 = a
1
=
(n 1)b
1

2
= 9b
1
.. o..b
1
=
3,325
9
= 0,369
y
16,919 = a
2
=
(n 1)b
2

2
= 9b
2
.. o..b
2
=
16,919
9
= 1,880
Por tanto, si deseamos tener un intervalo que incluya S
2
con probabilidad
.90, uno de estos intervalos es (0.369,1.880).Observe que este intervalo es
bastante amplio.
Denicion 7.2
Sea Z una variable aleatoria normal estandar y sea W una variable con
distribucion X
2
con v grados de libertad. Entonces, si W y Z son indepen-
dientes,
T =
Z
_
W/v
se dice que tiene una distribucion t con v grados de libertad.
Ejemplo 7.6
La resistencia a la tension para un tipo de alambre esta distribuida
normalmente con media desconocida y varianza desconocida
2
. Seis
trozos de alambre se seleccionan aleatoriamente de un rollo largo; Y
1
, la
resistencia a la tension para el trozo i , se mide para i = 1, 2, ..., 6. La
media poblacional y la varianza
2
pueden ser estimadas por Y y S
2
,
respectivamente. Como
2
Y
=
2
/n, se deduce que
2
Y
puede ser
estimada por S
2
/n. Encuentre la probabilidad aproximada de que Y este
dentro de 2S/

n de la verdadera media poblacional


Solucion
Deseamos hallar
P
_
2S

n
(Y )
2S

n
_
= P
_
2

n
_
Y
S
_
2
_
= P(2 T 2)
Solucion
Donde T tiene una distribucion t con, en este caso n 1 = 5 grados de
libertad. Al observar la tabla 5, Apendice 3, vemos que el area de la cola
superior a la derecha de 2.015 es .05. En consecuencia.
P(2,015 T 2,015) = ,90
Y la probabilidad de que Y este a no mas de 2 desviaciones estandar esti-
madas de es ligeramente menor que .90. Observe que si
2
se conociera,
la probabilidad de que Y este a no mas de 2
Y
de estaria dada por
P
_
2
_

n
_
(Y ) 2
_

n
__
= P
_
2

n
_
Y

_
2
_
= P(2 Z 2) = 0,9544
Denicion
Seam W
1
y W
2
variables aleatorias independientes con distribucion X
2
,
con V
1
, V
2
grados de libertad, respectivamente. Entonces se dice que
F =
W
1
/v
1
W
2
/v
2
Tiene una distribucion F con v
1
grados de libertad en el numerador y v
2
grados de libertad en el denominador.
Ejemplo 7.7
Si tomamos muestras independientes de tamaos n
1
= 6 y n
2
= 10 de
dos poblaciones normales con la misma varianza poblacional, encuentre el
numero b tal que
p
_
S
2
1
S
2
2
b
_
= ,95
Solucion
Como n
1
= 6, n
2
= 10 y las varianzas poblacionales son iguales, entonces.
S
2
1
/
2
1
S
2
2
/
2
2
=
S
2
1
S
2
2
Tiene una distribucion F con v
1
= n
1
1 = 5 grados de libertad en el
numerador y v
2
= n
2
1 = 9 grados de libertad en el denominador.
Asimismo,
P
_
S
2
1
S
2
2
b
_
= 1 P
_
S
2
1
S
2
2
b
_
Solucion
Por tanto, queremos determinar el numero b que delimita un area en el
extremo superior de .05 bajo la funcion de densidad F con 5 grados de
libertad en el numerador y 9 grados de libertad en el denominador. Segun
las tablas conocidas, se podra ver que el valor apropiado de b es 3.48.
Aun cuando las varianzas poblacionales son iguales, la probabilidad de que
la razon entre la varianzas muestrales sea mayor que 3.48 todavia es .05
(suponiendo tamaos muestrales de n
1
= 6 y n
2
= 10)
Teorema Del Lmite Central
Teorema
Sean Y
1
, Y
2
, ..., Y
n
variables aleatorias independientes y distribuidas idn-
ticamente con E(Y
i
) = y V(Y
i
) =
2
< . Denamos
U
n
=

n
i =1
Y
i
n

n
=
Y
/

n
donde Y =
1
n

n
i =1
Y
i
Entonces la funcin de distribucin de U
n
converge hacia la funcin de
distribucin normal estndar cuando n . Esto es
lim
n
P(U
n
u) =
_
u

2
e
t
2
/2
dt
para toda u.
Ejemplo 7.8
Example
Las calicaciones de exmenes para todos los estudiantes de ltimo ao
de preparatoria en cierto estado tienen media de 60 y varianza de 64. Una
muestra aleatoria de n = 100 estudiantes de una escuela preparatoria
grande tuvo una cali cacin media de 58. Hay evidencia para sugerir
que el nivel de conocimientos de esta escuela sea inferior? (Calcule la
probabilidad de que la media muestral sea a lo sumo 58 cuando n = 100.)
Solucin
Denote Y la media de una muestra aleatoria de n = 100 calicaciones
de una poblacin con = 60 y
2
= 64 Deseamos calcular P(Y
58). Sabemos por el Teorema 7.4 que
Y
/

n
tiene una distribucin que
puede aproximarse con una distribucin normal estndar. En consecuencia,
usando la Tabla 4, Apndice 3, tenemos
P(Y 58) = p
_
Y 60
8/

100

58 60
0,8
_
P(Z 2,5) = 0,0062
Debido a que esta probabilidad es muy pequea, no es probable que la
muestra de la escuela estudiada se pueda considerar como muestra aleatoria
de una poblacin con = 60 y
2
= 64. La evidencia sugiere que la cali
cacin promedio para esta preparatoria es menor que el promedio general
de = 60.
Ejemplo 7.9
Example
Los tiempos de servicio para los clientes que pasan por la caja en una
tienda de venta al menudeo son variables aleatorias independientes con
media de 1.5 minutos y varianza de 1.0. Calcule la probabilidad de que
100 clientes puedan ser atendidos en menos de 2 horas de tiempo total
de servicio.
Solucin
Si denotamos con Y
i
el tiempo de servicio para el i-simo cliente, entonces
queremos calcular
P
_
1

i =1
00Y
i
120
_
= P
_
Y
120
100
_
= P
_
Y 1,20
_
Como el tamao muestral es grande, el teorema del lmite central nos
dice que Y est distribuida normalmente en forma aproximada con media

Y
= y varianza
2
Y
=
2
/n = 1/100. Por tanto, usando la Tabla 4,
Apndice 3, tenemos
P(Y 1,20) = P
_
Y 1,50
1/

100
_

1,20 1,50
1/

100
P [Z (1,2 1,5)10] = p(Z 3)00,0013
Entonces, la probabilidad de que 100 clientes puedan ser atendidos en
menos de 2 horas es aproximadamente .0013. Esta pequea probabilidad
indica que es prcticamente imposible atender a 100 clientes en menos de
2 horas.
Aproximacion normal a la distribucion binomial
El teorema del limite central tambien se puede usar para aproximar proba-
bilidades de algunas variables aleatorias discretas cuando las probabilidades
exactas sean diciles de calcular.
Ejemplo 7.10
Example
La candidata A piensa que puede ganar las elecciones en una ciudad si
obtiene por lo menos 55 porciento de los votos en el distrito electoral
1.Tambien piensa que alrededor de 50 porciento de los votantes de la
ciudad estan a su favor. Si n=100 votantes se presentan a votar en el
distrito electoral 1, Cual es la probabilidad de que la candidata A reciba
al menos 55 porciento de sus votos?
Solucin
Sea Y el numero de votantes del distrito electoral 1 que estan a favor de la
candidata A. Debemos calcular P(Y/n ,55) cuando p es la probabilidad
de que un votante seleccionado aleatoriamente del distrito electoral 1 este
a favor de la candidata A. Si consideramos los n = 100 votantes del distrito
electoral 1 como una muestra aleatoria de la ciudad, entonces Y tiene una
distribucion binomial con n = 100 y p = 0,5. Hemos visto que la fraccion
de votantes que estan a favor de la candidata A es.
Y
n
=
1
n
n

i =1
X
i
donde X
i
= 1 si el i-esimo votante esta a favor de la candidata A y
X
i
= 0 de otro modo. Como es razonable suponer que X
i
= 1, 2, ..., n son
independientes, el teorema del limite central implica que X = Y/n esta
distribuida normalmente en forma aproximada con media p = ,5 y varianza
pq/n = (0,5)(0,5)/100 = 0,0025. Por tanto,
P
_
Y
n
0,55
_
= P
_
Y/n 0,5

0,0025

0,55 0,50
0,05
_
P(Z 1) = 0,1587
Ejemplo 7.11
Example
Suponga que Y tiene una distribucion binomial con n = 25 y p = 0,4.
Encuentre las probabilidades exactas de que Y 8 y Y = 8 y compare
estas con los valores correspondientes determinados con el uso de la
aproximacion normal.
Solucin
De la tabla 1, Apendice 3, hallamos que
P(Y 8) = ,274
Y
P(y = 8) = P(Y 8) P(Y 7) = ,274 ,154 = 0,120
Como dijimos antes, podemos considerar que Y tiene aproximadamente
la misma distribucion que W, donde W esta distribuida normalmente con

w
= np y
2
w
= np(1 p). Como buscamos P(Y 8), vemos el area de
la curva normal localizada a la izquierda de 8.5. Asi,
P(Y 8) P(W 8,5) = P
_
W np
_
np(1 p)

8,5 10
_
25(,4)(,6)
_
= P(Z 0,64) = 0,2709
De la tabla 4, Apendice 3.
Solucin
Este valor aproximado es cercano al valor exacto para P(Y 8) = 0,274,
obtenido de las tablas binomiales.
Para determinar la aproximacion normal a la probabilidad binomial p(8),
calcularemos el area bajo la curva normal entre los puntos 7.5 y 8.5 porque
este es el intervalo incluido en la barra del histograma localizada sobre
y = 8
Que se indica en la siguiente gura.
Solucin
Como Y tiene aproximadamente la misma distribucion que W, donde W
esta distribuida normalmente con
w
= np = 25(0,4) = 10 y
2
W
=
np(1 p) = 25(0,4)(0,6) = 6, se deduce que
P(Y = 8) P(7,5 W 8,5)
= P
_
7,5 10

6

W 10

6

8,5 10

6
_
= P(1,02 Z 0,61) = 0,2709 0,1539 = 0,1170
Nuevamente vemos que este valor aproximado es muy cercano al valor real,
P(Y = 8) = 0,120, calculado antes.
Referencias:
Wackerly Dennis D. Estadistica matemtica con aplicaciones,
CENGAGE learning, 2010.

Você também pode gostar