Escolar Documentos
Profissional Documentos
Cultura Documentos
Teora de muestras
Consideremos las tres siguientes cuestiones.
z Las estaturas de todos los alumnos del instituto Acci siguen una distribucin (normal) de
media = 150 cm y desviacin tpica = 4 cm. Se han seleccionado al azar 35 alumnos
y alumnas para participar en un programa de televisin. Cul es la probabilidad de que
la estatura media de los seleccionados est entre 149 y 151 cm?
z La estatura media de los 35 alumnos y alumnas del instituto Acci seleccionados al azar para
participar en un programa de televisin es de x = 150 cm. Cul es la probabilidad de que
la estatura media de todos los alumnos y alumnas del instituto est entre 149 y 151 cm?
z Se quiere comprobar si la estatura media de los alumnos y alumnas del instituto Acci es de
150 cm. Para ello, se toma una muestra al azar de 35 alumnos y alumnas y determinamos
que su media es x = 1500 9 cm. Es razonable admitir que la media poblacional es =
150 cm?
En el primer problema conocemos los datos de la poblacin y nos preguntamos sobre los
correspondientes a una muestra aleatoria. Este problema se enmarca dentro de la teora de
muestras y es tema de estudio durante el presente captulo. En el segundo problema ocurre
al contrario: conocemos el comportamiento de una muestra y tratamos de inferir datos acerca
de toda la poblacin. Este proceso se llama inferencia estadstica y nos ocuparemos de ella
en el siguiente captulo. Finalmente, en el tercer problema realizamos una hiptesis sobre un
parmetro poblacional y tratamos de estudiar su validez a travs del estudio de una muestra.
Este problema est dentro del mbito del denominado contrate de hiptesis y se sale de las
expectativas del curso (aunque, si te interesa, puedes leer sobre el tema en el libro de texto).
57
58
12.1.
Muestreo
Llamaremos poblacin (o universo) al conjunto de todos los elementos que poseen una determinada caracterstica. Una poblacin puede no estar formada slo por personas, sino tambin
por animales y objetos. Por ejemplo, podemos hablar de la poblacin de ranas de una determinada laguna o de la poblacin de coches de Guadix. En este ltimo caso, podemos estudiar el peso
de los coches o su antigedad en aos. Cada uno de los elementos de la poblacin se denomina
individuo. Por motivos que ya expondremos, en general, supondremos que la poblacin es muy
grande.
Para inferir informacin sobre la poblacin, es usual tomar una muestra. Llamaremos muestra a cualquier subconjunto de la poblacin. El tamao de una muestra es el nmero de
individuos que la componen (tambin se puede hablar del tamao de la poblacin entera). Se
suele recurrir a una muestra por distintas razones: porque la poblacin es excesivamente amplia (queremos medir el peso de todas las hormigas del planeta), porque la poblacin es muy
difcil de controlar (las ballenas que surcan el Ocano Pacco), porque el proceso de medicin
es destructivo (queremos saber la resistencia de una copa de cristal de bohemia, pero cada vez
que medimos rompemos una de ellas), porque se desea conocer informacin rpidamente (por
ejemplo, los sondeos electorales), etc.
Seleccionar una muestra es un procedimiento muy sencillo: slo hay que tomar una parte
cualquiera, por ejemplo, un individuo. Pero en la mayora de las ocasiones, nos interesa que
la muestra sea representativa de la poblacin, es decir, manieste en algn sentido el mismo
comportamiento que la poblacin total. Si la muestra est mal elegida, se producen errores
adicionales imprevistos e incontrolables llamados sesgos. Por ello, no es tan fcil encontrar
una muestra que manieste el comportamiento global de la poblacin. Llamaremos muestreo
al proceso mediante el cual se escoge una muestra de la poblacin. En lo sucesivo, nos har
falta que la muestra sea lo sucientemente grande como para poder ser representativa, pero,
qu signica una muestra grande? Fijamos un criterio general: llamaremos muestra grande
a aquella que tiene 30 ms individuos, y llamaremos muestra pequea a la de menos de 30
individuos. En muchas ocasiones utilizaremos la terminologa muestra sucientemente grande.
Existen distintos tipos de muestreo. El ms adecuado es el muestreo aleatorio, que es aqul
en el que todos los individuos de la muestra se eligen al azar y, de este modo, tienen la misma
probabilidad, a priori, de ser elegidos. Dentro de este tipo de muestreo, podemos considerar los
siguientes tipos:
I Muestreo aleatorio simple: es el ms sencillo y en l se basan todos los dems. Consiste
en numerar uno a uno los N elementos de la poblacin y despus hacer un sorteo para
seleccionar los n individuos de la muestra. El muestreo aleatorio simple suele llevarse a
A. Roldn
12.1. Muestreo
59
cabo por insaculacin (que proviene del latn meter en un saco), es decir, asignando a cada
individuo una papeleta o nmero que se introduce en un recipiente de tal forma que se van
sacando una a una las papeletas de los seleccionados. A este particular, es fundamental
observar si el sorteo se hace con o sin reemplazamiento.
I Muestreo aleatorio estraticado: este muestreo se realiza cuando la poblacin, de manera
natural, est dividida en ciertas capas, llamadas estratos (por ejemplo, los alumnos de la
ESO estn clasicados de 1o a 4o en cuatro estratos), y es dentro de stos subconjuntos
donde realizamos un muestreo aleatorio simple para seleccionar la muestra.
I Muestreo aleatorio sistemtico: este tipo de muestreo consiste en numerar a todos los
individuos de la poblacin y se elige a uno concreto (llamado origen) de ellos por sorteo.
A partir de l, y siguiendo un coeciente de elevacin (de tres en tres, de cinco en cinco,
etc.) se seleccionan los dems elementos que compondrn la muestra. Este coeciente debe
ser h = N=n. Por ejemplo, si en una poblacin de 100 individuos queremos seleccionar a
10 de ellos, sorteamos el primero entre el 1 y el 10, y si ha salido el 3, la muestra estar
formada por los individuos que ocupen las posiciones 3, 13, 23, 33,. . . , 93.
I Muestreo aleatorio por conglomerados y reas: este tipo de muestreo se realiza cuando
la poblacin est de manera natural dividida en ciertos subconjuntos, ahora llamados
conglomerados, que se numeran y se sortean. Una vez que se ha elegido un conglomerado,
se selecciona a todos los individuos que lo forman para participar en la muestra.
Hay alguna diferencia entre los conceptos de estrato y conglomerado. La principal est
en que los estratos deben estar formados por individuos que representan homogneamente
a la poblacin, es decir, comparten la caracterstica con la que se divide a la poblacin.
Sin embargo, los conglomerados deben ser heterogneos y admitir en ellos a toda una
representacin variada de la poblacin. Por eso se seleccionan individuos de diferentes
estratos (para que haya representatividad de las diferentes opciones) pero a todos los
individuos de un cierto conglomerado.
Dentro del muestreo aleatorio estraticado, es usual que jemos a priori o bien el porcentaje
que se va a seleccionar en cada estrato (en este caso se habla de muestreo aleatorio estraticado
con ajacin proporcional) o bien el tamao total de la muestra que se desea (y lo interesante
es ver cuntos individuos se seleccionan dentro de cada estrato). Realmente, si lo pensamos,
llegamos al mismo resultado, pero por diferentes caminos. Veamos dos ejercicios parecidos.
Ejercicio 27 En un pueblo pequeo hay 2000 hombres y 3000 mujeres. Indica cmo se debe
tomar una muestra formada por 80 personas.
Solucin :
En este caso hay dos estratos, compuestos uno por hombres y otro por mujeres. Como
queremos 80 personas en la muestra, establecemos las siguientes proporciones (que se resuelven
A. Roldn
60
n
80
n1
n2
=
=
=
N
5000
2000
3000
(
n1 = 32
)
n2 = 48
Muestra
Hombres
2000
n1
Mujeres
3000
n2
TOTAL
N = 5000
n = 80
Esto signica que hay que seleccionar 32 hombres y 48 mujeres, y, dentro de cada estrato,
proceder a un muestreo aleatorio simple.
Ejercicio 28 En un pueblo pequeo hay 2000 hombres y 3000 mujeres. Indica cmo se debe
tomar una muestra formada por el 3 % de la poblacin.
Solucin :
Realmente, los dos ejercicios anteriores son equivalentes. En el primero, nos piden tomar una
muestra de 80 personas, lo que supone un 80=5000 = 10 6 % de la poblacin. En el segundo, nos
piden que la muestra contenga al 3 % de la poblacin, lo que supone un tamao de 3 % 5000 =
150 personas. En ambos casos hay ajacin proporcional.
En los dos ejercicios anteriores, el nmero de individuos que se deben tomar en cada estrato
ha resultado ser exacto. Cuando aparecen decimales, tenemos que redondear las partes decimales
ms altas segn nos interese. Veamos un ejemplo.
Ejercicio 29 Los 640 alumnos y alumnas de la ESO del instituto Acci se reparten de la siguiente
manera: 102 en 1o , 197 en 2o , 218 en 3o y 123 en 4o . Se quiere seleccionar a 40 de ellos para
participar en un concurso de televisin. Indica cmo los seleccionaras.
Solucin :
n1
60 38; n2
120 31; n3
130 63; n4
70 69:
61
Solucin :
Ejercicio 31 Una ciudad de 2000 habitantes est poblada por personas de pelo negro, rubio
y castao. Se han seleccionado, mediante muestreo aleatorio estraticado con ajacin proporcional, una muestra constituida por 28 personas de pelo negro, 32 de pelo rubio y 20 de pelo
castao. Determina cul es la composicin, segn el color de pelo, de los habitantes de esta
ciudad.
Solucin :
Muestra
Negro
n1
28
Rubio
Castao
n2
n3
!
!
32
20
TOTAL
N = 2000
12.2.
n
80
28
32
20
=
=
=
=
N
2000
n1
n2
n3
)
n = 80
Supongamos que deseamos estudiar la media que se obtiene al lanzar un dado, dos dados,
tres dados, etc. Si lanzamos un nico dado, podemos obtener seis resultados posibles, todos ellos
equiprobables. As tenemos la siguiente distribucin de probabilidad de los datos que se pueden
A. Roldn
62
obtener:
1 dado
xi
pi
1
6
1
6
1
6
1
6
1
6
1
6
2
3
4
5
6
p 0.2
0.1
0.0
2
Un dado.
1
La variable X1 (que mide el resultado al lanzar un dado) sigue una distribucin discreta uniforme
de media X1 = 30 5.
Si lanzamos dos dados y la variable X2 mide la media aritmtica de los resultados obtenidos,
el espacio muestral se modica con los puntos medios entre los nmeros naturales del 1 al 6, y
cambian las probabilidades de los mismos:
2 dados
2 dados
x=
x1 +x2
2
3
2
5
2
7
2
3
2
5
2
7
2
5
2
7
2
9
2
5
2
7
2
9
2
7
2
9
2
11
2
7
2
9
2
11
2
2 dados
xi
pi
1
36
2
36
3
36
4
36
5
36
3
2
2
5
3
xi
pi
7
2
6
36
5
36
4
36
3
36
2
36
1
36
4
9
2
5
11
2
p 0.2
0.1
0.0
2
63
Si repetimos el experimento con tres, cuatro y cinco dados, observamos que la distribucin de
probabilidad va adquiriendo una forma caracterstica, manteniendo en todo momento su media
X = 30 5.
p 0.2
p 0.2
0.1
0.1
0.0
0.0
2
De esta forma, las variables que intervienen son discretas, pero su espacio muestral poco a
poco se llena de fracciones entre los nmeros 1 y 6. Qu pasar cuando hacemos crecer el nmero
de dados? La respuesta es bien sencilla y viene dada por el teorema central del lmite (12.2.1):
la distribucin de probabilidad tiende a la de una variable normal de la misma media. Adems,
su desviacin tpica estar bien controlada y cuanto mayor sea n, mejor ser la aproximacin.
Teorema 12.2.1 (Central del Lmite) Dada una poblacin de media y desviacin tpica
(no necesariamente normal), la distribucin de las medias muestrales Xn de tamao n
verica:
= :
2. Su desviacin tpica es
Xn
=p ;
n
30;
Xn
;p
Es muy importante aprender a interpretar lo que dice exactamente el teorema anterior. Este
teorema viene a medir los parmetros de la variable aleatoria que mide la media aritmtica
A. Roldn
64
cuando se toma de la poblacin una muestra de tamao n. En tal caso, la media de esta nueva
variable se conserva: es siempre la de la poblacin de partida. En segundo lugar, su desviacin
p
tpica es la de partida dividida entre n. Este denominador juega un papel fundamental pues
a medida que crece, hace que la desviacin tpica Xn sea cada vez menor y, as, los datos de
la distribucin de la medias tienden a estar ms concentrados alrededor de su media aritmtica. Finalmente, esta distribucin, que en principio nada tiene que ver con la normal, termina
parecindose a la de una distribucin normal cuando el tamao de la muestra as lo permite.
Hacemos algunos comentarios interesantes sobre el teorema central del lmite 12.2.1 y su
interpretacin.
Este teorema es vlido cualquiera que sea la distribucin de la poblacin de partida, tanto
si es discreta como si es continua. Por eso es curioso que sea como sea la poblacin
de partida, la distribucin de las medias muestrales siempre tiende a parecerse a una
distribucin normal.
Cmo se puede extraer una muestra de tamao 1000 en una clase que tiene solamente 15
alumnos? Slo hay una respuesta posible: la extraccin de la muestra se entender siempre
con reemplazamiento. Es lo mismo que ocurre con un dado. Si lanzamos dos dados, los
posibles valores se pueden repetir en un dado y en el otro. Es como si sacamos una carta de
una baraja de 6 cartas, la miramos, la devolvemos y volvemos a sacar otra. La operacin
se realiza siempre con reemplazamiento. As podemos lanzar mil dados o mil veces un
dado. Si hay reemplazamiento, perfectamente podemos sacar una muestra de tamao 1000
en una poblacin que slo tiene 15 individuos distintos. Podemos eludir la hiptesis del
reemplazamiento si suponemos que la poblacin es muy grande, como ya comentamos al
inicio del captulo.
La necesidad de hacer reemplazamiento surge del hecho de que la distribucin de las
medias muestrales se aproxima a la normal cuando la muestra es sucientemente grande,
y ya jamos como criterio que llamaramos muestra grande a aquella que tiene 30 ms
individuos. Precisamente escogimos el nmero 30 porque es el que aparece usualmente en
el teorema central del lmite.
Utilizando la media y la desviacin tpica de la poblacin, el teorema anterior trata de
inferir informacin sobre la media x de una muestra de tamao grande. Desde luego, y
x pueden no coincidir, pero el teorema anterior arma que cuanto mayor es n, ms cerca
p
est x de , ya que la desviacin tpica Xn = = n tiende a ser cero, y los datos de la
muestra estaran muy agrupados.
Si la poblacin de partida es normal, tambin es normal la distribucin de las medias
muestrales de cualquier tamao n. Por eso, si sabemos que partimos de una poblacin
A. Roldn
65
normal, podemos aplicar los dos primeros apartados a la distribucin de las medias de
tres, ocho o veinte elementos.
Hay ocasiones en que se sigue cumpliendo el teorema central del lmite an cuando la
poblacin de partida no es normal y se toma una muestra de tamao pequeo. A este
respecto, vanse los ejercicios 32 y 33.
Ejercicio 32 En una urna hay tres bolas numeradas con los nmeros 2, 4 y 6.
(a) Calcula la media y la desviacin tpica de la variable que mide el nmero que sale al sacar
una bola.
(b) Calcula la media y la desviacin tpica de la variable que mide la media que se obtiene al
sacar dos bolas con reemplazamiento.
(c) Cmo se relacionan los parmetros anteriores?
Solucin :
ni
xi ni
x2i ni
2
4
6
1
1
1
2
4
6
4
16
36
12
56
8
>
>
>
<
>
>
>
:
12
= 4;
3
r
r
56
8
=
42 =
:
3
3
=
Calculemos ahora todas las posibilidades que tenemos al extraer dos nmeros (con reemplazamiento):
E2 = f (2; 2) ; (2; 4) ; (2; 6) ; (4; 2) ; (4; 4) ; (4; 6) ; (6; 2) ; (6; 4) ; (6; 6) g :
Haciendo la media de los dos nmeros obtenidos, tenemos la siguiente tabla y parmetros:
xi
ni
xi ni
x2i ni
2
3
4
5
6
1
2
3
2
1
2
6
12
10
6
4
18
48
50
36
36
156
8
>
>
>
<
>
>
>
:
X2
X2
36
= 4;
9
r
r
156
4
=
42 =
:
9
3
=
Qu relacin existe entre los parmetros de X = X1 y X2 ? Por un lado, es claro que ambas
disponen de la misma media, pues X2 = 4 = X . Pero adems, se verica que
r
r
p
8=3
8
4
X
p = p =
=
= X2 :
6
3
n
2
A. Roldn
66
Por consiguiente, las relaciones que se indican en el teorema central del lmite 12.2.1 se siguen
conservando en este caso aun cuando las poblaciones de partida no son normales y el tamao
de las muestras que se toman es n = 2, claramente inferior a 30.
Ejercicio 33 Responder a las mismas cuestiones si hay cuatro bolas con los nmeros 22, 24,
28 y 30.
12.3.
Distribuciones en el muestreo
Recapacitando sobre el teorema central del lmite, aprovechamos para hacernos otras preguntas. La primera de ellas puede ser la siguiente: cundo se puede aplicar dicho teorema y
para qu sirve? Un primer ejemplo: para fabricar sillas. No todas las personas que se sientan
en una silla tienen la misma estatura. Cmo fabricarla de un tamao medio para que pueda
utilizarla la mayor cantidad de gente, por ejemplo en un colegio o en un cine? Si la muestra
es lo sucientemente grande, la media de las estaturas de las personas que en ellas se sienten
tender a la media poblacional que puede conocerse, quiz, a travs del Instituto Nacional de
Estadstica.
Y si no me interesa slo la media, sino la suma de todas las observaciones? Es el caso que
puede presentarse en el equipaje de un avin. Cada pasajero lleva una maleta que puede pesar
hasta 50 kg. Puede ser interesante calcular la media pero an es ms interesante calcular su
suma, pues es el peso total el que podra derribar el avin. Si este peso siguiese una distribucin
normal, podramos evaluar la posibilidad de que en un vuelo concreto se superase el peso mximo
permitido.
Y si nos interesase comparar las notas de Selectividad de dos universidades? Podramos
restar sus medias para evaluar la posibilidad de que una sea mayor que la otra en un curso
determinado. Y si queremos establecer los resultados que obtendr un partido poltico en las
prximas elecciones? Puede todo ello deducirse del teorema central del lmite? En los siguientes
apartados resolvemos algunas de estas cuestiones.
12.3.1.
67
y desviacin tpica
(no necesariamente
= :
2. Su desviacin tpica es
Xn
=p ;
n
30;
Xn
;p
Como se puede observar, este teorema no es ms que el teorema central del lmite (12.2.1).
Veamos cmo utilizarlo.
Ejercicio 34 En una ciudad, la estatura media de sus habitantes tiene una desviacin tpica
de 8 cm. Si la estatura media de dichos habitantes fuera de 175 cm, cul sera la probabilidad
de que la estatura media de una muestra de 100 individuos tomada al azar fuese superior a 176
cm?
Solucin :
;p
=N
175; p
8
100
= N 175; 00 8 :
X100 175
,! N (0; 1) :
00 8
Entonces, la probabilidad de que la estatura media de la muestra sea superior a 176 cm es:
p X100 > 176 = p
=1
X100 175
176 175
>
00 8
00 8
= p Z > 10 25 = 1
p Z
10 25 =
00 8944 = 00 1056:
A. Roldn
68
Ejercicio 35 En una distribucin N (20; 6), cul es la probabilidad de que la media de una
muestra de tamao 64 est comprendida entre 19 y 21?
Solucin :
;p
=N
6
20; p
64
= N 20; 00 75 :
X64 20
,! N (0; 1) :
00 75
X64
21 = p
19 20
00 75
X64 20
00 75
=p Z
10 33
p Z
=p Z
10 33
= 2 00 9082
21 20
00 75
=p
10 33 = p Z
p Z
10 33
10 33
10 33
=2 p Z
10 33 =
p Z
10 33 =
10 33
1=
1 = 00 8164:
Ejercicio 36 Una mquina envasa bolsas de sal con una media de 500 gr y una desviacin
tpica de 35 gr. Las bolsas se empaquetan en cajas de 150 unidades.
(a) Calcula la probabilidad de que la media de los pesos de las bolsas de una caja sea menor de
495 gr.
(b) Si un hipermercado compra 400 cajas de 150 unidades cada una, cuntas cajas espera que
estn formadas por bolsas cuya media de pesos sea menor de 495 gr?
Solucin :
Sea X la variable aleatoria que mide el peso de cada bolsa de sal. Segn los datos
del problema, la distribucin de X posee una media de = 500 gr y una desviacin tpica de
= 35 gr (aunque no sea necesariamente normal). Se toman cajas con n = 150 bolsas. Entonces
la variable X150 que mide la media de los pesos de las bolsas de una caja posee distribucin:
X150 ,! N
;p
=N
35
500; p
150
N 500; 20 8577 :
X150 500
,! N (0; 1) :
20 8577
69
Entonces, la probabilidad de que la media de los pesos de las bolsas de una caja sea menor de
495 gr es:
p X150 < 495 = p
X150 500
495 500
<
20 8577
20 8577
= p Z > 10 75 = 1
=p Z<
10 75 = 1
p Z
10 75 =
00 9599 = 00 0401:
Si un hipermercado compra 400 cajas y la probabilidad de que la media en una de ellas sea
menor de 495 gr es del 40 01 %, entonces es de esperar que
40 01 % de 400 cajas = 160 04 cajas
16 cajas
Sea X la variable aleatoria que mide el peso de las tabletas de chocolate. Segn los
datos, X ,! N ( = 125; = 4). Entonces la variable X25 que mide el peso medio de n = 25
tabletas (elegidas al azar) sigue una distribucin
X25 ,! N
;p
=N
125;
4
5
= N 125; 00 8 :
As, la probabilidad de que el peso medio de 25 tabletas de chocolate est entre 124 gr y 126 gr
es, tipicando para poder utilizar la tabla de la normal estndar Z ,! N (0; 1) de colas a la
izquierda,
p 124 < X25 < 126 = p
124 125
X25 125
126 125
<
<
0
0
08
08
00 8
= p Z < 10 25
= p Z < 10 25
= 2 00 8944
p Z<
1
=p
10 25 = p Z < 10 25
p Z < 10 25
10 25 < Z < 10 25 =
p Z > 10 25 =
= 2p Z < 10 25
1=
1 = 00 7888:
70
Entonces
p X64 > 124 = p
12.3.2.
X64 125
124 125
>
00 5
00 5
= p (Z >
2) = p (Z < 2) = 00 9772:
En ocasiones, puede ser ms interesante calcular las sumas muestrales que las medias, como
en el caso del avin que ya hemos comentado. En este caso queremos estudiar una variable que
es suma de n variables idnticas a la de partida: Tn = X1 + X2 + : : : + Xn . Si conocemos la
distribucin de las medias muestrales a travs del teorema (12.3.1), slo tenemos que multiplicar
por n para obtener los nuevos parmetros:
Xn
Xn
=p
)
n
Tn
=n
Tn
Xn
=n
=n
Xn
=n p =
n
n:
1. Su media es:
Tn
=n
n:
3. A medida que n crece, la distribucin de las sumas muestrales se aproxima a una normal
(es casi normal cuando n 30)
n
30;
Tn
n :
Ejercicio 38 Un avin con capacidad para 120 pasajeros acepta una carga mxima de 2400 kg
en equipaje. Se sabe que la distribucin del peso del equipaje de cada pasajero tiene 19 kg de
media y 4 kg de desviacin tpica. Calcula la probabilidad de que el avin no pueda despegar
debido al peso del equipaje cuando va completo.
A. Roldn
71
La variable que mide el peso de cada equipaje tiene una media de = 19 kg y una
desviacin tpica de = 4 kg. Si el avin va completo, se ha tomado una muestra de n = 120
pasajeros, y la suma de todos los pesos de los 120 equipajes sigue una distribucin:
p
p
n = N 120 19 ; 4
120
N 2280; 430 82 :
T120
N n
;
Tipicando encontramos una variable con distribucin normal estndar:
Z=
T120 2280
,! N (0; 1) :
430 82
Entonces la probabilidad de que el avin no pueda despegar a causa del peso del equipaje es de:
p (T120 > 2400) = p
=1
2400 2280
T120 2280
>
430 82
430 82
p Z
20 74 = 1
= p Z > 20 74 =
00 9969 = 00 0031:
Por consiguiente, hay una probabilidad del 00 31 % de que el avin no pueda despegar debido al
excesivo peso del equipaje.
12.3.3.
Supongamos que tenemos dos poblaciones de inicio, representadas por las variables aleatorias,
X1 y X2 , de medias respectivas 1 y 2 , y de desviaciones tpicas 1 y 2 (ya sean normales o
no). Supongamos que queremos obtener informacin sobre la diferencia de las respectivas medias
de sendas muestras de tamaos n1 y n2 , respectivamente. Para ello, se toma una muestra de
tamao n1 de X1 , y se calcula su media x1 , y se hace lo mismo con la otra, x2 , con una muestra
de tamao n2 . Si restamos estas dos medias, x1 x2 , tenemos un primer valor que toma la
variable diferencia entre las medias de las dos poblaciones. Cuando este proceso se repite una y
otra vez, podemos estimar la diferencia entre las medias muestrales
x1
x2 ;
x01
x02 ;
x001
x002 ; : : :
Estos valores dan lugar a una nueva variable aleatoria, cuya distribucin se denomina distribucin
en el muestreo de la diferencia de medias. Sus caractersticas principales son las siguientes.
Teorema 12.3.3 (Muestreo de la diferencia de medias) La distribucin en el muestreo
de la diferencia de medias Y entre dos poblaciones X1 y X2 (no necesariamente normales)
de medias 1 y 2 , respectivamente, y desviaciones tpicas 1 y 2 , cuando se toman muestras
de tamaos n1 y n2 , tiene las siguientes caractersticas.
1. Su media es la diferencia entre las respectivas medias:
Y
2:
A. Roldn
72
2
1
n1
2
2
n2
30;
N@
2
1
n1
2
2
n2
A:
Ejercicio 39 Se sabe que la talla de los nios recin nacidos en la Comunidad Autnoma A
se distribuye segn una N (52; 6), mientras que en la Comunidad Autnoma B se distribuyen
segn una N (48; 4). Si se toman muestras al azar de 50 nios recin nacidos de cada Comunidad
Autnoma, calcula la probabilidad de que la diferencia de medias de las tallas de los nios de
las muestras sea inferior a 3 cm.
Solucin :
Sabemos que las distribuciones de las tallas en las distintas comunidades son XA ,!
N (52; 6) y XB ,! N (48; 4). Entonces la diferencia entre las medias de las muestras de tamaos
n1 = n2 = 50 sigue una distribucin:
0
1
s
!
r
2
2
36
16
1
Y ,! N @ 1
+ 2 A = N 52 48 ;
+
N 4; 10 0198 :
2 ;
n1 n2
50 50
Tipicando, encontramos una variable con distribucin normal estndar:
Z=
Y 4
,! N (0; 1) :
10 0198
Entonces la probabilidad de que la diferencia entre las tallas medias de las dos muestras sea
inferior a 3 cm es:
p (Y < 3) = p
=1
12.3.4.
Y 4
3 4
< 0
0
1 0198
1 0198
p Z
00 98 = 1
=p Z<
00 98 = p Z > 00 98 =
00 8365 = 00 1635:
Supongamos ahora que queremos estimar la proporcin de votantes de un determinado partido poltico, para conocer as los resultados que obtendr en las prximas elecciones. No nos
A. Roldn
73
interesa en este momento ni la media de los votos ni su suma, sino la proporcin de votantes
que ese partido tiene, es decir, si el 20 % de la poblacin votar a ese partido. En tal caso,
tomar una muestra de n posibles votantes es como considerar una variable aleatoria binomial
P ,! B (n; p), donde n es el nmero de electores que se toma en la muestra y p es la proporcin
de votantes de dicho partido poltico. En realidad, estamos considerando como xito el que el
elector vote al partido en cuestin, y su probabilidad de xito p es precisamente el porcentaje de
votantes que tiene en la poblacin. Como lo que vote una persona es independiente de lo que
vote otra (si la muestra est bien seleccionada), la variable P sigue una distribucin binomial.
Podemos entonces tomar varias muestras de tamao n y determinar en cada una de ellas no
el nmero total de votos, sino la proporcin de votantes de dicho partido poltico en cada una
de las muestras. Surge as un estimador P^n que mide la proporcin de votantes del partido en
cada muestra de tamao n elegida aleatoriamente. Podemos entonces conocer la distribucin del
estimador P^n utilizando la aproximacin dada por el teorema de De Moivre.
9
P ,! B (n; p) >
>
>
=
p
) P
N ( P = n p ; P = n p q ):
n p 5
>
>
>
;
n q 5
P^n
P^n
n p q
=
n
p q
:
n
= p:
p q
;
n
74
(por ejemplo, si n p
5yn q
n
5):
P^n
30;
p;
p q
n
Nota 4 Cuando no se nos indique la proporcin p, supondremos que estamos en el peor caso
posible, es decir, cuando la desviacin tpica es mayor. Si hacemos un estudio de la funcin
p 2 [0; 1] 7! p (1 p), observaremos que sta tiene un mximo en el vrtice de la parbola, que
se alcanza precisamente cuando p = 00 5. Por consiguiente, si no se nos facilita la proporcin p,
supondremos que
p = 00 5:
Ejercicio 40 El 20 % de los jvenes de Guadix entre 18 y 30 aos son miopes. Calcula la
probabilidad de que en una muestra de 80 jvenes de la localidad haya:
Tipicando la variable, encontramos una que sigue una distribucin normal estndar:
Z=
P^80 00 2
,! N (0; 1) :
00 045
Para que en la muestra hubiese 20 jvenes miopes, la proporcin debera de ser de 20=80 =
00 25 = 25 %. Entonces la probabilidad de que haya menos de 20 jvenes miopes es:
!
0 25
02
^80 00 2
20
P
0
0
p P^80
= p P^80 00 25 = p
= p Z 10 11 = 00 8665:
80
00 045
00 045
Entonces la probabilidad de que haya ms de 17 jvenes miopes es:
p P^80
17
80
= p P^80
=1
A. Roldn
p Z
0 2125 = p
00 28 = 1
P^80 00 2
00 045
00 2125 00 2
00 045
00 6103 = 00 3897:
=p Z
00 28 =
75
10
80
P^80
25
80
P^80
00 3125 =
00 125 00 2
00 045
P^80 00 2
00 045
= p 00 125
=p
=p Z
20 5
p Z
=p Z
20 5
= 00 9938 + 00 9525
00 3125 00 2
00 045
10 67 = p Z
p Z
10 67
20 5
=p Z
=p
p Z
10 67
20 5 =
10 67 =
20 5 + p Z
10 67
1=
1 = 00 9463:
Ejercicio 41 El 7 % de los tornillos que fabrica una mquina son defectuosos. Si en una caja
se empaquetan 400 tornillos, calcula la probabilidad de que en ella haya:
Tipicando la variable, encontramos una que sigue una distribucin normal estndar:
Z=
P^400 00 07
,! N (0; 1) :
00 01276
Para que en la caja hubiese 35 tornillos defectuosos, la proporcin debera de ser de 35=400 =
00 0875. Entonces la probabilidad de que haya ms de 35 tornillos defectuosos es:
!
0 0875
0 07
^400 00 07
35
P
0
0
0
p P^400
= p P^400 0 0875 = p
= p Z 10 37 =
400
00 01276
00 01276
=1
p Z
10 37 = 1
00 9147 = 00 0853:
A. Roldn
76
Por otro lado, la probabilidad de que haya menos de 22 tornillos defectuosos es:
!
0 055
0 07
^400 00 07
P
0
0
22
= p P^400 00 055 = p
=p Z
p P^400
400
00 01276
00 01276
=p Z
10 18 = 1
10 18 = 1
p Z
10 18 =
00 881 = 00 119:
10
400
P^400
30
400
= p 00 025
=p
P^400
00 025 00 07
00 01276
=p
30 53
00 075 =
P^400 00 07
00 01276
00 39 = p Z
=p Z
00 39
=p Z
00 39 + p Z
p Z
00 075 00 07
00 01276
00 39
30 53 = p Z
30 53
30 53 =
p Z
00 39
1 = 00 6517 + 00 9999
p Z
30 53
1 = 00 6516:
10 57
= 00 9906 + 00 9418
20 35 = : : : = p Z
20 35 + p Z
10 57
1=
1 = 00 9324:
Solucin :
Sea X la variable aleatoria que mide el nmero de caras obtenidas al lanzar 256 veces
una moneda. Evidentemente, X ,! B (256; 00 5). Sea ahora P^200 = X=256 la proporcin de caras
que salen en 200 lanzamientos. Sabemos que
!
r
r
0 5 00 5
p
q
0
0
= N 0 5;
N 00 5; 00 03125
P^256
N p;
n
256
Tipicando la variable, encontramos una que sigue una distribucin normal estndar:
Z=
A. Roldn
P^256 00 5
,! N (0; 1) :
00 03125
77
00 52 = p
=1
12.3.5.
P^256 00 5
00 03125
00 52 00 5
00 03125
00 64 = 1
p Z
00 64 =
=p Z
00 7389 = 00 2611:
Tabla resumen
Muestreo
Condicin
Medias muestrales
30
Sumas muestrales
30
Diferencia de medias
n1 ; n 2
n
Proporcin
30
30
n p
n q
Distribucin aproximada
Xn
Tn
N@
P^n
;p
N
N (n
1
p;
2
1
n1
n)
2
2
n2
1
A
p q
n
A. Roldn