Você está na página 1de 21

Captulo 12

Teora de muestras
Consideremos las tres siguientes cuestiones.

z Las estaturas de todos los alumnos del instituto Acci siguen una distribucin (normal) de
media = 150 cm y desviacin tpica = 4 cm. Se han seleccionado al azar 35 alumnos
y alumnas para participar en un programa de televisin. Cul es la probabilidad de que
la estatura media de los seleccionados est entre 149 y 151 cm?
z La estatura media de los 35 alumnos y alumnas del instituto Acci seleccionados al azar para
participar en un programa de televisin es de x = 150 cm. Cul es la probabilidad de que
la estatura media de todos los alumnos y alumnas del instituto est entre 149 y 151 cm?
z Se quiere comprobar si la estatura media de los alumnos y alumnas del instituto Acci es de
150 cm. Para ello, se toma una muestra al azar de 35 alumnos y alumnas y determinamos
que su media es x = 1500 9 cm. Es razonable admitir que la media poblacional es =
150 cm?

En el primer problema conocemos los datos de la poblacin y nos preguntamos sobre los
correspondientes a una muestra aleatoria. Este problema se enmarca dentro de la teora de
muestras y es tema de estudio durante el presente captulo. En el segundo problema ocurre
al contrario: conocemos el comportamiento de una muestra y tratamos de inferir datos acerca
de toda la poblacin. Este proceso se llama inferencia estadstica y nos ocuparemos de ella
en el siguiente captulo. Finalmente, en el tercer problema realizamos una hiptesis sobre un
parmetro poblacional y tratamos de estudiar su validez a travs del estudio de una muestra.
Este problema est dentro del mbito del denominado contrate de hiptesis y se sale de las
expectativas del curso (aunque, si te interesa, puedes leer sobre el tema en el libro de texto).
57

58

12.1.

CAPTULO 12. TEORA DE MUESTRAS

Muestreo

Llamaremos poblacin (o universo) al conjunto de todos los elementos que poseen una determinada caracterstica. Una poblacin puede no estar formada slo por personas, sino tambin
por animales y objetos. Por ejemplo, podemos hablar de la poblacin de ranas de una determinada laguna o de la poblacin de coches de Guadix. En este ltimo caso, podemos estudiar el peso
de los coches o su antigedad en aos. Cada uno de los elementos de la poblacin se denomina
individuo. Por motivos que ya expondremos, en general, supondremos que la poblacin es muy
grande.
Para inferir informacin sobre la poblacin, es usual tomar una muestra. Llamaremos muestra a cualquier subconjunto de la poblacin. El tamao de una muestra es el nmero de
individuos que la componen (tambin se puede hablar del tamao de la poblacin entera). Se
suele recurrir a una muestra por distintas razones: porque la poblacin es excesivamente amplia (queremos medir el peso de todas las hormigas del planeta), porque la poblacin es muy
difcil de controlar (las ballenas que surcan el Ocano Pacco), porque el proceso de medicin
es destructivo (queremos saber la resistencia de una copa de cristal de bohemia, pero cada vez
que medimos rompemos una de ellas), porque se desea conocer informacin rpidamente (por
ejemplo, los sondeos electorales), etc.
Seleccionar una muestra es un procedimiento muy sencillo: slo hay que tomar una parte
cualquiera, por ejemplo, un individuo. Pero en la mayora de las ocasiones, nos interesa que
la muestra sea representativa de la poblacin, es decir, manieste en algn sentido el mismo
comportamiento que la poblacin total. Si la muestra est mal elegida, se producen errores
adicionales imprevistos e incontrolables llamados sesgos. Por ello, no es tan fcil encontrar
una muestra que manieste el comportamiento global de la poblacin. Llamaremos muestreo
al proceso mediante el cual se escoge una muestra de la poblacin. En lo sucesivo, nos har
falta que la muestra sea lo sucientemente grande como para poder ser representativa, pero,
qu signica una muestra grande? Fijamos un criterio general: llamaremos muestra grande
a aquella que tiene 30 ms individuos, y llamaremos muestra pequea a la de menos de 30
individuos. En muchas ocasiones utilizaremos la terminologa muestra sucientemente grande.
Existen distintos tipos de muestreo. El ms adecuado es el muestreo aleatorio, que es aqul
en el que todos los individuos de la muestra se eligen al azar y, de este modo, tienen la misma
probabilidad, a priori, de ser elegidos. Dentro de este tipo de muestreo, podemos considerar los
siguientes tipos:
I Muestreo aleatorio simple: es el ms sencillo y en l se basan todos los dems. Consiste
en numerar uno a uno los N elementos de la poblacin y despus hacer un sorteo para
seleccionar los n individuos de la muestra. El muestreo aleatorio simple suele llevarse a
A. Roldn

12.1. Muestreo

59

cabo por insaculacin (que proviene del latn meter en un saco), es decir, asignando a cada
individuo una papeleta o nmero que se introduce en un recipiente de tal forma que se van
sacando una a una las papeletas de los seleccionados. A este particular, es fundamental
observar si el sorteo se hace con o sin reemplazamiento.
I Muestreo aleatorio estraticado: este muestreo se realiza cuando la poblacin, de manera
natural, est dividida en ciertas capas, llamadas estratos (por ejemplo, los alumnos de la
ESO estn clasicados de 1o a 4o en cuatro estratos), y es dentro de stos subconjuntos
donde realizamos un muestreo aleatorio simple para seleccionar la muestra.
I Muestreo aleatorio sistemtico: este tipo de muestreo consiste en numerar a todos los
individuos de la poblacin y se elige a uno concreto (llamado origen) de ellos por sorteo.
A partir de l, y siguiendo un coeciente de elevacin (de tres en tres, de cinco en cinco,
etc.) se seleccionan los dems elementos que compondrn la muestra. Este coeciente debe
ser h = N=n. Por ejemplo, si en una poblacin de 100 individuos queremos seleccionar a
10 de ellos, sorteamos el primero entre el 1 y el 10, y si ha salido el 3, la muestra estar
formada por los individuos que ocupen las posiciones 3, 13, 23, 33,. . . , 93.
I Muestreo aleatorio por conglomerados y reas: este tipo de muestreo se realiza cuando
la poblacin est de manera natural dividida en ciertos subconjuntos, ahora llamados
conglomerados, que se numeran y se sortean. Una vez que se ha elegido un conglomerado,
se selecciona a todos los individuos que lo forman para participar en la muestra.
Hay alguna diferencia entre los conceptos de estrato y conglomerado. La principal est
en que los estratos deben estar formados por individuos que representan homogneamente
a la poblacin, es decir, comparten la caracterstica con la que se divide a la poblacin.
Sin embargo, los conglomerados deben ser heterogneos y admitir en ellos a toda una
representacin variada de la poblacin. Por eso se seleccionan individuos de diferentes
estratos (para que haya representatividad de las diferentes opciones) pero a todos los
individuos de un cierto conglomerado.
Dentro del muestreo aleatorio estraticado, es usual que jemos a priori o bien el porcentaje
que se va a seleccionar en cada estrato (en este caso se habla de muestreo aleatorio estraticado
con ajacin proporcional) o bien el tamao total de la muestra que se desea (y lo interesante
es ver cuntos individuos se seleccionan dentro de cada estrato). Realmente, si lo pensamos,
llegamos al mismo resultado, pero por diferentes caminos. Veamos dos ejercicios parecidos.
Ejercicio 27 En un pueblo pequeo hay 2000 hombres y 3000 mujeres. Indica cmo se debe
tomar una muestra formada por 80 personas.
Solucin :

En este caso hay dos estratos, compuestos uno por hombres y otro por mujeres. Como
queremos 80 personas en la muestra, establecemos las siguientes proporciones (que se resuelven
A. Roldn

60

CAPTULO 12. TEORA DE MUESTRAS

con simples reglas de tres)


Poblacin

n
80
n1
n2
=
=
=
N
5000
2000
3000
(
n1 = 32
)
n2 = 48

Muestra

Hombres

2000

n1

Mujeres

3000

n2

TOTAL

N = 5000

n = 80

Esto signica que hay que seleccionar 32 hombres y 48 mujeres, y, dentro de cada estrato,
proceder a un muestreo aleatorio simple.
Ejercicio 28 En un pueblo pequeo hay 2000 hombres y 3000 mujeres. Indica cmo se debe
tomar una muestra formada por el 3 % de la poblacin.

Solucin :

En este caso debemos elegir el 3 % de los hombres, es decir, 60 de ellos, y tambin


el 3 % de las mujeres, o sea, 90 de ellas. As, la muestra estar formada por 150 personas y, en
cada estrato, hay que hacer un muestreo aleatorio simple.

Realmente, los dos ejercicios anteriores son equivalentes. En el primero, nos piden tomar una
muestra de 80 personas, lo que supone un 80=5000 = 10 6 % de la poblacin. En el segundo, nos
piden que la muestra contenga al 3 % de la poblacin, lo que supone un tamao de 3 % 5000 =
150 personas. En ambos casos hay ajacin proporcional.
En los dos ejercicios anteriores, el nmero de individuos que se deben tomar en cada estrato
ha resultado ser exacto. Cuando aparecen decimales, tenemos que redondear las partes decimales
ms altas segn nos interese. Veamos un ejemplo.
Ejercicio 29 Los 640 alumnos y alumnas de la ESO del instituto Acci se reparten de la siguiente
manera: 102 en 1o , 197 en 2o , 218 en 3o y 123 en 4o . Se quiere seleccionar a 40 de ellos para
participar en un concurso de televisin. Indica cmo los seleccionaras.

Solucin :

Establecemos la proporcin y calculamos, con algunos decimales, cuntos individuos


tomaramos en cada estrato.
40
n1
n2
n3
n4
n
=
=
=
=
=
N
640
102
197
218
123

n1

60 38; n2

120 31; n3

130 63; n4

70 69:

Seleccionamos las partes enteras de estos nmeros: 6 alumnos/as de 1o , 12 de 2o , 13 de 3o y 7 de


4o . Entre todos, suman 38 alumnos/as, y nosotros queremos seleccionar 40. Cmo elegir los dos
que faltan? Miraremos las partes decimales y subiremos aquellas dos que sean mayores. En este
caso, la parte decimal ms alta es 00 79 (que corresponde a 4o ), por lo que tomaremos 8 alumnos/as
de 4o ; la segunda ms alta es 00 63 (que corresponde a 3o ), por lo que tomaremos 14 alumnos/as
A. Roldn

61

12.2. El teorema central del lmite

de 3o . As, denitivamente, la seleccin debe estar formada por 6 alumnos/as de 1o de ESO, 12


de 2o , 14 de 3o y 8 de 4o . Por supuesto, ahora dentro de cada nivel realizaremos un muestreo
aleatorio simple (numeraremos al alumnado y sortearemos los nmeros que correspondern a los
individuos seleccionados).
Ejercicio 30 Indica el tamao que se debe tomar de cada curso en un colegio con la siguiente
distribucin:
(a) 426 alumnos en 1o , 359 en 2o , 267 en 3o , 133 en 4o y 115 en 5o , seleccionando en total 100
alumnos;
(b) 853 alumnos en 1o , 512 en 2o , 321 en 3o , 204 en 4o y 110 en 5o , seleccionando en total 120
alumnos.
En el primer caso se tomarn 33 alumnos de 1o , 28 de 2o , 20 de 3o , 10 de 4o y 9 de
5o ; en el segundo colegio, 51 de 1o , 31 de 2o , 19 de 3o , 12 de 4o y 7 de 5o .

Solucin :

Ejercicio 31 Una ciudad de 2000 habitantes est poblada por personas de pelo negro, rubio
y castao. Se han seleccionado, mediante muestreo aleatorio estraticado con ajacin proporcional, una muestra constituida por 28 personas de pelo negro, 32 de pelo rubio y 20 de pelo
castao. Determina cul es la composicin, segn el color de pelo, de los habitantes de esta
ciudad.

Solucin :

Ahora la tabla se hace al revs, pero todo es similar.


Poblacin

Muestra

Negro

n1

28

Rubio
Castao

n2
n3

!
!

32
20

TOTAL

N = 2000

12.2.

n
80
28
32
20
=
=
=
=
N
2000
n1
n2
n3
)

n1 = 700; n2 = 800; n3 = 500:

n = 80

El teorema central del lmite

Supongamos que deseamos estudiar la media que se obtiene al lanzar un dado, dos dados,
tres dados, etc. Si lanzamos un nico dado, podemos obtener seis resultados posibles, todos ellos
equiprobables. As tenemos la siguiente distribucin de probabilidad de los datos que se pueden
A. Roldn

62

CAPTULO 12. TEORA DE MUESTRAS

obtener:
1 dado
xi

pi

1
6
1
6
1
6
1
6
1
6
1
6

2
3
4
5
6

p 0.2
0.1

0.0
2

Un dado.

1
La variable X1 (que mide el resultado al lanzar un dado) sigue una distribucin discreta uniforme
de media X1 = 30 5.
Si lanzamos dos dados y la variable X2 mide la media aritmtica de los resultados obtenidos,
el espacio muestral se modica con los puntos medios entre los nmeros naturales del 1 al 6, y
cambian las probabilidades de los mismos:
2 dados

2 dados
x=

x1 +x2
2

3
2

5
2

7
2

3
2

5
2

7
2

5
2

7
2

9
2

5
2

7
2

9
2

7
2

9
2

11
2

7
2

9
2

11
2

2 dados
xi

pi

1
36
2
36
3
36
4
36
5
36

3
2

2
5
3

xi

pi

7
2

6
36
5
36
4
36
3
36
2
36
1
36

4
9
2

5
11
2

Al representar el correspondiente diagrama de barras con las probabilidades asociadas, tenemos:

p 0.2
0.1

0.0
2

Media de dos dados.


A. Roldn

63

12.2. El teorema central del lmite

Si repetimos el experimento con tres, cuatro y cinco dados, observamos que la distribucin de
probabilidad va adquiriendo una forma caracterstica, manteniendo en todo momento su media
X = 30 5.

p 0.2

p 0.2

0.1

0.1

0.0

0.0
2

Media de tres dados.

Media de cuatro dados.

De esta forma, las variables que intervienen son discretas, pero su espacio muestral poco a
poco se llena de fracciones entre los nmeros 1 y 6. Qu pasar cuando hacemos crecer el nmero
de dados? La respuesta es bien sencilla y viene dada por el teorema central del lmite (12.2.1):
la distribucin de probabilidad tiende a la de una variable normal de la misma media. Adems,
su desviacin tpica estar bien controlada y cuanto mayor sea n, mejor ser la aproximacin.
Teorema 12.2.1 (Central del Lmite) Dada una poblacin de media y desviacin tpica
(no necesariamente normal), la distribucin de las medias muestrales Xn de tamao n
verica:

1. Tiene la misma media que la poblacin completa:


Xn

= :

2. Su desviacin tpica es
Xn

=p ;
n

y, por tanto, disminuye al aumentar n.


3. A medida que n crece, la distribucin de las medias muestrales se aproxima a una normal
(es casi normal cuando n 30)
n

30;

Xn

;p

Es muy importante aprender a interpretar lo que dice exactamente el teorema anterior. Este
teorema viene a medir los parmetros de la variable aleatoria que mide la media aritmtica
A. Roldn

64

CAPTULO 12. TEORA DE MUESTRAS

cuando se toma de la poblacin una muestra de tamao n. En tal caso, la media de esta nueva
variable se conserva: es siempre la de la poblacin de partida. En segundo lugar, su desviacin
p
tpica es la de partida dividida entre n. Este denominador juega un papel fundamental pues
a medida que crece, hace que la desviacin tpica Xn sea cada vez menor y, as, los datos de
la distribucin de la medias tienden a estar ms concentrados alrededor de su media aritmtica. Finalmente, esta distribucin, que en principio nada tiene que ver con la normal, termina
parecindose a la de una distribucin normal cuando el tamao de la muestra as lo permite.
Hacemos algunos comentarios interesantes sobre el teorema central del lmite 12.2.1 y su
interpretacin.

Este teorema es vlido cualquiera que sea la distribucin de la poblacin de partida, tanto
si es discreta como si es continua. Por eso es curioso que sea como sea la poblacin
de partida, la distribucin de las medias muestrales siempre tiende a parecerse a una
distribucin normal.
Cmo se puede extraer una muestra de tamao 1000 en una clase que tiene solamente 15
alumnos? Slo hay una respuesta posible: la extraccin de la muestra se entender siempre
con reemplazamiento. Es lo mismo que ocurre con un dado. Si lanzamos dos dados, los
posibles valores se pueden repetir en un dado y en el otro. Es como si sacamos una carta de
una baraja de 6 cartas, la miramos, la devolvemos y volvemos a sacar otra. La operacin
se realiza siempre con reemplazamiento. As podemos lanzar mil dados o mil veces un
dado. Si hay reemplazamiento, perfectamente podemos sacar una muestra de tamao 1000
en una poblacin que slo tiene 15 individuos distintos. Podemos eludir la hiptesis del
reemplazamiento si suponemos que la poblacin es muy grande, como ya comentamos al
inicio del captulo.
La necesidad de hacer reemplazamiento surge del hecho de que la distribucin de las
medias muestrales se aproxima a la normal cuando la muestra es sucientemente grande,
y ya jamos como criterio que llamaramos muestra grande a aquella que tiene 30 ms
individuos. Precisamente escogimos el nmero 30 porque es el que aparece usualmente en
el teorema central del lmite.
Utilizando la media y la desviacin tpica de la poblacin, el teorema anterior trata de
inferir informacin sobre la media x de una muestra de tamao grande. Desde luego, y
x pueden no coincidir, pero el teorema anterior arma que cuanto mayor es n, ms cerca
p
est x de , ya que la desviacin tpica Xn = = n tiende a ser cero, y los datos de la
muestra estaran muy agrupados.
Si la poblacin de partida es normal, tambin es normal la distribucin de las medias
muestrales de cualquier tamao n. Por eso, si sabemos que partimos de una poblacin
A. Roldn

65

12.2. El teorema central del lmite

normal, podemos aplicar los dos primeros apartados a la distribucin de las medias de
tres, ocho o veinte elementos.
Hay ocasiones en que se sigue cumpliendo el teorema central del lmite an cuando la
poblacin de partida no es normal y se toma una muestra de tamao pequeo. A este
respecto, vanse los ejercicios 32 y 33.
Ejercicio 32 En una urna hay tres bolas numeradas con los nmeros 2, 4 y 6.
(a) Calcula la media y la desviacin tpica de la variable que mide el nmero que sale al sacar
una bola.
(b) Calcula la media y la desviacin tpica de la variable que mide la media que se obtiene al
sacar dos bolas con reemplazamiento.
(c) Cmo se relacionan los parmetros anteriores?
Solucin :

Evidentemente, la media y la desviacin tpica de la variable X que mide el nmero


que puede salir en la bola se calculan con la siguiente tabla:
xi

ni

xi ni

x2i ni

2
4
6

1
1
1

2
4
6

4
16
36

12

56

8
>
>
>
<
>
>
>
:

12
= 4;
3
r
r
56
8
=
42 =
:
3
3
=

Calculemos ahora todas las posibilidades que tenemos al extraer dos nmeros (con reemplazamiento):
E2 = f (2; 2) ; (2; 4) ; (2; 6) ; (4; 2) ; (4; 4) ; (4; 6) ; (6; 2) ; (6; 4) ; (6; 6) g :
Haciendo la media de los dos nmeros obtenidos, tenemos la siguiente tabla y parmetros:
xi

ni

xi ni

x2i ni

2
3
4
5
6

1
2
3
2
1

2
6
12
10
6

4
18
48
50
36

36

156

8
>
>
>
<
>
>
>
:

X2

X2

36
= 4;
9
r
r
156
4
=
42 =
:
9
3
=

Qu relacin existe entre los parmetros de X = X1 y X2 ? Por un lado, es claro que ambas
disponen de la misma media, pues X2 = 4 = X . Pero adems, se verica que
r
r
p
8=3
8
4
X
p = p =
=
= X2 :
6
3
n
2
A. Roldn

66

CAPTULO 12. TEORA DE MUESTRAS

Por consiguiente, las relaciones que se indican en el teorema central del lmite 12.2.1 se siguen
conservando en este caso aun cuando las poblaciones de partida no son normales y el tamao
de las muestras que se toman es n = 2, claramente inferior a 30.
Ejercicio 33 Responder a las mismas cuestiones si hay cuatro bolas con los nmeros 22, 24,
28 y 30.

12.3.

Distribuciones en el muestreo

Recapacitando sobre el teorema central del lmite, aprovechamos para hacernos otras preguntas. La primera de ellas puede ser la siguiente: cundo se puede aplicar dicho teorema y
para qu sirve? Un primer ejemplo: para fabricar sillas. No todas las personas que se sientan
en una silla tienen la misma estatura. Cmo fabricarla de un tamao medio para que pueda
utilizarla la mayor cantidad de gente, por ejemplo en un colegio o en un cine? Si la muestra
es lo sucientemente grande, la media de las estaturas de las personas que en ellas se sienten
tender a la media poblacional que puede conocerse, quiz, a travs del Instituto Nacional de
Estadstica.
Y si no me interesa slo la media, sino la suma de todas las observaciones? Es el caso que
puede presentarse en el equipaje de un avin. Cada pasajero lleva una maleta que puede pesar
hasta 50 kg. Puede ser interesante calcular la media pero an es ms interesante calcular su
suma, pues es el peso total el que podra derribar el avin. Si este peso siguiese una distribucin
normal, podramos evaluar la posibilidad de que en un vuelo concreto se superase el peso mximo
permitido.
Y si nos interesase comparar las notas de Selectividad de dos universidades? Podramos
restar sus medias para evaluar la posibilidad de que una sea mayor que la otra en un curso
determinado. Y si queremos establecer los resultados que obtendr un partido poltico en las
prximas elecciones? Puede todo ello deducirse del teorema central del lmite? En los siguientes
apartados resolvemos algunas de estas cuestiones.

12.3.1.

Distribucin en el muestreo de la media

Estudiar el muestreo de la media es estudiar la distribucin de probabilidad de las medias


muestrales de tamao n. Precisamente, es lo que hemos estudiado a travs del teorema central
del lmite. Por eso a nadie le extraa ya el siguiente enunciado.
Teorema 12.3.1 (Muestreo de la media) La distribucin de las medias muestrales Xn
A. Roldn

67

12.3. Distribuciones en el muestreo

de tamao n a partir de una poblacin de media


normal), verica:

y desviacin tpica

(no necesariamente

1. Tiene la misma media que la poblacin completa:


Xn

= :

2. Su desviacin tpica es
Xn

=p ;
n

y, por tanto, disminuye al aumentar n.


3. A medida que n crece, la distribucin de las medias muestrales se aproxima a una normal
(es casi normal cuando n 30)
n

30;

Xn

;p

Como se puede observar, este teorema no es ms que el teorema central del lmite (12.2.1).
Veamos cmo utilizarlo.
Ejercicio 34 En una ciudad, la estatura media de sus habitantes tiene una desviacin tpica
de 8 cm. Si la estatura media de dichos habitantes fuera de 175 cm, cul sera la probabilidad
de que la estatura media de una muestra de 100 individuos tomada al azar fuese superior a 176
cm?
Solucin :

Sea X la variable que mide la estatura de un individuo elegido al azar en la poblacin.


Segn los datos del problema, X sigue una distribucin de media = 175 cm y desviacin tpica
= 8 cm (obsrvese que quiz no sea una variable con distribucin normal). Al tomar una
muestra de tamao n = 100, la distribucin de la media muestral es, aproximadamente,
X100

;p

=N

175; p

8
100

= N 175; 00 8 :

Tipicando, encontramos una variable con distribucin normal estndar:


Z=

X100 175
,! N (0; 1) :
00 8

Entonces, la probabilidad de que la estatura media de la muestra sea superior a 176 cm es:
p X100 > 176 = p
=1

X100 175
176 175
>
00 8
00 8

= p Z > 10 25 = 1

p Z

10 25 =

00 8944 = 00 1056:

A. Roldn

68

CAPTULO 12. TEORA DE MUESTRAS

Ejercicio 35 En una distribucin N (20; 6), cul es la probabilidad de que la media de una
muestra de tamao 64 est comprendida entre 19 y 21?
Solucin :

Como la poblacin de partida es normal, todas las distribuciones de las medias de


cualquier tamao tambin son normales. En este caso:
X64 ,! N

;p

=N

6
20; p
64

= N 20; 00 75 :

Tipicando, encontramos una variable con distribucin normal estndar:


Z=

X64 20
,! N (0; 1) :
00 75

Entonces, la probabilidad de que la media de la muestra est entre 19 y 21 es:


p 19

X64

21 = p

19 20
00 75

X64 20
00 75

=p Z

10 33

p Z

=p Z

10 33

= 2 00 9082

21 20
00 75

=p

10 33 = p Z
p Z

10 33

10 33

10 33

=2 p Z

10 33 =

p Z

10 33 =

10 33

1=

1 = 00 8164:

Ejercicio 36 Una mquina envasa bolsas de sal con una media de 500 gr y una desviacin
tpica de 35 gr. Las bolsas se empaquetan en cajas de 150 unidades.
(a) Calcula la probabilidad de que la media de los pesos de las bolsas de una caja sea menor de
495 gr.
(b) Si un hipermercado compra 400 cajas de 150 unidades cada una, cuntas cajas espera que
estn formadas por bolsas cuya media de pesos sea menor de 495 gr?
Solucin :

Sea X la variable aleatoria que mide el peso de cada bolsa de sal. Segn los datos
del problema, la distribucin de X posee una media de = 500 gr y una desviacin tpica de
= 35 gr (aunque no sea necesariamente normal). Se toman cajas con n = 150 bolsas. Entonces
la variable X150 que mide la media de los pesos de las bolsas de una caja posee distribucin:
X150 ,! N

;p

=N

35
500; p
150

N 500; 20 8577 :

Tipicando, encontramos una variable con distribucin normal estndar:


Z=
A. Roldn

X150 500
,! N (0; 1) :
20 8577

69

12.3. Distribuciones en el muestreo

Entonces, la probabilidad de que la media de los pesos de las bolsas de una caja sea menor de
495 gr es:
p X150 < 495 = p

X150 500
495 500
<
20 8577
20 8577

= p Z > 10 75 = 1

=p Z<

10 75 = 1

p Z

10 75 =

00 9599 = 00 0401:

Si un hipermercado compra 400 cajas y la probabilidad de que la media en una de ellas sea
menor de 495 gr es del 40 01 %, entonces es de esperar que
40 01 % de 400 cajas = 160 04 cajas

16 cajas

estn en esta situacin.


Ejercicio 37 (Selectividad 2006) Un fabricante produce tabletas de chocolate cuyo peso en
gramos sigue una ley Normal de media 125 gr y desviacin tpica 4 gr.
a) Si las tabletas se empaquetan en lotes de 25, cul es la probabilidad de que el peso medio de
las tabletas de un lote se encuentre entre 124 y 126 gr?
b) Si los lotes fuesen de 64 tabletas, cul sera la probabilidad de que el peso medio de las
tabletas del lote superase los 124 gramos?
Solucin :

Sea X la variable aleatoria que mide el peso de las tabletas de chocolate. Segn los
datos, X ,! N ( = 125; = 4). Entonces la variable X25 que mide el peso medio de n = 25
tabletas (elegidas al azar) sigue una distribucin
X25 ,! N

;p

=N

125;

4
5

= N 125; 00 8 :

As, la probabilidad de que el peso medio de 25 tabletas de chocolate est entre 124 gr y 126 gr
es, tipicando para poder utilizar la tabla de la normal estndar Z ,! N (0; 1) de colas a la
izquierda,
p 124 < X25 < 126 = p

124 125
X25 125
126 125
<
<
0
0
08
08
00 8

= p Z < 10 25
= p Z < 10 25
= 2 00 8944

p Z<
1

=p

10 25 = p Z < 10 25

p Z < 10 25

10 25 < Z < 10 25 =
p Z > 10 25 =

= 2p Z < 10 25

1=

1 = 00 7888:

Igualmente, si se toma una muestra de n = 64 tabletas de chocolate, la media sigue una


distribucin
4
X64 ,! N
;p
= N 125;
= N 125; 00 5 :
8
n
A. Roldn

70

CAPTULO 12. TEORA DE MUESTRAS

Entonces
p X64 > 124 = p

12.3.2.

X64 125
124 125
>
00 5
00 5

= p (Z >

2) = p (Z < 2) = 00 9772:

Distribucin en el muestreo de las sumas muestrales

En ocasiones, puede ser ms interesante calcular las sumas muestrales que las medias, como
en el caso del avin que ya hemos comentado. En este caso queremos estudiar una variable que
es suma de n variables idnticas a la de partida: Tn = X1 + X2 + : : : + Xn . Si conocemos la
distribucin de las medias muestrales a travs del teorema (12.3.1), slo tenemos que multiplicar
por n para obtener los nuevos parmetros:
Xn

Xn

=p

)
n

Tn

=n
Tn

Xn

=n

=n

Xn

=n p =
n

n:

As tenemos el siguiente teorema.


Teorema 12.3.2 (Muestreo de las sumas) La distribucin de las sumas muestrales Tn
de tamao n a partir de una poblacin de media y desviacin tpica (no necesariamente
normal), verica:

1. Su media es:
Tn

=n

2. Su desviacin tpica es:


Tn

n:

3. A medida que n crece, la distribucin de las sumas muestrales se aproxima a una normal
(es casi normal cuando n 30)
n

30;

Tn

n :

Ejercicio 38 Un avin con capacidad para 120 pasajeros acepta una carga mxima de 2400 kg
en equipaje. Se sabe que la distribucin del peso del equipaje de cada pasajero tiene 19 kg de
media y 4 kg de desviacin tpica. Calcula la probabilidad de que el avin no pueda despegar
debido al peso del equipaje cuando va completo.
A. Roldn

71

12.3. Distribuciones en el muestreo


Solucin :

La variable que mide el peso de cada equipaje tiene una media de = 19 kg y una
desviacin tpica de = 4 kg. Si el avin va completo, se ha tomado una muestra de n = 120
pasajeros, y la suma de todos los pesos de los 120 equipajes sigue una distribucin:
p
p
n = N 120 19 ; 4
120
N 2280; 430 82 :
T120
N n
;
Tipicando encontramos una variable con distribucin normal estndar:
Z=

T120 2280
,! N (0; 1) :
430 82

Entonces la probabilidad de que el avin no pueda despegar a causa del peso del equipaje es de:
p (T120 > 2400) = p
=1

2400 2280
T120 2280
>
430 82
430 82
p Z

20 74 = 1

= p Z > 20 74 =

00 9969 = 00 0031:

Por consiguiente, hay una probabilidad del 00 31 % de que el avin no pueda despegar debido al
excesivo peso del equipaje.

12.3.3.

Distribucin en el muestreo de la diferencia de medias

Supongamos que tenemos dos poblaciones de inicio, representadas por las variables aleatorias,
X1 y X2 , de medias respectivas 1 y 2 , y de desviaciones tpicas 1 y 2 (ya sean normales o
no). Supongamos que queremos obtener informacin sobre la diferencia de las respectivas medias
de sendas muestras de tamaos n1 y n2 , respectivamente. Para ello, se toma una muestra de
tamao n1 de X1 , y se calcula su media x1 , y se hace lo mismo con la otra, x2 , con una muestra
de tamao n2 . Si restamos estas dos medias, x1 x2 , tenemos un primer valor que toma la
variable diferencia entre las medias de las dos poblaciones. Cuando este proceso se repite una y
otra vez, podemos estimar la diferencia entre las medias muestrales
x1

x2 ;

x01

x02 ;

x001

x002 ; : : :

Estos valores dan lugar a una nueva variable aleatoria, cuya distribucin se denomina distribucin
en el muestreo de la diferencia de medias. Sus caractersticas principales son las siguientes.
Teorema 12.3.3 (Muestreo de la diferencia de medias) La distribucin en el muestreo
de la diferencia de medias Y entre dos poblaciones X1 y X2 (no necesariamente normales)
de medias 1 y 2 , respectivamente, y desviaciones tpicas 1 y 2 , cuando se toman muestras
de tamaos n1 y n2 , tiene las siguientes caractersticas.
1. Su media es la diferencia entre las respectivas medias:
Y

2:

A. Roldn

72

CAPTULO 12. TEORA DE MUESTRAS

2. Su varianza es la suma de las varianzas de sus respectivas medias de tamaos n1 y n2 , por


lo que su desviacin tpica es:
s
Y

2
1

n1

2
2

n2

3. A medida que n1 y n2 crecen, la distribucin de las diferencias muestrales se aproxima a


una normal (es casi normal cuando n1 ; n2 30)
0
1
s
n1 ; n 2

30;

N@

2
1

n1

2
2

n2

A:

Ejercicio 39 Se sabe que la talla de los nios recin nacidos en la Comunidad Autnoma A
se distribuye segn una N (52; 6), mientras que en la Comunidad Autnoma B se distribuyen
segn una N (48; 4). Si se toman muestras al azar de 50 nios recin nacidos de cada Comunidad
Autnoma, calcula la probabilidad de que la diferencia de medias de las tallas de los nios de
las muestras sea inferior a 3 cm.

Solucin :

Sabemos que las distribuciones de las tallas en las distintas comunidades son XA ,!
N (52; 6) y XB ,! N (48; 4). Entonces la diferencia entre las medias de las muestras de tamaos
n1 = n2 = 50 sigue una distribucin:
0
1
s
!
r
2
2
36
16
1
Y ,! N @ 1
+ 2 A = N 52 48 ;
+
N 4; 10 0198 :
2 ;
n1 n2
50 50
Tipicando, encontramos una variable con distribucin normal estndar:
Z=

Y 4
,! N (0; 1) :
10 0198

Entonces la probabilidad de que la diferencia entre las tallas medias de las dos muestras sea
inferior a 3 cm es:
p (Y < 3) = p
=1

12.3.4.

Y 4
3 4
< 0
0
1 0198
1 0198
p Z

00 98 = 1

=p Z<

00 98 = p Z > 00 98 =

00 8365 = 00 1635:

Distribucin en el muestreo de una proporcin

Supongamos ahora que queremos estimar la proporcin de votantes de un determinado partido poltico, para conocer as los resultados que obtendr en las prximas elecciones. No nos
A. Roldn

73

12.3. Distribuciones en el muestreo

interesa en este momento ni la media de los votos ni su suma, sino la proporcin de votantes
que ese partido tiene, es decir, si el 20 % de la poblacin votar a ese partido. En tal caso,
tomar una muestra de n posibles votantes es como considerar una variable aleatoria binomial
P ,! B (n; p), donde n es el nmero de electores que se toma en la muestra y p es la proporcin
de votantes de dicho partido poltico. En realidad, estamos considerando como xito el que el
elector vote al partido en cuestin, y su probabilidad de xito p es precisamente el porcentaje de
votantes que tiene en la poblacin. Como lo que vote una persona es independiente de lo que
vote otra (si la muestra est bien seleccionada), la variable P sigue una distribucin binomial.
Podemos entonces tomar varias muestras de tamao n y determinar en cada una de ellas no
el nmero total de votos, sino la proporcin de votantes de dicho partido poltico en cada una
de las muestras. Surge as un estimador P^n que mide la proporcin de votantes del partido en
cada muestra de tamao n elegida aleatoriamente. Podemos entonces conocer la distribucin del
estimador P^n utilizando la aproximacin dada por el teorema de De Moivre.
9
P ,! B (n; p) >
>
>
=
p
) P
N ( P = n p ; P = n p q ):
n p 5
>
>
>
;
n q 5

Como P^n = P=n, los nuevos parmetros de P^n sern


n p
=
=
= p;
n
n
P

P^n

P^n

n p q
=
n

p q
:
n

Esto es bsicamente lo que arma el siguiente teorema.


Teorema 12.3.4 (Muestreo de la proporcin muestral) Si en una poblacin la proporcin de individuos que posee una cierta caracterstica es p, la proporcin P^n de individuos con
dicha caracterstica en las muestras de tamao n es una variable aleatoria con los siguientes
parmetros:

1. Su media es la proporcin de individuos de la poblacin con dicha caracterstica:


P^n

= p:

2. Su desviacin tpica es:


P^n

p q
;
n

donde q = 1 p es la proporcin de individuos de la poblacin que carecen de la caracterstica estudiada.


3. A medida que n crece, la distribucin de las proporciones muestrales se aproxima a una
normal (es casi normal cuando n 30) siempre que p no se acerque ni a cero ni a uno
A. Roldn

74

CAPTULO 12. TEORA DE MUESTRAS

(por ejemplo, si n p

5yn q
n

5):
P^n

30;

p;

p q
n

Nota 4 Cuando no se nos indique la proporcin p, supondremos que estamos en el peor caso
posible, es decir, cuando la desviacin tpica es mayor. Si hacemos un estudio de la funcin
p 2 [0; 1] 7! p (1 p), observaremos que sta tiene un mximo en el vrtice de la parbola, que
se alcanza precisamente cuando p = 00 5. Por consiguiente, si no se nos facilita la proporcin p,
supondremos que
p = 00 5:
Ejercicio 40 El 20 % de los jvenes de Guadix entre 18 y 30 aos son miopes. Calcula la
probabilidad de que en una muestra de 80 jvenes de la localidad haya:

(a) como mucho, 20 jvenes miopes;


(b) como poco, 17 jvenes miopes;
(c) entre 10 y 25 jvenes miopes.

Sabemos que la proporcin de jvenes miopes es p = 00 2. Entonces la distribucin


de la proporcin de jvenes miopes en una muestra de tamao 80 sigue, aproximadamente, una
distribucin
!
r
r
0 2 00 8
p
q
0
= N 00 2;
N 00 2; 00 045 :
P^80
N p;
n
80
Solucin :

Tipicando la variable, encontramos una que sigue una distribucin normal estndar:
Z=

P^80 00 2
,! N (0; 1) :
00 045

Para que en la muestra hubiese 20 jvenes miopes, la proporcin debera de ser de 20=80 =
00 25 = 25 %. Entonces la probabilidad de que haya menos de 20 jvenes miopes es:
!
0 25
02
^80 00 2
20
P
0
0
p P^80
= p P^80 00 25 = p
= p Z 10 11 = 00 8665:
80
00 045
00 045
Entonces la probabilidad de que haya ms de 17 jvenes miopes es:
p P^80

17
80

= p P^80
=1

A. Roldn

p Z

0 2125 = p
00 28 = 1

P^80 00 2
00 045

00 2125 00 2
00 045

00 6103 = 00 3897:

=p Z

00 28 =

75

12.3. Distribuciones en el muestreo

Finalmente, la probabilidad de que en la muestra haya entre 10 y 25 jvenes miopes es:


p

10
80

P^80

25
80

P^80

00 3125 =

00 125 00 2
00 045

P^80 00 2
00 045

= p 00 125
=p

=p Z

20 5

p Z

=p Z

20 5

= 00 9938 + 00 9525

00 3125 00 2
00 045

10 67 = p Z
p Z

10 67

20 5

=p Z

=p
p Z

10 67

20 5 =

10 67 =

20 5 + p Z

10 67

1=

1 = 00 9463:

Ejercicio 41 El 7 % de los tornillos que fabrica una mquina son defectuosos. Si en una caja
se empaquetan 400 tornillos, calcula la probabilidad de que en ella haya:

(a) ms de 35 tornillos defectuosos;


(b) menos de 22 tornillos defectuosos;
(c) entre 10 y 30 tornillos defectuosos;
(d) entre el 5 % y el 10 % de tornillos defectuosos.

La proporcin de tornillos defectuosos es p = 00 07. Entonces, en una muestra de


tamao 400, la distribucin de la proporcin muestral es:
!
r
r
0 07 00 93
p
q
0
0
P^400
N p;
= N 0 07 ;
N 00 07; 00 01276 :
n
400
Solucin :

Tipicando la variable, encontramos una que sigue una distribucin normal estndar:
Z=

P^400 00 07
,! N (0; 1) :
00 01276

Para que en la caja hubiese 35 tornillos defectuosos, la proporcin debera de ser de 35=400 =
00 0875. Entonces la probabilidad de que haya ms de 35 tornillos defectuosos es:
!
0 0875
0 07
^400 00 07
35
P
0
0
0
p P^400
= p P^400 0 0875 = p
= p Z 10 37 =
400
00 01276
00 01276
=1

p Z

10 37 = 1

00 9147 = 00 0853:
A. Roldn

76

CAPTULO 12. TEORA DE MUESTRAS

Por otro lado, la probabilidad de que haya menos de 22 tornillos defectuosos es:
!
0 055
0 07
^400 00 07
P
0
0
22
= p P^400 00 055 = p
=p Z
p P^400
400
00 01276
00 01276
=p Z

10 18 = 1

10 18 = 1

p Z

10 18 =

00 881 = 00 119:

De la misma forma, la probabilidad de que en la muestra haya entre 10 y 30 tornillos defectuosos


es:
p

10
400

P^400

30
400

= p 00 025

=p

P^400

00 025 00 07
00 01276

=p

30 53

00 075 =
P^400 00 07
00 01276
00 39 = p Z

=p Z

00 39

=p Z

00 39 + p Z

p Z

00 075 00 07
00 01276
00 39

30 53 = p Z
30 53

30 53 =

p Z
00 39

1 = 00 6517 + 00 9999

p Z

30 53

1 = 00 6516:

Finalmente, en el ltimo caso se nos da directamente la proporcin de tornillos defectuosos (y


no el nmero total de los mismos), por lo que calculamos:
!
0 05
0 07
01
0 07
^400 00 07
0
0
P
0
0
p 00 05 P^400 00 1 = p
=
00 01276
00 01276
00 01276
=p

10 57

= 00 9906 + 00 9418

20 35 = : : : = p Z

20 35 + p Z

10 57

1=

1 = 00 9324:

Ejercicio 42 Calcula la probabilidad de obtener ms de un 52 % de caras al lanzar 256 veces


una moneda.

Solucin :

Sea X la variable aleatoria que mide el nmero de caras obtenidas al lanzar 256 veces
una moneda. Evidentemente, X ,! B (256; 00 5). Sea ahora P^200 = X=256 la proporcin de caras
que salen en 200 lanzamientos. Sabemos que
!
r
r
0 5 00 5
p
q
0
0
= N 0 5;
N 00 5; 00 03125
P^256
N p;
n
256
Tipicando la variable, encontramos una que sigue una distribucin normal estndar:
Z=
A. Roldn

P^256 00 5
,! N (0; 1) :
00 03125

77

12.3. Distribuciones en el muestreo

Para que haya una proporcin de ms del 52 %:


p P^256

00 52 = p
=1

12.3.5.

P^256 00 5
00 03125

00 52 00 5
00 03125

00 64 = 1

p Z

00 64 =

=p Z

00 7389 = 00 2611:

Tabla resumen

La tabla (12.3.5) resume las principales distribuciones estudiadas.

Muestreo

Condicin

Medias muestrales

30

Sumas muestrales

30

Diferencia de medias

n1 ; n 2
n

Proporcin

30
30

n p

n q

Distribucin aproximada
Xn
Tn

N@
P^n

;p

N
N (n
1

p;

2
1

n1

n)

2
2

n2

1
A

p q
n

A. Roldn

Você também pode gostar