Escolar Documentos
Profissional Documentos
Cultura Documentos
SEMANA 5
NDICE
2
ESTE DOCUMENTO CONTIENE LA SEMANA 5
OTROS TEMAS DE ESTIMACIN
APRENDIZAJES ESPERADOS
Usar intervalos de confianza para estimar parmetros de dos poblaciones
INTRODUCCIN
En un mdulo anterior se vieron los mtodos de estimacin puntual y la estimacin a travs de
intervalos de confianza.
Si X es una variable aleatoria que sigue una distribucin N ( , ), y X1 , X 2 ,..., X n es una muestra
aleatoria de tamao n, se puede calcular intervalos de confianza para los parmetros y p ;
dicho clculo se basa en las distribuciones de determinados estadsticos, tal y como se indica en la
siguiente tabla:
3
ESTE DOCUMENTO CONTIENE LA SEMANA 5
1. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE DOS
MEDIAS CON VARIANZAS CONOCIDAS
Si x y y son las medias muestrales de dos muestras aleatorias independientes de tamao nx y
n y tomadas de poblaciones que tienen varianzas conocidas 12 y 22 , respectivamente, un
intervalo de confianza para x y del 100 1 % est dado por (Montgomery & Runger,
1996, p. 331):
Observacin: el nivel de confianza 1 es exacto cuando las dos poblaciones son normales. Para
poblaciones que no lo son, el nivel de confianza es aproximadamente vlido para tamaos grandes
de muestra.
EJEMPLO: Dos fbricas A y B empaquetan bombones en caja. Los pesos promedio de las cajas se
desconocen, pero la desviacin estndar es 15 g y 10 g, respectivamente. En una muestra de 18
cajas de A se observ un peso promedio de 256 g y en una muestra de 20 cajas de B se observ un
peso promedio de 245 g. Hallar el intervalo de confianza a un 92% para la diferencia entre los
pesos promedios de las cajas A y B.
Solucin:
x 256
y 245
x 15
y 10
nx 18
ny 20
Ahora se debe hallar el valor de Z / 2 . Para ello se sabe que 1 = 0,92. Se despeja.
1 0,92
1 0,92
4
ESTE DOCUMENTO CONTIENE LA SEMANA 5
0,08
Y se obtiene 1,7507.
Se reemplazan los datos en el intervalo de confianza para la diferencia de medias.
x2 y2 x2 y2
x y Z / 2 x y x y Z / 2
nx ny nx ny
35 35
11 1,7507 x y 11 1,7507
2 2
11 7,324 x y 11 7 ,324
3,676 x y 18,324
5
ESTE DOCUMENTO CONTIENE LA SEMANA 5
2. INTERVALOS DE CONFIANZA DE DOS MEDIAS: MUESTRAS
DEPENDIENTES (DATOS PAREADOS)
Se supone una muestra aleatoria de tamao n , con n pares de observaciones enlazadas
procedentes de distribuciones normales de medias x y y . Es decir, x1 ,x2 ,...,xn los valores de
la muestra obtenida de la poblacin que tiene media x ; e y1 , y2 ,..., yn los valores de la muestra
diferencia entre las medias d x y tiene la forma (Newbold, Carlson & Thorne, 2008, p.
326):
sd sd
d t n1, / 2 d d t n 1, / 2
n n
d d
n 2
Con: sd i 1
nd
correspondientes a cada par. Estime, con un nivel de confianza del 99%, la diferencia media de
eficacia entre los dos medicamentos, x e y, para reducir el colesterol.
6
ESTE DOCUMENTO CONTIENE LA SEMANA 5
Par Medicamento X Medicamento Y Diferencia
di xi yi
1 29 26 3
2 32 27 5
3 31 28 3
4 32 27 5
5 32 30 2
6 29 26 3
7 31 33 -2
8 30 36 -6
Solucin:
colesterol sd .
n
d i
d i 1
1,625
n
d
n 2
i d
sd i 1
3,777
nd
Se reemplazan los datos en el intervalo de confianza para la diferencia entre muestras pareadas.
sd sd
d t n1, / 2 d d t n 1, / 2
n n
3,777 3,777
1,625 3, 499 x y 1,625 3, 499
8 8
3,05 x y 6,3
7
ESTE DOCUMENTO CONTIENE LA SEMANA 5
Como el intervalo de confianza contiene al valor cero, se puede concluir que x y podra ser
positivo, lo que sugerira que el medicamento " X " podra ser ms eficaz; o bien, que x y
podra ser negativo, lo que sugerira que el medicamento " Y " podra ser ms eficaz; o que
x y podra ser cero, lo que sugerira que los medicamentos " X " e " Y " son igual de
eficaces. Por lo tanto, no se puede saber si uno de los dos medicamentos es ms eficaz para
reducir el nivel de colesterol.
1 1 1 1
x y t n n
sp x y x y t n n 2 , / 2 s p
y 2 , / 2
x
nx ny x y
nx ny
nx 1 sx2 ny 1 s y2
Donde s p es el estimador ponderado de cada poblacin (conocida
nx ny 2
tambin como varianza muestral agrupada) y t n n 2 , / 2 es el punto crtico superior que
x y
corresponde al porcentaje / 2 de la distribucin t con nx ny 2 grados de libertad.
EJEMPLO: Los residentes de San Bernardo, Santiago de Chile se quejan que las multas por exceso
de velocidad son ms altas en su comuna que las que se imponen a los residentes de la comuna de
Las Condes. Las autoridades acordaron estudiar el problema para ver si las quejas eran razonables.
Se obtuvieron muestras aleatorias independientes de las multas pagadas por los residentes de
cada una de las comunas durante tres meses. El valor de estas multas, en miles de pesos, fue:
San Bernardo 100 125 135 128 140 142 128 137 156 142
Las Condes 95 87 100 75 110 105 85 95
8
ESTE DOCUMENTO CONTIENE LA SEMANA 5
Solucin:
Sea " x" el valor de la multa pagada por un habitante de San Bernardo y sea " y" el valor de la
multa pagada por un habitante de Las Condes. Se supone que las poblaciones son normales y se
determinan los promedios y las desviaciones estndar.
n n
xi y i
x i 1
$133,3 y i 1
$94
nx nx
x x y y
n 2 n 2
i i
sx2 i 1
$218,0111 s y2 i 1
$129, 4286
nx ny
nx 10 ny 8
nx 1 sx2 ny 1 s y2
sp
nx ny 2
sp
10 1 218,0111 8 1 129,4286
10 8 2
s p 179, 2562
s p 13,389
1 0,95 Se despeja
1 0,95
0,05
9
ESTE DOCUMENTO CONTIENE LA SEMANA 5
0,05
0,05 / 2 0,025
2
1 1 1 1
x y t n n 2 , / 2
sp x y x y t n n 2 , / 2 s p
x y
nx ny x y
nx ny
1 1 1 1
133,3 94 2,12 13,389 x y 133,3 94 2 ,12 13,389
10 8 10 8
9 9
39,3 28,38468 x y 39,3 28,38468
40 40
25,836 x y 52,764
Esto significa que el costo medio de una multa impuesta a un residente de San Bernardo es entre
$25.836 y $52.764 ms alto que el costo medio de una multa a un vecino de Las Condes.
10
ESTE DOCUMENTO CONTIENE LA SEMANA 5
2 2
sx2 s y sx2 s y
x y t , / 2 x y x y t , / 2
nx ny nx ny
2
sx2 s y2
Donde nx n y son los grados de libertad y t , / 2 es el punto crtico superior que
2
sx
2
2
sy2
nx n y
nx 1 ny 1
corresponde al porcentaje / 2 de la distribucin t .
Se supone que las varianzas poblacionales que son desconocidas, son distintas. Estime la
diferencia entre los valores medios de las facturas pendientes de pago de las dos oficinas. Utilice
un nivel de confianza del 95%.
Solucin:
2
sx2 s y2
nx n y
2
sx2
2
s y2
nx n y
nx 1 ny 1
11
ESTE DOCUMENTO CONTIENE LA SEMANA 5
2
152 502
16 11
2
2
15 502
2
16 11
16 1 11 1
2
225 2.500
16 11 58.242,69192
2 2
11, 247 11
225 2.500 5.178, 47285
16 11
15 10
1 0,95
Se despeja :
1 0,95
0,05
0,05
0,05 / 2 0,025
2
Ahora se construye el intervalo de confianza para la diferencia entre medias de dos distribuciones
normales con varianzas desconocidas y desiguales.
2 2
sx2 s y sx2 s y
x y t , / 2 x y x y t , / 2
nx ny nx ny
12
ESTE DOCUMENTO CONTIENE LA SEMANA 5
152 502 152 502
290 250 2, 201 x y 290 250 2 ,201
16 11 16 11
40 2, 20115,534967 x y 40 2, 20115,534967
40 34,19 x y 40 34,19
5,81 x y 74,19
El resultado significa que el valor medio de las facturas pendientes de pago de la sucursal Cerro
Navia es de entre $5.810 y $74.190 mayores que el valor medio de las facturas pendientes de pago
de la sucursal Lo Espejo.
observaciones procedentes de una poblacin que tiene una proporcin px xitos y sea p y la
proporcin observada de xitos en una muestra aleatoria independiente de n y observaciones
procedentes de una poblacin que tiene una proporcin p y xitos. Si las muestras son de gran
tamao (generalmente, al menos, de 40 observaciones cada una), se obtiene un intervalo de
confianza al 100 1 % de la diferencia entre proporciones poblacionales p x p y de la
forma siguiente (Newbold, Carlson & Thorne, 2008, p. 337):
px p y Z / 2
px 1 px p 1 p p p
y y
p x p y Z / 2
px 1 px p 1 p
y y
x y
nx ny nx ny
EJEMPLO: Se toma una muestra aleatoria de 85 soportes para el cigeal del motor de un
automvil, hallndose que 10 tienen un terminado ms rugoso de lo que las especificaciones
permiten. Se hace una modificacin al proceso de acabado de la superficie y se toma una segunda
muestra tambin de 85 soportes. Se halla que 8 de estos soportes son defectuosos. Obtenga el
13
ESTE DOCUMENTO CONTIENE LA SEMANA 5
intervalo de confianza del 95% para la diferencia en la proporcin de resortes defectuosos
producidos por ambos procesos.
Solucin:
1 0,95
Se despeja :
1 0,95
0,05
0,05
0,05 / 2 0,025
2
Z0 ,975 1,96
10
px
85
8
py
85
nx 85
ny 85
14
ESTE DOCUMENTO CONTIENE LA SEMANA 5
px p y Z / 2
px 1 px p 1 p p p
y y
p x p y Z / 2
px 1 px p 1 p
y y
x y
nx ny nx ny
10 10 8 8 10 10 8 8
1 1 1 1
10 8 85 85 85 85 10 8 85 85 85 85
1,96 px p y 1,96
85 85 85 85 85 85 85 85
30 616 30 616
2 2
1,96 289 7.225 px p y 1,96 289 7.225
85 85 85 85 85 85
2 2
1,96 0,00222 px p y 1,96 0,00222
85 85
2 2
0,09235 px p y 0,09235
85 85
0,0688 px py 0,1159
Como este intervalo de confianza incluye al cero, parece poco probable que los cambios hechos en
el proceso de acabado de la superficie hayan reducido el nmero de soportes defectuosos para
cigeal producidos.
n 1 s 2 2 n 1 s 2
n21, /2 n21,1 /2
15
ESTE DOCUMENTO CONTIENE LA SEMANA 5
Donde n 1, /2 es el nmero para el que:
2
P n21 n21, /2
2
P n21 n21,1 /2
2
Y la variable aleatoria n21 sigue una distribucin ji-cuadrado con n 1 grados de libertad.
Solucin:
1 0,95
Se despeja :
1 0,95
0,05
Como la distribucin ji-cuadrado es asimtrica, se debe calcular el valor para cada cola.
n21,1 /2 24,0,975
2
12, 4
16
ESTE DOCUMENTO CONTIENE LA SEMANA 5
n21, /2 24,0,025
2
39,36
n 1 s 2 2 n 1 s 2
n21, /2 n21,1 /2
25 1 100 2 25 1 100
39,36 12, 40
60,97 2 193,53
Es peligroso seguir el mtodo que se acaba de mostrar cuando la poblacin no sigue una
distribucin normal. La validez del estimador de un intervalo de la varianza depende mucho ms
del supuesto de la normalidad que la del estimador de un intervalo de la media poblacional.
0, 25 Z /2
2
n
ME 2
EJEMPLO: Se estima que el intervalo de confianza del 95% de la proporcin de responsables de las
admisiones en programas de posgrado en que pensaban que las calificaciones obtenidas en
exmenes normalizados eran muy importantes en la consideracin de un candidato, se obtuvo un
intervalo de 0,533 p 0,693 , basndose en 142 observaciones.
Suponga que debe garantizarse que el intervalo de confianza al 95% de la proporcin poblacional
tiene una amplitud mxima de 0,06 a cada lado de la proporcin muestral. De qu tamao debe
ser la muestra?
Solucin:
17
ESTE DOCUMENTO CONTIENE LA SEMANA 5
Se sabe que: ME 0, 06 y Z /2 Z0,025 1,96 (puede consultar por los ejemplos anteriores en
que se calcul el valor Z / 2 ).
0, 25 1,96
2
0, 25 Z2 /2
n 266, 78
ME 0, 06
2 2
Para lograr este intervalo de confianza ms estrecho, se necesita un mnimo de 267 observaciones
muestrales (un aumento significativo con respecto a 142 observaciones iniciales).
COMENTARIO FINAL
Los medios de comunicacin a menudo publican los resultados de encuestas de opinin sobre
cuestiones de actualidad, como el ndice de aprobacin del presidente en cuestiones nacionales o
en poltica exterior o las opiniones de la gente sobre alguna propuesta fiscal. Estas encuestas
generalmente representan las opiniones de algn subgrupo de la poblacin. Normalmente, dan
estimaciones del porcentaje de la poblacin que tiene determinadas opiniones y suelen concluir
con afirmaciones como con un error de muestreo de ms o menos 3% o la encuesta tiene un
margen de error del 3%. Concretamente, estos intervalos son el porcentaje muestral, ms o
menos el error de muestreo o margen de error indicado. Sin embargo, se debe hacer hincapi en
que el margen de error no incluye los errores que se deben a que la muestra es sesgada o es
inadecuada por otras razones.
Los intervalos de confianza son una excelente forma para dar una idea bastante exacta del valor
del parmetro que se quiere estimar.
No se debe perder de vista que es importante tener el criterio bajo qu condiciones se aplica un
intervalo u otro, ya que estas decisiones incidirn directamente en el acierto del parmetro que se
est estimando y, por ende, dependiendo la situacin, se podr mejorar la productividad, las
ventas, el servicio, etc.
18
ESTE DOCUMENTO CONTIENE LA SEMANA 5
REFERENCIAS
Biosca, A.; Espinet, M. J.; Fandos, M. J.; Jimeno, J.; Villagrn, B. J. & Escolano, L. E. (2003).
McGraw-Hill.
Newbold, P.; Carlson, W. & Thorne, B. (2008). Estadstica para la administracin y economa. 6
Prez, C. (2002). Estadstica aplicada a travs de Excel. 2 edicin. Madrid, Espaa: Prentice-Hall.
19
ESTE DOCUMENTO CONTIENE LA SEMANA 5