Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTIMACIN
5.1 DEFINCIN, CLASIFICACIN Y PROPIEDADE S DE LOS ESTIMADORS.
Estimacin de Parmetros.
En la prctica profesional a menudo resulta necesario inferir informacin acerca de una
poblacin mediante el uso de muestras extradas de ella; existen diversos motivos: econmicos,
de tiempo, tamao poblacional, etc.
Recordemos que en la unidad I utilizamos datos muestrales para calcular medidas
estadsticas (media, varianza, etc.); ahora en inferencia estadstica debemos diferenciar entre
clculos obtenidos a partir de una muestra con respecto a los obtenidos a partir de una
poblacin, es por ello que llamaremos parmetros poblacionales () a las estadsticas obtenidas
de una poblacin, y llamaremos estadsticos (E) a las obtenidas a partir de una muestra.
Una parte bsica de dicha inferencia consiste en estimar los valores de los parmetros
de la poblacin (media , varianza 2, etc.) a partir de las estadsticas correspondientes de la
muestra (media , varianza S2, etc) como se explica a continuacin.
Un estimador es una medida estadstica que especifica cmo utilizar los datos de la
muestra para estimar un parmetro desconocido de la poblacin.
Clasificacin:
Puntuales o de punto
Estimadores
Por intervalos de confianza
130
E =
Por ejemplo, si se cumple = , se dice que es un estimador insesgado de .
Por otra parte, si la estadstica E de la muestra tiende a ser igual al parmetro de la
poblacin a medida que se hace ms grande el tamao de la muestra, entonces la estadstica
recibe el nombre de estimador consistente del parmetro.
Empleando smbolos, si
Lm En
n
131
Si se fija el valor de 1-, se puede obtener el valor de zc necesario para que se satisfaga
la ecuacin anterior, con lo cual queda definido el intervalo de confianza del parmetro , (E-zc
E, E+zc E), correspondiente al nivel de confianza 1-.
La constante zc que fija el intervalo de confianza se conoce como valor crtico o punto
crtico. Si la distribucin de E es normal, el valor de zc correspondiente a uno de se obtiene de
la tabla de reas bajo la curva normal o de la tabla siguiente:
VALORES DE zc PARA DISTINTOS NIVELES DE CONFIANZA
Nivel de confianza en porcentaje
zc
99.73
99.00
98.00
96.00
95.45
95.00
90.00
80.00
68.27
50.00
3.00
2.58
2.33
2.05
2.00
1.96
1.64
1.28
1.00
0.674
X zc
en caso de que el muestro se haga a partir de una poblacin infinita o de que se efectu con
reemplazo a partir de una poblacin finita, o por
132
zc
Np n
N p 1
-1.96
x 1.96
1.96
31.608 32.392
b) Si Z = zc es tal que el rea bajo la curva normal a la derecha de zc es el 1.5 % del rea total,
entonces el rea entre 0 y zc es 0.5-0.015 =0.485, por lo que de la tabla de rea bajo la curva
normal se obtiene zc = 2.17. Por lo tanto, los lmites de confianza del 97% son:
z
-2.17
2.17
133
x 2.17
Ejemplo
Una muestra aleatoria de 50 calificaciones de cierto examen de admisin tiene un
promedio aritmtico de 72 puntos. Suponiendo desviacin estndar poblacional, = 10, y si el
examen se aplic a 1018 personas, obtener
a) El intervalo de confianza del 95% para la media del total de calificaciones.
b) El tamao de muestra necesario para que el error en la estimacin de la media no
exceda de 2 puntos, considerando el mismo nivel de confianza.
c) El nivel de confianza para que el intervalo 72 1 puntos contenga a la media
poblacional.
Solucin
a) Los datos son los siguientes: x = 72, Zc = 1.96, = 10, Np = 1018 y n = 50,
Como tenemos una poblacin finita, la frmula que se utilizar es la siguiente:
X zc
Np n
N p 1
Sustituyendo:
72 1.96 10
1018 50
50
(1018 1)
zc
NP n
NP 1
zc
NP n
2
NP 1
134
19.6
n
1018 n
2
1018 1
10
n
1018 n
2
1018 1
384.16 1018 n
4
n 1017
o sea
n 87.85
por lo cual, se requieren al menos 88 elementos en la muestra para que el error en la estimacin
no exceda de 2 puntos, para 1- = 0.95.
Lo anterior nos indica que si deseamos disminuir el error de estimacin debemos
aumentar el tamao de la muestra.
c) Los lmites de confianza son, en este caso
72 zc
10
50
1018 50
1018 1
72 zc (1.4142) (0.9755)
o sea
72 1.3795 zc
Puesto que se desea que el valor de la media sea 72 1 puntos, se verifica que
1= 1.3795 zc
es decir
zc =
1
= 0.725
1.3795
El rea bajo la curva normal estndar entre 0 y zc = 0.725 es, por interpolacin lineal,
igual a 0.2657. Por lo tanto, el nivel de confianza es igual al doble del rea anterior, es decir,
2(0.2657) = 0.5314 (o 53.14%), tal como se muestra en la figura
f(z)
z
0.725
135
z
-1.96
x zc
46 1.96
3
50
136
1.96
46 0.8315
45.1685 < < 46.8315
x tc
S
n 1
Ejemplo
Un da al azar se toma una muestra aleatoria de 10 varillas de la produccin de una
laminadora, al probarlas a la tensin hasta la ruptura se obtiene una resistencia media de 4800
kg./cm.2, con una desviacin estndar de 200 kg. /cm.2. Con un nivel de confianza del 95%,
estime la resistencia media de las varillas producidas el da que se tom la muestra. Considere
que la variable poblacional resistencia tiene distribucin normal.
Solucin.-
n = 10 x 4800kg / cm 2
1- = 95%
x tc
S
x tc
n 1
S
n 1
f(t)
t
-2.26
2.26
137
4800 2.26
200
200
4800 2.26
10 1
10 1
4649.4 4950.6
x
, es la que se usa
n
p z c
p 1 p
n
p z c
n = 70 x = 28 1- = 98%
p 1 p
n
Sustituyendo:
x 28
0.4
n 70
0.40.6
70
0.4 0.1364 o sea 0.2635 < P < 0.5364
0.4 2.33
(n 1) S 2
22
(n 1) S 2
12
Distribucin Ji cuadrada, 2
f(
f(
)
)
90%
1-
1.145
11.071
Ejemplo
Se ha observado durante 20 das que una lnea de ensamble de una fbrica, tiene una
desviacin estndar de 30 minutos al realizar el proceso de ensamble. Estime con un nivel de
confianza del 90% la desviacin estndar del proceso durante un ao.
Solucin.
n = 20,
S = 30 minutos
= n 1 = 20 -1 = 19
Se tiene que los lmites del intervalo de confianza para la varianza poblacional 2 est dado por
(n 1) S 2
22
(n 1) S 2
12
Los valores crticos se obtienen en la tabla al entrar con el valor de y el rea correspondiente,
como se ve en la siguiente figura:
f(
90%
5%
5%
10.1
Sustituyendo
30.1
(20 1)(30) 2
(20 1)(30) 2
2
30.1
10.1
Entonces la varianza poblacional est comprendida entre los dos siguientes valores:
568.10 2 1693.07
y si lo que se desea estimar es la desviacin estndar, , entonces
139
568.10 1693.07
o sea
x - y zc
X2
nX
Y 2
nY
x y zc
X 2 N X nX
nX
N X 1
Y 2 N Y nY
nY
NY 1
A = 0.4 kg x B 6.3
B = 0.3 kg.
140
1 95.45%
x A xB zc
6.5 6.3 2
A2
nA
B2
nB
0.42 0.32
100
100
0.2 0.1
por lo tanto el intervalo de confianza respectivo es:
0.1 A B 0.3
Cuando las desviaciones estndar poblacionales sean desconocidas y los
tamaos de las muestras mayores o iguales a 30, podemos usar estas mismas frmulas
sustituyendo los valores de por las desviaciones estndar muestrales , ya que stas
son estimadores puntuales consistentes de . Sin embargo, hay que considerar que el
resultado obtenido es slo una aproximacin.
5.3.2 Intervalo de confianza para la diferencia de medias, desconocidas
Intervalo de confianza para la diferencia de medias poblacionales, x y , cuando las
desviaciones estndar poblacionales son desconocidas y poblaciones distribuidas
normalmente, o, desviaciones estndar poblacionales desconocidas y muestras mayores o
iguales a 30. Considerando 12 22 .
Si x1 y x 2 son las medias de muestras aleatorias independientes de tamao n1 y n2
respectivamente, de poblaciones aproximadamente normales con varianzas poblacionales
iguales pero desconocidas, 12 22 , un intervalo de confianza de 1- para 1 2 es:
( x1 x2 ) t / 2 S p
1
1
1
1
1 2 ( x1 x2 ) t / 2 S p
n1 n2
n1 n2
S p2
Por consiguiente
S p S p2
141
Ejemplo
Se deben eliminar gases cidos de otros gases de refinera en una instalacin de
productos qumicos para reducir al mnimo la corrosin de las plantas. Dos mtodos para
eliminar estos gases produjeron el ritmo de corrosin (mm./ao) que se representan a
continuacin:
Mtodo A: 0.3, 0.7, 0.5, 0.8, 0.9, 0.7, 0.8
Mtodo B: 0.7, 0.8, 0.7 0.6, 2.1, 0.6, 1.4, 2.3
Estimar la diferencia entre el ritmo promedio de corrosin para los dos mtodos, con
un coeficiente de confianza de 0.90. Qu hiptesis se deben hacer para que sea vlida la
respuesta?
Solucin.
x A 0.6714 S A2 0.0424
x B 1.15
S p2
nA = 7
1- = 90%
.10 y / 2 .05
S B2 0.4886 nB = 8
(n A 1) S A2 (n B 1) S B2 (7 1)(0.0424) (8 1)(0.4886)
0.2827
n A nB 2
782
S p 0.2827 0.5316
El intervalo de confianza para la diferencia de medias poblacionales A B est dado
por:
( x A x B ) t / 2 S p
1
1
1
1
A B ( x A x B ) t / 2 S p
n A nB
n A nB
f(t)
t
-1.77
1.77
1 1
1 1
A B (0.6714 1.15) 1.77(0.5316)
7 8
7 8
142
( x1 x 2 ) t / 2
S12 S 22
n1 n2
S12 S 22
n1 n2
2
S
S
n1 n2
n1 1 n2 1
2
1
2
2
Grados de libertad.
Ejemplo
Puede tomarse un curso con crdito ya sea asistiendo a sesiones de clases en horas y
das fijos, o haciendo sesiones en lnea que el estudiante puede hacer a su propio paso y en los
tiempos que el estudiante escoja. El coordinador del curso desea determinar si estos dos das
de tomar el curso resultaron en una diferencia significativa en rendimiento medido por el
examen final para el curso. La siguiente informacin da las calificaciones en un examen con 45
puntos posibles para un grupo de nL= 9 estudiantes que tomaron el curso en lnea y un segundo
grupo de nC = 9 estudiantes que tomaron el curso de clases convencionales. Estos datos
presentan suficiente evidencia para indicar que existe diferencia significativa entre las
143
calificaciones para estudiantes que tomaron el curso en lnea y las de quienes asistieron a una
clase convencional? Calcular el intervalo con un nivel de confianza de 95%. Considere que la
variable calificaciones tiene distribucin normal y que 2 2 .
Calificaciones
En lnea
Saln de
clase
32
37
35
28
41
44
35
31
34
35
31
29
25
34
40
27
32
31
Con los datos muestrales de la tabla anterior se calcularon los siguientes estadsticos:
En lnea
=35.22
2 = 24.44
Saln de clase
= 31.56
2 = 20.03
( x1 x 2 ) t / 2
S12 S 22
n1 n2
S12 S 22
n1 n2
S12
S 22
n1 n2
n1 1 n2 1
2
24.44 20.03
9
9
15.84
Sustituyendo:
2
2
24.44
20.03
9 9
8
8
Se toma la parte entera de este resultado, o sea, = 15
Con el valor de y con el rea en dos colas = 0.05 entramos a la tabla t de Student y
obtenemos el valor crtico 2.131
144
24.44 20.03
9
9
3.66 4.7368
El intervalo de confianza queda como sigue
-1.076 < < 8.396
Como el cero est incluido en el intervalo podemos concluir que no existe diferencia
significativa entre el promedio de calificaciones del curso en lnea y el del saln de clase, con un
nivel de confianza de 95%.
x1
n1
x2
. Un estimador puntual de la diferencia entre las dos proporciones, p1 p 2 , est
n2
dado por el estadstico p 1 p 2 . Por lo tanto, la diferencia entre las proporciones muestrales,
( p 1 p 2 ) z / 2
p 1q1 p 2 q 2
p1 p 2 ( p 1 p 2 ) z / 2
n1
n2
donde q 1 p .
Ejemplo
145
p 1q1 p 2 q 2
n1
n2
75
80
0.05 y p N
0.04 , y la
1500
2000
(0.05)(0.95) (0.06)(0.94)
(0.05)(0.95) (0.04)(0.96)
1500
2000
1500
2000
el cual se simplifica a,
0.0017 PA PN 0.0217
Dado que el intervalo contiene el valor cero, no hay razn para creer que el nuevo
procedimiento ocasion una disminucin significativa en la proporcin de partes defectuosas
con respecto al mtodo actual.
EJERCICIOS
1. Cules son las caractersticas de un buen estimador puntual?
2. Consideras que la desviacin estndar muestral es un estimador consistente de la
desviacin estndar poblacional? Por qu?
3. Explique lo que significa margen de error en estimacin puntual.
4. En la siguiente grfica se presentan las distribuciones muestrales para dos estimadores
insesgados, una con una varianza pequea (A) y la otra con una varianza ms grande (B).
146
Verdadero valor
del parmetro
a) Cul de las dos distribuciones asegura que, con una alta probabilidad, una estimacin
puntual caer cerca del valor verdadero del parmetro?
b) Cmo se llama la caracterstica deseable en un estimador, que se describe en el
ejercicio anterior?
5. En determinados estudios de la calidad del agua es importante verificar la presencia o
ausencia de varios tipos de microorganismos. Supongamos que 30 muestras de 100
seleccionadas al azar muestran la presencia de un determinado microorganismo. Estimar la
probabilidad verdadera P de encontrar este microorganismo en una muestra de este mismo
volumen, con un intervalo de confianza de 90%.
6.- La agencia de proteccin ambiental ha reunido datos de mediciones de DL50 (dosis letal, es
decir, mata al 50% de los animales de prueba en un determinado intervalo de tiempo) para
determinadas sustancias qumicas que se encuentran probablemente en ros y lagos de agua
dulce. Para determinada especie de pescado, las mediciones de DL50 para el DDT en 12
experimentos dieron los siguientes resultados: 16, 5, 21, 19, 10, 5, 8, 2, 7, 2, 4, 9 (las mediciones
estn en partes por milln). Suponiendo que estas determinaciones de DL50 tienen una
distribucin aproximadamente normal, estimar la DL50 promedio real para el DDT con un
coeficiente de confianza igual a 90%.
7. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la
variabilidad de los resultados que producen muestras estndar. En un estudio de la cantidad de
calcio en el agua potable, el cual se efecta como parte del control de calidad de un agua, se
analiz seis veces la misma muestra en el laboratorio en intervalos aleatorios. Los seis
resultados, en partes por milln fueron 9.54, 9.61, 932, 9.48, 9.70, 9.26. Estimar la varianza de
los resultados de la poblacin para este estndar, usando un intervalo de confianza de 90%.
147
148
Tarea
Tiempo de la marca 1
Tiempo de la marca 2
21.8
36.5
22.6
35.2
21.0
36.2
19.7
34.0
21.9
36.4
21.6
36.1
22.5
37.5
23.1
38.0
22.2
36.3
10
20.1
35.9
11
21.4
35.7
12
20.5
34.9
13
22.7
37.1
14
20.5
34.2
15
21.3
35.4
149
BILBIOGRAFA
1. Mendenhall/Beaver/Beaver, (2010). Introduccin a la Probabilidad y Estadstica, Dcimo
Tercera Edicin, Editorial Cengage Learning, Mxico.
2. Jay L. Devore, Probabilidad y Estadstica para Ingeniera y Ciencias, (2008). Sptima Edicin,
Editorial Cengage Learning, Mxico.
3. Irwin Miller, John E. Freund, (2008). Probabilidad y Estadstica para Ingenieros, Editorial
Revert S.A. de C.V., Espaa.
4. Triola Mario F., (2009). Estadstica, Dcima edicin, Editorial Pearson Addison Wesley,
Mxico.
5. Walpole/Myers/Myers/Ye, (2007). Probabilidad y Estadstica para Ingeniera y Ciencias,
Octava Edicin, Editorial Pearson Prentice Hall, Mxico.
150