Você está na página 1de 21

ESTIMACION

El objetivo principal de la estadstica inferencial es la estimacin, esto es que


mediante el estudio de una muestra de una poblacin se quiere generalizar las
conclusiones al total de la misma. Como vimos en la seccin anterior, los
estadsticos varan mucho dentro de sus distribuciones muestrales, y mientras
menor sea el error estndar de un estadstico, ms cercanos sern unos de
otros sus valores.
Existen dos tipos de estimaciones para parmetros; puntuales y por intervalo.
Una estimacin puntual es un nico valor estadstico y se usa para estimar un
parmetro. El estadstico usado se denomina estimador.
Una estimacin por intervalo es un rango, generalmente de ancho finito, que
se espera que contenga el parmetro.
Estimacin Puntual
La inferencia estadstica est casi siempre concentrada en obtener algn tipo de
conclusin acerca de uno o ms parmetros (caractersticas poblacionales).
Para hacerlo, se requiere que un investigador obtenga datos muestrales de cada
una de las poblaciones en estudio. Entonces, las conclusiones pueden estar
basadas en los valores calculados de varias cantidades muestrales . Po ejemplo,
representamos con (parmetro) el verdadero promedio de resistencia a la
ruptura de conexiones de alambres utilizados para unir obleas de
semiconductores. Podra tomarse una muestra aleatoria de 10 conexiones para
determinar la resistencia a la ruptura de cada una, y la media muestral de la
resistencia a la ruptura x se poda emplear para sacar una conclusin acerca del
valor de . De forma similar, si 2 es la varianza de la distribucin de resistencia
a la ruptura, el valor de la varianza muestral s2 se podra utilizar pra inferir algo
acerca de 2.
Cuando se analizan conceptos generales y mtodos de inferencia es
conveniente tener un smbolo genrico para el parmetro de inters. Se utilizar
la letra griega para este propsito. El objetivo de la estimacin puntual es
seleccionar slo un nmero, basados en datos de la muestra, que represente el
valor ms razonable de .
Una muestra aleatoria de 3 bateras para calculadora podra presentar
duraciones observadas en horas de x1=5.0, x2 =6.4 y x3=5.9. El valor calculado
de la duracin media muestral es x = 5.77, y es razonable considerar 5.77 como
el valor ms adecuado de .
Una estimacin puntual de un parmetro es un slo nmero que se puede
considerar como el valor ms razonable de . La estimacin puntual se obtiene
al seleccionar una estadstica apropiada y calcular su valor a partir de datos de
la muestra dada. La estadstica seleccionada se llama estimador puntual de .

31

El smbolo (theta sombrero) suele utilizarse para representar el estimador de


y la estimacin puntual resultante de una muestra dada. Entonces = x se lee
como el estimador puntual de es la media muestral x . El enunciado la
estimacin puntual de es 5.77 se puede escribir en forma abreviada = 5.77 .
Ejemplo:
En el futuro habr cada vez ms inters en desarrollar aleaciones de Mg de bajo
costo, para varios procesos de fundicin. En consecuencia, es importante contar
con mtodos prcticos para determinar varias propiedades mecnicas de esas
aleaciones. Examine la siguiente muestra de mediciones del mdulo de
elasticidad obtenidos de un proceso de fundicin a presin:
44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1
Suponga que esas observaciones son el resultado de una muestra aleatoria. Se
desea estimar la varianza poblacional 2. Un estimador natural es la varianza
muestral:
2
2
2
2
( x i x )
(
44.2 44.0625) + (43.9 44.0625) + ... + (43.1 44.0625 )
2
2
= s =
=
= 0.251
n 1
8 1
En el mejor de los casos, se encontrar un estimador para el
cual = siempre. Sin embargo, es una funcin de las Xi muestrales, por lo
que en s misma una variable aleatoria.
= + error de estimacin
entonces el estimador preciso sera uno que produzca slo pequeas diferencias
de estimacin, de modo que los valores estimados se acerquen al valor
verdadero.
Propiedades de un Buen Estimador
Insesgado.- Se dice que un estimador puntual es un estimador insesgado de
si E = , para todo valor posible de . En otras palabras, un estimador
insesgado es aquel para el cual la media de la distribucin muestral es el
parmetro estimado. Si se usa la media muestral x para estimar la media
poblacional , se sabe que la x = , por lo tanto la media es un estimador
insesgado.

()

Eficiente o con varianza mnima.- Suponga que 1 y 2 son dos estimadores


insesgados de . Entonces, aun cuando la distribucin de cada estimador est
centrada en el valor verdadero de , las dispersiones de las distribuciones
alrededor del valor verdadero pueden ser diferentes.
Entre todos los estimadores de que son insesgados, seleccione al que tenga
varianza mnima. El resultante recibe el nombre de estimador insesgado
con varianza mnima (MVUE, minimum variance unbiased estimator) de .
En otras palabras, la eficiencia se refiere al tamao de error estndar de la
estadstica. Si comparamos dos estaisticas de una muestra del mismo tamao y
tratamos de decidir cual de ellas es un estimador mas eficiente, escogeramos la

32

estadstica que tuviera el menor error estndar, o la menor desviacin estndar


de la distribucin de muestreo.
Tiene sentido pensar que un estimador con un error estndar menor tendr una
mayor oportunidad de producir una estimacin mas cercana al parmetro de
poblacin que se esta considerando.
Distribucin muestral de
medias

Distribucin muestral de
medianas

Como se puede observar las dos distribuciones tienen un mismo valor en el


parmetro slo que la distribucin muestral de medias tiene una menor varianza,
por lo que la media se convierte en un estimador eficiente e insesgado.
Coherencia.- Una estadstica es un estimador coherente de un parmetro de
poblacin, si al aumentar el tamao de la muestra se tiene casi la certeza de que
el valor de la estadstica se aproxima bastante al valor del parmetro de la
poblacin. Si un estimador es coherente se vuelve mas confiable si tenemos
tamaos de muestras mas grandes.
Suficiencia.- Un estimador es suficiente si utiliza una cantidad de la informacin
contenida de la muestra que ningn otro estimador podra extraer informacin
adicional de la muestra sobre el parmetro de la poblacin que se esta
estimando.
Es decir se pretende que al extraer la muestra el estadstico calculado contenga
toda la informacin de esa muestra. Por ejemplo, cuando se calcula la media de
la muestra, se necesitan todos los datos. Cuando se calcula la mediana de una
muestra slo se utiliza a un dato o a dos. Esto es solo el dato o los datos del
centro son los que van a representar la muestra. Con esto se deduce que si
utilizamos a todos los datos de la muestra como es en el caso de la media, la
varianza, desviacin estndar, etc; se tendr un estimador suficiente.
Estimacin por Intervalos
Un estimado puntual, por ser un slo nmero, no proporciona por s mismo
informacin alguna sobre la precisin y confiabilidad de la estimacin. Por
ejemplo, imagine que se usa el estadstico x para calcular un estimado puntual
de la resistencia real a la ruptura de toallas de papel de cierta marca, y suponga

33

que x = 9322.7. Debido a la variabilidad de la muestra, nunca se tendr el caso


de que x =. El estimado puntual nada dice sobre lo cercano que esta de . Una
alternativa para reportar un solo valor del parmetro que se est estimando es
calcular e informar todo un intervalo de valores factibles, un estimado de
intervalo o intervalo de confianza (IC). Un intervalo de confianza se calcula
siempre seleccionando primero un nivel de confianza, que es una medida de el
grado de fiabilidad en el intervalo. Un intervalo de confianza con un nivel de
confianza de 95% de la resistencia real promedio a la ruptura podra tener un
lmite inferior de 9162.5 y uno superior de 9482.9. Entonces, en un nivel de
confianza de 95%, es posible tener cualquier valor de entre 9162.5 y 9482.9.
Un nivel de confianza de 95% implica que 95% de todas las muestras dara lugar
a un intervalo que incluye o cualquier otro parmetro que se est estimando, y
slo 5% de las muestras producir un intervalo errneo. Cuanto mayor sea el
nivel de confianza podremos creer que el valor del parmetro que se estima est
dentro del intervalo.
Una interpretacin correcta de la confianza de 95% radica en la interpretacin
frecuente de probabilidad a largo plazo: decir que un evento A tiene una
probabilidad de 0.95, es decir que si el experimento donde A est definido re
realiza una y otra vez, a largo plazo A ocurrir 95% de las veces. Para este caso
el 95% de los intervalos de confianza calculados contendrn a .
Valor verdadero de

Esta es una construccin repetida de intervalos de confianza de 95% y se puede


observar que de los 11 intervalos calculados slo el tercero y el ltimo no
contienen el valor de .
De acuerdo con esta interpretacin, el nivel de confianza de 95% no es tanto un
enunciado sobre cualquier intervalo en particular, ms bien se refiere a lo que
sucedera si se tuvieran que construir un gran nmero de intervalos semejantes.
Encontrar z a partir de un nivel de confianza

34

Existen varias tablas en las cuales podemos encontrar el valor de z, segn sea
el rea proporcionada por la misma. En esta seccin se realizar un ejemplo
para encontrar el valor de z utilizando tres tablas diferentes.
Ejemplo:
Encuentre el valor de z para un nivel de confianza del 95%.
Solucin 1:
Se utilizar la tabla que tiene el rea bajo la curva de - hasta z. Si lo vemos
grficamente sera:

El nivel de confianza bilateral est dividido en partes iguales bajo la curva:


0.475

0.475

En base a la tabla que se esta utilizando, se tendr que buscar el rea de 0.975,
ya que cada extremo o cola de la curva tiene un valor de 0.025.
0.975

z = 1.96

Por lo que el valor de z es de 1.96.

Solucin 2:
Si se utiliza una tabla en donde el rea bajo la curva es de 0 a z:

En este caso slo se tendr que buscar adentro de la tabla el rea de 0.475 y el
resultado del valor de z ser el mismo, para este ejemplo 1.96.

35

Solucin 3:
Para la tabla en donde el rea bajo la curva va desde z hasta :
0.025

Se busca el valor de 0.025 para encontrar z de 1.96.


Independientemente del valor del Nivel de Confianza este ser el procedimiento
a seguir para localizar a z. En el caso de que no se encuentre el valor exacto se
tendr que interpolar.
Estimacin para la Media
Es conocido de nosotros durante este curso, que en base a la distribucin
muestral de medias que se gener en el tema anterior, la formula para el calculo
x
de probabilidad es la siguiente: z =
. Como en este caso no conocemos

n
el parmetro y lo queremos estimar por medio de la media de la muestra, slo se
despejar de la formula anterior, quedando lo siguiente:
z
= x
n
De esta formula se puede observar que tanto el tamao de la muestra como el
valor de z se conocern. Z se puede obtener de la tabla de la distribucin normal
a partir del nivel de confianza establecido. Pero en ocasiones se desconoce
por lo que en esos casos lo correcto es utilizar otra distribucin llamada t de
student si la poblacin de donde provienen los datos es normal.
Para el caso de tamaos de muestra grande se puede utilizar una estimacin
puntual de la desviacin estndar, es decir igualar la desviacin estndar de la
muestra a la de la poblacin (s=).
Ejemplos:
1. Se encuentra que la concentracin promedio de zinc que se saca del agua a
partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6
gramos por mililitro. Encuentre los intervalos de confianza de 95% y 99%
para la concentracin media de zinc en el ro. Suponga que la desviacin
estndar de la poblacin es 0.3.
Solucin:
La estimacin puntual de es x = 2.6. El valor de z para un nivel de confianza
del 95% es 1.96, por lo tanto:

36

= x

z
(1.96 )(0.3) = 2.50 y 2.70
= 2.6
n
36
0.95

min = 2.50

max = 2.70

Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el


intervalo ser ms amplio:
z
(2.575)(0.3) = 2.47 y 2.73
= x
= 2.6
n
36
0.99

min = 2.47

max = 2.73

El intervalo de confianza proporciona una estimacin de la presicin de nuestra


estimacin puntual. Si es realmente el valor central de intervalo, entonces
x estima sin error. La mayor parte de las veces, sin embargo, x no ser
exactamente igual a y la estimacin puntual es errnea. La magnitud de este
error ser el valor absoluto de la diferencia entre y x , y podemos tener el nivel
z
de confianza de que esta diferencia no exceder
.
n
Como se puede observar en los resultados del ejercicio se tiene un error de
estimacin mayor cuando el nivel de confianza es del 99% y ms pequeo
cuando se reduce a un nivel de confianza del 95%.
2. Una empresa elctrica fabrica focos que tienen una duracin
aproximadamente distribuida de forma normal con una desviacin estndar
de 40 horas. Si una muestra de 30 focos tiene una duracin promedio de 780
horas, encuentre un intervalos de confianza de 96% para la media de la
poblacin de todos los focos que produce esta empresa.
Solucin:
z
z
(2.054 )(40) < < 780 + (2.054 )(40) = 765 < < 795
x
< < x+
= 780
n
n
30
30
Con un nivel de confianza del 96% se sabe que la duracin media de los focos
que produce la empresa est entre 765 y 765 horas.

37

3. La prueba de corte sesgado es el procedimiento ms aceptado para evaluar


la calidad de una unin entre un material de reparacin y su sustrato de
concreto. El artculo Testing the Bond Between Repair Materials and
Concrete Substrate informa que, en cierta investigacin, se obtuvo una
resistencia promedio muestral de 17.17 N/mm2 , con una muestra de 48
observaciones de resistencia al corte, y la desviacin estndar muestral fue
3.28 N/mm2 . Utilice un nivel de confianza inferior del 95% para estimar la
media real de la resistencia al corte.
Solucin:
En este ejercicio se nos presentan dos situaciones diferentes a los ejercicios
anteriores. La primera que desconoce la desviacin estndar de la poblacin y la
segunda que nos piden un intervalo de confianza unilateral.
El primer caso ya se haba comentado y se solucionar utilizando la desviacin
estndar de la muestra como estimacin puntual de sigma.
Para el intervalo de confianza unilateral, se cargar el rea bajo la curva hacia
un solo lado como sigue:
0.95

Z=-1.645

z
(1.654 )(3.38) = 16.39
= 17.17
n
48

Esto quiere decir que con un nivel de confianza de 95%, el valor de la media
est en el intervalo (16.39, ).
Estimacin de una Proporcin
Un estimador puntual de la proporcin P en un experimento binomial est dado
por la estadstica P=X/N, donde x representa el nmero de xitos en n pruebas.
Por tanto, la proporcin de la muestra p =x/n se utiulizar como estimador
puntual del parmetro P.
Si no se espera que la proporcin P desconocida est demasiado cerca de 0
de 1, se puede establecer un intervalo de confianza para P al considerar la
distribucin muestral de proporciones.
p P
z=
Pq
n
Al despejar P de esta ecuacin nos queda:

38

Pq
n
En este despeje podemos observar que se necesita el valor del parmetro P y
es precisamente lo que queremos estimar, por lo que lo sustituiremos por la
proporcin de la muestra p siempre y cuando el tamao de muestra no sea
pequeo.
pq
P= pz
n
Cuando n es pequea y la proporcin desconocida P se considera cercana a 0
a 1, el procedimiento del intervalo de confianza que se establece aqu no es
confiable, por tanto, no se debe utilizar. Para estar seguro, se debe requerir que
np nq sea mayor o igual a 5.
P= pz

El error de estimacin ser la diferencia absoluta entre p y P, y podemos tener el


pq
nivel de confianza de que esta diferencia no exceder z
.
n
Ejemplos:
1. Un fabricante de reproductores de discos compactos utiliza un conjunto de
pruebas amplias para evaluar la funcin elctrica de su producto. Todos los
reproductores de discos compactos deben pasar todas las pruebas antes de
venderse. Una muestra aleatoria de 500 reproductores tiene como resultado
15 que fallan en una o ms pruebas. Encuentre un intervalo de confianza de
90% para la proporcin de los reproductores de discos compactos de la
poblacin que no pasan todas las pruebas.
Solucin:
n=500
p = 15/500 = 0.03
z(0.90) = 1.645

pq
(0.03)(0.97 )
= 0.03 (1.645)
n
500
0.0237<P<0.0376
Se sabe con un nivel de confianza del 90% que la proporcin de discos
defectuosos que no pasan la prueba en esa poblacin esta entre 0.0237 y
0.0376.
P= pz

2. En una muestra de 400 pilas tipo B fabricadas por la Everlast Company, se


encontraron 20 defectuosas. Si la proporcin p de pilas defectuosas en esa
muestra se usa para estimar P, que vendr a ser la proporcin verdadera de
todas las pilas defectuosas tipo B fabricadas por la Everlast Company,
encuentre el mximo error de estimacin tal que se pueda tener un 95% de
confianza en que P dista menos de de p.

39

Solucin:
p=x/n = 20/400=0.05
z(0.95)=1.96

pq
(0.05)(0.95 )
= 1.96
= 0.021
n
400
Si p=0.05 se usa para estimar P, podemos tener un 95% de confianza en que P
dista menos de 0.021 de p. En otras palabras, si p=0.05 se usa para erstimar P,
el error mximo de estimacin ser aproximadamente 0.021 con un nivel de
confianza del 95%.
=z

Para calcular el intervalo de confianza se tendra:


p = 0.05 0.021
Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del
95% se sabe que la proporcin de pulas defectuosas de esta compaa est
entre 0.029 y 0.071.
Si se requiere un menor error con un mismo nivel de confianza slo se
necesita aumentar el tamao de la muestra.
3. En un estudio de 300 accidentes de automvil en una ciudad especfica, 60
tuvieron consecuencias fatales. Con base en esta muestra, construya un
intervalo del 90% de confianza para aproximar la proporcin de todos los
accidentes automovilsticos que en esa ciudad tienen consecuencias fatales.
Solucin:
P= 60/300 = 0.20
Z(0.90) = 1.645

P= pz

pq
(0.20 )(0.80)
= 0.20 (1.645)
= 0.20 0.038
n
300
0.162<P<0.238

Estimacin de la Diferencia entre dos Medias


Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y 22,
respectivamente, un estimador puntual de la diferencia entre 1 y 2 est dado
por la estadstica x1 x 2 . Por tanto. Para obtener una estimacin puntual de
1- 2, se seleccionan dos muestras aleatorias independientes, una de cada
poblacin, de tamao n1 y n2 , se calcula la diferencia x1 x 2 , de las medias
muestrales.
Recordando a la distribucin muestral de diferencia de medias:

40

z=

( x1 x 2 ) ( 1 2 )
12 2 2
+
n1
n2

Al despejar de esta ecuacin 1 - 2 se tiene:


2

1
22
1 2 = ( x1 x 2 ) z
+
n1
n2
En el caso en que se desconozcan las varianzas de la poblacin y los tamaos
de muestra sean mayores a 30 se podr utilizar la varianza de la muestra como
una estimacin puntual.
Ejemplos:
1. Se lleva a cabo un experimento en que se comparan dos tipos de motores, A
y B. Se mide el rendimiento en millas por galn de gasolina. Se realizan 50
experimentos con el motor tipo A y 75 con el motor tipo B. La gasolina que se
utiliza y las dems condiciones se mantienen constantes. El rendimiento
promedio de gasolina para el motor A es de 36 millas por galn y el promedio
para el motor B es 24 millas por galn. Encuentre un intervalo de confianza
de 96% sobre la diferencia promedio real para los motores A y B. Suponga
que las desviaciones estndar poblacionales son 6 y 8 para los motores A y
B respectivamente.
Solucin:
Es deseable que la diferencia de medias sea positiva por lo que se recomienda
restar la media mayor menos la media menor. En este caso ser la media del
motor B menos la media del motor A.
El valor de z para un nivel de confianza del 96% es de 2.05.
2

A
B2
36 64
B A = (x B x A ) z
+
= (42 36) 2.05
+
nA
nB
50 75
3.43<B-A <8.57
La interpretacin de este ejemplo sera que con un nivel de confianza del 96% la
diferencia del rendimiento promedio esta entre 3.43 y 8.57 millas por galn a
favor del motor B. Esto quiere decir que el motor B da mas rendimiento promedio
que el motor A, ya que los dos valores del intervalo son positivos.
2. Una compaa de taxis trata de decidir si comprar neumticos de la marca A
o de la B para su flotilla de taxis. Para estimar la diferencia de las dos
marcas, se lleva a cabo un experimento utilizando 12 de cada marca. Los
neumticos se utilizan hasta que se desgastan, dando como resultado
promedio para la marca A 36,300 kilmetros y para la marca B 38,100
kilmetros. Calcule un intervalo de confianza de 95% para la diferencia
promedio de las dos marcas, si se sabe que las poblaciones se distribuyen

41

de forma aproximadamente normal con desviacin estndar de 5000


kilmetros para la marca A y 6100 kilmetros para la marca B.
Solucin:
2

A
2
5000 2 6100 2
B A = (xB xA ) z
+ B = (38100 36300) 1.96
+
nA
nB
12
12
-2662.68<B-A <6262.67
Grficamente:
0.95

B A = 2662.68

B A = 6262.67

B A = 0
Como el intervalo contiene el valor cero, no hay razn para creer que el
promedio de duracin del neumtico de la marca B es mayor al de la marca A,
pues el cero nos est indicando que pueden tener la misma duracin promedio.
Estimacin de la Diferencia de dos Proporciones
En la seccin anterior se vio el tema de la generacin de las distribuciones
muestrales, en donde se tena el valor de los parmetros, se seleccionaban dos
muestras y podamos calcular la probabilidad del comportamiento de los
estadsticos. Para este caso en particular se utilizar la distribucin muestral de
diferencia de proporciones para la estimacin de las misma. Recordando la
formula:
( p p 2 ) ( P1 P2 )
z= 1
P1 q1
Pq
+ 2 2
n1
n2
Despejando P 1-P 2 de esta ecuacin:
Pq
Pq
P1 P2 = ( p1 p 2 ) z 1 1 + 2 2
n1
n2
Aqu se tiene el mismo caso que en la estimacin de una proporcin, ya que al
hacer el despeje nos queda las dos proporciones poblacionales y es
precisamente lo que queremos estimar, por lo que se utilizarn las proporciones
de la muestra como estimadores puntuales:
pq
p q
P1 P2 = ( p1 p 2 ) z 1 1 + 2 2
n1
n2
Ejemplos:
1. Se considera cierto cambio en un proceso de fabricacin de partes
componentes. Se toman muestras del procedimiento existente y del nuevo
42

para determinar si ste tiene como resultado una mejora. Si se encuentra


que 75 de 1500 artculos del procedimiento actual son defectuosos y 80 de
2000 artculos del procedimiento nuevo tambin lo son, encuentre un
intervalo de confianza de 90% para la diferencia real en la fraccin de
defectuosos entre el proceso actual y el nuevo.
Solucin:
Sean P 1 y P2 las proporciones reales de defectuosos para los procesos actual y
nuevo, respectivamente. De aqu, p 1=75/1500 = 0.05 y p2 = 80/2000 = 0.04. con
el uso de la tabla encontramos que z para un nivel de confianza del 90% es de
1.645.
pq
pq
(0.05 )(0.95) (0.04 )(0.96)
P1 P2 = ( p1 p 2 ) z 1 1 + 2 2 = (0.05 0.04) 1.645
+
n1
n2
1500
2000
-0.0017<P 1-P 2<0.0217
Como el intervalo contiene el valor de cero, no hay razn para creer que el
nuevo procedimiento producir una disminucin significativa en la proporcin de
artculos defectuosos comparado con el mtodo existente.
2. Un artculo relacionado con la salud, reporta los siguientes datos sobre la
incidencia de disfunciones importantes entre recin nacidos con madres
fumadoras de marihuana y de madres que no la fumaban:
Tamao Muestral
Nmero de disfunciones
Proporcin muestral

Usuaria
1246
42
0.0337

No Usuaria
11178
294
0.0263

Encuentre el intervalo de confianza del 99% para la diferencia de


proporciones.
Solucin:
Representemos P1 la proporcin de nacimientos donde aparecen disfunciones
entre todas las madres que fuman marihuana y definamos P 2, de manera similar,
para las no fumadoras. El valor de z para un 99% de confianza es de 2.58.
pq pq
(0.0337)(0.9663) (0.0263)(0.9737)
P1 P2 = ( p1 p2 ) z 1 1 + 2 2 = (0.0337 0.0263) 2.58
+
n1
n2
1246
11178
-0.0064<P 1-P 2<0.0212
Este intervalo es bastante angosto, lo cual sugiere que P1-P 2 ha sido estimado
de manera precisa.
Determinacin de Tamaos de Muestra para Estimaciones
Al iniciar cualquier investigacin, la primer pregunta que surge es: de qu
tamao debe ser la o las muestras?. La respuesta a esta pregunta la veremos
en esta seccin, con conceptos que ya se han visto a travs de este material.

43

Clculo del Tamao de la Muestra para Estimar una Media


Qu tan grande debe ser una muestra si la media muestral se va a usar para
estimar la media poblacional?. La respuesta depende del error estndar de la
media, si este fuera cero, entonces se necesitara una sola media que ser igual
necesariamente a la media poblacional desconocida , porque = 0. Este caso
extremo no se encuentra en la prctica, pero refuerza el hecho de que mientras
menor sea el error estndar de la media, menor es el tamao de muestra
necesario para lograr un cierto grado de precisin.
Se estableci antes que una forma de disminuir el error de estimacin es
aumentar el tamao de la muestra, si ste incluye el total de la poblacin,
entonces x sera igual a cero. Con esto en mente, parece razonable que
para un nivel de confianza fijo, sea posible determinar un tamao de la muestra
tal que el error de estimacin sea tan pequeo como queramos, para ser mas
preciso, dado un nivel de confianza y un error fijo de estimacin , se puede
escoger un tamao de muestra n tal que P( x <) = Nivel de confianza. Con
el propsito de determinar n. El error mximo de estimacin esta dado por:
z
=
n
Si se eleva al cuadrado ambos lados de esta ecuacin y se despeja n de la
ecuacin resultante, obtenemos:
2
z
n =


Como n debe de ser un nmero entero, redondeamos hacia arriba todos los
resultados fraccionarios.
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el
error de estimacin se convierte en:
z N n
=
n N 1
De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:
n=

z 2 2 N
2 ( N 1) + z 2 2

Ejemplos:
1. Un bilogo quiere estimar el peso promedio de los ciervos cazados en el
estado de Maryland. Un estudio anterior de diez ciervos cazados mostr que
la desviacin estndar de sus pesos es de 12.2 libras. Qu tan grande debe
ser una muestra para que el bilogo tenga el 95% de confianza de que el
error de estimacin es a lo ms de 4 libras?

44

Solucin:

z
(1.96 )(12.2 )
n =
=
= 35.736
4

En consecuencia, si el tamao de la muestra es 36, se puede tener un 95% de


confianza en que difiere en menos de 4 libras de x .
2

2. Una empresa elctrica fabrica focos que tienen una duracin


aproximadamente normal con una desviacin estndar de 40 horas. De qu
tamao se necesita una muestra si se desea tener 96% de confianza que la
media real est dentro de 10 horas de la media real?
2
2
z
(2.053)(40 )
n =
=
= 67.43
10

Se necesita una muestra de 68 focos para estimar la media de la poblacin y


tener un error mximo de 10 horas.
Qu pasara si en lugar de tener un error de estimacin de 10 horas slo se
requiere un error de 5 horas?
2
2
z
(2.053)(40 )
n =
=
= 269.74
5

Se puede observar como el tamao de la muestra aumenta, pero esto tiene


como beneficio una estimacin ms exacta.
3. Suponga que en el ejercicio anterior se tiene una poblacin de 300 focos, y
se desea saber de que tamao debe de ser la muestra. El muestreo se
realizar sin reemplazo.
Solucin:
Como se tiene una poblacin finita y un muestreo sin reemplazo es necesario
utilizar la formula con el factor de correccin.
2
2
z 2 2 N
(
2.053) (40) (300)
n= 2
=
= 55.21
( N 1) + z 2 2
(10 )2 (300 1) + (2.053)2 (40 )2
Si se tiene una poblacin finita de 300 focos slo se tiene que extraer de la
poblacin una muestra sin reemplazo de 56 focos para poder estimar la duracin
media de los focos restantes con un error mximo de 10 horas.
Clculo del Tamao de la Muestra para Estimar una Proporcin
Se desea saber que tan grande se requiere que sea una muestra para asegurar
que el error al estimar P sea menor que una cantidad especfica .
pq
=z
n
Elevando al cuadrado la ecuacin anterior se despeja n y nos queda:
z 2 pq
n= 2

45

Esta frmula est algo engaosa, pues debemos utilizar p para determinar el
tamao de la muestra, pero p se calcula a partir de la muestra. Existen
ocasiones en las cuales se tiene una idea del comportamiento de la proporcin
de la poblacin y ese valor se puede sustituir en la frmula, pero si no se sabe
nada referente a esa proporcin entonces se tienen dos opciones:
Tomar una muestra preliminar mayor o igual a 30 para proporcionar una
estimacin de P. Despus con el uso de la frmula se podra determinar de
forma aproximada cuntas observaciones se necesitan para proporcionar el
grado de precisin que se desea.
Tomar el valor de p como 0.5 ya que sustituyendo este en la frmula se
obtiene el tamao de muestra mayor posible. Observe el siguiente ejemplo:
Se desconoce el valor de P, por lo que se utilizarn diferentes valores y se
sustituirn en la formula para observar los diferentes tamaos de muestras. El
nivel de confianza que se utilizar es del 95% con un error de estimacin de
0.30.
z 2 pq
p
n
2
(1.96) 2(0.10)(0.90)
0.10
3.84
(0.30)2
(1.96) 2(0.20)(0.80)
0.20
6.82
(0.30)2
(1.96)2(0.30)(0.70)
0.30
8.96
(0.30) 2
(1.96) 2(0.40)(0.60)
0.40
10.24
(0.30)2
(1.96)2(0.50)(0.50)
0.50
10.67
(0.30) 2
(1.96)2(0.60)(0.40)
0.60
10.24
(0.30) 2
(1.96)2(0.70)(0.30)
0.70
8.96
(0.30) 2
(1.96) 2(0.80)(0.20)
0.80
6.82
(0.30)2
(1.96) 2(0.90)(0.10)
0.90
3.84
(0.30)2
Como se puede observar en la tabla anterior cuando P vale 0.5 el tamao de la
muestra alcanza su mximo valor.
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el
error de estimacin se convierte en:
pq N n
=z
n N 1

46

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:


z 2 pqN
n= 2
( N 1) + z 2 pq

Ejemplos:
1. En una muestra aleatoria de 500 familias que tienen televisores en la ciudad
de Hamilton, Canad, se encuentra que 340 estn suscritas a HBO. Qu
tan grande se requiere que sea una muestra si se quiere tener 95% de
confianza de que la estimacin de P est dentro de 0.02?
Solucin:
Se tratarn a las 500 familias como una muestra preliminar que proporciona una
estimacin de p=340/500=0.68.
2
z 2 pq (1.96) (0.68)(0.32 )
n= 2 =
= 2090

(0.02) 2
Por lo tanto si basamos nuestra estimacin de P sobre una muestra aleatoria de
tamao 2090, se puede tener una confianza de 95% de que nuestra proporcin
muestral no diferir de la proporcin real por ms de 0.02.
2. Una legisladora estatal desea encuestar a los residentes de su distrito para
conocer qu proporcin del electorado conoce la opinin de ella, respecto al
uso de fondos estatales para pagar abortos. Qu tamao de muestra se
necesita si se requiere un confianza del 95% y un error mximo de
estimacin de 0.10?
Solucin:
En este problema, se desconoce totalmente la proporcin de residentes que
conoce la opinin de la legisladora, por lo que se utilizar un valor de 0.5 para p.
2
z 2 pq (1.96) (0.50 )(0.50)
n= 2 =
= 96.04

(0.10) 2
Se requiere un tamao de muestra de 97 residentes para que con una confianza
del 95% la estimacin tenga un error mximo de 0.10.
Clculo del Tamao de la Muestra para Estimar la Diferencia de Medias
Si se recuerda a la distribucin muestral de diferencia de medias se tiene que
error esta dado por:
21 2 2
=z
+
n1
n2
En esta ecuacin se nos pueden presentar dos casos:
Los tamaos de muestra son iguales.
Los tamao de muestra son diferentes .

47

Para el primer caso no se tiene ningn problema, se eleva al cuadrado la


ecuacin y se despeja n ya que n1 es igual a n2.
z 2 21 + 2 2
n=
2
Para el segundo caso se pondr una n en funcin de la otra. Este caso se utiliza
cuando las poblaciones son de diferente tamao y se sabe que una es K veces
mayor que la otra.

Poblaci
n 1

Poblacin 2

n1=Kn2

z 2 21 + k 22
n2 =
k 2

Ejemplo:
Un director de personal quiere comparar la efectividad de dos mtodos de
entrenamiento para trabajadores industriales a fin de efectuar cierta operacin
de montaje. Se divide un nmero de operarios en dos grupos iguales: el primero
recibe el mtodo de entrenamiento 1, y el segundo, el mtodo 2. Cada uno
realizar la operacin de montaje y se registrar el tiempo de trabajo. Se espera
que las mediciones para ambos grupos tengan una desviacin estndar
aproximadamente de 2 minutos. Si se desea que la estimacin de la diferencia
en tiempo medio de montaje sea correcta hasta por un minuto, con una
probabilidad igual a 0.95, cuntos trabajadores se tienen que incluir en cada
grupo de entrenamiento?
z 2 21 + 2 2
1.96 2 2 2 + 2 2
n=
=
= 31
2
12
Cada grupo debe contener aproximadamente 31 empleados.

) (

)(

Clculo del Tamao de la Muestra para Estimar la Diferencia de


Proporciones
Si se recuerda a la distribucin muestral de diferencia de medias se tiene que
error esta dado por:
pq
pq
=z 1 1 + 2 2
n1
n2
En esta ecuacin se nos pueden presentar dos casos:
Los tamaos de muestra son iguales.
Los tamao de muestra son diferentes .
Para el primer caso no se tiene ningn problema, se eleva al cuadrado la
ecuacin y se despeja n ya que n1 es igual a n2.

48

z 2 ( p1q1 + p 2 q 2 )
2
Para el segundo caso se pondr una n en funcin de la otra. Este caso se utiliza
cuando las poblaciones son de diferente tamao y se sabe que una es K veces
mayor que la otra.
n=

Poblaci
n 1

Poblacin 2

n1=Kn2

z 2 ( p1q1 + kp2 q 2 )
n2 =
k 2
Ejemplo:
Una compaa de productos alimenticios contrat a una empresa de
investigacin de mercadotecnia , para muestrear dos mercados, I y II, a fin de
comparar las proporciones de consumidores que prefieren la comida congelada
de la compaa con los productos de sus competidores. No hay informacin
previa acerca de la magnitud de las proporciones P1 y P2. Si la empresa de
productos alimenticios quiere estimar la diferencia dentro de 0.04, con una
probabilidad de 0.95, cuntos consumidores habr que muestrear en cada
mercado?
z 2 ( p1q1 + p 2 q2 ) 1.96 2 [(0.5)(0.5) + (0.5)(0.5)]
n=
=
= 1200.5
2
0.04 2
Se tendr que realizar encuestas a 1201 consumidores de cada mercado para
tener una estimacin con una confianza del 95% y un error mximo de 0.04.

Problemas propuestos
1. Se prob una muestra aleatoria de 400 cinescopios de televisor y se
encontraron 40 defectuosos. Estime el intervalo que contiene, con un
coeficiente de confianza de 0.90, a la verdadera fraccin de elementos
defectuosos.
2. Se planea realizar un estudio de tiempos para estimar el tiempo medio de un
trabajo, exacto dentro de 4 segundos y con una probabilidad de 0.90, para
terminar un trabajo de montaje. Si la experiencia previa sugiere que = 16
seg. mide la variacin en el tiempo de montaje entre un trabajador y otro al
realizar una sola operacin de montaje, cuntos operarios habr que incluir
en la muestra?
3. El decano registr debidamente el porcentaje de calificaciones D y F
otorgadas a los estudiantes por dos profesores universitarios de
matemticas. El profesor I alcanz un 32%, contra un 21% para el profesor II,
con 200 y 180 estudiantes, respectivamente. Estime la diferencia entre los

49

porcentajes de calificaciones D y F otorgadas por los dos profesores. Utilice


un nivel de confianza del 95% e interprete los resultados.

4. Suponga que se quiere estimar la produccin media por hora, en un proceso


que produce antibitico. Se observa el proceso durante 100 perodos de una
hora, seleccionados al azar y se obtiene una media de 34 onzas por hora con
una desviacin estndar de 3 onzas por hora. Estime la produccin media
por hora para el proceso, utilizando un nivel de confianza del 95%.
5. Un ingeniero de control de calidad quiere estimar la fraccin de elementos
defectuosos en un gran lote de lmparas. Por la experiencia, cree que la
fraccin real de defectuosos tendra que andar alrededor de 0.2. Qu tan
grande tendra que seleccionar la muestra si se quiere estimar la fraccin
real, exacta dentro de 0.01, utilizando un nivel de confianza fe 95%?
6. Se seleccionaron dos muestras de 400 tubos electrnicos, de cada una de
dos lneas de produccin, A y B. De la lnea A se obtuvieron 40 tubos
defectuosos y de la B 80. Estime la diferencia real en las fracciones de
defectuosos para las dos lneas, con un coeficiente de confianza de 0.90 e
interprete los resultados.
7. Se tienen que seleccionar muestras aleatorias independientes de n1=n2=n
observaciones de cada una de dos poblaciones binomiales, 1 y 2. Si se
desea estimar la diferencia entre los dos parmetros binomiales, exacta
dentro de 0.05, con una probabilidad de 0.98. qu tan grande tendra que
ser n?. No se tiene informacin anterior acerca de los valores P1 y P2, pero
se quiere estar seguro de tener un nmero adecuado de observaciones en la
muestra.
8. Se llevan a cabo pruebas de resistencia a la tensin sobre dos diferentes
clases de largueros de aluminio utilizados en la fabricacin de alas de
aeroplanos comerciales. De la experiencia pasada con el proceso de
fabricacin se supone que las desviaciones estndar de las resistencias a la
tensin son conocidas. La desviacin estndar del larguero 1 es de 1.0
Kg/mm2 y la del larguero 2 es de 1.5 Kg/mm2. Se sabe que el
comportamiento de las resistencias a la tensin de las dos clases de
largueros son aproximadamente normal. Se toma una muestra de 10
largueros del tipo 1 obtenindose una media de 87.6 Kg/mm2, y otra de
tamao 12 para el larguero 2 obtenindose una media de 74.5 Kg/mm2 .
Estime un intervalo de confianza del 90% para la diferencia en la resistencia
a la tensin promedio.
9. Se quiere estudiar la tasa de combustin de dos propelentes slidos
utilizados en los sistemas de escape de emergencia de aeroplanos. Se sabe
que la tasa de combustin de los dos propelentes tiene aproximadamente la

50

misma desviacin estndar; esto es 1=2 = 3 cm/s. Qu tamao de


muestra debe utilizarse en cada poblacin si se desea que el error en la
estimacin de la diferencia entre las medias de las tasas de combustin sea
menor que 4 cm/s con una confianza del 99%?.
Respuesta a los Problemas propuestos
1.
2.
3.
4.
5.
6.
7.
8.
9.

0.07532 P 0.1246
n= 44
0.0222 P1- P 2 0.1978
33.412 34.588
n= 6147
0.059 PB-P A 0.141
n= 1086
12.22 1-2 13.98
n= 8

51

Você também pode gostar