Você está na página 1de 22

Estimación

de Muestras
Grandes
INFERENCIA ESTADÍSTICA
JTP. JUAN PABLO QUIROGA
Temario
vEstimación puntual para una media o proporción poblacional.
vIntervalo de confianza de muestra grande ( 1-α)100%.
vUn intervalo de confianza de muestra grande (1- α) 100% para una proporción poblacional p.
vEstimación de la diferencia entre dos medias poblacionales.
vEstimación de la diferencia entre dos proporciones binomiales.
vLimites de confianza de una cola
vSelección del tamaño muestral.
Como estimar una media o proporción
poblacional:
Para estimar la media poblacional µ para una población cuantitativa, el estimador puntual 𝑥
#
Con el error estándar estimado como:
'
𝑆𝐸 =
(

El 95% de margen de error cuando n ≥ 30 se estima como:


'
± 1,96( )
(

Para estimar la proporción poblacional p para una población binomial , el estimador


2
Puntual 𝑝̂ = es insesgado, con un error estándar estimado como
(
3̂ .56
SE=
(

Si construyéramos

Un intervalo de confianza del 95% nos dice que, si construyéramos muchos de estos intervalos (todos los cuales
tendrían puntos extremos ligeramente diferentedss), 95% de ellos encerrarían la media poblacional
Como estimar una media o proporción
poblacional:
La tabla muestra en en que el numerador del error estándar de 𝑝̂ cambia
para diversos valores de p. Observa que, para casi todos los valores de p, en
especial cuando p esta entre 0,3 y 0,7, hay muy poco cambio en 𝑝. 𝑞 , el
numerador del SE, que alcanza su máximo valor cuando p= 0,5.
Esto significa que el margen de error usando el estimador 𝑝̂ también será
máximo cuando p=0,5

Las encuestas de sondeo político generalmente usan tamaños muestrales de alrededor de 1000, de modo que su
margen de error es:

8,9 .(8,9)
1.96. = 0.031 o sea alrededor de 3%
;888
Intervalo de confianza de muestra
grande (1-α)100%
La probabilidad de que un intervalo de confianza contenga el parámetro estimado se
denomina coeficiente de confianza.

=
𝑥̅ ± zα/2 (

Donde zα/2 es el valor de z correspondiente a un área


α/2 en la cola superior de una distribución z normal
Estándar y:
n= tamaño muestral
σ= desviación estándar de la población muestrada
Intervalo de confianza de muestra
grande (1-α)100%
Si σ es desconocida, puede ser aproximada por la desviación estándar muestral s cuando el
tamaño muestral sea grande (n≥30) y el intervalo aproximado de confianza es:

'
𝑥̅ ± zα/2 (

Donde zα/2 es el valor de z correspondiente a un área


α/2 en la cola superior de una distribución z normal
Estándar y:
n= tamaño muestral
s= desviación estándar muestral
Intervalo de confianza de muestra
grande (1-α)100%
Otra forma de hallar el intervalo de confianza de muestra grande para media poblacional µ
es empezar con estadística:

𝑥̅ − 𝜇
𝑧= 𝜎 Que tienen una distribución normal
C 𝑛
estándar
2̅ H I
𝑃(−𝑧𝛼 /2 < J < 𝑧𝛼 /2 )= 1- α
C K

Esta desigualdad puede rescribirse como:

𝑃(𝑥̅ − 𝑧𝛼 /2 =C (< µ < 𝑥


# + 𝑧𝛼 /2 =C ()= 1- α
Resolver
Un nutricionista selecciono una muestra aleatoria de n= 50 adultos hombres. Se encontró que el
promedio de ingesta diaria de productos lácteos fue de 𝑥̅ = 756 gramos por día, con una
desviación estándar de s = 35 gramos por día. Use esa información para construir un
intervalo de confianza del 95% para la ingesta diaria media de productos lácteos para
hombres
'
𝑥̅ ± 1,96( ) = 756 ± 9,70
(

Por tanto, el intervalo de confianza de 95% para µ es de 746.30 a 765,70 gramos por día
Construya un intervalo de confianza de 99% para el mismo ejemplo
Caracteristicas del intervalo de confianza
Es tan angosto como es posible. Cuanto mas angosto sea el intervalo, mas exactamente se habrá
localizado el parámetro estimado.
Tiene un coeficiente de confianza grande, cercano a 1. Cuanto mayor sea el coeficiente de
confianza, es mas probable que el intervalo contenga el parámetro estimado.
Intervalo de confianza de muestra grande (1-
α)100% para una proporción poblacional p
𝑝. 𝑞
𝑝̂ ± Zα/2
𝑛
Como p y q son incógnitas, se estiman con el uso de los mejores estimadores puntuales 𝑝̂ y 𝑞6. El
tamaño muestral se considera grande cuando: n. 𝑝̂ > 5 y n.𝑞6 > 5
Resolver
Una muestra aleatoria de 985 “probables” electores, es decir los que probablemente voten en la
próxima elección, fueron encuestados telefónicamente realizado por el partido A. De ellos 592
indicaron que tenían intención de votar por la candidatura del partido A en la próxima elección.
Construya un intervalo de confianza de 90% para p, la proporción de electores probables de la
población que tienen intención de votar por la candidatura del partido A. Con base en esta
información ¿ Se puede concluir que el candidato ganara la elección?
Resolución
La estimación puntual para p es:
𝑝̂ = x/n = 592/985 = 0,601

3.5 8,j8; .(8,kll)


Y el error estándar estimado es: = = 0,16
( lm9

El valor de z para un intervalo de confianza de 90% es el valor que tiene el área de α/2 = 0,05 en
la cola superior de la distribución z, z0,5 = 1,645. El intervalod e confianza del 90% para p es
entonces

8,j8; .(8,kll)
𝑝̂ ± Zα/2 (𝑝̂ . 𝑞6)/n 𝑝̂ ± 1,645 = 0,601 ± 0,26
lm9
Resolución
Se estima que el porcentaje de probables electores que tiene n intención de votar por el
candidato del partido A es entre 57,5% y 62,7% Suponiendo que el candidato necesita mas de
50% de los votos para ganar la elección y como los limites de confianza exceden ese limite, se
pued edecir con un 90% de confianza que el candidato ganara la elección.
Resolver
1. Encuentre un intervalod e confianza de 90% oara una media poblacional µ para estos valores:
n= 125 𝑥̅ = 0,84; s2= 0,086
n= 50 𝑥̅ = 21,9; s2= 3,44
Resolver
1. Encuentre un intervalo de confianza de 90% para una media poblacional µ para estos valores:
n= 125 𝑥̅ = 0,84; s2= 0,086
n= 50 𝑥̅ = 21,9; s2= 3,44
1. Una muestra aleatoria de n = 300 observaciones de una población binomial produjo x= 263
éxitos. Encuentre un intervalo de confianza de 90% para p e interprete el intervalo.
2. Se selecciona una muestra aleatoria de n mediciones de una población con media 𝜇
desconocida y desviación estandar 𝜎 = 10 conocida. Calcule el ancho del intervadlo de
confianza de 95% para 𝜇 para estos valores de n. n= 100; n=200; n=400
Resolver
1. La lluvia acida, causada por la reacción de ciertos contaminantes del aire con el agua de
lluvia, parece ser un problema creciente en Argentina. La lluvia pura que cae en aire limpio,
registra un valor de PH = 5,7 ( PH valor de la acidez 0= Acido, 14 es alcalino). Suponga que
muestras de agua de 40 lluvias se analizan oara el contenido de PH y 𝑥̅ = 3,7 y s = 0,5.
Encuentre un intervalo de confianza de 99% para el PH medio en agua de lluvia e interprete el
resultado.
2. Una encuestra muestral esta diseñada para estimar la proporción de minivans en el estado de
california. Se selecciona una muestra de 500 registros de una base de datos del
departamento de vehiculos y 68 clasifican como minivans
1. Use un intervalo de confianza del 95% para estimar la proporción de minivans de califormia
2. ¿cómo se puede estimar la proporción de minivans en California, con un grado mas alto de
precisión?
Resolver
1. ¿qué es normal cuando se trata de temperaturas corporales de personas? Una muestra
aleatoria de 130 temperaturas corporales humanas dadas, tenia una media de 36,80ºC y una
desviación estándar de 0,73 grados.
1. Construya un intervalo de confianza de 99% para la temperatura corporal promedio de las personas
sanas.
2. ¿ El intervalo de confianza construido en la parte 1, contiene al valor de 37ºC que es la temperatura
promedio usual citada por médicos y otros especialistas?
Resolver
1. Se considera esencial para una buena salud una pequeña cantidad del oligoelemento
selenio, 50-200microgramos por día. Suponga que se seleccionaron dos muestras n1=n2=30
adultos de dos regiones de Argentina y se registro la ingesta diaria de selenio para cada
persona. La media y la desviación estándar de las ingestas diarias de selenio para los 30
adultos de la región 1 fueron x1=167,1 y s1= 24,3 microgramos. Respectivamente. Las
estadísticas correspondientes para los 30 adultos de la región 2 fueron x2= 140,9 y s2= 17,6
microgramos.
1. Encuentre un intervalo de confianza de 95% para la diferencia de las ingestas medias de selenio
para las dos regiones. Interprete ese intervalo.
Resolver
1. Como grupo, los estudiantes que se especializan en Economía tienen las expectativas
salariales mas altas, seguidos por aquellos que estudian en los campos de las ciencias
computacionales, de acuerdo con los resultados de una encuesta estudiantil 2015. Se
seleccionaron muestras aleatorias de 50 recién graduados universitarios en cada
especialidad para comparar los salarios iniciales de los graduados en economía y ciencias
computacionales, y se obtuvo la siguiente información:
2. Especialidad Media ($) Desviación estandar
Economia 56.202 2225
Ciencias de Computación 50.657 2375

a) Encuentre una estimación puntual para la diferencia en salarios iniciales de estudiantes universitarios que
se especializan en Economía y Ciencias de Computación ¿cuál es el margen de error de su estimación?
b) Con base a los resultados de la parte a) ¿Piensa usted que hay diferencia importante en el promedio de
salarios iniciales entre unos y otros?, explique
Resolver
1. Como grupo, los estudiantes que se especializan en Economía tienen las expectativas
salariales mas altas, seguidos por aquellos que estudian en los campos de las ciencias
computacionales, de acuerdo con los resultados de una encuesta estudiantil 2015. Se
seleccionaron muestras aleatorias de 50 recién graduados universitarios en cada
especialidad para comparar los salarios iniciales de los graduados en economía y ciencias
computacionales, y se obtuvo la siguiente información:
Estimación de la diferencia entre dos
proporciones binomiales
Resolver:
1. Se seleccionaron muestras aleatorias independientes de n1= 800 y n2 = 640 observaciones de
las poblaciones binomiales 1 y 2 y se observaron x1= 337 y x2= 374 éxitos:
◦ Encuentre un intervalo de confianza de 90% para la diferencia ( p1-p2) de las dos proporciones
poblacionales. Interprete el intervalo.
◦ ¿qué suposiciones deben hacerse para que el intervalo de confianza sea valido?¿ se satisfacen estas
suposiciones?
2.¿La compañía M&M usa la misma proporción de dulces rojo en sus variedades sencillo y de maní? Una
muestra aleatoria de 56 M&M’s sencillos contenía 12 dulces rojos y otra muestra aleatoria de 32 M&M`s
de Maní contenían 8 dulces rojos.
◦ Construya un intervalo de confianza de 95% para la diferencia en las proporciones de dulces rojos para
las variedades sencilla y de maní
◦ Con base en el intervalo de confianza de la parte anterior, ¿ puede concluirse que hay una diferencia en
las proporciones de dulces rojos para las variedades sencilla y de maní? Explique
Resolver
1. En un estudio de la relación entre el orden de nacimiento y el éxito universitario, un
investigador encontró que 126 de una muestra de 180 graduados universitarios eran
primogénitos o hijos únicos. En una muestra de 100 No graduados de edad y nivel
socioeconómico comparables el número de primogénitos o hijos únicos fue de 54. Estime la
diferencia entre las proporciones de primogénitos o hijos únicos en las dos poblaciones de
las cuales se tomaron muestra. Use un intervalo de confianza del 90% e interprete sus
resultados.
2. Un ingeniero de control de calidad desea estimar la fracción de defectos en un lote grande
cartuchos de tinta para impresoras. De experiencias previas, el sabe que la fracción real de
defectos debe estar alrededor de 0,05 ¿ Que tan grande debe ser la muestra si el desea
estimar la verdadera fracciona no mas de 0,01, usando un intervalo de confianza de 95%

Você também pode gostar