Você está na página 1de 20

UNIDAD III: ESTADÍSTICA INFERENCIAL 74

INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL.

Una de las partes importantes de la estadística es resumir datos con la


posibilidad de efectuar generalizaciones y predicciones, esto significa un
avance importante en el conocimiento científico. En estadística descriptiva se
ven los métodos para organizar y resumir datos, así como obtener muestras
aleatorias (muestreo aleatorio simple) y la obtención de medidas descriptivas,
además de los fundamentos básicos de la probabilidad. Ahora que ya
contamos con estos fundamentos básicos podemos reunirlos para iniciar el
estudio de la inferencia estadística.

¿Qué es la estadística inferencial? Podemos resumirla como el proceso


mediante el cual se obtiene una conclusión respecto a una población
desconocida con base en los resultados obtenidos a partir de una muestra. La
incertidumbre producida por este proceso es cuantificable mediante la
probabilidad.
La inferencia estadística está basada en la Estimación y en las Pruebas
de Hipótesis. Por medio de la Estimación, se determinan los parámetros
desconocidos de una población, con la Prueba de Hipótesis se trata de decidir
si se aceptan o se rechazan esas estimaciones. En esta unidad tenemos tres
objetivos:

1. Estimar el valor único de un parámetro desconocido, conocida


como estimación puntual.
2. Estimar mediante un intervalo de valores en el cual se espera
con una determinada probabilidad, que se encuentre el
parámetro desconocido, conocida como estimación por
intervalos.
3. Estimar mediante una Prueba de Hipótesis, para inferir si se
acepta o se rechaza una hipótesis basándose en la evidencia
que proporciona la información muestral.

La finalidad del muestreo consiste en estimar mediante una muestra, las


características de la población de la cual se seleccionó la muestra. De ahí que
es necesario recordar que las medidas en la población se llaman
PARÁMETROS y las medidas en la muestra se llaman ESTADÍSTICOS.
UNIDAD III: ESTADÍSTICA INFERENCIAL 75

ESTIMACIÓN PUNTUAL

El objetivo principal de la estadística inferencial es la estimación, pero,


¿qué tipo de inferencias pueden hacerse? si en general lo que se desea es
conocer los parámetros que caracterizan a la población, sin embargo el
conocimiento de los parámetros de una población solo se puede lograr
realizando el censo de la población y esto no siempre se puede realizar.

Entonces los valores poblacionales suelen estimarse por sus correspondientes


valores muestrales, así la media muestral X es un estimador del parámetro de
x
la media poblacional µ. Una proporción muestral p$ = es una estimación de la
n
proporción poblacional p. La varianza muestral s2 es un estimador de la
varianza poblacional s2 . Resumiendo: X , p$ , s2, son estimadores, obtenidos de
una muestra de la población. En general, para un parámetro θ se tiene un
estimador q$ , este estimador es insesgado o de mínima varianza si el valor
esperado del estimador es igual al valor del parámetro poblacional θ, es decir si
E[ q$ ]= mq$ =θ. Comúnmente, los parámetros poblacionales se simbolizan con una
letra griega y sus estimadores con una letra latina.

Así que la mejor manera de conocer un parámetro es estimándolo, es


decir, aproximarse al parámetro por medio de un estadístico obtenido con una
muestra, el valor numérico que toma el estimador en una observación muestral
se llama ESTIMACIÓN PUNTUAL.

El estimador es una variable aleatoria que depende únicamente de las


peculiaridades de la muestra y la estimación puntual es un número, o sea el
valor que el estimador tomó con la realización de la muestra.

La estimación es el procedimiento utilizado cuando se responde a una


pregunta que pide el valor de un parámetro poblacional. Por ejemplo ¿Cuál es
el tiempo promedio que tardan los estudiantes del CCH Vallejo en llegar de su
casa a la escuela?
Si es necesario contestar esta pregunta debe tomarse una muestra de la
población y calcular la media muestral x . Supóngase que se selecciona una
muestra aleatoria de 200 tiempos y que resulta una media de 60 minutos.
¿Cuál es la estimación del valor medio de la población? Si se toma la media
muestral como dicha estimación, se estará efectuando una estimación puntual.

Cuando a un estadístico se le usa para estimar un parámetro, lo


denominamos ESTIMADOR y el valor numérico que tenga el estimador en una
observación muestral se llama ESTIMACIÓN PUNTUAL.

Para el ejemplo; la media muestral, x = 60 minutos es la mejor


estimación puntual para el tiempo que tardan los estudiantes en llegar de su
casa a la escuela para esta población. Es decir la media muestral x es un
estimador de la media poblacional µ. Lo anterior no quiere decir que la media
poblacional sea exactamente 60 minutos, esto se interpreta como µ es un
valor cercano a 60 minutos.
UNIDAD III: ESTADÍSTICA INFERENCIAL 76

En la unidad anterior se estudiaron los conceptos de distribución muestral


donde X es una variable aleatoria que depende únicamente de las
peculiaridades de la muestra. Por ejemplo la media muestral X es un
estimador de la media poblacional µ, mientras que la media x = 60 minutos es
una estimación puntual de µ. De ahí que denotaremos a la variable aleatoria X
con la letra mayúscula X , y a la estimación puntual x ( x = 60 minutos) con la
letra minúscula.

ACTIVIDAD:
 Contesta las siguientes preguntas:
a) ¿Cuántas naranjas hay en un kilogramo? __________
b) ¿Cuánto pesa una naranja? __________
c) ¿Cuánto dinero gastas en transportes cada mes? __________
d) ¿Cuántos días haz vivido? __________
e) ¿Cuál será tu promedio final al terminar el CCH? __________

Sí analizamos las respuestas a estas preguntas podemos observar que: no son


exactas, se pueden dar varias respuestas a una misma pregunta y todas son
igualmente válidas, se puede controlar el grado de aproximación de la
respuesta, la respuesta depende de los intereses y conocimientos de quien la
da, permite tomar decisiones a partir del dato obtenido.

Prueba ahora tu capacidad para estimar.


1.- ¿Cuántos pelos tiene un gato? ___________________________________
2.- ¿Cuántos litros de agua empleas al bañarte? ________________________
3.- ¿Cuántas lentejas hay en un kilogramo? ____________________________
4.- ¿Cuánto gasta en alimentación al mes tu familia? _____________
5.- ¿Qué ángulo de visión puedes barrer con un solo ojo? _________________
6.- ¿Cuántas palabras tiene una pagina del libro “El código Da Vinci”? _______
7.- ¿Cuánto tiempo tardaste en contestar razonablemente estas Cuestiones?
_________

 Una guardería atiende 50 niños en el nivel maternal B (niños entre dos y


tres años); continuamente dan entrenamiento y al final observan y evalúan
sus habilidades psicomotoras. La puntuación obtenida por cada niño en el
último entrenamiento está registrada en la siguiente tabla:

Niño Niño Niño Niño Niño Puntuación


Puntuación Puntuación Puntuación Puntuación
No. No. No. No. No.
1 63 11 56 21 57 31 56 41 60
2 68 12 51 22 55 32 60 42 61
3 52 13 66 23 42 33 61 43 79
4 55 14 73 24 69 34 53 44 53
5 51 15 76 25 69 35 68 45 58
6 61 16 37 26 74 36 66 46 57
7 71 17 59 27 64 37 53 47 61
8 47 18 49 28 83 38 73 48 70
9 65 19 72 29 77 39 63 49 47
10 75 20 67 30 60 40 64 50 60

1.- La media de la población de puntajes de los niños es m = 61.74 .


UNIDAD III: ESTADÍSTICA INFERENCIAL 77

2.-Se seleccionaron cuatro muestras aleatorias con reemplazo de tamaño n=5


de esta población usando una tabla de dígitos aleatorios, los resultados se
presentan en la siguiente tabla. Completa los dos últimos renglones con lo que
se pide.

Cuatro muestras de tamaño n = 5


1 2 3 4
48 58 52 83
60 51 72 73
64 83 61 56
58 73 51 73
55 79 70 61
X
X -m

3.- Ahora, usando una tabla de dígitos aleatorios extrae cuatro muestras
aleatorias de tamaño n = 10 con reemplazo, y elabora a continuación una tabla
como la anterior.

Cuatro muestras de tamaño n = 10


1 2 3 4

X
X -m

4.- En general ¿se observa que las discrepancias entre la media muestral X y
la media poblacional µ, o sea, ( X - µ) es menor cuando la muestra es de mayor
tamaño? ¿Qué observas en los casos anteriores para n =5 y para n =10?
__________________________

5.- ¿Qué piensas que ocurriría si se aumenta el tamaño de la muestra? ¿Por


qué? ___________________________________________________________

6.- Repite el procedimiento anterior para muestras con reemplazo de tamaño


n =15 y anota tus resultados en la siguiente tabla.
UNIDAD III: ESTADÍSTICA INFERENCIAL 78

Cuatro muestras de tamaño n =15


1 2 3 4

X
X -m

6.- ¿Qué observas en relación a las discrepancias X - µ con los anteriores


tamaños de muestra? ___________________________________________

ACTIVIDAD (Para iniciar Intervalos de confianza).


¿Cuándo un médico forense tiene que establecer la hora de un fallecimiento es
difícil que pueda decir que éste ocurrió a las 5h, 21m, 33s. La forma más
frecuente de expresar esta información es “el fallecimiento ocurrió entre las 5 y
6 h,” haciendo esto con mucha precisión; ya que por lo general el intervalo de
tiempo suele ser más amplio.

De este modo, se tienen varios valores posibles para dar la hora del
fallecimiento: de tal manera que cualquier instante entre las 5h y las 6 h. es un
candidato adecuado. Lo que nunca pretende decir el forense es que todos los
valores entre las 5h y 6h miden el suceso, sino que cualquiera de ellos puede
ser la medida real, y que, por lo tanto todos estos valores deben considerarse
como medidas posibles a tomarse en cuenta a la hora de establecer
consecuencias sobre este hecho.

Contesta las siguientes preguntas:


Si un alumno presenta el Examen de Ingreso Único al Nivel Medio Superior
a) ¿Cuál sería el número de aciertos para asegurar su primera opción?
___________________________________________________________
b) ¿Cuál es el tiempo que empleas al ir de tu casa al CCH?
________________________________________________________
c) ¿Cuál sería el número de aciertos para asegura su segunda opción?
___________________________________________________________
d) ¿Qué número de calzado utilizan las mujeres de tu salón?
___________________________________________________________
UNIDAD III: ESTADÍSTICA INFERENCIAL 79

e) ¿Cuál es la duración en horas de la batería de un teléfono celular?


_________________________________________________________

INTERVALO DE CONFIANZA.
Volviendo al ejemplo inicial ¿Cuál es el tiempo promedio que tardan los
estudiantes del CCH Vallejo en llegar de su casa a la escuela?
¿Qué significa decir que µ está próxima a 60 minutos? El término
“próximo” es relativo pero podemos decir posiblemente entre más o menos 15
minutos, de ahí que esperaríamos que µ esté entre 45 y 75 minutos. Lo
anterior nos indicaría que debemos hacer estimaciones utilizando el concepto
de intervalo donde utilizaremos una medida para la confiabilidad de éste en la
estimación del parámetro en cuestión. Esto se realizará como sigue:
- A partir de una muestra grande tomada con reemplazo al azar donde se
utilizarán como estimaciones puntuales de las medidas de la población la
media y el error estándar.
- Se determina un intervalo con centro en x , en términos de s x donde pueda
generalizarse que está la media de la población µ. Este intervalo se denomina
intervalo de confianza. Los extremos del intervalo se denominan límites de
confianza.
- Se determina la probabilidad que será el nivel de confianza, el cual debe
determinarse de antemano, digamos, por ejemplo, el 95% o 99% (que
denotaremos por 1-α). Entre mayor sea el intervalo mayor será esa
probabilidad.
Así por ejemplo un intervalo de confianza al 95% quedará expresado como x
±1.96 s x . (en la tabla de la distribución NORMAL estándar puedes encontrar
los valores que dejan el 2.5% en los extremos y te determinan una z = ±1.96).
Si el nivel de confianza es del 99% el intervalo será x ±2.58 s x .

EJEMPLO 1: En una empresa se observó que los días de permiso solicitado


por los trabajadores mensualmente durante 9 meses fueron:
x1=5; x2=6; x3=7; x4=8; x5=9; x6=9; x7=10; x8=11 y x9=12.
Se determina la población de muestras de tamaño dos con reemplazo tomadas
de esta población.

5 6 7 8 9 9 10 11 12
5 (5,5) (5,6) (5,7) (5,8) (5,9) (5,9) (5,10) (5,11) (5,12)
6 (6,5) (6,6) (6,7) (6,8) (6,9) (6,9) (6,10) (6,10) (6,12)
7 (7,5) (7,6) (7,7) (7,8) (7,9) (7,9) (7,10) (7,11) (7,12)
8 (8,5) (8,6) (8,7) (8,8) (8,9) (8,9) (8,10) (8,11) (8,12)
9 (9,5) (9,6) (9,7) (9,8) (9,9) (9,9) (9,10) (9,11) (9,12)
9 (9,5) (9,6) (9,7) (9,8) (9,9) (9,9) (9,10) (9,11) (9,12)
10 (10,5) (10,6) (10,7) (10,8) (10,9) (10,9) (10,10) (10,11) (10,12)
11 (11,5) (11,6) (11,7) (11,8) (11,9) (11,9) (11,10) (11,11) (11,12)
12 (12,5) (12,6) (12,7) (12,8) (12,9) (12,9) (12,10) (12,11) (12,12)

La distribución de medias muestrales x es:


UNIDAD III: ESTADÍSTICA INFERENCIAL 80

x 5 5.5 6 6.5 7 7.5 8 8.5 9 9.5 10 10.5 11 11.5 12


f 1 2 3 4 7 8 9 10 10 8 7 6 3 2 1

De ahí que la media es m x =8.55 su varianza es s x =2.3457 y s x =1.5315


2

Con la información anterior determina los intervalos de confianza al 95% para


cada valor muestral de x .

INTERVALO DE CONFIANZA = Estimador puntual ± Coeficiente de confiabilidad x Error estándar

(1.96) s x
x- (1.96) s x
x+ Intervalo
5-(1.96)(1.5315) 5+(1.96)(1.5315) (1.99, 8.0017)
5.5-(1.96)(1.5315) 5.5+(1.96)(1.5315) (2.49, 8.5017)
6-(1.96)(1.5315) 6+(1.96)(1.5315) (2.998, 9.0017)
6.5-(1.96)(1.5315) 6.5+(1.96)(1.5315) (3.498, 9.5017)
7-(1.96)(1.5315) 7+(1.96)(1.5315) (3.998, 10.0017)
7.5-(1.96)(1.5315) 7.5+(1.96)(1.5315) (4.498, 10.5017)
8-(1.96)(1.5315) 8+(1.96)(1.5315) (4.998, 11.0017)
8.5-(1.96)(1.5315) 8.5+(1.96)(1.5315) (5.498, 11.5017)
9-(1.96)(1.5315) 9+(1.96)(1.5315) (5.998, 12.0017)
9.5-(1.96)(1.5315) 9.5+(1.96)(1.5315) (6.498, 12.5017)
10-(1.96)(1.5315) 10+(1.96)(1.5315) (6.998, 13.0017)
10.5-(1.96) 10.5+(1.96)(1.5315) (7.498, 13.5017)
(1.5315) 11+(1.96)(1.5315) (7.998, 14.0017)
11-(1.96)(1.5315) 11.5+(1.96)(1.5315) (8.498, 14.5017)
11.5-(1.96)(1.5315) 12+(1.96)(1.5315) (8.998, 15.0017)
12-(1.96)(1.5315)

Representemos gráficamente los intervalos, como sabemos que la media de la


distribución muestral X es m x =µ=8.55.

¿CUÁL ES EL NIVEL DE CONFIANZA QUE DEBEMOS SELECCIONAR?


UNIDAD III: ESTADÍSTICA INFERENCIAL 81

Si aumentamos el nivel de confianza del 95% al 99% aumentará la posibilidad


de que el intervalo de confianza contenga el valor de la media en la población y
aunque es menos precisa la estimación ya que del intervalo se habrá ampliado
en un 4% (cálculo comparado con 1.96 y 2.57 errores estándar).

Al decidir cuál es el nivel de confianza que se utilizará, se debe considerar que


el objetivo principal del intervalo de confianza es comunicar a los demás los
resultados de la muestra. Con el intervalo de confianza podemos expresar el
error de muestreo, mediante un intervalo que posiblemente incluya la media de
la población. Por lo tanto, el nivel de confianza elegido a veces es un poco
arbitrario. Sin embargo, es conveniente considerar según el estudio que se
esté realizando y según la precisión que se requiera.

Como ya vimos en el ejemplo 1 una estimación por intervalo, es un intervalo


con centro en el estimador x , que se espera contenga el parámetro µ; por
ejemplo, veamos el intervalo (5.498, 11.501) sería una estimación por intervalo
del verdadero promedio de días de permiso solicitados por los trabajadores, el
ancho de este intervalo es 11.501-5.498=6.003, este intervalo puede contener o
no a la media poblacional µ.

La media x como estimador del parámetro µ tiene asociado un grado de


precisión que indica qué tan exacta es si el intervalo (5.498,11.501) es una
estimación por intervalo de µ basado en x =8.5 creemos razonable que
5.498 < µ < 11.501 o sea tenemos un grado de confianza de que el valor de µ
esté entre 8.5 ± 0.05.

La confiabilidad es la probabilidad de que la estimación sea correcta. Como


consecuencia del Teorema Central del Límite, la distribución muestral de X es
normal para muestras grandes por tanto, cuando estimamos µ usamos x .

Podemos considerar que una muestra es grande cuando n>30 y podemos


aumentar la confiabilidad y la precisión trabajando con muestras grandes.
s
Como µ= m x y sx = , entonces los valores de x serán cercanos a µ
n
cuando el tamaño de muestra aumente.

Las medidas poblacionales suelen estimarse por sus correspondientes


medidas muestrales; una media muestral x es una estimación de la media
x
poblacional µ; una proporción muestral p$ = es una estimación de la
n
proporción poblacional p; la varianza poblacional s2 se estima por s2 la varianza
muestral y la desviación estándar poblacional σ se estima por la desviación
estándar s obteniéndose de la muestra.

EJEMPLO 2:
UNIDAD III: ESTADÍSTICA INFERENCIAL 82

Cuando vemos una expresión del tipo:


P(1.48m1.62)=0.90,

pensamos que hay una probabilidad de 0.90 o 90% de que la media de la


población, calculada a partir de una muestra extraída de esta, sea un valor
comprendido entre 1.48 a 1.62. En éste caso el 0.90 es la probabilidad con la
que podemos afirmar el posible valor de la media poblacional este en dicho
intervalo, es decir que hay un 90% de confiabilidad, de que la media tenga
algún valor dentro del intervalo mencionado.

Representado gráficamente se observaría como:

Si deseamos tener mayor precisión al estimar el valor del parámetro, se debe


de contar con un intervalo de longitud más pequeño, pues hay mayor precisión
entre mas pequeña sea la confiabilidad, y viceversa, es decir es más confiable
el valor estimado del parámetro entre menos preciso sea y esto sucede cuando
aumentamos el tamaño del intervalo.

La confiabilidad y precisión están determinados por la relación de la


probabilidad de un evento más la probabilidad de su complemento que es igual
a 1, para éste caso:
(1-) +  = 1, donde:
 es la probabilidad de cometer error en la estimación
1- es la probabilidad de no cometer error (confiabilidad)

El intervalo obtenido con fines de estimación, se conoce como intervalo de


Confianza del (1-)% de contener a la verdadera media poblacional.
Por lo anterior, sabemos que con una misma muestra se pueden obtener
estimaciones muy precisas pero poco confiables o poco precisas pero más
confiables, esto depende del valor asignado a 1-.
Los valores más comunes asignados a 1- son: 90%, 95% y 99%
UNIDAD III: ESTADÍSTICA INFERENCIAL 83

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL µ CON


VARIANZA CONOCIDA.
Estimación por intervalo con un nivel de confianza específico. El Teorema
Central del Límite es la piedra angular para hacer estimaciones por intervalos
de confianza.

EJEMPLO 3: En un hospital de nutrición donde se atienden a mil niños en


promedio cada mes se extrajo una muestra de 40 niños de entre 6 y 7 años de
edad y se les midió la estatura obteniendo los siguientes resultados:

123 125 128 125 125 124 126 124


122 123 127 121 125 125 125 123
125 125 125 123 125 124 127 123
122 128 125 122 125 123 125 124
127 124 125 124 124 125 127 125

Como el tamaño de la muestra es suficientemente grande, esto no constituye


gran dificultad, puesto que se aplica el Teorema Central del Límite, para inferir
que la distribución de probabilidades del estadístico x es normal. De otra
manera, no pueden utilizarse estas técnicas.

Con base en esta muestra determina algunos intervalos de confianza para la


estatura promedio de los niños de entre 6 y 7 años, utilizando el valor medio de
la muestra x = 124.575 donde s2 = 4.59. En la siguiente tabla se muestran los
cálculos para intervalos de confianza de 90%, 95%, 99%.
s
X  Z
2 n
Donde Z  2 Es el valor de z que corresponde a un área de 
2 en la cola
derecha de la distribución normal estándar de z.

Intervalos de confianza para µ cuando se conoce σ.


Tamaño de la muestra n = 40, σ = 2.14, x = 124.575

Confianza = Fórmula Cálculos Intervalos


Deseada
90% 1.65 x �1.65 s 2.14 124.0167 a 125.1333
124.575±1.65
n 40

95% 1.96 s 2.14 123.9125 a 125.2374


x �1.96 124.575±1.96
n 40

99% 2.58 s 2.14 123.7029 a 125.4470


x �2.58 124.575±2.58
n 40
UNIDAD III: ESTADÍSTICA INFERENCIAL 84

ACTIVIDAD:
 Si un alumno tarda entre 40 y 60 minutos en trasladarse de su casa al CCH
a) ¿Cuál es el tiempo que hace de su casa al CCH?
__________________
b) ¿Cuál es la diferencia entre el tiempo regular y el mayor tiempo?
__________________________________________________________
c) ¿Cuál es la diferencia entre el tiempo regular y el menor tiempo?
___________________________________________________________
d) Expresa los resultados anteriores entre el tiempo regular y ambas
diferencias. _____________________________________________

 El costo promedio de un celular es de $2000. Si este precio oscila en un


20%
a) ¿Cuál es el costo mínimo? ____________________________________
b) ¿Cuál es el costo máximo? ___________________________________
c) Expresa el costo posible del celular como un intervalo ______________

 Una máquina envasa azúcar en bolsas de 1000 gr. Periódicamente se


revisa la máquina para ver sí no se ha desajustado, para lo cual se
selecciona una muestra aleatoria de 49 bolsas, pesando su contenido y
obteniendo un peso promedio de X = 988 gr. con una desviación estándar
de 8 gr. A partir de esta información se desea construir un intervalo del 94%
de confianza, para la estimación del verdadero peso de azúcar en las
bolsas.

 Responde a las siguientes preguntas:


a) ¿Cuál es la diferencia entre una estimación puntual de la media
poblacional ( m ) y una estimación por intervalo de confianza de el
mismo parámetro? __________________________________________
__________________________________________________________
__________________________________________________________

b) ¿Qué significa que podamos afirmar con una probabilidad 1-  que el


intervalo obtenido contenga para cualquier muestra determinada el valor
estimado de m ? ____________________________________________
__________________________________________________________
__________________________________________________________

 Después de leer el siguiente planteamiento, responde a las preguntas:


Si el tiempo promedio que tardan 36 estudiantes (muestreados al azar) en
resolver un examen es de 19.9 minutos y la desviación estándar de esos
tiempos es s = 5.73 minutos, se dice que con la aplicación del modelo para
estimar el valor promedio real m de todos los estudiantes de ese colegio
(población), resulta que dicho valor, se estima que se encuentra entre 18.0 y
21.8 minutos, con un intervalo de confianza del 95%, ¿qué significa lo
siguiente?

a) ¿Se tiene la certeza de que el valor promedio real ( m ) se encuentra en


ese intervalo? ______________________________________________
__________________________________________________________
UNIDAD III: ESTADÍSTICA INFERENCIAL 85

b) ¿La estimación del valor promedio real ( m ) se puede basar en el tiempo


promedio obtenido en la muestra? ______________________________
__________________________________________________________

c) ¿Qué significa sustituir por 1.96 el valor del 95% de confianza?


__________________________________________________________
__________________________________________________________
s
d) ¿En que nos basamos para sustituir m por m x y σ por en la
n
fórmula para obtener ese intervalo? _____________________________
_________________________________________________________

EJEMPLO 4:
Se eligió una muestra aleatoria n = 50 personas y se encontró que la
ingestión de lácteos diarios promedio es de x = 756 gramos con una
desviación estándar s = 35 gramos diarios y se construyó un intervalo de
confianza del 95% para la ingestión de lácteos.
El intervalo de confianza aproximado de 95% es: 756  9.70
Por lo que el intervalo de confianza de 95% para m es  746.30, 765.70
La interpretación del intervalo de confianza, si el objetivo es construir 20
intervalos, los intervalos podrían parecerse a los de la figura:

m
De los 20 intervalos, se podría esperar que el 95% de ellos es decir 19 de
20 funcionen como se ha planeado y contengan a m dentro de sus límites
inferior y superior. Recuerda que no puedes estar seguro de que cualquier
intervalo particular contenga la media m, y nunca sabrás si tu intervalo
particular es uno de los 19 que la contienen o si este es el que no contiene
a la media m.
Observación:
Un buen intervalo de confianza debe de tener las siguientes características:
1. Ser tan estrecho como sea posible. Cuando más estrecho sea el
intervalo, habrás localizado el parámetro estimado con más
exactitud.
2. Tener un coeficiente de confianza grande, cercano a 1. Cuanto más
grande sea el coeficiente de confianza, hay más probabilidades de
que el intervalo contenga al parámetro estimado.
TAMAÑO DE MUESTRA
UNIDAD III: ESTADÍSTICA INFERENCIAL 86

Cuando se efectúan estimaciones de un intervalo para la media, se puede


contar con los datos conocidos de una muestra, sin embargo en ocasiones se
requiere saber ¿qué tan grande debe ser la muestra de la población? Aún
cuando sabemos que se presentará cierto grado de error de muestreo por no
considerar a la población completa, el error de muestreo se puede controlar si
seleccionamos una muestra del tamaño adecuado.

EJEMPLO 5:
El departamento de personal de la Delegación Milpa Alta, desea estimar el
número promedio de años de educación superior terminados por sus
empleados. Una estimación aceptable de la desviación estándar del número de
años de educación superior, es 1.0 ¿cuál debe ser el tamaño de la muestra,
para estimar la µ con una precisión menor a 0.5 años y 99% de confianza?

1-= 0.99 Z  = 2.58  = 0.5


2
s
considerando que el error de estimación está dado por  = z podemos
2 n
2
 z s 
despejar n de la expresión anterior obteniendo n =  2 

 
2
 2.58 (1) 
sustituyendo tenemos n =   = 5.16 2 = 26.62 como el tamaño de la
 0. 5 
muestra debe ser un número entero, se redondea al siguiente entero n = 27

La Bolsa Universitaria de Trabajo de la UNAM, realiza una investigación de los


ingresos anuales de los estudiantes egresados que consiguen empleo por
medio de este servicio. Se sabe que la desviación estándar de los ingresos
anuales de 1000 egresados es de $1,500 ¿Qué tan grande debe ser la muestra
que debe tomar la BUT de la UNAM, con el fin de estimar el ingreso medio
anual de los estudiantes graduados el año pasado, dentro de más menos $500
y con un nivel de confianza del 95%?

1-= 0.95 Z  = 1.96


2
El límite superior de confianza es x  zs x = x  $500 por lo cual zs x = $500

Sustituyendo Z  = 1.96 tenemos 1.96s x = $500 despejando


2
$500
sx = = $255
1.96
2
s  s 
El error estándar de la media es s x = despejando n =  
n s x 

2
 $1500 
Sustituyendo en la fórmula n =   = 5.882 = 34.6
2

 $255 

Se redondea al siguiente entero n = 35


INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN POBLACIONAL
UNIDAD III: ESTADÍSTICA INFERENCIAL 87

La Estimación de la proporción de una población, es una de las Estimaciones


que se utiliza con frecuencia por ejemplo: el gobierno estima mediante un
muestreo, la proporción de personas sin trabajo de la fuerza laboral de un país
(o sea el índice de desempleo); la proporción de votantes probables que
votarán por un partido determinado; la proporción de personas que ven un
programa de televisión, etc.

Cada uno de estos ejemplos es un experimento binomial, y el parámetro por


estimar es la Proporción binomial  . Cuando el tamaño de la muestra es
grande, la proporción muestral:

x Número total de éxitos


ˆ =
p =
n Número total de ensayos
el mejor estimador puntual para la proporción poblacional  .
p$ es
Puesto que su distribución muestral es aproximadamente normal, con media 
pq
y la desviación estándar de la proporción de éxitos en una muestra s p = ,
n
p̂ se puede usar para construir un intervalo de confianza de (1-)100% de
confianza para una proporción poblacional  en una muestra grande:
pq
pˆ  z 
2 n

Donde z  2 Es el valor de z que corresponde a un área de 


2 en la cola
derecha de la distribución normal estándar de z.
EJEMPLO 6:
Cuando se sondeo una muestra de 70 padres de familia con relación al bajo
desempeño escolar de sus hijos adolescentes de secundaria, el 66% mencionó
que la disminución en sus calificaciones se debía al excesivo tiempo dedicado
al Internet.

 Calcule la desviación estándar de la proporción de padres de familia que


culpan al excesivo tiempo en Internet, de las bajas calificaciones de sus
hijos adolescentes.
 Encuentre los límites de confianza inferior y superior, para esta proporción,
dado un 95% de nivel de confianza.

a) El tamaño de la muestra n = 70
b) La proporción es pˆ = 0.66
c) La desviación estándar es

pˆ (1 - pˆ ) 0.66(1 - 0.66) 0.66(0.34)


s pˆ = = = = 0.0566
n 70 70
d) ¿El tamaño de la muestra es suficientemente grande para que de
acuerdo al Teorema Central del Límite, la distribución de la proporción
muestral sea aproximadamente normal?
Se verifica que npˆ  5 y n(1 - pˆ )  5
UNIDAD III: ESTADÍSTICA INFERENCIAL 88

ˆ 5
np 70(0.66)= 46.2  5 n(1 - p
ˆ) 5 70(0.34)=23.8 
5
e) El valor del coeficiente de confianza z  2 para un intervalo de confianza
1- 0.95
de 95% es = = 0.475 que se busca en la tabla de la
2 2
distribución normal estándar dando un valor de z  2 = 1.96
f) El límite inferior del intervalo es
pˆ - z s pˆ = 0.66 - 1.96(0.0566) = 0.66 - 0.111 = 0.549
2
g) El límite superior del intervalo es
pˆ  z s pˆ = 0.66  1.96(0.0566) = 0.66  0.111 = 0.771
2
h) Por lo tanto podemos estimar que la proporción  de padres de familia
que culpan al excesivo tiempo de Internet de las bajas calificaciones de
sus hijos adolescentes se encuentra en el intervalo 0.549  p  0.771

ACTIVIDADES:

 En base a análisis previos, una nutrióloga estima, que la desviación


estándar del contenido de proteínas por cada lata de atún de marca
Pescador, es de aproximadamente 3.2 gr. ¿qué tan grande debe ser el
tamaño de la muestra de latas que debe analizar para que el error en la
estimación del parámetro que desconoce (m) sea de cuando más 1.5 gr. Con
una confianza mínima de:
a) 95% b) 99%

 Se tomó una muestra aleatoria de 256 alumnos que ingresaron a la


Escuela Nacional Preparatoria de la UNAM durante 2007, de los cuales el
68% son mujeres. ¿Cuál es el intervalo de confianza del 94% para la
verdadera proporción de ésta investigación?

a) El tamaño de la muestra
b) La proporción es
c) La desviación estándar es

d) ¿El tamaño de la muestra es suficientemente grande para que de


acuerdo al Teorema Central del Límite, la distribución de la proporción
muestral sea aproximadamente normal?
Verifica que npˆ  5 y n(1 - pˆ )  5
ˆ 5
np n(1 - p
ˆ) 5
e) El valor del coeficiente de confianza z  2 para un intervalo de confianza
de 94% es
que se busca en la tabla de la distribución normal estándar
z =
2
f) El límite inferior del intervalo es
UNIDAD III: ESTADÍSTICA INFERENCIAL 89

g) El límite superior del intervalo es

h) Por lo tanto podemos concluir que: ______________________________


__________________________________________________________

se encuentra en el intervalo _______________________________

 Una maestra de matemáticas del CCH plantel Vallejo, aplicó un examen


diagnóstico a 150 alumnos que ingresaron a primer semestre, y encontró
que el 42% de ellos no podía realizar operaciones con fracciones
correctamente. Estime el error estándar de la proporción y construya un
intervalo de confianza del 99% para la proporción verdadera de alumnos
que ingresan al primer semestre del CCH que no pueden efectuar
operaciones con fracciones correctamente.

a) El tamaño de la muestra
b) La proporción es
c) La desviación estándar es

d) ¿El tamaño de la muestra es suficientemente grande para que de


acuerdo al Teorema Central del Límite, la distribución de la proporción
muestral sea aproximadamente normal?
Verifica que npˆ  5 y n(1 - pˆ )  5
ˆ 5
np n(1 - p
ˆ) 5
e) El valor del coeficiente de confianza z  2 para un intervalo de confianza
de 94% es
que se busca en la tabla de la distribución normal estándar
z =
2

f) El límite inferior del intervalo es

g) El límite superior del intervalo es

h) Por lo tanto podemos concluir que: ______________________________


__________________________________________________________

se encuentra en el intervalo _____________________________

EJERCICIOS
UNIDAD III: ESTADÍSTICA INFERENCIAL 90

3.1.1 Explica con tus propias palabras que entiendes por “estimación puntual”.

3.1.2. Un automóvil de 4 cilindros en la Ciudad de México arroja un promedio


de 8.2 Km. por litro indica dos estimaciones puntuales del parámetro 8.2 Km.

3.2.1 Explica el concepto de estimación por intervalos

3.2.2. Explica con tus propias palabras el significado de estimación por


intervalo del siguiente problemas: Josué leyó un reporte en donde se indica que
hay un 90 % de seguridad de que las cajas de galletas “Chispas de Chocolate”
en su presentación de 1 Kg., tengan un contenido que va desde 0.985 Kg.
hasta 1.015 Kg.

3.2.3. SÍ los expertos en cierta materia afirman con una probabilidad de 0.99
que el Error Máximo de la Estimación de una media poblacional es 1.30 y este
valor fue obtenido mediante la sustitución de los elementos de la expresión del
6.2
Error Máximo: (2.575) , ¿Cuáles son los valores de n, σ y zα/2?
150
3.2.4. En una distribución muestral de p ¿cuáles son las condiciones que se
debe cumplir para considerar que n es grande?

3.3.1 ¿Con qué finalidad se utiliza la estimación por intervalo?

3.3.2 Establece los conceptos que definen la confiabilidad y la precisión de un


intervalo.

3.3.3. ¿Qué significa el intervalo P( 5.3  m  8.9) = 0.99 ?

3.3.4 ¿Qué propósito tiene determinar intervalos de confianza para la


proporción poblacional?

3.4.1 Un entrenador de atletismo encontró que en promedio, una muestra de 35


atletas, corren 5 kilómetros en 17.2 minutos, con una desviación estándar de 8
minutos aproximadamente. Si se supone que la distribución de la población es
normal, ¿cuál es el intervalo de confianza del 90 por ciento para μ?

3.4.2 Se selecciona una muestra aleatoria de 500 fumadores de cigarros y se


encontró que 90 tienen preferencia por la marca Raleigh. ¿Determina un
intervalo de confianza de 86% para la fracción de la población de fumadores
que prefieren la marca Raleigh?

3.4.3 La estatura de la muestra aleatoria de 50 estudiantes mostró una media


de 172 cms. y una desviación de 6.8 cms. Determina un intervalo de confianza
del 98% para la estatura media de todos los estudiantes.

3.4.4 ¿Qué tamaño de muestra seria necesario para obtener un intervalo de


confianza del 95% para la proporción en la población si el error es 0.08 ?

3.5.1 ¿La interpretación estadística de un intervalo de confianza para estimar


m donde 100(1-  )% = 90% es?
UNIDAD III: ESTADÍSTICA INFERENCIAL 91

3.5.2 ¿La interpretación estadística de un intervalo de confianza para estimar


p donde 100(1-  )% = 97% es?
~

3.5.3. Con base a las estaturas de 100 personas, el intervalo de confianza


estimado del 90% de la media de la población m que corresponde a 1.68m, es
de 1.65 < m < 1.71. Dibuja un esbozo de la gráfica que represente el intervalo
de confianza para μ.
3.5.4 ¿ En donde se encuentra ubicado el intervalo de confianza para la
estimación de una proporción poblacional en términos del área bajo la curva
normal?

3.6.1 ¿Cuál debe ser el tamaño de la muestra de n si la media poblacional m


debe estimarse con el 98% de confianza y un error máximo de 220, sabiendo
que la población tiene un desviación estándar s de 150?

3.6.2 ¿De qué tamaño fue seleccionada una muestra, sin el error estándar
resultó 1.9 para un valor  = 1.96 con  = 5.73?
3.7.1. Sí la x del tiempo que hace una muestra de 81 empleados del Hospital
Siglo XX, para llegar desde su casa al trabajo es de 1.48 horas, con una s = 0.60
el intervalo de confianza del 99%, es:
3.7.2. Con base en una muestra aleatoria 56 alumnos del CCH plantel oriente,
se cuantificó el gasto semanal de los alumnos para asistir a la escuela,
_
obteniendo una media aritmética
x = 114.6 pesos y desviación
estándar s = 39.1 pesos. El Intervalo de Confianza para la media aritmética
poblacional con 1 -  = 0.99 fue:
P (101.18  m  128.01) = 0.99
¿ Qué concluyes con este intervalo ?

3.7.3 Durante un año y medio las ventas han estado disminuyendo de manera
consistente en las 1 500 sucursales de una cadena de comida rápida. Una
empresa de asesores ha determinado que el 31 % de una muestra de 95
sucursales tiene claros signos de una mala administración. Construye un
intervalo de confianza del 95 % para esta proporción.

3.7.4 En una encuesta realizada a las personas que salían de ver una película
en una sala de cine, se determinó con un nivel de confianza del 95% que los
límites de 47.6% y 54.4% contienen al porcentaje de espectadores a los que
les gustó la película ¿se podría decir que para la mayoría de las personas la
película fue de su agrado?

SOLUCIÓN A LOS EJERCICIOS


UNIDAD III: ESTADÍSTICA INFERENCIAL 92

3.1.1. Cuando a un estadístico se le usa para estimar un parámetro, lo


denominamos ESTIMADOR y el valor numérico que toma el estimador en una
observación muestral se llama ESTIMACION PUNTUAL.

3.1.2. Varias respuestas por ejemplo: 7.5 Km., 8.3 Km., 7.9 Km., etc.

3.2.1. Consiste de dos valores numéricos que definen un intervalo, el cual,


con grados variables de confianza se considera que incluye al parámetro que
está estimando.

3.2.2. Que las cajas de galletas tienen en promedio 1 Kg., y que se ha


estimado con un nivel de confianza del 90% y que su peso oscila entre 0.985 y
1.015 Kg.

3.2.3. n = 150; σ = 6.2 y zα/2 = 2.575

3.2.4. np  5
n(1 – p)  5

3.3.1. Para conocer con una alta probabilidad (prefijada por el interesado) entre
que valores extremos se encuentra una media o una proporción poblacionales.

3.3.2. El estimador se acercará al parámetro Θ de la población aumentando el


tamaño de la muestra, esto nos da la confiabilidad de que un parámetro Θ se
encuentre dentro del intervalo. Un intervalo más angosto nos da más precisión
de que el parámetro Θ se encuentre dentro del intervalo escogido.

3.3.3. Significa que la media poblacional (m ) se encuentra contenida en el


intervalo de 5.3 a 8.9, inclusive, con una probabilidad de 0.99.

3.3.4. Conocer entre que valores se encuentra p con una probabilidad fijada de
antemano.

3.4.1. El coeficiente de confianza de 0.90 se aproxima a 1.645. El error


8
estándar es de s x = = 1.35, de modo que el intervalo de confianza del 90
35
por ciento para μ es: 17.2 ± 1.645(1.35)
17.2 ± 2.2
15.0< μ <19.4

3.4.2. 0.1546  p  0.2054

3.4.3. 169.57  m  174.24

3.4.4. N = 150

3.5.1. Que el 90% de los intervalos construidos contienen al parámetro m .


Por ejemplo: Si se construyen 120 intervalos 108 de ellos contienen m

3.5.2. Que el 97% de los intervalos construidos contienen al parámetro p.


UNIDAD III: ESTADÍSTICA INFERENCIAL 93

Por ejemplo: Si se construyen 90 intervalos 87 de ellos contienen p

3.5.3.

90%

1.65 1.68 1.71

3.5.4. entre - zα/2 y z α/2


3.6.1. 81

3.6.2. 36

3.7.1. 1.3080 hrs. < μ < 1.6520 hrs.

3.7.2. Se concluye que la media poblacional de gasto semanal de todos los


alumnos del CCH plantel está contenida en el intervalo de 101.18 a 128.01 con
una probabilidad de 0.99

3.7.3. (0.22, 0.40) ó 0.22 < p < 0.40

3.7.4. No se puede asegurar si a la mayoría le gustó la película

Você também pode gostar