Você está na página 1de 20

MÉTODOS ESTADÍSTICOS

Jennyfer Portilla Yela


Correo:
Jennyfer.portilla@correounivalle.edu.co

Universidad del Valle


Santiago de Cali
2019
DISTRIBUCIÓN MUESTRAL PARA LA VARIANZA 𝑺𝟐
A medida que las empresas y las industrias ponen más énfasis en la elaboración de productos que satisfacen
criterios de calidad, es mayor la necesidad de calcular y reducir la varianza de sus procesos. Es por esto que
conociendo la distribución de las varianzas de la muestra 𝑺𝟐 .

Pueden tomar diferentes valores, por lo tanto se

35
𝑆12 conocen como una variable aleatoria.

30
Una distribución muestral de la

25
varianza es la distribución de

Frecuencia
𝑆22

20
probabilidad de todos los posibles

15
valores de la varianza muestral.

10
5
𝑆𝑘2 0
5 10 15 20 25 30 35
2
S

Definición: Seleccionemos una muestra aleatoria de tamaño n de una población con distribución normal,
con desviación estándar igual a σ. De la muestra encontramos que la desviación estándar es igual a S, con
estos datos se puede calcular la siguiente variable aleatoria:

𝑛 − 1 𝑆2
= 𝜒2
𝜎2
La variable 𝜒 2 es una expresión que relaciona la varianza muestral 𝑆 2 y a la poblacional 𝜎 2 , de ahí su
utilidad dado que ambas quedan relacionadas con una distribución conocida, esta es distribución chi-
cuadrado, esto es: 𝜒2 ∼ 𝜒2 𝑛−1
DISTRIBUCIÓN MUESTRAL
DISTRIBUCIÓN MUESTRALPARA
PARALA VARIANZA 𝑺𝑺𝟐𝟐
LA VARIANZA
Ejemplo: Supongamos que las onzas de líquido que vierte una máquina embotelladora
tiene una distribución normal con 𝜎 2 = 1. Si se elige una muestra aleatoria de 10
botellas y se mide la cantidad de líquido que contiene cada una, ¿Cuál es la
probabilidad de que la varianza muestral sea mayor que 1.63?

Solución
X: Cantidad de líquido que la máquina embotelladora vierte
𝑛 = 10 X ∼ 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇, 𝜎 2 = 1)
2 𝑛−1 𝑆 2 10−1 𝑆 2 2
De acuerdo con lo anterior 𝜒 = = ~𝜒(9) , entonces:
𝜎2 1

2
10 − 1 𝑆 2 10 − 1 ∗ 1.63
𝑃 𝑆 > 1.63 = 𝑃 >
1 1
= 𝑃 𝜒92 > 14.67
= 1 − 𝑃 𝜒92 ≤ 14.67
= 1 − 0.90
= 0.10

La probabilidad de que la varianza muestral sea mayor que 1.63 es de 0.10.


𝟐𝟐
DISTRIBUCIÓN MUESTRAL PARA LA VARIANZA
DISTRIBUCIÓN MUESTRAL PARA LA VARIANZA 𝑺 𝑺

Ejercicio:

Si cierto proceso productivo de azúcar presenta una variabilidad mayor a 10.000


𝑔𝑟𝑎𝑚𝑜𝑠 2 es necesario hacer un ajuste en la máquina. Se sabe por estudios anteriores
que la producción de azúcar se distribuye normal con una varianza de 5536 𝑔𝑟𝑎𝑚𝑜𝑠 2 .
Si se selecciona una muestra de 30 paquetes de azúcar, ¿Cuál es la probabilidad de que
sea necesario reajustar la máquina?
INTERVALOS DE CONFIANZA
Anteriormente se dijo que un estimador es un estadístico que se usa para estimar un
parámetro poblacional.
Ejemplo
La media muestral 𝑋ത es un estimador puntual de la media poblacional μ.
Como no se puede esperar que un estimador puntual suministre el valor exacto del parámetro
poblacional, se suele calcular una estimación por intervalo.

Un estimador por intervalo es una regla para calcular dos números, por ejemplo a y b, del que
usted está completamente seguro que contiene el parámetro de interés. El concepto de
“completamente seguro” significa “con gran probabilidad”. Medimos esta probabilidad usando
el coeficiente de confianza (𝟏 − 𝜶).

Un intervalo de confianza es un rango de valores (Intervalo) estimado en el cual se espera que se


encuentre el valor del parámetro con una determinada confianza.

Por ejemplo:
(Parámetro) • El peso promedio de las cajas de cereal está entre
𝜽 495 y 502 gr.
• El porcentaje de votantes a favor podría estar
entre 65% y 74%.
a b • La variabilidad del llenado de las botella estaría
entre 4 y 6 𝑐𝑚2 .
COEFICIENTE O NIVEL DE CONFIANZA
En alguna forma, cada vez que se saque una muestra y construya un intervalo de confianza,
usted espera que incluya el parámetro, pero, a veces falla.

El nivel de confianza (1 − 𝛼) representa


el porcentaje de intervalos (“porcentaje
de éxito”) que incluirían el parámetro de
población si usted tomara muestras de la
misma población una y otra vez.

Por lo general, un nivel de confianza de


95% funciona adecuadamente. Esto indica
que si usted recogió cien muestras y creó
cien intervalos de confianza de 95%,
cabría esperar que aproximadamente 95
de los intervalos incluyeran el parámetro
de población.

En estas circunstancias, α es el llamado nivel de significación (Viene determinado por el


hecho de tomar solo una muestra de una población para realizar inferencias), esto es, una
medida de las posibilidades de fallar en la estimación mediante tal intervalo.
CONSTRUCCIÓN DE UN INTERVALO DE CONFIANZA
Sabemos que 𝑋ത es un estimador puntual de Margen de error: Esta cantidad indica la
μ muy razonable. Como resultado, el precisión de la estimación. Cuando usted utiliza
intervalo de confianza de μ depende del un estimador para una parámetro, es importante
conocimiento de la distribución muestral de recordar que, sin importar lo bien que este

𝑋. diseñado su estudio, su estimación esta sujeta a
error de muestreo.
Los intervalos de confianza por lo general
son de la forma 𝑎; 𝑏 , siendo: Es decir, cuantifica la cantidad que se considera
nos podemos haber equivocado al realizar la
𝑎 = 𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 − 𝑀𝑎𝑟𝑔𝑒𝑛 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟 estimación.
𝑏 = 𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 + 𝑀𝑎𝑟𝑔𝑒𝑛 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟
Ejemplo:
Donde: En una encuesta se indicó que la edad promedio
de los evaluados es de 22 años con un margen
Estimador: Es el valor que estima un de error de 3 años.
parámetro usando los datos de la muestra,
por ejemplo: Esto significa que: “La edad de los evaluados
estará entre 19 años y 25 años”.
𝜇
ณ 𝑆𝑒 𝑒𝑠𝑡𝑖𝑚𝑎 𝑐𝑜𝑛 → ณത
𝑋
Entre más grande sea el margen de error menos
𝑃𝑎𝑟á𝑚𝑒𝑡𝑟𝑜 𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟
seguro se podrá estar del valor de la estimación
puntual.
CONSTRUCCIÓN DE UN INTERVALO DE CONFIANZA
A menudo interesa el promedio de una población 𝜇. Por ¿ 𝜇𝐴 ?
ejemplo,

“Entre que valores se encontrará el peso promedio de


las cajas de cereal que produce la máquina A”.

Dado que nuestro interés es construir un rango de valores entre los que se encuentre el 𝜇 de una
población (𝑎 < 𝜇 < 𝑏) con cierto nivel de confianza (1 − 𝛼). Entonces:

𝐼𝐶 𝜇 1−𝛼 % = 𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 − 𝑀𝑎𝑟𝑔𝑒𝑛 𝑒𝑟𝑟𝑜𝑟; 𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 + 𝑀𝑎𝑟𝑔𝑒𝑛 𝑒𝑟𝑟𝑜𝑟


• Estimador: 𝑋ሜ
𝜎
• Margen de error (Error de muestreo): 𝑍1−𝛼
2 𝑛 Es el número de unidades
necesarias para conseguir
el ancho correcto para
Esto es: tener un nivel de confianza
𝜎 𝜎 de 1 − 𝛼.
𝐼𝐶 𝜇 1−𝛼 % = 𝑋ሜ − 𝑍1−𝛼 ; 𝑋ሜ + 𝑍1−𝛼
2 𝑛 2 𝑛
−𝑍1−𝛼 𝑍1−𝛼
2 2

Lo anterior es válido si el tamaño de muestra es grande (n>30) o si la población es normal con


varianza conocida.
INTERVALOS DE CONFIANZA PARA 𝝁
Ejemplo 1: Una máquina llena tazas con helado, y se supone que está ajustada para verter la
cantidad de 250 g. Como la máquina no puede llenar cada taza con exactamente 250 g, el
contenido que se añade a cada taza individual presenta cierta variación, cual indica que es una
variable aleatoria. Por estudios se sabe que el llenado de las tazas se ajusta a una distribución
normal con un llenado promedio de 250 g y una desviación estándar de 2.5 g. Para determinar
si la máquina está calibrada, se toma una muestra aleatoria de n = 25 tazas de helado para
pesarlas y se obtuvo un promedio de 250.2 g. Con información recolectada se puede afirmar
¿QuÉ la máquina esta calibrada (Use un nivel de confianza del 95%)?

X: Llenado de tazas de helado


𝑋 ∼ 𝑁𝑜𝑟𝑚𝑎𝑙 𝜇, 𝜎 = 2.5
𝑛 = 25

De acuerdo con lo anterior, se debe construir un intervalo de la forma:


𝜎 𝜎

𝐼𝐶 < 𝜇 > 1−𝛼 % = 𝑋 − 𝑍1−𝛼 ത
; 𝑋 + 𝑍1−𝛼
2 𝑛 2 𝑛

Inicialmente debemos encontrar a 𝑍1−𝛼 .


2
1 − 𝛼 = 0.95 → 𝛼 = 1 − 0.95 = 0.05 𝑍1−𝛼 = 𝑍 0.05 = 𝑍0.975 = 1.96
2 1− 2
𝜎 𝜎
𝐼𝐶 < 𝜇 > 1−𝛼

% = 𝑋 − 1.96 ; 𝑋ത + 1.96
𝑛 𝑛
INTERVALOS DE CONFIANZA PARA 𝝁
Ejemplo 1:

X: Llenado de tazas de helado


𝑋 ∼ 𝑁𝑜𝑟𝑚𝑎𝑙 𝜇 = 250, 𝜎 = 2.5
𝑛 = 25

𝜎 𝜎
𝐼𝐶 < 𝜇 >(1−𝛼)% = 𝑋ത − 1.96 ത
; 𝑋 + 1.96
𝑛 𝑛
De acuerdo con la muestra 𝑋ത = 250.2, entonces:

2.5 2.5
𝐼𝐶 < 𝜇 >95% = 250.2 − 1.96 ; 250.2 + 1.96
25 25

𝐼𝐶 < 𝜇 >95% = 249.22; 251.18

Lo que nos indica que con un 95% de confianza podemos concluir que el llenado promedio de
las tazas con helado se encuentra entre 249.22g y 251.18g, por lo tanto, como el valor deseado
250g de μ está dentro del intervalo de confianza resultante, no hay razón para creer que la
máquina esté mal calibrada.
INTERVALOS DE CONFIANZA PARA 𝝁
Tamaño de Desviación Distribución de Intervalo de confianza
muestra estándar (𝝈) la variable
Grande Normal o no 𝜎 𝜎
Conocida 𝑋ത − 𝑍1−𝛼 ത
; 𝑋 + 𝑍1−𝛼
𝑛 ≥ 30 normal 2 𝑛 2 𝑛
Grande Normal o no 𝑆 𝑆
Desconocida 𝑋ത − 𝑍1−𝛼 ത
; 𝑋 + 𝑍1−𝛼
𝑛 ≥ 30 normal 2 𝑛 2 𝑛
Pequeña 𝜎 𝜎
Conocida Normal 𝑋ത − 𝑍1−𝛼 ; 𝑋ത + 𝑍1−𝛼
𝑛 < 30 2 𝑛 2 𝑛
Pequeña 𝑆 𝑆
Desconocida Normal ഥ
X − 𝑡𝛼 , ഥ
; X + 𝑡𝛼,(𝑛−1)
𝑛 < 30 2
𝑛−1 𝑛 2 𝑛
Notas:
• 𝝈 es la desviación poblacional.
• 𝑺 es la desviación muestral.
• 𝒁𝟏−𝜶 es un valor de la distribución normal con media cero y varianza uno, que
𝟐
𝜶 𝛼
corresponde a la probabilidad de 1 − 𝟐 , es decir: 𝑃 𝑍 ≤ 𝑍1−𝛼 = 1 − 2
2
• 𝒕𝜶, 𝒏−𝟏 es un valor de la distribución t-student con 𝑛 − 1 grados de libertad, que
𝟐
𝜶 𝛼
corresponde a la probabilidad de 𝟐, es decir: 𝑃 𝑡𝑛−1 ≥ 𝑡𝛼 =
2 2
INTERVALOS DE CONFIANZA PARA 𝝁
Ejemplo 2: La International Air Transport Association realiza encuestas entre los viajeros de
negocios en las que se califica la calidad de los aeropuertos de salida internacional. La
calificación máxima es 10. Se seleccionó una muestra de 16 viajeros de negocios y a cada uno
se le pidió su calificación para el aeropuerto internacional de Miami. Para las 16 calificaciones
se obtuvo un promedio de 6.34 y una desviación estándar de 2.16 (Suponga que las
calificaciones tienen una distribución normal). Calcule el intervalo de confianza de 95% para la
media poblacional de las calificaciones al aeropuerto de Miami.

X: Calificación del aeropuerto de Miami.


𝑋 ∼ 𝑁𝑜𝑟𝑚𝑎𝑙 𝜇, 𝜎 𝑛 = 16 → 𝑋ത = 6.34 𝑆 = 2.16

De acuerdo con lo anterior, se debe construir un intervalo de la forma:


𝑆 𝑆
𝐼𝐶 < 𝜇 >(1−𝛼)% = ഥ X − 𝑡𝛼, 𝑛−1 ;ഥ
X + 𝑡𝛼,(𝑛−1)
2 𝑛 2 𝑛

Inicialmente debemos encontrar a 𝑡𝛼, 𝑛−1 .


2

1 − 𝛼 = 0.95 → 𝛼 = 1 − 0.95 = 0.05 𝑡𝛼, = 𝑡0.05 = 𝑡0.025,(15) = 2.131


2 𝑛−1 2 , 16−1
Entonces:
𝑆 𝑆
𝐼𝐶 < 𝜇 >(1−𝛼)% = ഥ
X − 2.131 ;ഥ
X + 2.131
𝑛 𝑛
INTERVALOS DE CONFIANZA PARA 𝝁
Ejemplo 2:
𝑆 𝑆
𝐼𝐶 < 𝜇 >(1−𝛼)% = ഥ
X − 2.131 ഥ
; X + 2.131
𝑛 𝑛

De acuerdo con la muestra:

2.16 2.16
𝐼𝐶 < 𝜇 >95% = 6.34 − 2.131 ; 6.34 + 2.131
16 16

𝐼𝐶 < 𝜇 >95% = 5.189; 7.490

Lo que nos indica que con un 90% de confianza se puede concluir que la media
poblacional de las calificaciones que recibe el aeropuerto de Miami está entre 5.189 y
7.490.
INTERVALO DE CONFIANZA PARA LA PROPORCIÓN POBLACIONAL
Los especialistas en diferentes áreas, a menudo, utilizan una muestra para estimar la
proporción de ocurrencias de un evento en una población. Por ejemplo, el gobierno estima,
mediante un procedimiento de muestreo, el índice de desempleo o la proporción de personas
sin trabajo de la fuerza laboral del país.

En algunos casos no basta con dar una estimación de dicha proporción, para estos casos, suele
ser necesario recurrir a la construcción un intervalo de confianza para una proporción
poblacional (P).

Tal como se vio para la media de la población 𝜇, el intervalo de confianza se construye


restando y sumando una cantidad especifica llamada: Margen de error. Si se toma una
muestra aleatoria de tamaño n de una población. Esto es:

𝑝Ƹ 1 − 𝑝Ƹ 𝑝(1
Ƹ − 𝑝)Ƹ
𝐼𝐶 𝑃 1−𝛼 % = 𝑝Ƹ − 𝑍1−𝛼 ; 𝑝Ƹ + 𝑍1−𝛼
2 𝑛 2 𝑛

Lo anterior se considera válido si: 𝑛𝑝Ƹ > 5 o 𝑛(1 − 𝑝)Ƹ > 5.


INTERVALO DE CONFIANZA PARA LA PROPORCIÓN POBLACIONAL
Ejemplo 1: La gerencia de recursos humanos de una empresa quiere estimar, con un nivel de
confianza de 96%, el porcentaje de los trabajadores de la empresa que cuentan con casa propia; de
una muestra de 350 empleados, 50% dijo tener casa propia.

X: Cantidad de empleados con casa propia.


n=350 𝑝=0.50
ො 1 − 𝛼 = 0.96 → 𝛼 = 0.04

Para poder emplear el intervalo de confianza se debe cumplir que 𝑛𝑝ො > 5, esto es:

𝑛𝑝ො > 5 → 350 0.50 = 175 > 5


Entonces:
0.50 1 − 0.50 0.50(1 − 0.50)
𝐼𝐶 𝑃 96% = 0.50 − 𝑍1−𝛼 ; 0.50 + 𝑍1−𝛼
2 350 2 350
Donde:
𝑍1−𝛼 = 𝑍 0.04 = 𝑍0.98 = 2.05
2 1− 2

0.50 1 − 0.50 0.50(1 − 0.50)


𝐼𝐶 𝑃 96% = 0.50 − 2.05 ; 0.50 + 2.05
350 350
𝐼𝐶 𝑃 96% = 0.4452; 0.5547

Se estima con una confianza de 96% que el porcentaje de trabajadores que cuentan con casa
propia esta entre 44.52% y 55.47%.
INTERVALOS DE CONFIANZA
Ejercicio:

Se deseo estimar, con una confianza establecido, la proporción de alumnos de una universidad
que acuden a sus instalaciones en su propio automóvil; se toma una muestra de 200 alumnos y
se encuentra que 25 de ellos manifiestan tener automóvil. Como resultado se obtuvo un rango
entre 0.065 y 0.185 ¿Con que nivel de confianza se construyo el intervalo?
INTERVALO DE CONFIANZA PARA LA VARIANZA DE LA POBLACIÓN
La varianza de la población da un indicio de cómo se comporta un conjunto de
datos. Desafortunadamente, normalmente es imposible saber exactamente el valor que
toma el parámetro. Para compensar nuestra falta de conocimiento, podemos construir un
intervalo de confianza. Para ello debemos recordar que:

Si la población tiene una distribución normal entonces podemos afirmar que:

𝑛 − 1 𝑆2 2
2 ∼ 𝜒𝑛−1
𝜎

Si se toma una muestra aleatoria de tamaño n de una población normal, un intervalo de


confianza para la varianza poblacional será:

𝑛 − 1 𝑆2 𝑛 − 1 𝑆2
𝐼𝐶 𝜎 2 1−𝛼 % = 2 ; 2
𝜒 𝛼 𝜒𝛼
1− ,𝑛−1 ,𝑛−1
2 2
Donde:

2 𝛼 𝛼
𝜒1− 𝛼 →𝑃 2
𝜒𝑛−1 < 𝜒2 =1− 𝜒𝛼2,𝑛−1 →𝑃 2
𝜒𝑛−1 < 𝜒2 =
2 ,𝑛−1 2 2 2
Intervalo de confianza para la varianza de la población
Ejemplo 2: Se toma una muestra aleatoria de 20 bolitas de acero y se mide su con precisión. Las
medidas, en mm, son las siguientes:

2.02 1.94 2.09 1.95 1.98 2.00 2.03 2.04 2.08 2.07 1.99 1.96 1.99 1.95 1.99 1.99 2.03 2.05 2.01 2.03

Si se asume que los diámetro se distribuyen normalmente, encuentre un intervalo de confianza para la
varianza de los diámetros con una confianza del 95%.

X: Diámetros de las bolitas de acero.


𝑋 ∼ 𝑁𝑜𝑟𝑚𝑎𝑙(𝜇, 𝜎)
n=20 1 − 𝛼 = 0.95 → 𝛼 = 0.05
Usando los datos obtenemos que 𝑆 2 = 0.001889, entonces:

20 − 1 (0.001889) 20 − 1 (0.001889)
𝐼𝐶 𝜎2 95% = ;
𝜒 2 0.05 2
𝜒0.05
1− 2 ,20−1 2 ,20−1
Donde:
𝜒2 0.05
2
= 𝜒0.975,19 2
→ 𝑃 𝜒19 < 𝜒 2 = 0.975 2
𝜒0.05 2
= 𝜒0.025,19 2
→ 𝑃 𝜒19 < 𝜒 2 = 0.025
1− ,20−1 ,20−1
2 2

2 2
𝜒0.975,19 = 32.87 𝜒0.025,19 = 8.90

20 − 1 (0.001889) 20 − 1 (0.008189) Con una confianza del 95% podemos afirmar que
𝐼𝐶 𝜎 2 95% = ; la varianza de los diámetros de las bolitas de
32.87 8.90
𝐼𝐶 𝜎 2 = 0.001091; 0.00403 acero se encuentra entre 0.001091 y 0.0040.
95%
Intervalo de confianza para la varianza de la población
Ejercicio:

1. Una máquina es utilizada para llenar botellas con detergente líquido. Una muestra aleatoria de 20
botellas dio como resultado una varianza muestral de 0.0153 𝑜𝑛𝑧𝑎𝑠 2 . Si la varianza del volumen
de llenado es muy grande, específicamente superior a 0.032 𝑜𝑛𝑧𝑎𝑠 2 , habrá una proporción
inaceptable de botellas con contenidos de líquidos muy alejados de la media. Suponiendo que el
llenado de la máquina está normalmente distribuido, construya un intervalo de confianza de límite
superior del 95% para la varianza y decida si la máquina se encuentra producción bajo las
condiciones deseadas.

2. En un automóvil típico, las carcasas se atornillan con una serie de tornillos de 13 𝑚𝑚. A muestra
aleatoria de 12 tornillos se les verifica como parte de un proceso de control de calidad el diámetro
en la punta y se encuentra que tiene una variación de 0.0013 𝑚𝑚2 . Construya un intervalo de
confianza del 95% para la varianza de los diámetros. ¿Qué se puede concluir?
INTERVALOS DE CONFIANZA
Ejercicios:

1. Supongamos que el tiempo que permanecen los clientes en una tienda local de
alimentación sigue una distribución normal. Una muestra aleatoria de 16 clientes tenía un
tiempo medio de 25 minutos. Supongamos que la desviación estándar es de 6 minutos.
Halle el margen de error y la amplitud del intervalo de confianza de la media poblacional al
95%.

2. Preocupa la velocidad a la que se conduce en un determinado tramo de una autopista. El


radar indica la siguiente velocidad de una muestra aleatoria de siete automóviles en
kilómetros por hora:79, 73, 68, 77, 86, 71, 69. Suponiendo que la población sigue una
distribución normal, ¿Entre que valores se encontraría la velocidad promedio a la que se
maneja en dicha autopista (Use un nivel de confianza del 95%)?

Você também pode gostar