Tema 2. Prueba de Hipótesis - 2muestras

EI.
Contenido
2. Prueba de Hipótesis
2.1. Pruebas de hipótesis
2.2. Elementos de una prueba estadística
2.3. Errores tipo I y II
2.4 Significancia: Valor p
2.5 Pruebas de hipótesis para medias: muestras grandes y pequeñas
2.6 Pruebas de hipótesis para varianzas y proporciones
2.7 Potencia de la prueba
Prueba de hipótesis – Dos muestras
En el contraste de hipótesis de dos muestras no se pretende medir dos características
diferentes de una misma población, el objetivo es medir una misma característica a dos
diferentes poblaciones y comparar los valores de sus parámetros.
Supongamos se tienen dos poblaciones de interés, llamémoslas X e Y, que como variables

aleatorias se supone son Estocásticamente Independientes, con tamaño 𝑛1 y 𝑛2 …
La aleatoriedad permite que la toma de una muestra no influencie o se vea influenciada
por la forma en la que se toma la otra muestra.
𝑋 𝑇 = (𝑋1 𝑋2 … 𝑋𝑛1 ) 𝑌 𝑇 = (𝑌1 𝑌2 … 𝑌𝑛2 )

Población 1 𝜇𝑥 , 𝜎𝑥2 Población 2 𝜇𝑦 , 𝜎𝑦2
Muestra 1 𝑋, 𝑠𝑥2 Muestra 2 𝑌, 𝑠𝑦2
Prueba de hipótesis – Dos muestras (2)
El problema consiste en verificar estadísticamente si la diferencia (𝜇1 − 𝜇2 ) entre las dos
medias poblacionales, es igual a un determinado valor δ
Un contraste bilateral se plantea de la siguiente manera:

𝐻0 : 𝜇1 − 𝜇2 = δ
𝐻1 : 𝜇1 − 𝜇2 ≠ δ
Asumiendo muestras grandes y varianzas de ambas poblaciones conocidas, podemos

calcular el estadístico de prueba a partir de:
𝜃 − 𝜃0 𝜃 = 𝜇1 − 𝜇2
𝑍=
𝜎𝜃
𝜃 = 𝑋1 − 𝑋2
CONTRASTE BILATERAL 𝐻0 : 𝜇1 − 𝜇2 = δ
𝐻1 : 𝜇1 − 𝜇2 ≠ δ
𝜃 − 𝜃0
𝑍= 𝜃 = 𝜇1 − 𝜇2
𝜎𝜃 (𝑋1 − 𝑋2 ) − (𝜇1 − 𝜇2 )
𝜃 = 𝑋1 − 𝑋2 𝑍=
𝜎12 𝜎22 Valor p
Error estándar del estimador
𝑛1 + 𝑛2
𝜎12 𝜎22 −𝑍𝛼/2 𝝁𝟏 − 𝝁𝟐 𝑍

𝜎𝑋1 −𝑋2 = + Valor p = 2P (Z < -a) 𝛼/2
𝑛1 𝑛2 ó
Valor p = 2P (Z > a)
CONTRASTE UNILATERAL 𝐻0 : 𝜇1 − 𝜇2 = δ
𝐻1 : 𝜇1 − 𝜇2 < δ
𝜃 − 𝜃0
𝑍= 𝜃 = 𝜇1 − 𝜇2 (𝑋1 − 𝑋2 ) − (𝜇1 − 𝜇2 )
𝜎𝜃 𝑍=
𝜃 = 𝑋1 − 𝑋2 𝜎12 𝜎22
𝑛1 + 𝑛2 Valor p
Error estándar del estimador
𝜎12 𝜎22 −𝑍𝛼 𝝁𝟏 − 𝝁𝟐

𝜎𝑋1 −𝑋2 = + Valor p = P (Z < -a)
𝑛1 𝑛2
Se extraen dos muestras aleatorias independientes de tamaños 𝒏𝟏 y 𝒏𝟐 , de dos
poblaciones con medias μ𝟏 y μ𝟐 y varianzas 𝝈𝟐𝟏 y 𝝈𝟐𝟐 . La variable aleatoria sigue una
distribución normal estándar…
(𝑿𝟏 − 𝑿𝟐 ) − (𝝁𝟏 − 𝝁𝟐 )
𝒁=
𝝈𝟐𝟏 𝝈𝟐𝟐
𝒏𝟏 + 𝒏𝟐
Ambos estadísticos sirven para como base para el desarrollo de los procedimientos de
prueba que incluyen dos medias. La hipótesis bilateral sobre dos medias se escribe…
𝐻0 : 𝜇1 − 𝜇2 = δ 𝑋1 − 𝑋2 − δ
z=
𝐻1 : 𝜇1 − 𝜇2 ≠ δ 𝜎12 𝜎22
+
𝑛1 𝑛2
Ejercicio
Intentamos probar si una nueva dieta baja en grasa ayuda a perder peso a personas
obesas. 100 personas con esta condición se seleccionan aleatoriamente y se asignan al
grupo 1, quienes prueban la dieta. Otro grupo de 100 personas con la misma condición,
se seleccionan y asignan al grupo 2, quienes comienzan una dieta de aproximadamente
la misma cantidad de comida pero no tan baja en grasa. Después de 4 meses, la pérdida
de peso fue de 9.31 lbs para el grupo 1 (s=4.67) y 7.40 lbs (s=4,04) para el grupo 2.
Pruebas sobre dos medias (Varianzas desconocidas pero iguales 𝝈𝟐𝟏 = 𝝈𝟐𝟐 = 𝝈𝟐 )
Las situaciones más comunes que implican pruebas sobre dos medias son aquellas con
varianzas desconocidas. Si ambas distribuciones son normales y además 𝝈𝟐𝟏 = 𝝈𝟐𝟐 = 𝝈𝟐 .
Se puede usar la prueba t agrupada…
𝐻0 : 𝜇1 = 𝜇2
𝐻1 : 𝜇1 ≠ 𝜇2
Rechazamos 𝐻0 al nivel de significación 𝛼 cuando el estadístico t calculado
𝑿𝟏 − 𝑿𝟐 − 𝜹 (𝑛1 −1)𝑆12 +(𝑛2 −1)𝑆22
𝐭= Donde 𝑆𝑝2 =
𝑛1 +𝑛2 −2
𝟏 𝟏
𝑺𝒑 +
𝒏𝟏 𝒏𝟐
Excede a 𝑡𝑛1 +𝑛2 −2,𝛼/2 o es menor que −𝑡𝑛1 +𝑛2 −2,𝛼/2

Ejercicio
Supongamos que deseamos conocer si los vinos de la denominación de origen Ribera

del Duero tienen el mismo contenido alcohólico que los de otra denominación de
origen, por ejemplo la de Toro. Se trata de saber si existe una clara diferenciación en los
mismos ya que, debido a la proximidad geográfica de ambas regiones, es posible que
haya fraudes y se intercambien vinos de ambas dependiendo del mercado de los
mismos. ¿Existen diferencias en el grado alcohólico de ambas denominaciones?.
Supuesto: El grado alcohólico sigue una distribución normal para ambas poblaciones,
varianzas poblacionales son desconocidas pero iguales.
Pruebas sobre dos medias (Varianzas desconocidas pero diferentes 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 )
Si las poblaciones son normales, el estadístico
(𝑿𝟏 − 𝑿𝟐 ) − (𝝁𝟏 − 𝝁𝟐 )
𝐓′ =
𝑺𝟐𝟏 𝑺𝟐𝟐
+
𝒏𝟏 𝒏𝟐
Tiene una distribución t aproximada con grados de libertad aproximados

2 2
𝑆12 𝑆2
+
𝑛1 𝑛2
𝑣= El valor de 𝑣 no necesariamente es
2 2
𝑆12 𝑆22 un número entero, debemos
/(𝑛1 − 1) + /(𝑛2 − 1) redondearlo al entero más cercano
𝑛1 𝑛2
Como resultado, el procedimiento de prueba consiste en No Rechazar 𝐻0 cuando

−𝑡𝑣,𝛼/2 < t′ < 𝑡𝑣,𝛼/2
Ejercicio
En un estudio realizado en Virginia Tech se compararon los niveles de acido ascórbico en
plasma en mujeres embarazadas fumadoras con los de mujeres no fumadoras. Para el estudio
se seleccionaron 32 mujeres que estuvieran en los últimos 3 meses de embarazo, que no
tuvieran padecimientos importantes y que sus edades fluctuaran entre los 15 y los 32 anos.
Antes de tomar muestras de 20 ml de sangre se pidió a las participantes que fueran en ayunas,
que no tomaran sus suplementos vitamínicos y que evitaran alimentos con alto contenido de
acido ascórbico. A partir de las muestras de sangre se determinaron los siguientes valores de
ácido ascórbico en el plasma de cada mujer, en miligramos por 100 mililitros .Existe suficiente
evidencia para concluir que hay una diferencia entre los niveles de acido ascórbico en plasma
de mujeres fumadoras y no fumadoras?
Suponga que los dos conjuntos de datos provienen de poblaciones normales con varianzas
diferentes. Utilice un valor P.
Ejercicio:
Pruebas sobre dos varianzas
Consideremos ahora el problema de probar la igualdad de las varianzas 𝜎12 𝑦 𝜎22 de dos
poblaciones. Ello implicaría establecer la hipótesis nula 𝐻0 de que 𝜎12 = 𝜎22 contra una
de las siguientes 𝐻1 : 𝜎12 < 𝜎22 ; 𝜎12 > 𝜎22 ; 𝜎12 ≠ 𝜎22
Para muestras aleatorias independientes de tamaño 𝑛1 y 𝑛2 , respectivamente de las dos
poblaciones en estudio (Se asume que ambas poblaciones siguen una distribución
aproximadamente normal). Para ello se requiere analizar el cociente:
𝒔𝟐𝟏 𝑣1 = 𝑛1 − 1
𝒇= 𝟐 𝑣2 = 𝑛2 − 1 Donde:
𝒔𝟐 𝑠12 y 𝑠22 son las varianzas calculadas de las dos
muestras
𝑣1 y 𝑣2 son los grados de libertad de cada
muestra
Pruebas sobre dos varianzas
La región crítica de tamaño 𝛼 para cada caso se detalla a continuación:

𝐻0 : 𝜎12 = 𝜎22 𝐻0 : 𝜎12 = 𝜎22 𝐻0 : 𝜎12 = 𝜎22
𝐻1 : 𝜎12 < 𝜎22 𝐻1 : 𝜎12 > 𝜎22 𝐻1 : 𝜎12 ≠ 𝜎22
𝒇 > 𝒇𝜶 (𝒗𝟐 , 𝒗𝟏 ) 𝒇 > 𝒇𝜶 (𝒗𝟏 , 𝒗𝟐 ) 𝒇 > 𝒇𝜶 𝒗𝑴 , 𝒗𝒎
𝒔𝟐𝟐 𝒔𝟐𝑴
𝒇= 𝟐 𝒔𝟐𝟏 𝒇= 𝟐
𝒔𝟏 𝒇= 𝒔𝒎
𝒔𝟐𝟐
2
𝑠𝑀 = 𝑚𝑎𝑥{𝑠12 , 𝑠22 } 𝑣𝑀 = 𝑛𝑀 − 1
2 = 𝑚𝑖𝑛{𝑠 2 , 𝑠 2 } 𝑣𝑚 = 𝑛𝑚 − 1
𝑠𝑚 1 2
Ejercicio
Se compara la producción de tornillos de dos máquinas disponibles en una fábrica, una de
ellas es nueva por lo que se esperaría que en promedio haya una mayor producción. Se
toman muestras de la producción de ambas máquinas, obteniéndose los siguientes
resultados:
Máquina nueva Máquina vieja
42.1 41.3 42.4 43.2 41.8 42.7 43.8 42.5 43.1 44.0
41.0 41.8 42.8 42.3 42.7 43.6 43.3 43.5 41.7 44.1
El supervisor de área percibe que si bien no hay una diferencia significativa en la media de
producción de ambas máquinas, sí existe diferencia en cuanto a la dispersión. ¿Son
fundadas las sospechas del supervisor?
Pruebas sobre dos proporciones
A menudo surgen situaciones en las que se desea probar la hipótesis de que dos
proporciones son iguales. Por ejemplo, podemos tratar de mostrar evidencia de que la
proporción de médicos que son pediatras en un estado es igual a la proporción de
pediatras en otro estado.
Para ello, tomamos dos muestras independientes 𝑋1 𝑦 𝑋2 , las cuales representan la

cantidad de observaciones con una determinada característica; que tienen un tamaño
𝑛1 𝑦 𝑛2 respectivamente, los cuales son lo suficientemente grandes (Aproximación de
la Binomial a la Normal)
Pruebas sobre dos proporciones
En general, deseamos probar la hipótesis nula 𝐻0 de que dos proporciones, o
parámetros binomiales, son iguales 𝑝1 = 𝑝2 ; versus 3 alternativas de hipótesis alterna
𝐻1 : 𝑝1 < 𝑝2 ; 𝑝1 > 𝑝2 ; 𝑝1 ≠ 𝑝2
𝐻0 : 𝑝1 = 𝑝2 = 𝑝
𝐻1 : 𝑝1 ≠ 𝑝2
Necesitamos calcular el estadístico Z, planteado de la siguiente manera:
𝜽−𝜽 (𝒑𝟏 −𝒑𝟐 ) − (𝒑𝟏 − 𝒑𝟐 ) Donde:

𝒁= 𝒁=
𝟏 𝟏 𝑿𝟏 + 𝑿𝟐
𝝈𝜽 𝒑(𝟏 − 𝒑) + 𝒑=
𝒏𝟏 𝒏𝟐 𝒏𝟏 + 𝒏𝟐
Ejercicio
A los varones y a las mujeres se les preguntó qué harían si recibieran un billete de $ 1000
por correo, el cual estaba dirigido a su vecino, pero se les entregó erróneamente. ¿Lo
devolverían a su vecino? De los 69 hombres muestreados, 52 dijeron que sí y de las 131
mujeres muestreadas, 120 sí. ¿Los datos indican que las proporciones que dicen que sí son
diferentes para hombres y mujeres a un nivel de significancia del 5%?
DATOS PAREADOS
Diferencia de dos medias cuando las muestras NO son independientes
Cada unidad experimental homogénea recibe ambas condiciones de la población; como

resultado, cada unidad experimental tiene un par de observaciones, una para cada
población. Por ejemplo, si realizamos una prueba de una nueva dieta con 15 individuos,
los pesos antes y después de seguir la dieta conforman la información de las dos
muestras. Las dos poblaciones son “antes” y “después”, y la unidad experimental es el
individuo.
Las observaciones se miden de forma pareada, de tal manera que a un 𝑋𝑖 le corresponde

un 𝑌𝑖 , obteniéndose lo siguiente:
(𝑋1 , 𝑌1 ); (𝑋2 , 𝑌2 );…; (𝑋𝑖 , 𝑌𝑖 ); … . ; (𝑋𝑛 , 𝑌𝑛 )
DATOS PAREADOS
(𝑋1 , 𝑌1 ); (𝑋2 , 𝑌2 );…; (𝑋𝑖 , 𝑌𝑖 ); … . ; (𝑋𝑛 , 𝑌𝑛 )
Podríamos asumir que la media y varianza de X e Y estarían dadas por:

𝜇1 𝑦 𝜎12 𝜇2 𝑦 𝜎22
¿Cuál es el problema con este supuesto? Asumiríamos que 𝐶𝑜𝑣𝑋𝑌 = 0
Se define una nueva variable aleatoria “D”, cuyos “n” valores observados son:
𝑫𝒊 = 𝑿𝒊 − 𝒀𝒊 ; 𝒊 = 𝟏, 𝟐, 𝟑, … , 𝒏 Cuya media y varianza están dadas por:

𝝁𝑫 y 𝝈𝟐𝑫
DATOS PAREADOS
𝑫𝒊 = 𝑿𝒊 − 𝒀𝒊 ; 𝒊 = 𝟏, 𝟐, 𝟑, … , 𝒏
𝐸 𝐷 = 𝜇𝐷 = 𝐸 𝑋 − 𝑌 = 𝜇1 − 𝜇2
Contraste de hipótesis:
𝐻0 : 𝜇𝐷 = 𝛿 𝐻0 : 𝜇𝐷 = 𝛿 𝐻0 : 𝜇𝐷 = 𝛿
𝐻1 : 𝜇𝐷 ≠ 𝛿 𝐻1 : 𝜇𝐷 > 𝛿 𝐻1 : 𝜇𝐷 < 𝛿
DATOS PAREADOS
El estadístico de la prueba se define como:
𝑫−𝜹
𝐓=
𝑺𝑫 / 𝒏
Donde:
𝐷: Es la media de las diferencias
𝑆𝐷 : Es la desviación estándar de las diferencias
Ejercicio: Datos pareados
La presencia de metales en el agua potable afectan su sabor, y, una concentración alta de
estos puede representar un riesgo para la salud. En un análisis se tomaron 10 datos que
miden la concentración de zinc en el fondo y superficie del agua. ¿Los datos sugieren que la
verdadera concentración media en el fondo del agua excede el de la superficie?
Puntos donde se tomaron las muestras

1 2 3 4 5 6 7 8 9 10
Concentración de zinc en el
.430 .266 .567 .531 .707 .716 .651 .589 .469 .723
fondo del agua
Concentración de zinc en la
.415 .238 .390 .410 .605 .609 .632 .523 .411 .612
superficie del agua

Tema 2. Prueba de Hipótesis - 2muestras

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Tema 2. Prueba de Hipótesis - 2muestras

Enviado por

Direitos autorais:

Formatos disponíveis

EI.

Supongamos se tienen dos poblaciones de interés, llamémoslas X e Y, que como variables

𝑋 𝑇 = (𝑋1 𝑋2 … 𝑋𝑛1 ) 𝑌 𝑇 = (𝑌1 𝑌2 … 𝑌𝑛2 )

Un contraste bilateral se plantea de la siguiente manera:

Asumiendo muestras grandes y varianzas de ambas poblaciones conocidas, podemos

𝜎12 𝜎22 −𝑍𝛼/2 𝝁𝟏 − 𝝁𝟐 𝑍

𝜎12 𝜎22 −𝑍𝛼 𝝁𝟏 − 𝝁𝟐

Excede a 𝑡𝑛1 +𝑛2 −2,𝛼/2 o es menor que −𝑡𝑛1 +𝑛2 −2,𝛼/2

Supongamos que deseamos conocer si los vinos de la denominación de origen Ribera

Tiene una distribución t aproximada con grados de libertad aproximados

Como resultado, el procedimiento de prueba consiste en No Rechazar 𝐻0 cuando

La región crítica de tamaño 𝛼 para cada caso se detalla a continuación:

𝒇 > 𝒇𝜶 (𝒗𝟐 , 𝒗𝟏 ) 𝒇 > 𝒇𝜶 (𝒗𝟏 , 𝒗𝟐 ) 𝒇 > 𝒇𝜶 𝒗𝑴 , 𝒗𝒎

Para ello, tomamos dos muestras independientes 𝑋1 𝑦 𝑋2 , las cuales representan la

Necesitamos calcular el estadístico Z, planteado de la siguiente manera:

𝜽−𝜽 (𝒑𝟏 −𝒑𝟐 ) − (𝒑𝟏 − 𝒑𝟐 ) Donde:

Cada unidad experimental homogénea recibe ambas condiciones de la población; como

Las observaciones se miden de forma pareada, de tal manera que a un 𝑋𝑖 le corresponde

(𝑋1 , 𝑌1 ); (𝑋2 , 𝑌2 );…; (𝑋𝑖 , 𝑌𝑖 ); … . ; (𝑋𝑛 , 𝑌𝑛 )

Podríamos asumir que la media y varianza de X e Y estarían dadas por:

¿Cuál es el problema con este supuesto? Asumiríamos que 𝐶𝑜𝑣𝑋𝑌 = 0

𝑫𝒊 = 𝑿𝒊 − 𝒀𝒊 ; 𝒊 = 𝟏, 𝟐, 𝟑, … , 𝒏 Cuya media y varianza están dadas por:

El estadístico de la prueba se define como:

Puntos donde se tomaron las muestras

Você também pode gostar