Você está na página 1de 31

TECNOLÓGICO NACIONAL DE MÉXICO

Instituto Tecnológico de Tijuana

“Pruebas de hipótesis
con dos muestras y varias muestras de datos
numéricos”

Tijuana, B.C., 5 de Abril de 2016


1
Índice
Pruebas de hipótesis con dos muestras y varias
muestras de datos numéricos
4.1 Introducción ............................................................................ 3

4.2 Distribuciones normales y t student ........................................4

4.3 Pruebas de significancia .......................................................... 5

4.4 Comparación de dos muestras independientes pruebas t para

las diferencias entre dos medias .................................................... 5

4.5 Prueba de Fisher para varianzas y de igualdad de las varianzas

de dos poblaciones normales ....................................................... 15

4.6 Comparaciones de dos muestras pareadas ............................. 18

4.7 Modelo totalmente aleatorio: análisis de varianza de un factor21

4.8 Selección del tamaño de muestra para estimar la diferencia de dos

medias .......................................................................................... 28

Conclusión ................................................................................... 30

Bibliografía/Referencias .............................................................. 31

2
Introducción
Esta investigación se concentra en la prueba de hipótesis, otro aspecto de la estadística
inferencial que al igual que la estimación del intervalo de confianza, se basa en la información
de la muestra. Se desarrolla una metodología paso a paso que le permita hacer inferencias
sobre un parámetro poblacional mediante el análisis diferencial entre los resultados observados
(estadístico de la muestra)y los resultados de la muestra esperados si la hipótesis subyacente es
realmente cierta. En el problema de estimación se trata de elegir el valor de un parámetro de la
población, mientras que en las pruebas de hipótesis se trata de decidir entre aceptar o rechazar
un valor especificado (por ejemplo, si el nivel de centra miento de un proceso es o no lo
es).Prueba de hipótesis: Estadísticamente una prueba de hipótesis es cualquier afirmación
acerca de una población y/o sus parámetros.

Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste
involucra la toma de decisión acerca de las hipótesis. La decisión consiste en rechazar o no una
hipótesis en favor de la otra.
Por cada tipo de prueba de hipótesis se puede calcular una prueba estadística apropiada. Esta
prueba estadística mide el acercamiento del calor de la muestra (como un promedio) a la
hipótesis nula. La prueba estadística, sigue una distribución estadística bien conocida (normal,
etc.) o se puede desarrollar una distribución para la prueba estadística particular.

La distribución apropiada de la prueba estadística se divide en dos regiones: una región de


rechazo y una de no rechazo. Si la prueba estadística cae en esta última región no se puede
rechazar la hipótesis nula y se llega a la conclusión de que el proceso funciona correctamente.
Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico en la
distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no se puede
rechazar) de la región de rechazo. A hora bien el valor crítico depende del tamaño de la región
de rechazo.

3
4.2 Distribuciones normales y t student
En estadística y probabilidad se llama distribución normal, distribución de Gauss o distribución
gaussiana, a una de las distribuciones de probabilidad de variable continua que con más
frecuencia aparece en fenómenos reales.

La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un


determinado parámetro. Esta curva se conoce como campana de Gauss.

La importancia de esta distribución radica en que permite modelar numerosos fenómenos


naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de
este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables
que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada
observación se obtiene como la suma de unas pocas causas independientes.

De hecho, la estadística es un modelo matemático que sólo permite describir un fenómeno, sin
explicación alguna. Para la explicación causal es preciso el diseño experimental, de ahí que al
uso de la estadística en psicología y sociología sea conocido como método correlacional. La
distribución normal también es importante por su relación con la estimación por mínimos
cuadrados, uno de los métodos de estimación más simples y antiguos.

La distribución normal también aparece en muchas áreas de la propia estadística. Por ejemplo,
la distribución muestral de las medias muéstrales es aproximadamente normal, cuando la
distribución de la población de la cual se extrae la muestra no es normal. Además, la
distribución normal maximiza la entropía entre todas las distribuciones con media y varianza
conocidas, lo cual la convierte en la elección natural de la distribución subyacente a una lista de
datos resumidos en términos de media muestral y varianza. La distribución normal es la más
extendida en estadística y muchos tests estadísticos están basados en una supuesta
"normalidad".

En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad


que surge del problema de estimar la media de una población normalmente distribuida cuando
el tamaño de la muestra es pequeño. Aparece de manera natural al realizar la prueba t de
Student para la determinación de las diferencias entre dos medias muestrales y para la
construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones
cuando se desconoce la desviación típica de una población y ésta debe ser estimada a partir de
los datos de una muestra.

La distribución t de Student es la distribución de probabilidad del cociente

Dónde:
 𝑍 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 𝑑𝑒 𝑚𝑒𝑑𝑖𝑎 𝑛𝑢𝑙𝑎 𝑦 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 1
 𝑉 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑐ℎ𝑖𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑐𝑜𝑛 𝑉 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
 𝑍 𝑦 𝑉 𝑠𝑜𝑛 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠

4
Si 𝜇 es una constane no nula, el cociente es una variable aleatoria que sigue la
distribución t student no central con parámetro de no-centralidad 𝜇.

4.3 Pruebas de significancia


Las pruebas de significancia estadística son un procedimiento que brinda un criterio objetivo
para calificar las diferencias que presentan al comprar los resultados de dos muestras, con el
objetivo de explicar si dichas diferencias se mantienen dentro de los limites previstos por el
diseño estadístico (un error y una confianza esperados) o si, por el contrario, la diferencia entre
ellas resulta lo suficiente grande como para inferir que ha ocurrido un cambio real en el
indicador.

4.4 Comparación de dos muestras


independientes para las diferencias entre dos
medias
Cuando se conocen las varianzas de 2 poblaciones
Si se trata de muestras grandes e independientes y si se conocen las verdaderas varianzas de las
poblaciones correspondientes, el estadístico de prueba es la ya conocida z estandarizada de la
distribución normal que para 2 poblaciones se calcula como:

̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 )
𝒛=
𝝈𝑿𝟏 −𝑿𝟐
Pero como la hipótesis nula plantea que:
𝑯𝒐 : 𝝁 𝟏 − 𝝁 𝟐 = 𝟎
La expresión anterior se convierte en:

𝝈 𝟐 𝟏 𝝈𝟐 𝟐
𝝈𝑿𝟏−𝑿𝟐 =√ +
𝒏𝟏 𝒏𝟐
Sin embargo el caso más común es que no se conozcan las varianzas, entonces se utilizan la de
las muestras para estimarlas, y el procedimiento es exactamente igual.

5
Como se menciona en el párrafo anterior, la única diferencia entre las fórmulas para calcular el
estadístico de prueba y el error estándar de la diferencia entre 2 medias, cuando se utilizan
datos muestrales es que se sustituye 𝑺𝟐 por 𝝈𝟐 y 𝑺𝑿𝟏−𝑺𝟐 por 𝝈𝑿𝟏 −𝑿𝟐 de la siguiente
manera:

̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 )
𝒛=
𝒔𝑿𝟏−𝑿𝟐

𝑺𝟐 𝟏 𝑺𝟐 𝟐
𝑺𝑿𝟏 −𝑿𝟐 =√ +
𝒏𝟏 𝒏𝟐

Cuando no se conocen las varianzas pero se asume que son iguales

En estas condiciones, el estadístico de prueba sigue siendo Z de la distribución normal estándar:

̅𝟏 − 𝑿
𝑿 ̅𝟐
𝒛=
𝒔𝑿𝟏−𝑿𝟐
Pero ahora, como se supone que las varianzas de las 2 poblaciones son iguales, se combinan las
varianzas muestrales de la siguiente manera:

𝟐 (𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐


𝑺𝒄 =
𝒏𝟏 + 𝒏𝟐 − 𝟐
Nótese que esta forma de combinar las varianzas muestrales es una forma de ponderación, en
donde los pesos son los respectivos tamaños de muestra. Una vez realizada la combinación de
varianzas, se calcula el error estándar de la diferencia de medias de la misma manera que se
𝟐
hizo antes pero ahora utilizando la varianza combinada 𝑺𝒄

𝑺𝒄 𝟐 𝑺𝒄 𝟐
𝑺𝒙𝟏−𝒙𝟐 =√ +
𝒏𝟏 𝒏𝟐

6
Cuando no se conocen las varianzas pero se asume que son iguales

En estos casos estas circunstancias, el estadístico de prueba apropiado es la t Student:

̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 )
𝒕=
𝑺𝒙𝟏−𝒙𝟐

Pero, de nuevo, como la hipótesis nula plantea que:

𝑯𝒐: 𝝁𝟏 − 𝝁𝟐 = 𝟎

La expresión se convierte en:


̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐)
𝒕=
𝑺𝒙𝟏 −𝒙𝟐
Con 𝒏𝟏 + 𝒏𝟐 − 𝟐 grados de libertad

Al igual que antes, cuando es asumido que las dos varianzas poblacionales son iguales, estas se
combinan, como en la formula anterior:
𝟐 (𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐
𝑺𝒄 =
𝒏𝟏 + 𝒏𝟐 − 𝟐

El error estándar de la diferencia entre dos medias, que es la fórmula anterior:

𝑺𝒄 𝟐 𝑺𝒄 𝟐
𝑺𝒙𝟏−𝒙𝟐 =√ +
𝒏𝟏 𝒏𝟐

7
Ejercicios
1. Un gerente de producción desea determinar si existe diferencia entre la productividad de los
trabajadores del turno matutino y los del turno vespertino. Para ello, toma una muestra
aleatoria de 30 trabajadores de cada turno y encuentra que produjeron un promedio de 68
artículos por turno, con una desviación estándar de 16, en tanto que los del turno vespertino
produjeron 65.5 artículos en promedio con desviación estándar de 17. ¿Existe diferencia entre la
productividad de los 2 turnos, a un nivel de significación de 0.01

𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐

𝑷(−𝟐. 𝟓𝟕𝟓 ≤ 𝒛 ≤ 𝟐. 𝟓𝟕𝟓) = 𝟎. 𝟎𝟏


𝑺𝟐 𝑺𝟐 𝟐 𝟏𝟔𝟐 𝟐
𝟏𝟕
𝑺𝑿𝟏 −𝑿𝟐 = √ 𝒏 𝟏 + =√ 𝟑𝟎 + 𝟑𝟎 =4.2622
𝟏 𝒏𝟐

̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 ) 𝟔𝟖 − 𝟔𝟓. 𝟓
𝒛= = = 𝟎. 𝟓𝟖𝟔𝟖
𝒔𝑿𝟏 −𝑿𝟐 𝟒. 𝟐𝟔
Este valor observado del estadístico de prueba está dentro del rango critico de -2.575 a 2.575,
así que no se tienen elementos para rechazar la hipótesis nula, por lo que se concluye que la
producción promedio en los dos turnos es igual.

2. Un departamento de control de calidad desea evaluar dos máquinas que fabrican ciertas
piezas circulares de plástico. Se desea saber si la maquina A la fábrica con un diámetro mayor
que la maquina B. Para ello se toma una muestra de 12 piezas de la maquina A y se encuentra
que su diámetro tiene una media de 1.061 cm con varianza de 0.000442. En tanto que una
muestra aleatoria de 10 piezas de la maquina B arroja una media de 1.038 cm con una varianza
de 0.000228. Si los diámetros de estas piezas se distribuyen de forma normal en las dos
máquinas y se sabe que sus varianzas son iguales, compruebe la hipótesis de que la maquina A
está fabricando piezas de mayor diámetro, con un nivel de significancia de 0.05.

𝑯𝒐: 𝝁𝟏 > 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≤ 𝝁𝟐
𝑷((𝒕 ≥ 𝟏. 𝟕𝟐𝟒𝟕|𝒈𝒍 = 𝟐𝟎)) = 𝟎. 𝟎𝟓

(𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐 (𝟏𝟐 − 𝟏)(𝟎. 𝟎𝟎𝟎𝟒𝟒𝟐) + (𝟏𝟎 − 𝟏)(𝟎. 𝟎𝟎𝟎𝟐𝟐𝟖)
𝑺𝒄 𝟐 = =
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝟏𝟐 + 𝟏𝟎 − 𝟐
= 𝟎. 𝟎𝟎𝟎𝟑𝟒𝟕

𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟎. 𝟎𝟎𝟎𝟑𝟒𝟓𝟕 𝟎. 𝟎𝟎𝟎𝟑𝟒𝟕
𝑺𝒙𝟏 −𝒙𝟐 =√ + =√ + = 𝟎. 𝟎𝟎𝟕𝟗𝟔
𝒏𝟏 𝒏𝟐 𝟏𝟐 𝟏𝟎

̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟏. 𝟎𝟔𝟏 − 𝟏. 𝟎𝟑𝟖)
𝒕= = = 𝟐. 𝟖𝟗
𝑺𝒙𝟏 −𝒙𝟐 𝟎. 𝟎𝟎𝟕𝟗𝟔
8
Así que como el valor calculado de t, 2.89 es mayor que el valor critico determinado según el
nivel de significancia, 1.7247 se rechaza la hipótesis nula para concluir que, efectivamente, la
maquina A está fabricando piezas con mayor diámetro que las producidas por la maquina B.

3. En 2 ciudades en las que existen refinerías se tomó una muestra a cada persona de un grupo
de 35, y se midió el nivel de plomo en la sangre. En la ciudad A s encontró que en promedio el
nivel de plomo es de 74.9 microgramos con una desviación estándar de 8. En la ciudad B, el
promedio es de 78 microgramos con una desviación estándar de 1. ¿Existe diferencia en el nivel
de plomo en la sangre de los habitantes de cada ciudad, a un nivel de significancia de 0.01?
𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐

𝑷(−𝟐. 𝟓𝟕𝟓 ≤ 𝒛 ≤ 𝟐. 𝟓𝟕𝟓) = 𝟎. 𝟗𝟗


𝑺𝟐 𝟏 𝑺𝟐 𝟐 𝟖𝟐 𝟏𝟐
𝑺𝑿𝟏 −𝑿𝟐 = √ + =√ + = 𝟏. 𝟑𝟔𝟐𝟕
𝒏𝟏 𝒏𝟐 𝟑𝟓 𝟑𝟓

̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 ) 𝟕𝟒. 𝟗 − 𝟕𝟖
𝒛= = = 𝟏. 𝟎𝟐𝟕𝟑
𝒔𝑿𝟏−𝑿𝟐 𝟏. 𝟑𝟔𝟐𝟕

El valor calculado de Z cae dentro de la región de aceptación, por lo que no se rechaza la


hipótesis nula y se concluye que no existe diferencia entre el nivel promedio de plomo en la
sangre de los habitantes de la ciudad A y la ciudad B

4. Para la fabricación de una pieza específica se emplean dos máquinas. Se toma una muestra
40 piezas elaboradas por ambos aparatos y se encuentra que las piezas que produjo la maquina
A tienen una longitud promedio de 83mm con una desviación estándar de 5mm, mientras que
las de la maquina B una longitud promedio de 82 mm con una desviación estándar de 2mm.
Determine si existe diferencia entre la longitud de las piezas fabricadas por cada máquina, con
un nivel de significancia de 5%.
𝑯𝒐: 𝝁𝟏 ≤ 𝝁𝟐
𝑯𝒂: 𝝁𝟏 > 𝝁𝟐
𝑷((𝒕 ≥ 𝟏. 𝟔𝟖𝟒|𝒈𝒍 = 𝟑𝟗)) = 𝟎. 𝟎𝟓

(𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐 (𝟒𝟎 − 𝟏)(𝟎. 𝟎𝟎𝟎𝟐𝟓) + (𝟒𝟎 − 𝟏)(𝟎. 𝟎𝟎𝟔𝟕𝟐𝟒)
𝑺𝒄 𝟐 = =
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝟒𝟎 + 𝟒𝟎 − 𝟐
= 𝟎. 𝟎𝟎𝟑𝟑𝟕𝟒𝟓

𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟎. 𝟎𝟎𝟑𝟑𝟕𝟒𝟓 𝟎. 𝟎𝟎𝟑𝟑𝟕𝟒𝟓
𝑺𝒙𝟏 −𝒙𝟐 =√ + =√ + = 𝟎. 𝟎𝟏𝟐𝟗
𝒏𝟏 𝒏𝟐 𝟒𝟎 𝟒𝟎

9
̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟎. 𝟎𝟖𝟑 − 𝟎. 𝟎𝟖𝟐)
𝒕= = = 𝟎. 𝟕𝟕𝟓𝟏
𝑺𝒙𝟏 −𝒙𝟐 𝟎. 𝟎𝟏𝟐𝟗

5. En una facultad se imparten dos licenciaturas, administración y contaduría. Se preguntó a 42


alumnos de administración cual es el número de veces que han consultado libros en la biblioteca
durante el último mes, y se obtuvo que en promedio fueran 27 veces con una desviación
estándar de 4, mientras que en la muestra de 37 alumnos de contaduría el promedio fue de 23
con una desviación estándar de 3. Compruebe si existe diferencia entre el promedio de
consultas realizadas por los alumnos de cada licenciatura con un nivel de significa de 0.05.
𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
𝑷((𝒕 ≥ 𝟏. 𝟔𝟖𝟒|𝒈𝒍 = 𝟒𝟏)) = 𝟎. 𝟎𝟓

𝟐 (𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐 (𝟒𝟐 − 𝟏)(𝟏𝟔) + (𝟒𝟐 − 𝟏)(𝟗)


𝑺𝒄 = = = 𝟏𝟐. 𝟓
𝒏 𝟏 + 𝒏𝟐 − 𝟐 𝟒𝟐 + 𝟒𝟐 − 𝟐
𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟏𝟐. 𝟓 𝟏𝟐. 𝟓
𝑺𝒙𝟏 −𝒙𝟐 =√ + =√ + = 𝟎. 𝟐𝟗𝟕𝟔
𝒏𝟏 𝒏𝟐 𝟒𝟐 𝟒𝟐

̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟐𝟕 − 𝟐𝟑)
𝒕= = = 𝟏𝟑. 𝟒𝟒𝟎𝟖
𝑺𝒙𝟏 −𝒙𝟐 𝟎. 𝟐𝟗𝟕𝟔

El valor calculado de Z cae dentro de la región de rechazo por lo que se rechaza la hipótesis nula
y se concluye que existe una diferencia entre el promedio de veces que los alumnos de
administración han consultado algún libro en la biblioteca y el promedio de los alumnos de
contaduría.

6. Para probar la velocidad de combustión de 2 tipos de aceite automotriz se tomó una muestra
de 50 botellas de dos marcas distintas. En la marca A se encontró que el tiempo promedio de
combustión es de 47.5 seg con una desviación estándar de 3.2 seg y la marca B el tiempo
promedio es de 49.4 seg con una desviación estándar de 3.7 seg. Compruebe si existe diferencia
entre el tiempo de combustión de las dos marcas de aceite con un nivel de significancia de 0.01.

𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐

𝑷(−𝟐. 𝟓𝟕𝟓 ≤ 𝒛 ≤ 𝟐. 𝟓𝟕𝟓) = 𝟎. 𝟎𝟏


𝑺𝟐 𝟏 𝑺𝟐 𝟐 𝟑.𝟐𝟐 𝟑.𝟕𝟐
𝑺𝑿𝟏 −𝑿𝟐 = √ + =√ + = 𝟎. 𝟔𝟗𝟏𝟖
𝒏𝟏 𝒏𝟐 𝟓𝟎 𝟓𝟎

̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 ) 𝟒𝟕. 𝟓 − 𝟒𝟗. 𝟒
𝒛= = = −𝟑. 𝟎𝟎𝟕𝟐
𝒔𝑿𝟏−𝑿𝟐 𝟎. 𝟔𝟑𝟏𝟖

10
7. Una compañía telefónica brinda dos tipos de servicios, plan y prepago, y desea saber si existe
diferencia entre el número de minutos utilizados mensualmente en cada servicio. En el caso de
los usuarios del servicio de plan se tomó una muestra de 36 personas y se encontró que en
promedio de minutos fue de 237 con una desviación estándar de 8.7. De los usuarios de prepago
se tomó una muestra de 41 y en promedio fue de 248 con una desviación estándar de 10.4.
Compruebe la hipótesis con un nivel de significancia de 0.01.

Se desea probar si el salario medio mensual de los empleados oficinistas de 2 empresas del
ramo de servicios turísticos son iguales o no, con un nivel de significancia de 1%. Para ello, se
toman muestras de ambas y los datos correspondientes se resumen en el siguiente cuadro:

Muestra Muestra
empresa 1 empresa 2
Tamaño n 𝑛1 = 50 𝑛2 = 60
Media 𝑋̅1 =6000 𝑋̅2 =5850
2Desv. Estándar 𝑆1 =300 𝑆2 =214

𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐

𝑷(−𝟐. 𝟓𝟕𝟓 ≤ 𝒛 ≤ 𝟐. 𝟓𝟕𝟓) = 𝟎. 𝟎𝟏


𝑺𝟐 𝟏 𝑺𝟐 𝟐 𝟑𝟎𝟎𝟐 𝟐𝟏𝟒𝟐
𝑺𝑿𝟏 −𝑿𝟐 = √ + =√ + = 𝟔𝟏. 𝟒𝟏𝟕𝟓
𝒏𝟏 𝒏𝟐 𝟑𝟔 𝟑𝟔

̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 ) 𝟔𝟎𝟎𝟎 − 𝟓𝟖𝟓𝟎
𝒛= = = 𝟐. 𝟒𝟒𝟐𝟑
𝒔𝑿𝟏−𝑿𝟐 𝟔𝟏. 𝟒𝟏𝟕𝟓

8. En una muestra aleatoria de n1=10 focos el promedio de vida de los focos es 𝑿 ̅ 𝟏 =4000 horas,
con una desviación de S1=200 horas. Para otra marca de focos de cuya vida útil también se
presume que sigue una distribución normal, una muestra aleatoria de n2= 8 focos tiene una
media muestral de 𝑿 ̅ 𝟐 =4300 horas y una desviación estándar muestral de S2 = 250, pruebe la
hipótesis de que no existe ninguna diferencia entre el ciclo medio de vida útil de las 2 marcas de
focos con un nivel de significancia del 1%
𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
𝑷((𝒕 ≥ 𝟐. 𝟓𝟕𝟓|𝒈𝒍 = 𝟒𝟏)) = 𝟎. 𝟎1

11
(𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐 (𝟏𝟎 − 𝟏)(𝟐𝟎𝟎𝟐 ) + (𝟖 − 𝟏)(𝟐𝟓𝟎𝟐 )
𝑺𝒄 𝟐 = = = 𝟒𝟗𝟖𝟒𝟑. 𝟕𝟓
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝟏𝟎 + 𝟖 − 𝟐

𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟒𝟗𝟖𝟒𝟑. 𝟕𝟓 𝟒𝟗𝟖𝟒𝟑. 𝟕𝟓
𝑺𝒙𝟏 −𝒙𝟐 =√ + =√ + = 𝟏𝟎𝟓. 𝟗𝟎
𝒏𝟏 𝒏𝟐 𝟏𝟎 𝟖

̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟒𝟎𝟎𝟎 − 𝟒𝟑𝟎𝟎)
𝒕= = = −𝟐. 𝟖𝟑
𝑺𝒙𝟏 −𝒙𝟐 𝟏𝟎𝟓. 𝟗𝟎

Como cae en la zona de aceptación se acepta con un nivel de significancia del 0.01, la hipótesis
nula de que no existe diferencia entre las dos marcas de focos.

9. Un desarrollador considera dos ubicaciones alternativas para un centro comercial regional dado
que el ingreso domestico de la comunidad es una consideración importante en la selección del sitio,
él desea probar la hipótesis nula de que no existe ninguna diferencia entre los montos de ingreso
domestico medio de las dos comunidades. Se supone que la desviación estándar del ingreso
domestico también es igual en las dos comunidades. En una muestra de 𝑛1=30 hogares de la
primera comunidad el ingreso anual promedio es de 𝑥1̅ =45,500 con una desviación estándar
𝑆1=1,800. En una muestra de 𝑛2=40 hogares de la segunda comunidad 𝑥2̅ =44,600 y 𝑆2=2,400.
Pruebe la hipótesis nula al nivel de significancia de 5%.

𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
𝑷((𝒕 ≥ 𝟐. 𝟓𝟕𝟓|𝒈𝒍 = 𝟒𝟏)) = 𝟎. 𝟎1

(𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐 (𝟑𝟎 − 𝟏)(𝟏𝟖𝟎𝟎𝟐 ) + (𝟒𝟎 − 𝟏)(𝟐𝟒𝟎𝟎𝟐 )


𝑺𝒄 𝟐 = =
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝟑𝟎 + 𝟒𝟎 − 𝟐
= 𝟓𝟏𝟔𝟏𝟕𝟔𝟒. 𝟕𝟎𝟔

𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟓𝟏𝟔𝟏𝟕𝟔𝟒. 𝟕𝟎𝟔 𝟓𝟏𝟔𝟔𝟕. 𝟕𝟎𝟔


𝑺𝒙𝟏 −𝒙𝟐 = √ + =√ + = 𝟓𝟖𝟔. 𝟔𝟏𝟓𝟒
𝒏𝟏 𝒏𝟐 𝟑𝟎 𝟒𝟎

̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟒𝟓𝟓𝟎𝟎 − 𝟒𝟒𝟔𝟎𝟎)
𝒕= = = 𝟏. 𝟓𝟑𝟒𝟐
𝑺𝒙𝟏 −𝒙𝟐 𝟓𝟖𝟔. 𝟔𝟏𝟓𝟒

10. Una muestra aleatoria de 𝑛1=12 estudiantes de Contaduría tiene un promedio de calificación
media de 2.70 (donde A=4) con una desviación estándar de .40 en el caso de los estudiantes de
ingeniería en sistemas una muestra aleatoria de n2 = 10 estudiantes tiene un promedio de
calificación media de 2.90 con una desviación estándar de .30 se supone que los valores de
calificación sigue una distribución normal ,pruebe la hipótesis nula de que el promedio de
calificación de las 2 categorías de estimación no es diferente con un nivel de significancia de 5%

𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
12
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
𝑷((𝒕 ≥ 𝟐. 𝟗𝟐𝟏|𝒈𝒍 = 𝟒𝟏)) = 𝟎. 𝟎5

(𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐 (𝟏𝟐 − 𝟏)(. 𝟒𝟎𝟐 ) + (𝟏𝟎 − 𝟏)(. 𝟑𝟎𝟐 )
𝑺𝒄 𝟐 = = = 𝟎. 𝟏𝟐𝟖𝟓
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝟏𝟐 + 𝟏𝟎 − 𝟐

𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟎. 𝟏𝟐𝟖𝟓 𝟎. 𝟏𝟐𝟖𝟓
𝑺𝒙𝟏 −𝒙𝟐 =√ + =√ + = 𝟎. 𝟏𝟓𝟑𝟒
𝒏𝟏 𝒏𝟐 𝟏𝟐 𝟏𝟎

̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟒𝟓𝟓𝟎𝟎 − 𝟒𝟒𝟔𝟎𝟎)
𝒕= = = 𝟓𝟖𝟔𝟕. 𝟎𝟏
𝑺𝒙𝟏 −𝒙𝟐 𝟎. 𝟏𝟓𝟑𝟒

11. El salario medio diario de una muestra de n1=30 empleados de una gran empresa
manufacturera es 𝑋􀴤1=280, por una distribución estándar de 14 pesos. En otra gran empresa
una muestra aleatoria n2=40 empleados tiene un salario medio de 𝑋􀴤2 =270 pesos, con una
desviación estándar de 10 pesos. Pruebe la hipótesis de que no existe diferencia entre los
montos salariales semanales medio de las dos empresas con un nivel de significancia del 5%.

𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
𝑷((𝒕 ≥ 𝟐. 𝟗𝟐𝟏|𝒈𝒍 = 𝟒𝟏)) = 𝟎. 𝟎5

𝟐 (𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐 (𝟑𝟎 − 𝟏)(𝟏𝟒𝟐 ) + (𝟒𝟎 − 𝟏)(𝟏𝟎𝟐 )


𝑺𝒄 = = = 𝟏𝟒𝟎. 𝟗𝟒𝟏𝟏
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝟑𝟎 + 𝟒𝟎 − 𝟐

𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟏𝟒𝟎. 𝟗𝟒𝟏𝟏 𝟏𝟒𝟎. 𝟗𝟒𝟏𝟏


𝑺𝒙𝟏 −𝒙𝟐 = √ + =√ + = 𝟐. 𝟖𝟔𝟕𝟑
𝒏𝟏 𝒏𝟐 𝟑𝟎 𝟒𝟎

̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟐𝟖𝟎 − 𝟐𝟕𝟎)
𝒕= = = 𝟑. 𝟒𝟖𝟕𝟔
𝑺𝒙𝟏 −𝒙𝟐 𝟐. 𝟖𝟔𝟕𝟑

12. La altura promedio de 50 palmas que tomaron parte de un ensayo es de 78 cm. con una
desviación estándar de 2.5 cm.; mientras que otras 50 palmas que no forman parte tienen media y
desviación estándar igual a 77.3 y desviación estándar poblacional de2.8 cm. Se desea probar la
hipótesis de que las palmas que participan en el ensayo son más altas que las otras. Con un nivel de
significancia del 0.05
𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
𝑷((𝒕 ≥ 𝟐. 𝟗𝟐𝟏|𝒈𝒍 = 𝟒𝟏)) = 𝟎. 𝟎5

13
(𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐 (𝟓𝟎 − 𝟏)(𝟐. 𝟓𝟐 ) + (𝟓𝟎 − 𝟏)(𝟐. 𝟖𝟐 )
𝑺𝒄 𝟐 = = = 𝟕. 𝟎𝟒𝟓
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝟓𝟎 + 𝟓𝟎 − 𝟐
𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟕. 𝟎𝟒𝟓 𝟕. 𝟎𝟒𝟓
𝑺𝒙𝟏 −𝒙𝟐 =√ + =√ + = 𝟎. 𝟓𝟑𝟎𝟖
𝒏𝟏 𝒏𝟐 𝟓𝟎 𝟓𝟎

̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟕𝟖 − 𝟕𝟕. 𝟑)
𝒕= = = 𝟏. 𝟑𝟏𝟖𝟕
𝑺𝒙𝟏 −𝒙𝟐 𝟎. 𝟓𝟑𝟎𝟖

13. Para una muestra aleatoria de n1=10 lámparas de gas, se encuentra que la vida promedio es
x􀴤1=6000 horas con s1=200. Para otra marca de lámparas, para los cuales se supone también que
tiene una vida útil con distribución normal, una muestra aleatoria de n2=15 lámparas de gas tiene
una media muestral de x􀴤2 =5600 horas y una desviación estándar muestral de s2=250. Pruebe la
hipótesis de que no existe diferencia entre la vida útil promedio de las dos marcas de lámparas de
gas, utilizando un nivel de significancia del 1%

𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
𝑷((𝒕 ≥ 𝟐. 𝟒𝟕𝟓|𝒈𝒍 = 𝟒𝟏)) = 𝟎. 𝟎5

𝟐 (𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐 (𝟏𝟎 − 𝟏)(𝟐𝟎𝟎𝟐 ) + (𝟏𝟓 − 𝟏)(𝟐. 𝟓𝟎𝟐 )


𝑺𝒄 = = = 𝟓𝟑𝟔𝟗𝟓. 𝟔𝟓
𝒏𝟏 + 𝒏 𝟐 − 𝟐 𝟏𝟎 + 𝟏𝟓 − 𝟐
𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟓𝟑𝟔𝟗𝟓. 𝟔𝟓 𝟓𝟑𝟔𝟗𝟓. 𝟔𝟓
𝑺𝒙𝟏 −𝒙𝟐 = √ + =√ + = 𝟗𝟒. 𝟔𝟎𝟎𝟔
𝒏𝟏 𝒏𝟐 𝟏𝟎 𝟏𝟓

̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟔𝟎𝟎𝟎 − 𝟓𝟔𝟎𝟎)
𝒕= = = 𝟒. 𝟐𝟐𝟖𝟑
𝑺𝒙𝟏 −𝒙𝟐 𝟗𝟒. 𝟔𝟎𝟎𝟔

14
4.5 Prueba de Fisher para varianzas y de
igualdad de las varianzas de dos poblaciones
normales
Para probar si existe o no la diferencia entre las varianzas de dos poblaciones puede utilizarse
como estadístico de prueba de F de la distribución de F de Fisher, llamada así en honor del
destacado estadístico Ronald Aylmer Fisher, que se calcula como el cociente de las varianzas de
dos poblaciones:

𝝈𝟐 𝟏
𝑭= 𝟐
𝝈 𝟐
Que sería la expresión teoría de F. Y el valor calculado de F a partir de las varianzas muestrales:

𝑭 𝑺 𝟐
𝒄𝒂𝒍= 𝟏 𝟐
𝑺𝟐

La prueba se lleva a cabo sobre la diferencia hipotética entre dos varianzas poblacionales:
𝑯𝒐 = 𝝈𝟏 𝟐 − 𝝈𝟐 𝟐 = 𝟎; para realizarla se obtienen las varianzas de dos muestras tomadas de
dos poblaciones diferentes. En otras palabras, esta prueba se realiza para las poblaciones
independientes, las que suele identificarse como 1 y 2.
Las dos varianzas muestrales son las que se utilizan como base para hacer inferencias sobre sus
correspondientes parámetros.

Si puede asumirse que las dos varianzas poblacionales son iguales, 𝝈𝟐 𝟏 = 𝝈𝟐 𝟐 , entonces se
utiliza como estadístico de prueba, la distribución F con 𝒏𝟏 − 𝟏 grados de libertad para el
numerador y 𝒏𝟏 − 𝟏 grados de libertad para el denominador; ya que el estadístico de prueba se
calcula con los datos muestrales se construye un cociente.

La distribución F no es una distribución simétrica; esta sesgada a la derecha y su forma


específica depende de los grados de libertad tanto del numerador como del denominador. A su
vez cada tabla tiene como encabezados las columnas los grados de libertad del numerador y en
los renglones los grados de libertad del denominador. Así, para un área de 0.05 en el extremo
derecho de esta distribución con 10 grados de libertad en el numerador y 20 en el
15
denominador, el valor de F es igual a 2.35. Este valor quiere decir que, dados esos grados de
libertad, la probabilidad de que la F sea igual o mayor de 2.35 es de 0.05 o de 5%. Esto mismo
en símbolos:
𝑷(𝑭 ≥ 𝟐. 𝟑𝟓|𝒈𝒍𝟏 = 𝟏𝟎, 𝒈𝒍𝟐 = 𝟐𝟎) = 𝟎. 𝟎𝟓

Tal como puede apreciarse, al tratarse de una distribución asimétrica, la tabla de distribución F
no muestra valores de probabilidad para el lado izquierdo y estos se requieren cuando la

prueba que se está realizando es de dos extremos (≠) o cuando es de un extremo y la región de
rechazo está en el lado izquierdo.

En estos casos para determinar los valores no mostrados, lo que se hace es utilizar el inverso
del valor correspondiente de las talas, invirtiendo el orden de los grados de libertad en
símbolos:

𝑭 𝟏
𝟏−𝒂,𝒈𝒍𝟐, 𝒈𝒍𝟏 =
𝑭𝟏−𝒂,𝒈𝒍𝟐,𝒈𝒍𝟏

Ejercicios
1. Se desea el grado de aprendizaje en matemáticas en 2 escuelas del mismo nivel que utilizan
métodos de enseñanza diferentes. Para aplicar la prueba t para la diferencia entre dos medias,
debe ser posible suponer que ambas poblaciones tienen la misma varianza. Por ello, antes de
realizar la prueba sobre las medias, es conveniente realizar una prueba sobre igualdad de
varianzas de las 2 poblaciones. Al hacer esta prueba, se toma una muestra aleatoria de 21
estudiantes en cada una de las 2 escuelas y se obtienen los siguientes resultados:
Escuela 1 Escuela 2
𝒏𝟏 =21 𝒏𝟏 =21
𝑯𝒐 = 𝝈𝟏 𝟐 − 𝝈𝟐 𝟐 ̅
𝑿 = 𝟕. 𝟗 ̅
𝑿 = 𝟖. 𝟑
=𝟎 𝑆1 = 1.1 𝑆1 = 1.21
𝑯𝒐 = 𝝈𝟏 𝟐 − 𝝈𝟐 𝟐
=𝟎

𝑷(𝑭 ≥ 𝟐. 𝟒𝟔|𝒈𝒍𝟏 = 𝟐𝟎, 𝒈𝒍𝟐 = 𝟐𝟎) = 𝟎. 𝟎𝟐𝟓

𝑭 𝑺 𝟐 𝟏.𝟏𝟐
𝒄𝒂𝒍= 𝟏 𝟐 = =𝟎.𝟖𝟑
𝑺𝟐 𝟏.𝟐𝟏𝟐

̅𝟏 − 𝑿
𝑯𝒐: 𝑿 ̅𝟐 = 𝟎
̅ ̅𝟐 ≠ 𝟎
𝑯𝒂: 𝑿𝟏 − 𝑿

𝟐 (𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐 𝟐𝟎(𝟏. 𝟏)𝟐 + 𝟐𝟎(𝟏. 𝟐𝟏)𝟐


𝑺𝒄 = = = 𝟏. 𝟒𝟔𝟒𝟏
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝟐𝟏 + 𝟐𝟏 − 𝟐

16
𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟏. 𝟒𝟔𝟒𝟏 𝟏. 𝟒𝟔𝟒𝟏
𝑺𝒙𝟏 −𝒙𝟐 =√ + =√ + = 𝟎. 𝟏𝟑𝟗𝟒
𝒏𝟏 𝒏𝟐 𝟐𝟏 𝟐𝟏

̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟕. 𝟗 − 𝟖. 𝟑)
𝒕= = = −𝟐. 𝟖𝟕
𝑺𝒙𝟏 −𝒙𝟐 𝟎. 𝟏𝟑𝟗𝟒𝟔

𝑷((−𝟐. 𝟎𝟐𝟏 ≤ 𝒕 ≤ 𝟐. 𝟎𝟐𝟏|𝒈𝒍 = 𝟒𝟎)) = 𝟐. 𝟎𝟐𝟏 Se rechaza la hipótesis nula y se concluye que
la diferencia entre las dos medias muestrales es diferente de 0.

2. Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de motores


respecto al tiempo en minutos. Los resultados se muestran en la tabla:

Construya un intervalo de confianza del 90%


𝝈𝟐 𝟏 𝐒𝟏 𝟐 𝟓𝟎
𝑭= 𝟐 = = = 𝟑. 𝟗𝟑𝟎𝟖
𝝈 𝟐 𝐅𝐬𝟐 𝟐 (𝟎. 𝟓𝟑𝟎)(𝟐𝟒)

𝝈𝟐 𝟏 𝐒𝟏 𝟐 𝟓𝟎
𝑭= 𝟐 = = = 𝟏. 𝟎𝟕𝟑𝟖
𝝈 𝟐 𝐅𝐬𝟐 𝟐 (𝟏. 𝟗𝟒)(𝟐𝟒)
S1 2
Con un nivel de confianza del 90% se sabe que la relación de varianzas esta entre 1.07 y
S2 2
3.93. Esto supondría que la varianza de la población 1 es mayor a la varianza de la población 2
entre 1.07 y 3.93.

3. Una compañía fabrica propulsores para uso en motores de turbina. Al ingeniero de


manufactura le gustaría seleccionar el proceso que tenga la menor variabilidad en la rugosidad
de la superficie. Para ello toma una muestra de n1=16 partes del primer proceso, la cual tiene
una desviación estándar s1 = 4.7 micro pulgadas, y una muestra aleatoria de n2=12 partes del
segundo proceso, la cual tiene una desviación estándar s2 = 5.1micropulgadas. Se desea
encontrar un intervalo de confianza del 90% para el cociente de las dos varianzas s12/s22.
Suponga que los dos procesos son independientes y que la rugosidad de la superficie está
distribuida de manera normal.
𝝈𝟐 𝟏 𝐒𝟏 𝟐 (𝟎. 𝟑𝟔𝟖)(𝟒. 𝟕𝟐 )
𝑭= 𝟐 = = = 𝟎. 𝟑𝟏𝟐𝟓
𝝈 𝟐 𝐅𝐬𝟐 𝟐 𝟓. 𝟏𝟐

𝝈𝟐 𝟏 𝐒𝟏 𝟐 (𝟐. 𝟓𝟏)(𝟒. 𝟕𝟐 )
𝑭= 𝟐 = = = 𝟐. 𝟏𝟑𝟏𝟕
𝝈 𝟐 𝐅𝐬𝟐 𝟐 𝟓. 𝟏𝟐
Estos resultados los podemos interpretar de la siguiente manera:

17
Puesto que este intervalo de confianza incluye a la unidad, no es posible afirmar que las
desviaciones estándar de la rugosidad de la superficie de los dos procesos sean diferentes con
un nivel de confianza del 90%.

4.6 Comparaciones de dos muestras


pareadas
Pruebas para muestras pareadas cuando no se conocen las varianzas pero no se necesita
asumir que sean iguales

Se analizó el caso de una prueba para la diferencia entre 2 medias provenientes de poblaciones
independientes. Aquí se analizará el caso de la diferencia entre 2 medias provenientes de
poblaciones pareadas o relacionadas. Es importante tener presentes las circunstancias de estos
casos:
• Se trata de muestras pareadas.
• Los tamaños de muestras son pequeños.
• La variable se distribuye de forma normal en la población.
En este caso, la prueba se convierte en una prueba sobre la diferencia entre las observaciones,
ya que se calculan las diferencias entre:
1. Dos individuos de la misma especie sometidos a tratamientos diferentes (pareamiento
de individuos según una característica de interés).
2. Dos mediciones hechas a los mismos individuos.

La media de la diferencia es:


𝜮 𝑫𝒊
̅=
𝑫
𝒏
Con el teorema del límite central, el promedio de las diferencias sigue una distribución normal
cuando se conoce la varianza de las diferencias y n es grande. Pero generalmente no se conoce
la varianza de las diferencias, entonces se estima:

̅ )𝟐
∑𝒏𝒊=𝟏(𝑫𝒊 − 𝑫
𝑺=√
𝒏−𝟏

El error estándar de las diferencias pareadas es:


̅
𝑫
𝑺𝑫 =
√𝒏

Con muestras pequeñas, el estadístico de prueba es:

18
̅
𝑫
𝒕𝒏−𝟏 =
𝑺𝑫

Con n-1 grados de libertad. Nótese que aquí cambian los grados de libertad, al tratarse de
muestras pareadas.

Ejercicios
1. Un fabricante de automóviles recolecta datos sobre millaje de 𝒏=𝟏𝟎 autos de diversas
categorías de peso usando gasolina de calidad estándar con y sin cierto aditivo. Por supuesto,
los motores 94 fueron ajustados a las mismas especificaciones antes de cada corrida, y los
mismos conductores sirvieron para los dos casos de gasolina (aunque no se les hizo saber que
gasolina se usaba en una corrida en particular). Dados los datos de millaje en la tabla,
probamos la hipótesis de que no existe diferencia entre el millaje medio obtenido con y sin el
aditivo, empleando el nivel de significancia del 5%

𝟐𝟕𝟔.𝟖
Promedio con aditivo =
𝟏𝟎
𝟐𝟕. 𝟔𝟖 𝒎𝒑𝒈
𝟐𝟕𝟓.𝟏
Promedio sin aditivo =
𝟏𝟎
𝟐𝟕. 𝟓𝟏 𝒎𝒑𝒈
𝑯𝒐: 𝝁𝒅 = 𝟎
𝑯𝒂: 𝝁𝒅 ≠ 𝟎
𝒕 𝒄𝒓𝒊𝒕𝒊𝒄𝒂(𝒈𝒍 = 𝟗, 𝜶 = 𝟎. 𝟎𝟓)
= 𝟐. 𝟐𝟔𝟐

̅ = 𝜮 𝑫𝒊 =𝟏.𝟕=0.17
𝑫 𝒏 𝟏𝟎

̅ )𝟐
∑𝒏𝒊=𝟏(𝑫𝒊 − 𝑫 𝟏. 𝟑𝟏 − 𝟏𝟎(𝟎. 𝟏𝟕𝟐 )
𝑺=√ =√
𝒏−𝟏 𝟏𝟎 − 𝟏
= 𝟎. 𝟑𝟑𝟔𝟖

̅
𝑫 𝟎. 𝟏𝟕
𝑺𝑫 = = = 𝟎. 𝟎𝟓𝟑𝟕
√𝒏 √𝟏𝟎
̅
𝑫 𝟎.𝟏𝟕
𝒕𝒏−𝟏 = 𝑺 =𝟎.𝟑𝟑𝟔𝟖 = 𝟎. 𝟓𝟎𝟒𝟕
𝑫

19
2. El director de la capacitación de una compañía desea comparar un nuevo método de
capacitación técnica, que supone la combinación de diskettes instructivos de cómputo y
resolución de problemas en el laboratorio con el método tradicional de impartición de clases. Se
asocian así doce pares de aprendices de acuerdo con sus antecedentes y desempeño académico,
en tanto que uno de los miembros de cada par asignado al curso tradicional y el otro al nuevo
método. Al final del curso se determina el nivel de aprendizaje por medio de un examen sobre
información básica y la capacidad de aplicarla. Dado que el director de capacitación desea
conceder el beneficio de la duda ala sistema de instrucción establecido, se formula la hipótesis
nula de que el desempeño medio del sistema establecido es igual o mayor que el nivel medio de
desempeño del nuevo sistema. Pruebe esta hipótesis al nivel de significancia de 5%. Los datos
muéstrales de desempeño se presentan en las tres primeras columnas de la siguiente tabla:

Par de Método Nuevo ̅ ̅𝟐


Diferencia 𝑫𝒊 − 𝑫 𝑫𝒊 − 𝑫
aprendices tradicional método
1 89 94 5 0.1667 0.0277
2 87 91 4 -0.8333 0.6943
3 70 68 2 -2.8333 8.0275
4 83 88 5 0.1667 0.0277
5 67 75 8 3.1667 10.0279
6 71 66 5 0.1667 0.0277
7 92 94 2 -2.8333 8.0275
8 81 88 7 2.1667 4.6945
9 97 96 1 -3.8333 14.69
10 78 88 10 5.1667 26.6947
11 94 95 1 -3.8333 14.6941
12 79 87 8 3.1667 10.0279
Total 988 1030 58 0.0004 97.6615
𝑯𝒐: 𝝁𝒅 = 𝟎
𝑯𝒂: 𝝁𝒅 < 𝟎
̅ = 𝜮 𝑫𝒊 =𝟓𝟖=4.8333
𝑫 𝒏 𝟏𝟐

̅ )𝟐
∑𝒏𝒊=𝟏(𝑫𝒊 − 𝑫 𝟗𝟕. 𝟔𝟔𝟏𝟓
𝑺=√ =√ = 𝟐. 𝟗𝟕𝟗𝟔
𝒏−𝟏 𝟏𝟐 − 𝟏

20
̅
𝑫 𝟒. 𝟖𝟑𝟑𝟑
𝑺𝑫 = = = 𝟏. 𝟑𝟗𝟓𝟐
√𝒏 √𝟏𝟐
̅ 𝟒.𝟖𝟑𝟑𝟑
𝑫
𝒕𝒏−𝟏 = 𝑺 = 𝟏.𝟑𝟗𝟓𝟐 = 𝟑. 𝟒𝟔𝟒𝟐
𝑫

4.7 Modelo totalmente aleatorio: análisis de


varianza de un factor
Se extraen dos muestras aleatorias independientes de tamaño 𝒏𝟏 y 𝒏𝟐 , respectivamente, de
dos poblaciones con medias 𝝁𝟏 y 𝝁𝟐 , y varianzas 𝝈𝟏 𝟐 y 𝝈𝟐 𝟐 . Sabemos que la variable aleatoria
tiene una distribución normal estándar.

̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 )
𝒛=
𝝈𝟏 𝟐 𝝈𝟐 𝟐
√ +
𝒏𝟏 𝒏𝟐
Suponemos que 𝒏𝟏 y 𝒏𝟐 son suficientemente grandes, por lo que se aplica el teorema del
limite central. Por supuesto, si las dos poblaciones son normales, el estadístico anterior tiene
una distribución normal estándar aun para 𝒏𝟏 y 𝒏𝟐 pequeñas. Evidentemente, si podemos
suponer que 𝝈𝟏 = 𝝈𝟐 = 𝝈, el estadístico anterior se reduce a

̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 )
𝒛=
𝟏 𝟏
𝝈√𝒏 + 𝒏
𝟏 𝟐
Los dos estadísticos anteriores sirven como base para el desarrollo de los procedimientos de
prueba que incluyen dos medias. La equivalencia con el intervalo de confianza y facilidad de la
transcicion del caso de pruebas sobre una sola media hacen que esto sea sencillo.

La hipótesis bilateral sobre dos medias se escribe con bastante generalidad como
𝑯𝒐 = 𝝁𝟏 − 𝝁𝟐 = 𝒅𝒐
En efecto, la alternativa puede ser bilateral o unilateral. De nuevo, la distribución que se utiliza
̅𝟏 𝒚 ̅
es la distribución del estadístico de prueba bajo 𝑯𝒐 . Se calculan los valores 𝑿 𝑿𝟐 y para 𝝈𝟏 𝟐 y
𝝈𝟐 𝟐 conocidas, el estadístico de prueba dado por una región critica de dos colas en el caso de la
alternativa bilateral.

21
̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − 𝒅𝒐
𝒛=
𝝈𝟏 𝟐 𝝈𝟐 𝟐
√ +
𝒏𝟏 𝒏𝟐

Ejercicios
1. Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con
métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el segundo
grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas y se
ejercita en el pedaleo de alta frecuencia. Después de un mes de entrenamiento se realiza un
test de rendimiento consistente en un recorrido cronometrado de 9 Km. Los tiempos
empleados fueron los siguientes:

A un nivel de confianza del 95% ¿Puede considerarse que los tres métodos producen resultados
equivalentes? O por el contrario ¿Hay algún método superior a los demás?
Solución: Comenzamos calculando los totales y los cuadrados de los totales divididos por el
número de observaciones:

A continuación calculamos los cuadrados de las observaciones y su total:

A partir de estas cantidades básicas calculamos las Sumas de Cuadrados:


 SC(total) = 2984 - 2940 = 44
 SC(intra) = 2984 – 2966,8 = 17,2
22
 SC(entre) = 2966,8 – 2940 = 26,8
Los cuadrados medios serán:
 CM(entre) = 26,8/2 = 13,4
 CM(intra) = 17,2/12 = 1,43

Por consiguiente el estadístico de contraste vale:


F = 13,4/ 1,43 = 9,37

El valor de la F teórica con 2 y 12 grados de libertad, a un nivel de confianza del 95% es 3,89.
Por consiguiente se rechaza la hipótesis nula y se concluye que los tres métodos de
entrenamiento producen diferencias significativas.

2. Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro
procedimientos diferentes, asignados al azar a un grupo de sujetos. Posteriormente se les
realiza una prueba de recuerdo de dichas palabras, obteniéndose los siguientes resultados:

¿Qué conclusiones pueden sacarse acerca de las cuatro formas de presentación, con un nivel de
significación del 5%?
Solución: Comenzamos calculando los totales y los cuadrados de los totales divididos por el
número de observaciones:

A continuación calculamos los cuadrados de las observaciones y su total:

23
A partir de estas cantidades básicas calculamos las Sumas de Cuadrados:
 SC(total) = 988 – 819,8 = 168,2
 SC(intra) = 988 – 902 = 86
 SC(entre) = 902 – 819,8 = 82,2
Los cuadrados medios serán:
 CM(entre) = 82,2/3 = 27,4
 CM(intra) = 86/22 = 3,9

Por consiguiente el estadístico de contraste vale:


F = 27,4/ 3,9 = 7,03
El valor de la F teórica con 3 y 22 grados de libertad, a un nivel de confianza del 95% es 3,05.
Por consiguiente se rechaza la hipótesis nula y se concluye que los cuatro procedimientos de
presentación producen diferencias significativas.

3. Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro
procedimientos diferentes, asignados al azar a un grupo de sujetos. Posteriormente se les
realiza una prueba de recuerdo de dichas palabras, obteniéndose los siguientes resultados:

¿Qué conclusiones pueden sacarse acerca de las cuatro formas de presentación, con un nivel de
significación del 5%?
Solución: Comenzamos calculando los totales y los cuadrados de los totales divididos por el
número de observaciones:

A continuación calculamos los cuadrados de las observaciones y su total:

24
A partir de estas cantidades básicas calculamos las Sumas de Cuadrados:
 SC(total) = 988 – 819,8 = 168,2
 SC(intra) = 988 – 902 = 86
 SC(entre) = 902 – 819,8 = 82,2
Los cuadrados medios serán:

 CM(entre) = 82,2/3 = 27,4


 CM(intra) = 86/22 = 3,9
Por consiguiente el estadístico de contraste vale:
F = 27,4/ 3,9 = 7,03
El valor de la F teórica con 3 y 22 grados de libertad, a un nivel de confianza del 95% es 3,05.
Por consiguiente se rechaza la hipótesis nula y se concluye que los cuatro procedimientos de
presentación producen diferencias significativas.

4. En un experimento se compararon tres métodos de enseñar un idioma extranjero; para


evaluar la instrucción, se administró una prueba de vocabulario de 50 preguntas a los 24
estudiantes del experimento repartidos de a ocho por grupo.
a) ¿Cuál es la variable respuesta y la explicativa en este estudio?
Respuesta: La variable respuesta es el puntaje en la prueba de vocabulario. La variable
explicativa son los métodos de enseñanza (auditivo, traducción y combinado). Es un factor con
3 niveles.
b) TABLA DE ANOVA

Pasos para completar la tabla:


1) Calcular los grados de libertad, en el total son n-1 y n=24, por lo tanto son 23. Los grupos a
comparar son 3 por lo tanto los gl Inter son 2, verifico que (2+21) son los 23 del total.
2) La suma de cuadrados Inter se obtiene multiplicando la media cuadrática por los gl, i.e.:
323.792*2=647.584
3) Teniendo la SC Inter, saco la SC Intra restando: 1460.958-647.584=813.374
4) Con la SC Intra y los gl calculo la media cuadrática Intra= 813.374/21=38.732 Por último con
las dos MC calculo el test F=323.792/38.732=8.360

c) Qué supuestos debería verificar el investigador, escriba las hipótesis asociadas a ellos.
Respuesta: El investigador antes de comparar las medias, debe verificar los supuestos de
Normalidad y de Homogeneidad de las varianzas (el supuesto de independencia se comprueba
en el diseño, dividió a 8 estudiantes por cada método).

5. Un exceso de ozono es una señal de contaminación. Se tomaron seis muestras de aire de


concentraciones de ozono (en partes por 10 mil) en cuatro ciudades de la séptima región
(Curicó, Talca, Linares y Maule) y se determinó el contenido de ozono. Use las salidas de SPSS
para llevar a cabo el Análisis de Varianza (ANOVA) paso a paso. Al final informe sobre la
situación del ozono a las autoridades regionales.
25
Respuesta: Pasos, primero describimos los datos:

Si ordenamos los promedios vemos que en Curicó se obtiene el promedio más bajo de ozono,
luego está Maule, Talca y Linares. Llama la atención que en Linares se den promedio mayores
que en Talca que es una ciudad mayor.
Segundo, verificamos los supuestos, primero el supuesto de independencia se cumple ya que
los datos son de distintas ciudades, hay independencia; seguimos con el de Normalidad
(usaremos el Test de Kolmogorov-Smirnov):
H0: la distribución de ozono de Curicó NO es normal
H1: la distribución de ozono de Curicó es normal

Estadístico de KS= 0,214, valor-p=0,2 mayor que 0,05 por lo tanto acepto normalidad
H0: la distribución de ozono de Talca NO es normal
H1: la distribución de ozono de Talca es normal

Estadístico de KS= 0,285, valor-p=0,138 mayor que 0,05 por lo tanto acepto normalidad
H0: la distribución de ozono de Linares NO es normal
H1: la distribución de ozono de Linares es normal
Estadístico de KS= 0,102, valor-p=0,2 mayor que 0,05 por lo tanto acepto normalidad
H0: la distribución de ozono de Maule NO es normal
H1: la distribución de ozono de Maule es normal

Estadístico de KS= 0,190, valor-p=0,2 mayor que 0,05 por lo tanto acepto normalidad.
Conclusión general, podemos aceptar el supuesto de Normalidad de estos datos en todas las
ciudades.
Continuamos con el supuesto de homocedasticidad, realizamos el test de Levene para la
hipótesis:

Donde:
1=Curicó, 2=Talca, 3=Linares y 4=Maule
Resultado según tabla:
Estadístico= 1,081, valor-p=0,38, es mayor que 0,05, por lo tanto acepto la hipótesis nula y
podemos concluir que las varianzas son homogéneas. Se cumple el supuesto de
homocedasticidad.

26
En vista que se cumplen todos los supuestos ANOVA, procedemos a comparar las medias de las
mediciones de ozono en las 4 ciudades con el test de ANOVA, la hipótesis es:
H1: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4
H0: al menos dos medias no son iguales.
Según la tabla el F observado es 9,418 y el valor-p es menor que 0,001, por lo tanto rechazamos
la hipótesis nula, y concluimos que existen diferencias significativas entre los promedios de
ozono en estas ciudades.
Ahora nos interesa saber qué promedios son diferentes. Para eso hacemos test de
comparaciones múltiples de Tukey, que controla la tasa de error tipo I. Mirando la tabla de la

salida de SPSS podemos construir la siguiente tabla con los promedios ordenados de menor a
mayor:
Después de estudiar los datos, podemos llegar a una conclusión global de que Curicó, Maule y

Talca tienen promedios similares de ozono, en cambio Linares aparece con niveles
significativamente superiores (al 5%).

6. Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la hipertensión arterial,


comparándola con la de una dieta sin sal. Para ello se seleccionan al azar 25 hipertensos y se
distribuyen aleatoriamente en 5 grupos. Al primero de ellos no se le suministra ningún
tratamiento, al segundo una dieta con un contenido pobre en sal, al tercero una dieta sin sal, al
cuarto el fármaco a una dosis determinada y al quinto el mismo fármaco a otra dosis. Las
presiones arteriales sistólicas de los 25 sujetos al finalizar los tratamientos son:
La tabla de ANOVA es:

Como F0,05(4,20) =2,87 y 11,24>2,87 rechazamos la hipótesis nula y concluimos que los
resultados de los tratamientos son diferentes.

27
4.8 Selección del tamaño de muestra para
estimar la diferencia de dos medias
Se puede utilizar un procedimiento similar para determinar el tamaño de la muestra 𝒏 = 𝒏𝟏 =
𝒏𝟐 que se requiere para una potencia específica de la prueba en que se comparan dos medias
poblacionales. Por ejemplo, suponga que deseamos probar la hipótesis cuando se conocen
𝝈𝟏 𝟐 y 𝝈𝟐 𝟐

𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 = 𝒅𝒐,
𝑯𝒂 : 𝝁𝟏 − 𝝁𝟐 ≠ 𝒅𝒐,

Para una alternativa específica, digamos, 𝝁𝟏 − 𝝁𝟐 = 𝒅𝒐 + 𝜹 en la figura se muestra que la


potencia de nuestra prueba es

̅𝟏 − 𝑿
𝟏 − 𝜷 = 𝑷(|𝑿 ̅ 𝟐 | > 𝜶 𝒄𝒖𝒂𝒏𝒅𝒐 𝝁𝟏 − 𝝁𝟐 = 𝒅𝒐 + 𝜹
Por lo tanto,

𝟐
(𝒛𝜶 + 𝒛𝜷 ) (𝝈𝟏 𝟐 + 𝝈𝟐 𝟐 )
𝟐
𝒏≈
𝜹𝟐
28
Para la prueba de una sola cola, la expresión para el tamaño requerido de la muestra cuando
𝒏 = 𝒏𝟏 = 𝒏𝟐 es

𝟐
(𝒁𝒂 +𝒁𝜷 ) +(𝝈𝟏 𝟐 + 𝝈𝟐 𝟐 )
Elección del tamaño de la muestra: 𝒏 =
𝜹𝟐
Cuando se desconoce la varianza poblacional (o varianzas en la situación de dos muestra), la
elección del tamaño de la muestra no es directa. Al probar la hipótesis 𝝁 = 𝝁𝟎 + 𝜹, el
estadistco

̅ − (𝝁𝟎 + 𝜹)
𝑿
𝑺/√𝒏

no sigue una distribución t, como podría esperarse, sino que más bien sigue la distribución t no
central para determinar el tamaño adecuado de la muestra, si dispone de alguna estimación de
𝝈 o si 𝜹 es un múltiplo de 𝝈.
|𝜹| |𝝁 − 𝝁𝟎 |
∆= =
𝝈 𝝈

En el caso de la prueba t de dos muestras en la que se desconocen las varianzas, pero se


suponen iguales, obtenemos los tamaños muestrales n = n1 = n2 necesarios para controlar los
valores de α y β para diversos valores de
|𝜹| |𝝁𝟏 − 𝝁𝟐 − 𝒅𝒐|
∆= =
𝝈 𝝈

1. De una población de 1,176 adolescentes de una ciudad se desea conocer la aceptación por los
programas humorísticos televisivos y para ello se desea tomar una muestra por lo que se
necesita saber la cantidad de adolescentes que deben entrevistar para tener para tener una
información adecuada con error estándar menor de 0.015 al 90% de confiabilidad.
Solución:

Es decir, para realizar una investigación se necesita una muestra de al menos 298 adolescentes.

29
Conclusión
En esta investigación se estudió la metodología básica necesaria al realizar pruebas de hipótesis
para las medias correspondientes a 2 poblaciones y se revisaron las pruebas para la diferencia
entre 2 medias en diversas circunstancias:
Con muestras grandes e independientes, cuando se conocen y cuando no se conocen las
varianzas correspondientes a las 2 poblaciones. Además se explican 2 casos para esta última
circunstancia, cuando no se conocen las varianzas; podemos asumir que son iguales, y no puede
asumirse que lo sean.
Las pruebas para 2 poblaciones con muestras pequeñas e independientes, variables distribuidas
normalmente, cuando no se conocen las varianzas de las correspondientes poblaciones pueden
asumirse que sean iguales, y no puede asegurarse que lo sean.

30
Bibliografía
 Díaz Mata, A. (2013). Estadística Aplicada a la Administración y la Economía. México,
D.F: The McGraw Hill.
 http://dta.utalca.cl/estadistica/ejercicios/interpretar/Metodos/resuelto%20anova.pdf
 http://www.hrc.es/bioest/Anova_4.html
 http://www.ugr.es/~jsalinas/weproble/T14res.PDF

31

Você também pode gostar