Escolar Documentos
Profissional Documentos
Cultura Documentos
Territorio TOTAL
A B C D
Numero de ventas en la muestra 𝑓0 6 12 14 8 40
Numero esperado de ventas 𝑓𝑒 10 10 10 10 40
De acuerdo con la fórmula 12.1 anterior, observe que, si las frecuencias observadas
son muy parecidas en las esperadas, el valor estadístico chi cuadrada será cercano
a cero. A medida que las frecuencias esperadas, el valor de chi cuadrada se hará
mayor. Por tanto, se concluye que en una prueba chi cuadrada, para determinar si
el patrón de frecuencias observadas es diferente del patrón esperado, solo se
emplea la cola superior de la distribución chi cuadrada.
EJEMPLO 2 El cálculo del estadístico en la prueba de chi cuadrada utilizando los
patrones de frecuencias observadas y esperadas de la tabla 12.1 es como sigue:
(𝑓0 − 𝑓𝑒 )2 (6 − 10)2 (12 − 10)2 (14 − 10)2 (8 − 10)2 40
𝑋2 = ∑ = + = = 4.00
𝑓𝑒 10 10 10 10 10
El valor requerido del estadístico de prueba chi cuadrada para rechazar la hipótesis
nula depende del nivel de significancia que se establezca y de los grados de libertad.
En las pruebas de bondad de ajuste, los grados de libertad gl son el número de
categorías menos el número de parámetros estimados, a partir de la muestra,
menos 1. Si k = número de categorías para los datos y m = número de parámetros
estimados basándose en la muestra, los grados de libertad en una prueba de
bondad de ajuste de chi cuadrada son
gl = k – m – 1
si la hipótesis nula es que las frecuencias tienen distribuciones iguales, no es
necesario hacer ninguna estimación de parámetros y m = 0. (en los problemas 12.6
y 12.8 se presentan ejemplos en los cuales m es mayor que cero.) Siempre sustrae
1, ya que dado un numero total de observaciones, una vez que han introducido las
frecuencias observadas en k – 1 de las categorías de una tabla de frecuencias, la
ultima casilla ya no puede variar libremente. Por ejemplo, dado en las primeras tres
categorías en la tabla 12.1 tienen las frecuencias observadas de 6, 12 y 14,
respectivamente, se incluye que la frecuencia en la cuarta categoría debe ser 8,
para que sumadas den el tamaño de la muestra que es n = 40.
EJEMPLO 3 A continuación se presenta el procedimiento completo para la prueba
de hipótesis correspondiente a los datos de la tabla 12.1; la hipótesis nula se prueba
para un nivel de significancia de 5 por ciento.
𝐻0 : El numero de ventas se distribuye de manera uniforme entre los cuatro
territorios.
𝐻1 : El numero de ventas no se distribuye de manera uniforme entre los cuatro
territorios.
gl = k – m – 1 = 4 – 0 – 1 = 3
𝑋 2 critica (gl = 3, α = 0.05) = 7.81 (de acuerdo con el apéndice 7)
𝑋 2 calculada = 4.00 (de acuerdo con el ejemplo 2)
Como el valor chi cuadrada que se obtuvo es de 4.00 y este valor no es mayor que
el valor critico 7.81, la hipótesis nula de que las ventas están igualmente distribuidas
entre los cuatro territorios no se puede rechazar para un nivel de significancia del 5
por ciento.
Los valores obtenidos para el estadístico de prueba chi cuadrada se basan en
conteos discretos, mientras que la distribución chi cuadrada es continua si las
frecuencias esperadas 𝑓𝑒 en las casillas no son pequeñas, este hecho no es
importante en términos del grado de aproximación de la distribución chi cuadrada a
la distribución del estadístico de prueba. Una regla usal es que la frecuencia
esperada 𝑓𝑒 para cada casilla, o categoría, debe ser por lo menos 5. Las casillas
que no cumplan con este criterio deben combinarse, si es posible, con las categorías
adyacentes, de modo que se satisfaga este requerimiento. Entonces, este numero
ya reducido de categorías es el que se emplea para determinar los grados de
libertad gl para esta prueba. Véanse los problemas 12.6 y 12.8. las frecuencias
esperadas de todas las Casilla de una tabla de datos también se pueden hacer
mayores aumentando el tamaño de la muestra. Compare las frecuencias
esperadas.
La frecuencia esperada puede basarse en cualquier hipótesis respecto a la forma
de la distribución de frecuencia poblacional. Si la hipótesis se basa en el patrón de
frecuencias observado a lo largo del tiempo entonces, como en el caso de la
hipótesis de igual posición, no hay que hacer ninguna estimación de parámetros;
gl: k-m-l-k-0-1 = k-1
ejemplo 4
a lo largo del tiempo la venta de una fábrica de aparato de televisión ha sido 40%
de aparatos de pantalla pequeña (menos de 20 pulgadas) 40% de aparatos de
pantalla mediana (20 a 27 pulgadas) y 20% de aparato e pantalla grande ( mayor
que 27 pulgadas) con objeto de elaborar un programa de producción para el siguen
te mes, se trae una muestra aleatoria de 100 de las compras realizadas durante el
presente periodo, y se encuentran que 55 de los aparatos comprados fueron
pequeños, 45 fueron medianos, 10 fueron grandes. A continuación, la prueba de
hipótesis nula que este patrón hipotético de venta sigue vigente, para un nivel de
significancia del 1%.
H0: los porcentajes de ventajas en las categorías de pantalla pequeña, mediana y
grande son 40% y 20%, respectivamente.
H1: el patrón actual de venta de estos aparatos de televisión es diferente al patrón
histórico en H0.
Gl= k-m-1 = 3-0-1=2
x² critica (gl =2, α =0.01) = 9.21
x² calculada (véanse en la tabla 12.2 las frecuencias observadas y esperadas):
(𝑓0−𝑓𝑒)² (55−40)² (35−40)² (10−20)²
x²=∑ = + + = 11.25
𝑓𝑒 40 40 20
el valor encontrado para el estadístico chi cuadrada es 11.25 que es mayor que el
valor critico 9.21. por tanto, se rechaza la H0 para un nivel de significancia del 1%.
Al comparar las frecuencias obtenidas y las esperadas de la tabla 12.2, se encuentra
que las variaciones principales son que se venden más aparatos pequeños y menos
aparatos grandes, y que parece haber también una pequeña disminución en los
aparatos medianos.
Tamaño de pantalla
total
pequeña mediana grande
Frecuencia observada fo 55 35 10 100
Patrón histórico fe 40 40 20 100
Tabla 12.2 ventas esperadas y observadas de aparatos de tv por tamaño de pantalla
𝐻1 𝜋 ≠ 0.40
𝑔𝑙 = 𝑘 − 𝑚 − 1 = 2 − 0 − 1 = 1
total
SI NO
Numero observados en la muestra,𝑓0 10 40 50
Numero esperado en la muestra,𝑓𝑒 20 30 50
El valor obtenido para el estadístico de prueba es 8.33, que es mayor que el valor
critico 3.84. por tato, se rechaza la hipótesis nula para un nivel de significancia de
5% y se concluye que la proporción en toda la empresa, de interesados en participar
en el programa no es 0.40.
𝐻0 : 𝜋1 = 𝜋2 𝐻1 : 𝜋1 ≠ 𝜋2
comunidades tatal
Comunidad Comunidad
1 2
Número que ve el programa 10 15 25
Número que no lo ve 40 35 75
total 50 50 100
Total
Comunidad 1 Comunidad 2
# que ve el programa 12.5 12.5 25
# que no ve el programa 37.5 37.5 75
Total 50 50 100
El valor obtenido para el estadístico de prueba es 1.34, que no es mayor que el valor
critico 6.63. por tanto, para un nivel de significancia de 1% no se puede rechazar la
hipótesis nula, y se concluye que la proporción de espectadores de las dos
condiciones puede no diferir. Esta es la misma conclusión a la que se llevó en la
sección 11.7 empleando el estadístico z.
Prueba para la diferencia entre varias proporciones poblacionales. Dado el método
básico del ejemplo9 la prueba chi cuadrada se puede usar para probar diferencias
entre varias (k) proporciones poblaciones empleando la tabla de 2 x k para el
análisis de frecuencia. En este caso no existe un procedimiento matemático
equivalente que se base en el uso de la estadístico z. La hipótesis nula es de las
diferentes proporciones poblacionales son iguales ente si (es decir que las
diferentes proporciones muestrales pueden haberse obtenido por casualidad de la
misma población). El procedimiento de muestreo consiste en tomar varias muestras
aleatorias independientes, una por cada una de las k categorías de datos.
Ejemplo 10 de acuerdo la ejemplo 9, suponga que se muestra las familias de cuatro
comunidades para determinar el número de televisores que vieron un programa
especial acerca de la economía nacional. La tabla 12.8 presenta los datos
muéstrales observados mientras que la tabla 12.9 presenta las frecuencias
esperadas, basándose en la fórmula 12.3. A continuación se presenta la prueba
para la hipótesis nula de que no hay diferencia entre las proporciones poblacionales;
Se usa un nivel de significancia de 1%
H0: ∏1=∏2=∏3=∏4 H1=No todas ∏1=∏2=∏3=∏4
Gl=(r-1) (k-1) = (2-1) (4-1) =3
x²critica (gl=3, α=0.01) =11.35
(𝑓0−𝑓𝑒)2 (10−12)2 (15−12)2 (5+12)2 (18−12)2 (40−38)2 (35−38)2 (45−38)2
x²=∑ = + + + + + + +
𝑓𝑒 12 12 12 12 38 38 38
(32−38)2
= 0.33 + 0.75 + 4.08 + 3.0 + 0.11 + 0.24 + 1.29 + 0.95 = 10.75
38
comunidades
Total
1 2 3 4
# de programa 10 15 5 18 48
# que no ve el programa 40 35 45 32 152
Total 50 50 50 50 200
Pag. 228
El valor obtenido para el estadístico chi cuadrada es de 10.75 que no es mayor que
el valor critico 11.35 por tanto la diferencia a la proporción de televidentes de las
cuatro comunidades muestreadas no es suficientemente grande para rechazar la
hipótesis nula para un nivel de significancia de 1 por ciento. Es posible suponer que
las proporciones de televidentes en las diferentes comunidades sean las mismas,
que no difieran.
12.5 USO DE SOFTWARE
El software para análisis de estadístico por lo general contiene herramientas para
realizar pruebas de bondad de ajuste y pruebas para tabla de contingencia. En las
pruebas de bondad de ajuste, tanto las frecuencias esperadas tienen que ser datos
de entrada por que se basan en la hipótesis nula especifica que se va a probar. En
las tablas de contingencia, las frecuencias esperadas se determinan directamente
a partir de los datos muestrales. Por tanto, para llevar a cabo estas pruebas como
datos de entrada solo se requieren las frecuencias observadas. Como se explica en
las secciones 12.3 y 12.4, las pruebas para tabla de contingencia se usan para
probar la independencia de dos variables categóricas o para probar hipótesis
relacionadas con la igualdad de dos o mas proporciones poblacionales. Por tanto,
el problema resuelto 12.15 ilustra el uso de minitab.
PROBELMAS RESUELTOS
PRUEBAS DE BONDAD DE AJUSTE
21.1 se afirma que entre los clientes de una tienda especializada en pantalones de
mezclilla hay el mismo numero de hombres que de mujeres. Se observa una
muestra aleatoria de 40 clientes, en donde 25 son hombres y 15 mujeres. Pruebe la
hipótesis nula de que el numero de clientes hombres y mujeres es igual empleando
la prueba de chi cuadrada y 5% como nivel de significancia.
De acuerdo con la tabla 12.10,
𝐻0 : El numero de clientes hombres y mujeres es el mismo (el patrón de frecuencias es uniforme)
𝐻1 : El numero de clientes hombres y mujeres es el mismo.
gl = k – m – 1 = 2 - 0 – 1 = 1
𝑋 2 critica (gl = 1, α = 0.05) = 3.84
(52 ) (−5)2
= + = 2.50
20 20
total
Hombres clientes
Numero de (𝑓𝑒 ) 20 20 40
12.2. el problema 12.1 suponga que lo que afirma ahora es que, de los clientes de
la tienda, el numero de hombres es doble que el numero de mujeres, use los datos
que se muestran en la tabla 12.11 y pruebe esta hipótesis en un nivel de
significancia de 5 por ciento.
Tabla 12.11 Frecuencias obtenidas y esperadas para el problema 12.2
clientes total
Hombres Mujeres
𝑔𝑙 = 𝑘 − 𝑚 = 0 − 1 = 1
2
(𝑓0 − 𝑓𝑒 )2 (25 − 26.67)2 (15 − 13.33)2 (−1.67)2 (1.67)2
𝑥 =∑ = + = +
𝑓𝑒 26.67 13.33 26.67 13.33
= 0.10 + 0.21 = 0.31
Es claro que el valor obtenido para el estadístico chi cuadra, 0.31 no es mayor que
el valor critico 3.84. Por tanto, no se puede rechazar la hipótesis para un nivel
significancia de 5 por ciento. El hecho de que ninguna de las dos hipótesis nulas
en los problemas 12.1 y 12.2 se hayan podido rechazar de muestra el beneficio de
la duda concedido a la hipótesis nula en cada caso. Sin embargo, el tamaño de la
muestra también afecta la probabilidad de los resultados muestrales (véase el
problema 12.3)
𝑔𝑙 = 𝑘 − 𝑚 = 0 − 1 = 1
2
(𝑓0 − 𝑓𝑒 )2 (50 − 40)2 (30 − 40)2
𝑥 =∑ = + = 5.00
𝑓𝑒 40 40
El valor obtenido para chi cuadrada es 5.00, que es mayor que el valor critico 3.84.
Por tanto, se rechaza la hipótesis nula para un nivel de significancia de 5 por
ciento. Aun cuando los datos muéstrales son proporcionalmente iguales a los del
problema 12.1 ahora la decisión es rechazar 𝐻0 , y no aceptarla. Esto demuestra la
mayor sensibilidad de una prueba estadística realizada con un tamaño de muestra
mayor.
Tabla 12.12 frecuencias obtenidas y esperadas el problema 12.3
Clientes Total
Hombres Mujeres
Numero en la muestra (𝑓0 ) 50 30 80
Numero esperado (𝑓𝑒 ) 40 40 80
gl = k – m – 1 = 3 – 0 – 1 = 2
CORREO: jealmasar@hotmail.com