La Prueba Chi Cuadrada

LA PRUEBA DE CHI CUADRADA PARA EL
ANALISIS DE DATOS CUALITATIVOS 12
12.1 PROPOSITO GENERAL DE LA PRUEBA CHI CUADRADA

Los pedimentos que se describen en este capítulo implican la comparación de un
patrón observado en las frecuencias de datos muestrales organizados en
determinaste categorías, con un patrón de frecuencias esperado con base a una
hipótesis nula particular.
En las secciones 9.6 y 11.8 se describe el uso de la distribución de probabilidad
𝑋 2 (chi cuadrada) para inferencia estadística acerca de la varianza poblacional. El
estadístico de prueba que se presenta en las siguientes secciones también esta
distribuido como el modelo probabilístico chi cuadrada, y debido a que también se
empelan pruebas de hipótesis, los pasos básicos de las pruebas de hipótesis
descritos en la sección 10.2 se aplican también en este capítulo.
Este capitulo comprende el uso de la prueba chi cuadrada para probar la bondad de
ajuste, la independencia de dos variables y la hipótesis relativas a proporciones
poblacionales, que es una extensión de la prueba de diferencias entre dos
proporciones poblacionales, que se describe en la sección 11.7
12.2 PRUEBAS DE BONDAD DE AJUSTE
La hipótesis nula en una prueba de bondad de ajuste en una especificación respecto
al patrón de frecuencias esperado de un conjunto de categorías. El patrón esperado
puede ajustarse a patrones tales como el binomial, el de Poisson o el normal.
EJEMPLO 1
Un distribuidor regional de sistemas de aire acondicionado ha subdividido la región
en cuatro territorios. A un posible comprador de la distribuidora se le asegura que
las ventas de equipo están distribuidas de manera aproximadamente igual en los 4
territorios. El posible comprador extrae de los archivos de la empresa una muestra
aleatoria de 40 de las ventas realizadas durante el año pasado y encuentra que el
número de ventas en cada uno de los cuatro territorios es como se registra en el
primer renglón de la tabla 12.1 (donde 𝑓0 representa la “frecuencia observada”). Con
base a la hipótesis de que las ventas están igualmente distribuidas, en el segundo
renglón de la tabla 12.1 (donde 𝑓𝑒 representa la “frecuencia esperada”) se da la
distribución uniforme esperada de las ventas.
TABLA 12.1 número de ventas de sistemas de aire acondicionado
de acuerdo con el territorio.
Territorio TOTAL
A B C D
Numero de ventas en la muestra 𝑓0 6 12 14 8 40
Numero esperado de ventas 𝑓𝑒 10 10 10 10 40
CAPITULO 12 LA PRUEBA DE CHI CUADRADA PARA ELA ANALISIS DE

DATOS CUALITATIVOS
Para que la hipótesis nula sea aceptada, las diferencias entre frecuencias
observadas y frecuencias esperadas deben ser atribuibles la variabilidad de
muestreo para el nivel de significancia estipulado. Así, el estadístico de prueba chi
cuadrada se basa en la magnitud de esta diferencia en cada una de las categorías
de la distribución de frecuencias entre los patrones de frecuencias obtenidas y
esperadas es
(𝑓0 −𝑓𝑒 )2
𝑋2 = ∑ (12.1)
𝑓𝑒
De acuerdo con la fórmula 12.1 anterior, observe que, si las frecuencias observadas
son muy parecidas en las esperadas, el valor estadístico chi cuadrada será cercano
a cero. A medida que las frecuencias esperadas, el valor de chi cuadrada se hará
mayor. Por tanto, se concluye que en una prueba chi cuadrada, para determinar si
el patrón de frecuencias observadas es diferente del patrón esperado, solo se
emplea la cola superior de la distribución chi cuadrada.
EJEMPLO 2 El cálculo del estadístico en la prueba de chi cuadrada utilizando los
patrones de frecuencias observadas y esperadas de la tabla 12.1 es como sigue:
(𝑓0 − 𝑓𝑒 )2 (6 − 10)2 (12 − 10)2 (14 − 10)2 (8 − 10)2 40
𝑋2 = ∑ = + = = 4.00
𝑓𝑒 10 10 10 10 10
El valor requerido del estadístico de prueba chi cuadrada para rechazar la hipótesis
nula depende del nivel de significancia que se establezca y de los grados de libertad.
En las pruebas de bondad de ajuste, los grados de libertad gl son el número de
categorías menos el número de parámetros estimados, a partir de la muestra,
menos 1. Si k = número de categorías para los datos y m = número de parámetros
estimados basándose en la muestra, los grados de libertad en una prueba de
bondad de ajuste de chi cuadrada son
gl = k – m – 1
si la hipótesis nula es que las frecuencias tienen distribuciones iguales, no es
necesario hacer ninguna estimación de parámetros y m = 0. (en los problemas 12.6
y 12.8 se presentan ejemplos en los cuales m es mayor que cero.) Siempre sustrae
1, ya que dado un numero total de observaciones, una vez que han introducido las
frecuencias observadas en k – 1 de las categorías de una tabla de frecuencias, la
ultima casilla ya no puede variar libremente. Por ejemplo, dado en las primeras tres
categorías en la tabla 12.1 tienen las frecuencias observadas de 6, 12 y 14,
respectivamente, se incluye que la frecuencia en la cuarta categoría debe ser 8,
para que sumadas den el tamaño de la muestra que es n = 40.
EJEMPLO 3 A continuación se presenta el procedimiento completo para la prueba
de hipótesis correspondiente a los datos de la tabla 12.1; la hipótesis nula se prueba
para un nivel de significancia de 5 por ciento.
𝐻0 : El numero de ventas se distribuye de manera uniforme entre los cuatro
territorios.
𝐻1 : El numero de ventas no se distribuye de manera uniforme entre los cuatro
territorios.
gl = k – m – 1 = 4 – 0 – 1 = 3
𝑋 2 critica (gl = 3, α = 0.05) = 7.81 (de acuerdo con el apéndice 7)
𝑋 2 calculada = 4.00 (de acuerdo con el ejemplo 2)
Como el valor chi cuadrada que se obtuvo es de 4.00 y este valor no es mayor que
el valor critico 7.81, la hipótesis nula de que las ventas están igualmente distribuidas
entre los cuatro territorios no se puede rechazar para un nivel de significancia del 5
por ciento.
Los valores obtenidos para el estadístico de prueba chi cuadrada se basan en
conteos discretos, mientras que la distribución chi cuadrada es continua si las
frecuencias esperadas 𝑓𝑒 en las casillas no son pequeñas, este hecho no es
importante en términos del grado de aproximación de la distribución chi cuadrada a
la distribución del estadístico de prueba. Una regla usal es que la frecuencia
esperada 𝑓𝑒 para cada casilla, o categoría, debe ser por lo menos 5. Las casillas
que no cumplan con este criterio deben combinarse, si es posible, con las categorías
adyacentes, de modo que se satisfaga este requerimiento. Entonces, este numero
ya reducido de categorías es el que se emplea para determinar los grados de
libertad gl para esta prueba. Véanse los problemas 12.6 y 12.8. las frecuencias
esperadas de todas las Casilla de una tabla de datos también se pueden hacer
mayores aumentando el tamaño de la muestra. Compare las frecuencias
esperadas.
La frecuencia esperada puede basarse en cualquier hipótesis respecto a la forma
de la distribución de frecuencia poblacional. Si la hipótesis se basa en el patrón de
frecuencias observado a lo largo del tiempo entonces, como en el caso de la
hipótesis de igual posición, no hay que hacer ninguna estimación de parámetros;
gl: k-m-l-k-0-1 = k-1
ejemplo 4
a lo largo del tiempo la venta de una fábrica de aparato de televisión ha sido 40%
de aparatos de pantalla pequeña (menos de 20 pulgadas) 40% de aparatos de
pantalla mediana (20 a 27 pulgadas) y 20% de aparato e pantalla grande ( mayor
que 27 pulgadas) con objeto de elaborar un programa de producción para el siguen
te mes, se trae una muestra aleatoria de 100 de las compras realizadas durante el
presente periodo, y se encuentran que 55 de los aparatos comprados fueron
pequeños, 45 fueron medianos, 10 fueron grandes. A continuación, la prueba de
hipótesis nula que este patrón hipotético de venta sigue vigente, para un nivel de
significancia del 1%.
H0: los porcentajes de ventajas en las categorías de pantalla pequeña, mediana y
grande son 40% y 20%, respectivamente.
H1: el patrón actual de venta de estos aparatos de televisión es diferente al patrón
histórico en H0.
Gl= k-m-1 = 3-0-1=2
x² critica (gl =2, α =0.01) = 9.21
x² calculada (véanse en la tabla 12.2 las frecuencias observadas y esperadas):
(𝑓0−𝑓𝑒)² (55−40)² (35−40)² (10−20)²
x²=∑ = + + = 11.25
𝑓𝑒 40 40 20
el valor encontrado para el estadístico chi cuadrada es 11.25 que es mayor que el
valor critico 9.21. por tanto, se rechaza la H0 para un nivel de significancia del 1%.
Al comparar las frecuencias obtenidas y las esperadas de la tabla 12.2, se encuentra
que las variaciones principales son que se venden más aparatos pequeños y menos
aparatos grandes, y que parece haber también una pequeña disminución en los
aparatos medianos.
Tamaño de pantalla
total
pequeña mediana grande
Frecuencia observada fo 55 35 10 100
Patrón histórico fe 40 40 20 100
Tabla 12.2 ventas esperadas y observadas de aparatos de tv por tamaño de pantalla
12.3 prueba para la independencia de dos variables categóricas (prueba para

tabla de contingencia)
En el caso de las pruebas de bondad de ajuste, solo existe una variable categórica,
por ejemplo, el tamaño de las pantallas de tv que han sido vendidos, y lo que se
prueba en una hipótesis que se refiere al patrón de frecuencia, es decir la
distribución de la variable. Las frecuencias observadas se pueden enumerar en un
solo renglón o en una sola columna de categoría y lo que se prueba es la hipótesis
de que la variable son estadísticamente independientes. La independencia implica
el reconocimiento de la categoría en la se clasifica una observación respecto a una
de las variables no tiene efecto sobre la probabilidad, de que, en relación con otra
variable, este en una de las diferentes categorías. Cuando intervienen dos variables
las frecuencias observadas se colocan en una tabla de clasificación de dos variables
o tabla de contingencia (véase en la sección 5.8) la dimensión de esta tabla se
define como r(k) en donde r indica en número de renglones y k el número de
columnas.
Ejemplo 5 se repite la tabla 12.3 de la sección 5.8 es un ejemplo de formato más
simple posible para una tabla de contingencia, ya que cada una de las dos variables
(sexo y edad) tiene solo dos niveles o categorías de clasificación.
Tabla12.3 tabla de contingencia para los clientes de una tienda de departamentos
Sexo
edad total
hombre mujer
Menos de 30 77 33 110
30 y mayor 63 27 90
Total 140 60 200
Si se rechaza la hipótesis nula de la independencia de datos clasificados como los
de la tabla 12.3, esto indica que las dos variables son dependientes y que existe
una relación entre ellas. Por ejemplo, en la tabla 12.3, esto indicaría que existe una
relación entre la edad y el sexo de los clientes de la tienda de departamentos.
Dado la hipótesis de la independencia de las dos variables la frecuencia esperada
en cada una de las casillas de la tabla de contingencia debe estar en proporción a
las frecuencias totales observadas en la columna y en el renglón donde su ubica la
casilla en relación con el tamaño total de la muestra. Así, si Fr es la frecuencia total
en un renglón dado y Fe es la frecuencia total en la columna dada, la fórmula para
determinar la frecuencia esperada en la casilla de la tabla de contingencia que se
ubica en el renglón y en esa columna es
𝑓𝑒𝑓𝑘
fe 𝑛
La fórmula general para los grados de libertad correspondientes a una prueba de

hipótesis es
gl=(r-1) (k-1)
EJEMPLO6 En la tabla 12.4 se reportan las frecuencias esperadas para los datos
de la tabla 12.3 por ejemplo, el cálculo de la frecuencia esperada en el renglón uno,
columna 1 es
𝑓𝑒𝑓𝑘 (110)(140) 15400
Fe= = = = 77
𝑛 200 200
Observe en este caso las tres frecuencias esperadas restantes se puede obtener
restando esta frecuencia de los totales de renglón y de la columna, en lugar de usar
la formula (12.3). Esta es una clara indicación de que una tabla de contingencia de
2x2 existe un grado de libertad y de que solamente la frecuencia de una casilla esta
libre para variar.
Tabla 12.4 tabla de frecuencias esperadas para las frecuencias observadas de tabla
12.3
sexo
Edad Total
hombre Mujer
Menos de 30 77 33 110
30 y mayor 63 27 90
Total 140 60 200
El estadístico de prueba chi cuadrada para tablas de contingencia se calcula

exactamente igual que para las pruebas de ajuste de ajuste (véase la sección 12.2)
Ejemplo 7: a continuación, se presenta la prueba de hipótesis nula de la

independencia de los datos de la tabla 12.3., se usa un nivel de significancia de 1%.
Ho: sexo y la edad de la tienda son independientes.
H1: el sexo y la edad son variables dependientes (existe una relación entre ellas
𝑔𝑙(𝑟 − 1)(𝑘 − 1) = (2 − 1)(2 + 1) = 1
𝑥 2 𝑐𝑟𝑖𝑡𝑖𝑐𝑎 (𝑔𝑙 = 1, 𝑎 = 0.01) = 6.63
(𝑓0 − 𝑓𝑒 )2 (60 − 77)2 (50 − 33)2 80 − 63)2 (10 − 27)2

𝑥2 = ∑ = + + + = 27.80
𝑓𝑒 77 33 63 27
El valor obtenido para el estadístico de la prueba es 27.80, que es mayor que el

valor critico requerido 6.63. por tanto, se rechaza la hipótesis nula de la
independencia para un nivel de significancia de 1 por ciento. Observando la tabla
12.3, se ve que es más probable que los clientes de sexo masculino tengan más de
30 años, mientras que los clientes de sexo femenino es más probable que tenga
menos de 30 años. El resultado de chi cuadrada indica que, para un nivel de
significancia de 1 por ciento, esta relación observa en la muestra no se puede
atribuir a la casualidad.
12.4 PRUEBAS DE HIPÓTESIS PARA PROPORCIONES

Prueba para un valor hipotético de la proporción. Dada una proporción poblacional
hipotética y una proporción observada en una muestra aleatoria tomada de la
población, en la sección 11.4 se usó la distribución de la probabilidad normal como
aproximación al proceso binomial con objeto de probar una hipótesis nula. Desde el
punto de vista matemático se pude demostrar que esta prueba bilateral equivale a
una prueba chi cuadrada de bondad de ajuste con un renglón de frecuencia y dos
categorías (una tabla de 1 x 2). Dado que una prueba chi cuadra se tiene un análisis
de diferencia entre frecuencias obtenidas y esperadas independiente de la dirección
de las diferencias, no existe un procedimiento de prueba chi cuadrada que sea
equivalente a una prueba unilateral para el valor de una proporción poblacional.
EJEMPLO 8 El jefe de un departamento de personal estima que la proporción de

los empleados de una empresa grande dispuesta a participar en un nuevo programa
de investigación de acciones es π = 0.40. se contacta una muestra aleatoria de n =
50 empleados, y 10 manifiesta su intención de participar. El valor hipotético de la
población se puede probar usando la distribución de probabilidad normal, como se
describe en la sección 11.4. a continuación se muestra el uso de la prueba chi
cuadrada con el mismo fin, empleando un nivel de significancia de 5%.
𝐻0 : 𝜋 = 0.40
𝐻1 𝜋 ≠ 0.40
𝑔𝑙 = 𝑘 − 𝑚 − 1 = 2 − 0 − 1 = 1
(Existen dos categorías para frecuencias observadas, como se indica en la tabla

12.5)
Tabla 12.5 Frecuencias observadas y esperadas para el ejemplo 8
total
SI NO
Numero observados en la muestra,𝑓0 10 40 50
Numero esperado en la muestra,𝑓𝑒 20 30 50
𝑥 2 critica (gl = 1, ν = 0.05) = 3.84

𝑥 2 Calculada (la tabla 12.5 muestra las frecuencias observadas y las esperadas):
(𝑓0 −)2 (10 − 20)2 (40 − 30)2

𝑥2 = ∑ = + = 8.33
𝑓𝑒 20 30
El valor obtenido para el estadístico de prueba es 8.33, que es mayor que el valor
critico 3.84. por tato, se rechaza la hipótesis nula para un nivel de significancia de
5% y se concluye que la proporción en toda la empresa, de interesados en participar
en el programa no es 0.40.
Prueba para la diferencia de dos proporciones poblacionales. En la sección 11.7 se

presenta un procedimiento para probar la hipótesis nula de que no hay difencia de
2 proporciones, basándose en el uso de la distribución de probabilidad normal.
Desde el punto de vista matemático se puede demostrar que esta prueba de dos
colas equivale a un aprueba de chi cuadrada para una tabla de contingencia en la
cual las frecuencias observadas se organizan en una tabla de 2 x 2. De nuevo, no
existe una prueba chi cuadrada equivalente a una prueba unilateral basada en el
uso de la distribución de probabilidad normal.
El procedimiento de muestreo que se usa en la prueba para la diferencia para las

dos proporciones consiste en formar dos muestras aleatorias, una para cada una
de las categorías (K). lo anterior es diferente a lo que se hace para una tabla 2 x 2
empleada en una prueba de independencia de dos variables en la sección 12.3, en
donde se toma un amuestra aleatoria de para todo el análisis.
EJEMPLO 9 El ejemplo 8 de la sección 11.7indica que 10 de 50 familias de una

comunidad vieron un progreso de televisión sobre la economía nacional y que en
una segunda comunidad 15 de 50 familias vieron un programa. En ese ejemplo se
prueba la hipótesis nula 𝐻0 : (𝜋1 − 𝜋2 ) = 0 o lo que es equivalente, 𝐻0 : 𝜋1 = 𝜋2 para un
nivel de significancia de 1 por ciento. A continuación, se presenta una prueba
equivalente usando el estadístico de prueba chi cuadra.
𝐻0 : 𝜋1 = 𝜋2 𝐻1 : 𝜋1 ≠ 𝜋2
(𝑔𝑙 = (𝑟 − 1)(𝑘 − 1) = (2 − 1)(2 − 1) = 1

(las frecuencias observadas se organizan en una 2x2, como se indica en la tabla 12.6)
comunidades tatal
Comunidad Comunidad
1 2
Número que ve el programa 10 15 25
Número que no lo ve 40 35 75
total 50 50 100
𝑥 2 critica (gl =1, α = 0.001) = 6.63
𝑥 2 Calculada (las frecuencias observadas se presentan en la tabla 12.6 mientras

que las frecuencias esperadas, calculadas con la formula (12.3), se presentan en la
tabla 12.7):
(𝑓0 − 𝑓𝑒 )2 (10 − 12.5)2 (15 − 12.5)2 (40 − 37.5)2 (35 − 37.5)2

𝑥2 = ∑ = + + + = 1.34
𝑓𝑒 12.5 12.5 37.5 37.5
Tabla 12.7 frecuencia esperada para los datos de la tabla 12.6
Total
Comunidad 1 Comunidad 2
# que ve el programa 12.5 12.5 25
# que no ve el programa 37.5 37.5 75
Total 50 50 100
El valor obtenido para el estadístico de prueba es 1.34, que no es mayor que el valor
critico 6.63. por tanto, para un nivel de significancia de 1% no se puede rechazar la
hipótesis nula, y se concluye que la proporción de espectadores de las dos
condiciones puede no diferir. Esta es la misma conclusión a la que se llevó en la
sección 11.7 empleando el estadístico z.
Prueba para la diferencia entre varias proporciones poblacionales. Dado el método
básico del ejemplo9 la prueba chi cuadrada se puede usar para probar diferencias
entre varias (k) proporciones poblaciones empleando la tabla de 2 x k para el
análisis de frecuencia. En este caso no existe un procedimiento matemático
equivalente que se base en el uso de la estadístico z. La hipótesis nula es de las
diferentes proporciones poblacionales son iguales ente si (es decir que las
diferentes proporciones muestrales pueden haberse obtenido por casualidad de la
misma población). El procedimiento de muestreo consiste en tomar varias muestras
aleatorias independientes, una por cada una de las k categorías de datos.
Ejemplo 10 de acuerdo la ejemplo 9, suponga que se muestra las familias de cuatro
comunidades para determinar el número de televisores que vieron un programa
especial acerca de la economía nacional. La tabla 12.8 presenta los datos
muéstrales observados mientras que la tabla 12.9 presenta las frecuencias
esperadas, basándose en la fórmula 12.3. A continuación se presenta la prueba
para la hipótesis nula de que no hay diferencia entre las proporciones poblacionales;
Se usa un nivel de significancia de 1%
H0: ∏1=∏2=∏3=∏4 H1=No todas ∏1=∏2=∏3=∏4
Gl=(r-1) (k-1) = (2-1) (4-1) =3
x²critica (gl=3, α=0.01) =11.35
(𝑓0−𝑓𝑒)2 (10−12)2 (15−12)2 (5+12)2 (18−12)2 (40−38)2 (35−38)2 (45−38)2
x²=∑ = + + + + + + +
𝑓𝑒 12 12 12 12 38 38 38
(32−38)2
= 0.33 + 0.75 + 4.08 + 3.0 + 0.11 + 0.24 + 1.29 + 0.95 = 10.75
38
Tabla12.8 En cuatro comunidades, número de personas que ven un programa de televisión.
comunidades
Total
1 2 3 4
# de programa 10 15 5 18 48
# que no ve el programa 40 35 45 32 152
Total 50 50 50 50 200
Pag. 228
Tabla 12.9 frecuencias esperadas para los datos de la tabla 12.8

Comunidades Total
1 2 3 4
Numero que ve el programa 12.0 12.0 12.0 12.0 48
Numero que no ve el programa 38.0 38.0 38.0 38.0 152
Total 50 50 50 50 200
El valor obtenido para el estadístico chi cuadrada es de 10.75 que no es mayor que
el valor critico 11.35 por tanto la diferencia a la proporción de televidentes de las
cuatro comunidades muestreadas no es suficientemente grande para rechazar la
hipótesis nula para un nivel de significancia de 1 por ciento. Es posible suponer que
las proporciones de televidentes en las diferentes comunidades sean las mismas,
que no difieran.
12.5 USO DE SOFTWARE
El software para análisis de estadístico por lo general contiene herramientas para
realizar pruebas de bondad de ajuste y pruebas para tabla de contingencia. En las
pruebas de bondad de ajuste, tanto las frecuencias esperadas tienen que ser datos
de entrada por que se basan en la hipótesis nula especifica que se va a probar. En
las tablas de contingencia, las frecuencias esperadas se determinan directamente
a partir de los datos muestrales. Por tanto, para llevar a cabo estas pruebas como
datos de entrada solo se requieren las frecuencias observadas. Como se explica en
las secciones 12.3 y 12.4, las pruebas para tabla de contingencia se usan para
probar la independencia de dos variables categóricas o para probar hipótesis
relacionadas con la igualdad de dos o mas proporciones poblacionales. Por tanto,
el problema resuelto 12.15 ilustra el uso de minitab.
PROBELMAS RESUELTOS
PRUEBAS DE BONDAD DE AJUSTE
21.1 se afirma que entre los clientes de una tienda especializada en pantalones de
mezclilla hay el mismo numero de hombres que de mujeres. Se observa una
muestra aleatoria de 40 clientes, en donde 25 son hombres y 15 mujeres. Pruebe la
hipótesis nula de que el numero de clientes hombres y mujeres es igual empleando
la prueba de chi cuadrada y 5% como nivel de significancia.
De acuerdo con la tabla 12.10,
𝐻0 : El numero de clientes hombres y mujeres es el mismo (el patrón de frecuencias es uniforme)
𝐻1 : El numero de clientes hombres y mujeres es el mismo.
gl = k – m – 1 = 2 - 0 – 1 = 1
𝑋 2 critica (gl = 1, α = 0.05) = 3.84
(𝑓0 − 𝑓𝑒 )2 (25 − 20)2 (15 − 20)2

𝑋2 = ∑ = +
𝑓𝑒 20 20
(52 ) (−5)2
= + = 2.50
20 20
El valor encontrado para el estadístico de prueba es 2.50 que no es mayor que el

valor critico 3.84. por tanto, no puede rechazarse la hipótesis nula para un nivel de
significancia de 5 por ciento.
Tabla 12.10 Frecuencias obtenidas y esperadas para el problema 12.1
total
Hombres clientes
Numero en la muestra (𝑓0 ) 25 15 40
Numero de (𝑓𝑒 ) 20 20 40
12.2. el problema 12.1 suponga que lo que afirma ahora es que, de los clientes de
la tienda, el numero de hombres es doble que el numero de mujeres, use los datos
que se muestran en la tabla 12.11 y pruebe esta hipótesis en un nivel de
significancia de 5 por ciento.
Tabla 12.11 Frecuencias obtenidas y esperadas para el problema 12.2
clientes total
Hombres Mujeres

Numero de (𝑓𝑒 ) 26.67 13.33 40

Ho: Hay el doble de hombres que de mujeres como clientes.
H1: No hay el doble de hombres que de mujeres como clientes.
𝑔𝑙 = 𝑘 − 𝑚 = 0 − 1 = 1
𝑥 2 𝑐𝑟𝑖𝑡𝑖𝑐𝑎 (𝑔𝑙 = 1, 𝑎 = 0.05) = 3.84
2
(𝑓0 − 𝑓𝑒 )2 (25 − 26.67)2 (15 − 13.33)2 (−1.67)2 (1.67)2
𝑥 =∑ = + = +
𝑓𝑒 26.67 13.33 26.67 13.33
= 0.10 + 0.21 = 0.31
Es claro que el valor obtenido para el estadístico chi cuadra, 0.31 no es mayor que
el valor critico 3.84. Por tanto, no se puede rechazar la hipótesis para un nivel
significancia de 5 por ciento. El hecho de que ninguna de las dos hipótesis nulas
en los problemas 12.1 y 12.2 se hayan podido rechazar de muestra el beneficio de
la duda concedido a la hipótesis nula en cada caso. Sin embargo, el tamaño de la
muestra también afecta la probabilidad de los resultados muestrales (véase el
problema 12.3)
12.3. En la situación que se describe en el problema 12.1, suponga que se prueba

la misma hipótesis nula, pero que cada categoría las frecuencias muestrales se
duplican exactamente. Es decir, de 80 clientes tomados de manera aleatoria 50
son hombres y 30 son mujeres. Pruebe la hipótesis nula para un nivel de
significancia de 5 por ciento y copare su decisión con la del problema 12.1.
Ho: El número de clientes hombres y mujeres es el mismo.

H1: El número de clientes hombres y mujeres no es el mismo.
𝑔𝑙 = 𝑘 − 𝑚 = 0 − 1 = 1
𝑥 2 𝑐𝑟𝑖𝑡𝑖𝑐𝑎 (𝑔𝑙 = 1, 𝑎 = 0.05) = 3.84
2
(𝑓0 − 𝑓𝑒 )2 (50 − 40)2 (30 − 40)2
𝑥 =∑ = + = 5.00
𝑓𝑒 40 40
El valor obtenido para chi cuadrada es 5.00, que es mayor que el valor critico 3.84.
Por tanto, se rechaza la hipótesis nula para un nivel de significancia de 5 por
ciento. Aun cuando los datos muéstrales son proporcionalmente iguales a los del
problema 12.1 ahora la decisión es rechazar 𝐻0 , y no aceptarla. Esto demuestra la
mayor sensibilidad de una prueba estadística realizada con un tamaño de muestra
mayor.
Tabla 12.12 frecuencias obtenidas y esperadas el problema 12.3
Clientes Total
Hombres Mujeres
Numero esperado (𝑓𝑒 ) 40 40 80
12.4 un fabricante de refrigeradores ofrece tres líneas de productos: económica,

media y cara, en términos de precios comparativos. Antes de una promoción de
ventas dirigida a destacar las virtudes de los refrigeradores caros, el porcentaje de
ventas de cada una de las tres categorías era 45, 30 y 25, y respectivamente. En
una muestra aleatoria de 50 refrigeradores vendidos después de la promoción, el
numero de ventas en las categorías de precio económico, medio y caro fue 15, 15
y 20, respectivamente. Pruebe la hipótesis nula de que el patrón actual de ventas
no difiere del patrón histórico; use un nivel de significancia de 5%.
𝐻0 : El patrón actual de frecuencias de ventas sea justa al patrón histórico
𝐻1 : el patrón actual de frecuencias de ventas difiere del patrón histórico.
gl = k – m – 1 = 3 – 0 – 1 = 2
𝑥 2 critica (gl = 2 α = 0.05) = 5.99
(𝑓0 − 𝑓𝑒 )2 (15 − 22.5)2 (15 − 15)2 (20 − 12.5)2

𝑥2 = ∑ = + +
𝑓𝑒 22.5 15 12.5
(−7.5)2 (0)2 (7.5)2

= + + = 7.00
22.5 15 12.5
Tabla 12.13 frecuencias obtenidas y esperadas para el problema 12.4
Categoría de precio Total

del refrigerador
económico Medio caro
Numero vendido(𝑓0 ) 50 30 80 50
Número que se espera vender (𝑓𝑒 ) 40 40 80 50
El valor obtenido para el estadístico de prueba es de 7.00 que es mayor que el valor
critico 5.99. por tanto, se rechaza la hipótesis nula con el nivel de significancia del
5%. Aunque este rechazo no indica por sí mismo de qué manera difiere el patrón
actual de ventas del patrón histórico, una revisión de la tabla 12.13 indica que se
vendieron mas refrigeradores caros y menos refrigeradores económicos de los que
se esperaría de acuerdo con el patrón histórico de ventas.
Cualquier modelo probabilístico puede servir como base para la determinación de
las frecuencias esperadas en una prueba de bondad de ajuste (véase la sección
12.2). suponga que se formula la hipótesis de que la distribución del numero de
fallas por hora de las maquinas en una planta de ensamblaje se ajusta a una
distribución de probabilidad de Poisson particular, que esta determinada por la
media de la distribución de probabilidad de Poisson, que se estudia en la sección
6.6. sin embargo, aquí no se especifica una distribución de Poisson particular, que
esta determinada por la media de la distribución, λ. La tabla 12.14 presenta el
numero de fallas observando en una muestra de 40 horas.
CORREO: jealmasar@hotmail.com

La Prueba Chi Cuadrada

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

La Prueba Chi Cuadrada

Enviado por

Direitos autorais:

Formatos disponíveis

LA PRUEBA DE CHI CUADRADA PARA EL

ANALISIS DE DATOS CUALITATIVOS 12

12.1 PROPOSITO GENERAL DE LA PRUEBA CHI CUADRADA

CAPITULO 12 LA PRUEBA DE CHI CUADRADA PARA ELA ANALISIS DE

12.3 prueba para la independencia de dos variables categóricas (prueba para

La fórmula general para los grados de libertad correspondientes a una prueba de

El estadístico de prueba chi cuadrada para tablas de contingencia se calcula

Ejemplo 7: a continuación, se presenta la prueba de hipótesis nula de la

𝑥 2 𝑐𝑟𝑖𝑡𝑖𝑐𝑎 (𝑔𝑙 = 1, 𝑎 = 0.01) = 6.63

(𝑓0 − 𝑓𝑒 )2 (60 − 77)2 (50 − 33)2 80 − 63)2 (10 − 27)2

El valor obtenido para el estadístico de la prueba es 27.80, que es mayor que el

12.4 PRUEBAS DE HIPÓTESIS PARA PROPORCIONES

EJEMPLO 8 El jefe de un departamento de personal estima que la proporción de

(Existen dos categorías para frecuencias observadas, como se indica en la tabla

𝑥 2 critica (gl = 1, ν = 0.05) = 3.84

(𝑓0 −)2 (10 − 20)2 (40 − 30)2

Prueba para la diferencia de dos proporciones poblacionales. En la sección 11.7 se

El procedimiento de muestreo que se usa en la prueba para la diferencia para las

EJEMPLO 9 El ejemplo 8 de la sección 11.7indica que 10 de 50 familias de una

(𝑔𝑙 = (𝑟 − 1)(𝑘 − 1) = (2 − 1)(2 − 1) = 1

𝑥 2 critica (gl =1, α = 0.001) = 6.63

𝑥 2 Calculada (las frecuencias observadas se presentan en la tabla 12.6 mientras

(𝑓0 − 𝑓𝑒 )2 (10 − 12.5)2 (15 − 12.5)2 (40 − 37.5)2 (35 − 37.5)2

Tabla 12.7 frecuencia esperada para los datos de la tabla 12.6

Tabla12.8 En cuatro comunidades, número de personas que ven un programa de televisión.

Tabla 12.9 frecuencias esperadas para los datos de la tabla 12.8

(𝑓0 − 𝑓𝑒 )2 (25 − 20)2 (15 − 20)2

El valor encontrado para el estadístico de prueba es 2.50 que no es mayor que el

Numero en la muestra (𝑓0 ) 25 15 40

Numero en la muestra (𝑓0 ) 25 15 40

De acuerdo con la tabla 12.11,

𝑥 2 𝑐𝑟𝑖𝑡𝑖𝑐𝑎 (𝑔𝑙 = 1, 𝑎 = 0.05) = 3.84

12.3. En la situación que se describe en el problema 12.1, suponga que se prueba

Ho: El número de clientes hombres y mujeres es el mismo.

𝑥 2 𝑐𝑟𝑖𝑡𝑖𝑐𝑎 (𝑔𝑙 = 1, 𝑎 = 0.05) = 3.84

12.4 un fabricante de refrigeradores ofrece tres líneas de productos: económica,

𝐻0 : El patrón actual de frecuencias de ventas sea justa al patrón histórico

𝐻1 : el patrón actual de frecuencias de ventas difiere del patrón histórico.

𝑥 2 critica (gl = 2 α = 0.05) = 5.99

(𝑓0 − 𝑓𝑒 )2 (15 − 22.5)2 (15 − 15)2 (20 − 12.5)2

(−7.5)2 (0)2 (7.5)2

Tabla 12.13 frecuencias obtenidas y esperadas para el problema 12.4

Categoría de precio Total

Você também pode gostar