Você está na página 1de 32

MARCO TEORICO

CHI CUADRADO

En estadística y estadística aplicada se denomina prueba χ² (pronunciado como «ji


cuadrado» y a veces como «chi cuadrado») a cualquier prueba en la que
el estadístico utilizado sigue una distribución χ² si la hipótesis nula es cierta. Algunos
ejemplos de pruebas χ² son:

 La prueba χ² de Pearson, la cual tiene numerosas aplicaciones:

 La prueba χ² de frecuencias
 La prueba χ² de independencia
 La prueba χ² de bondad de ajuste

 La prueba χ² de Pearson con corrección por continuidad o corrección


de Yates
 La prueba de Bartlett de homogeneidad de varianzas

Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La
hipótesis nula de la prueba Chi-cuadrado postula una distribución de probabilidad
totalmente especificada como el modelo matemático de la población que ha generado
la muestra.

Para realizar este contraste se disponen los datos en una tabla de frecuencias. Para
cada valor o intervalo de valores se indica la frecuencia absoluta observada o empírica
(Oi). A continuación, y suponiendo que la hipótesis nula es cierta, se calculan para cada
valor o intervalo de valores la frecuencia absoluta que cabría esperar o frecuencia
esperada (Ei=n·pi , donde n es el tamaño de la muestra y pi la probabilidad del i-ésimo
valor o intervalo de valores según la hipótesis nula). El estadístico de prueba se basa
en las diferencias entre la Oi y Ei y se define como:

Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n es
suficientemente grande, es decir, si todas las frecuencias esperadas son mayores que
5. En la práctica se tolera un máximo del 20% de frecuencias inferiores a 5.
Si existe concordancia perfecta entre las frecuencias observadas y las esperadas el
estadístico tomará un valor igual a 0; por el contrario, si existe una gran discrepancia
entre estas frecuencias el estadístico tomará un valor grande y, en consecuencia, se
rechazará la hipótesis nula. Así pues, la región crítica estará situada en el extremo
superior de la distribución Chi-cuadrado con k-1 grados de libertad.

Para realizar un contraste Chi-cuadrado la secuencia es:

 Analizar
 Pruebas no paramétricas
 Chi-cuadrado

EJERCICIO N°1

La variabilidad en la cantidad de impurezas presentes en un lote de productos químicos,


utilizada para un proceso en particular, depende del tiempo que tarda el proceso. Un
fabricante que emplea dos líneas de producción 1 y 2, hizo un pequeño ajuste al proceso
2, con la esperanza de reducir la variabilidad, así como la cantidad media de impurezas
en los productos químicos. Muestras de n1=25 y n2=20 mediciones de dos lotes
produjeron las siguientes medias y varianzas:

¿Presentan los datos evidencia suficiente para indicar que las variaciones del proceso son
menores para el 2? Realice una prueba con un α = 0.05.

Solución

Datos:
Estadístico de prueba:
Población 1 Población 2

La sugerencia que se hace es que el


numerador sea el de valor mayor.
n1 = 25 n2 = 20
Entonces los grados de libertad uno será
= 0.05 el tamaño de la muestra de la población
uno menos uno.
Ensayo de hipótesis:
1= 25-1 = 24 y 2 = 20-1=19.
Regla de decisión:

Si Fc 2.11 No se rechaza Ho,

Si la Fc > 2.11 se rechaza Ho.

Cálculo:

SOLUCIÓN CON MINITAB

P= 1-0.509

P= 0.05
0.05 ≥ 0.05

Como el valor de P =0.05 es igual a 0.05 no se rechaza Ho, y se concluye con un α = 0.05
que no existe suficiente evidencia para decir que la varianza del proceso 2 es menor que
la del proceso 1.

EJERCICIO N°2

En su incansable búsqueda de un sistema de llenado adecuado de aceites para motor,


cierta empresa prueba dos máquinas. Robo-fill se usa para llenar 16 tarros y da una
desviación estándar de 1.9 onzas en el llenado. Con Automat-fill se llenan 21 frascos que
dan una desviación estándar de 2.1 onzas. Si la empresa tiene que elegir uno de estos
sistemas en función de la uniformidad de llenado. ¿Cual deberá seleccionar? Use un α=
0.10.
SOLUCIÓN

Datos: Ensayo de hipótesis:

Robo-Fill

sRF = 1.9

nRF = 16
Estadístico de prueba:
α = 0.10

Automat-Fill

sAF = 2.1
La sugerencia que se hace es que el
nAF = 21 numerador sea el de valor mayor.

Entonces los grados de libertad uno será


el tamaño de la muestra de la población
uno menos uno

. 1= 21-1 = 20 y 2 = 16-1=15.

Regla de decisión:

Si Fc 2.20 No se rechaza Ho,

Si la Fc > 2.20 se rechaza Ho.

Cálculo:

SOLUCIÓN CON MINITAB


P= 1-0.93626

P= 0.0632

0.10 ≥ 0.0632

Como 0.0632 es menor que 0.10 no se rechaza Ho, y se concluye con un α = 0.10 que la
variación de llenado de la máquina Robo-Fill no es menor a la de Automat-Fill, por lo
que se selecciona cualquier máquina.

EJERCICIO N°3

Las capas de óxido en las obleas semiconductoras son depositadas en una mezcla de gases
para alcanzar el espesor apropiado. La variabilidad del espesor es una característica crítica
de la oblea, y lo deseable para los siguientes pasos de la fabricación es tener una
variabilidad baja. Para ello se estudian dos mezclas diferentes de gases con la finalidad
de determinar con cuál se obtienen mejores resultados en cuanto a la reducción en la
variabilidad del espesor del óxido. Veintiún obleas son depositadas en cada gas. Las
desviaciones estándar de cada muestra del espesor del óxido son s1 = 1.96 angstroms y
s2 = 2.13 angstroms. ¿Existe evidencia que indique una diferencia en las desviaciones?
Utilice α=0.05.

Solución:

Datos: La sugerencia que se hace es


que el numerador sea el de valor mayor
s1= 1.96 .

n1 = 21 Entonces los grados de libertad uno será


el tamaño de la muestra de la población
s2 = 2.13 uno menos uno. 1= 21-1 = 20 y 2 =
21-1=20.
n2= 21
Regla de decisión:
Ensayo de hipótesis:
Si Ho= Fc 2.46 No se rechaza Ho,

Si Ho= Fc > 2.46 se rechaza Ho.

Cálculo:
Estadístico de prueba:

SOLUCIÓN CON MINITAB


P= 1-0.974464

P= 0.02554

0.05 ≥ 0.02554

Como 0.02554 es menor que 0.05 no se rechaza Ho.

EJERCICIO N°4
La variabilidad en la cantidad de grasa presente en un lote de un complemento
dietético, utilizada para un proceso de fabricación de un alimento, depende del
origen del complemento. Un fabricante que recibe el complemento de dos
proveedores 1 y 2, hizo una comparación analizando muestras de ambos
proveedores. Muestras de n1=10 y n2=16 mediciones de dos lotes produjeron
las varianzas:
S21=1.25 y S22=0.5
¿Presentan los datos evidencia suficiente para indicar que la variabilidad en el
contenido de grasa es menor para el producto que se recibe del proveedor 2?
Realice una prueba con un = 0.05.

Solución.
Datos: La sugerencia que se hace es que el
numerador sea el de valor mayor.
n1 = 21
Entonces los grados de libertad uno será
n2= 16 el tamaño de la muestra de la población
uno menos uno.
Ensayo de hipótesis:
1= 10-1 = 20 y 2 = 16-1=20.

Regla de decisión:

Si Ho= Fc 2.58 No se rechaza Ho,


Estadístico de prueba: Si Ho= Fc > 2.58 se rechaza Ho.

Cálculo:

F= 2.5

SOLUCIÓN CON MINITAB


P= 1-0.94

P= 0.05

0.05 ≥ 0.05

Como 0.05 ≤0.05 no se rechaza Ho, y se concluye con un = 0.05 que no


existe suficiente evidencia para decir que la variabilidad del contenido de
grasa del complemento del proveedor 2 es menor que la del complemento
suministrado por el proveedor 1.

EJERCICIO N°5
Encontrar el valor de f en cada caso

1. α= 0.25 F1=4 F2=9


2. α= 0.95 F1=15 F2=10
3. α= 0.25 F1=6 F2=8
4. α= 0.25 F1=24 F2=24

1. F=3.633

2. F=2.845

3. F= 3.581
4. F=1.984

EJERCICIO N°6
Un ingeniero, investiga si la duración de un material de construcción guarda relación con
el tiempo en que se ha producido, recogió la información de 216 muestras recogidos y
categorizados por su tiempo y duración.

La primera hipótesis nos dice que la falla si depende del tiempo

Y la segunda hipótesis la contradice.

I II III IV
Falla leve 15 32 18 5
Falla media 8 29 23 18
Falla alta 1 20 25 22

SOLUCIÓN CON MINITAB

Según los datos obtenidos, la falla si guarda relación con el tiempo

EJERCICIO N°7
Un investigador quiere estudiar si hay asociación entre la práctica deportiva y la sensación
de bienestar. Extrae una muestra aleatoria de 100 sujetos. Los datos aparecen a
continuación.

Sensación de Práctica deportiva Total

Bienestar Sí no

Sí 20 25 45

No 10 45 55

Total 30 70 100

SOLUCIÓN

1) Grados de libertad, son:


K = (número de fila-1)x(número de columnas-1)
= (2-1)x(2-1) = 1
2) El valor alfa 0,05
3) El valor que buscamos
 g2.l .;  12;0,01  6,63
4) Tenemos

 exp
2
 8,13
SOLUCIÓN CON MINITAB
0.05 > 0.017
SIGNIFICADO en el ejemplo: La práctica deportiva y la sensación de bienestar estás
asociadas.

EJERCICIO N°8

Se desea estudiar hasta qué punto existe relación entre el tiempo de residencia de
inmigrantes en nuestro país y su percepción de integración. Se dispone de una muestra
pequeña de 230 inmigrantes a los que se les evaluó en ambas variables obteniéndose la
siguiente tabla de frecuencias observadas. ¿Confirman estos datos la hipótesis planteada
con un nivel de confianza del 95%?

Tiempo de residencia Grado de integración Total


Bajo Alto
Más tiempo 40 90 130

Menos tiempo 90 10 100


Total 130 100 230

1) Grados de libertad, son:


K = (número de fila-1)x(número de columnas-1)
= (2-1)x(2-1) = 1
2) El valor alfa 0,05
3) El valor que buscamos
 g2.l .;  12;0,05  3,84
4) Tenemos
exp
2
 80,69

SOLUCIÓN CON MINITAB


0.00 < 0.05
SIGNIFICADO en el ejemplo: El tiempo de residencia y el grado de integración estás
asociadas.

EJERCICIO N°9

El artículo “Ozone for Removal of Acute Toxicity from Logyard Run-off” (M. Zenaitis y S.
Duff, en Ozone Science and Engineering, 2002:83-90) presenta análisis químicos del agua que
escurre de aserraderos en la Columbia Británica. Incluye seis mediciones de pH para seis
muestras de agua: 5.9, 5.0, 6.5, 5.6, 5.9, 6.5. Suponiendo que éstas sean una muestra aleatoria de
las muestras de agua de una población aproximadamente normal, encuentre un intervalo de
confianza de 95% para la media del pH.

SOLUCIÓN CON MINITAB


EJERCICIO N°10

El artículo “An Automatic Visual System for Marble Tile Classification” (L. Carrino, W. Polini,
y S. Turchetta, en Journal of Engineering Manufacture, 2002:1095-1108) describe una medida
para la sombra del azulejo de mármol en el cual la cantidad de luz reflejada por éste se mide en
una escala de 0-255. Un azulejo perfectamente negro no refleja luz alguna y mide 0, y un
azulejo perfectamente blanco mediría 255. Se midió una muestra de nueve azulejos Mezza
Perla, con los siguientes resultados: 204.999 206.149 202.102 207.048 203.496 206.343
203.496 206.676 205.831 ¿Es adecuado utilizar la estadística t de Student para construir un
intervalo de confianza de 95% para la media de la sombra del azulejo Mezza Perla? Si es así,
hágalo. Si no, explique por qué.

SOLUCIÓN CON MINITAB


EJERCICIO N°11

Una química hizo ocho mediciones independientes del punto de fusión del tungsteno. Obtuvo
una media muestral de 3 410.14°C y una desviación estándar muestral de 1.018°C. a) Determine
un intervalo de confianza de 95% para el punto de fusión del tungsteno.

SOLUCIÓN CON MINITAB

EJERCICIO N°12

Se toman cinco mediciones de la clasificación de octano para un tipo especial de gasolina. Los
resultados (en %) son 87.0, 86.0, 86.5, 88.0, 85.3. Encuentre un intervalo de confianza de 99%
para la media de la clasificación de octano de media para este tipo de gasolina.

SOLUCIÓN CON MINITAB


EJERCICIO N°13

Actualmente en el Perú las supervisiones de obra son relativamente importante, debido a que la
corrupción en nuestro país cada día es peor. Para esto tenemos un cuadro donde nos representa
una muestra de la supervisión de obras en la región de Cajamarca.

SUPERVISIÓN DE Peor Igual Mejor


OBRA
S1 7 28 115
S2 15 20 85
S3 10 30 90
S4 5 40 115

Donde la hipótesis nula es la que la variable supervisión de obra con la variable estado de la
obra son independientes. Determinar por medio de la prueba chi cuadrada y dar la conclusión
con respecto a la hipótesis.
RESOLUCIÓN
1. Copio la tabla en Excel
2. Lo paso a Minitab

3. Resuelvo e identifico p value. Primero voy a tablas, luego a tabla cruzada chi cuadrado.
4. EL VALOR DE P- VALUE ES DE 0.037, es menor a 0.05 entonces se concluye que la
supervisión de obra influye en el estado de una obra y por lo tanto se rechaza la hipótesis nula.
EJERCICIO N°14

Para la construcción de caminos en el Perú, se necesita de instrumentos en buen estado, como


también la cantidad de instrumentos tiene que ser elevada para que sea rápida la entrega. En el
siguiente cuadro de contingencia se muestra la construcción de caminos en 4 departamentos del
Perú con sus respectivos estados y frecuencias.
Determinar por medio de la prueba chi cuadrado, si se rechaza o no la hipótesis nula, siendo esta
que los instrumentos no influyen en la construcción de los caminos del Perú.

CAMINOS Mal estado Intermedio Buen


estado
C1 22 50 37
C2 15 20 19
C3 20 30 17
C4 28 40 25

1. Copiamos la tabla a Excel


2. Transcribimos a Minitab
3. Resolvemos y encontramos el valor de p value.

4. Conclusión: Como el valor de p-value es mucho mayor al de 0.05 entonces se rechaza la


hipótesis nula y esto quiere decir que la influencia del estado de los instrumentos
influye bastante en la construcción de caminos y carreteras.
EJERCICIO N°15

En la ciudad de Cajamarca se quiere construir un supermercado para lo cual se necesita de


personal de servicio con su mucha eficiencia al trabajar. A continuación, se muestra una tabla de
contingencia donde se muestran los obreros por cada nivel.
Determinar por medio de chi cuadrado el valor de p – value y ver si es que se rechaza o acepta
la hipótesis nula, siendo esta que la eficiencia de los obreros influye en la construcción de los
niveles del edificio.

NIVEL DE EDIFICIO No Intermedio Eficiente


eficiente
N1 22 25 18
N2 15 20 19
N3 20 30 17
N4 28 28 25
N5 10 22 15
N6 12 19 16
N7 15 23 22
RESOLUCIÓN
1. Se copia los datos a minitab
2. Le damos en tabla, y luego en asociación chi cuadrada y encontramos el valor de p
value
4 Se concluye que como el valor de p value es mayor que 0.05, entonces quiere decir que se
rechaza la hipótesis nula y por lo tanto la eficiencia de los obreros influye en la construcción de
los niveles de un edificio.
EJERCICIO N°16

Para la construcción de canales en el Perú, se necesita de instrumentos en buen estado, como


también la cantidad de instrumentos tiene que ser elevada para que sea rápida la entrega. En el
siguiente cuadro de contingencia se muestra la construcción de canales de irrigación en 4
departamentos del Perú con sus respectivos estados y frecuencias.
Determinar por medio de la prueba chi cuadrado, si se rechaza o no la hipótesis nula, siendo esta
que los instrumentos no influyen en la construcción de los canales de irrigación del Perú

CANALES Mal estado Intermedio Buen


estado
C1 22 50 37
C2 15 20 19
C3 20 30 17
C4 28 40 25
1. Copiamos la tabla a Excel
2. Transcribimos a Minitab
3. Resolvemos y encontramos el valor de p value.

4. Conclusión: Como el valor de p-value es mucho mayor al de 0.05 entonces se rechaza la


hipótesis nula y esto quiere decir que la influencia del estado de los instrumentos
influye bastante en la construcción de canales de irrigación.
EJERCICIO N°17

Se sabe que la resistencia a la compresión promedio de un conjunto de ladrillos es de


170 𝑘𝑔/𝑐𝑚2 . El estudio se hizo en la ciudad de Arequipa con una muestra de 50 ladrillos, pues
estos tuvieron una resistencia a la compresión media de 195 𝑘𝑔/𝑐𝑚2 , con una desviación
estándar de 28 𝑘𝑔/𝑐𝑚2 . Usando un nivel de significancia del 98%. ¿Este grupo es
significativamente (con respecto a la resistencia a la compresión) de la población regular?
Solución:

RESPUESTA

Como p    0.02 se rechaza la hipótesis nula. Por lo tanto, la resistencia la compresión


promedio, 170 kg/cm2 es diferente a la de la población regular.
EJERCICIO N°18

Se sabe que la resistencia la compresión promedio de un conjunto de probetas de concreto con


aditivo plastificante a los 28 días tienen una resistencia de 180 kg/cm2. El estudio se realizo en
la ciudad de Trujillo con una muestra de 30 probetas, estas tuvieron una resistencia a la
compresión de 190 kg/cm2 con una desviación estandas de 15 kg/cm2. Usando un nivel de
significancia del 95% ¿Este grupo es significativamente de la población regular?

RESPUESTA

Como p    0.05 se rechaza la hipótesis nula. Por lo tanto, la resistencia la compresión


promedio, 180 kg/cm2 es diferente a la de la población regular.

EJERCICIO N°19

La resistencia a la compresión promedio de un conjunto de probetas de yeso proveniente de una


cantera de Trujillo tiene una resistencia a la compresión promedio de 100 kg/cm2. El estudio se
realizó con una muestra de 50 probetas, estas tuvieron una resistencia a la compresión de 110
kg/cm2 con una desviación estándar de 8 kg/cm2. Usando un nivel de significancia del 98%
¿Este grupo es significativamente de la población regular?

RESPUESTA

Como p    0.02 se rechaza la hipótesis nula. Por lo tanto, la resistencia la compresión


promedio, 100 kg/cm2 es diferente a la de la población regular.
1)
EJERCICIO N°20

Se sabe que la resistencia a la compresión promedio de un conjunto de ladrillos es de


180 𝑘𝑔/𝑐𝑚2 . El estudio se hizo en la ciudad de Cajamarca con una muestra de 35 ladrillos,
pues estos tuvieron una resistencia a la compresión media de 196.5 𝑘𝑔/𝑐𝑚2 , con una
desviación estándar de 32.12 𝑘𝑔/𝑐𝑚2 . Usando un nivel de significancia del 95%. ¿Este grupo
es significativamente (con respecto a la resistencia a la compresión) de la población regular?

RESPUESTA

Como p    0.05 se rechaza la hipótesis nula. Por lo tanto, la resistencia la compresión


promedio, 180 kg/cm2 es diferente a la de la población regular.
2) Se sabe que la resistencia la compresión promedio de un conjunto de probetas de
concreto con aditivo incorporador de aire a los 28 días tienen una conducción térmica
promedio de 0.09 (W/mK). El estudio se realizó en la ciudad de Puno con una muestra
de 30 probetas, estas tuvieron una resistencia a la compresión de 0.085 W/mK con una
desviación estándar de 0.5 W/mK. Usando un nivel de significancia del 95% ¿Este
grupo es significativamente de la población regular?

RESPUESTA

Como p    0.05 se ACEPTA la hipótesis nula. Por lo tanto, la conductividad térmica


promedio, de 0.09 (W/mK) es igual a la de la población regular.

Você também pode gostar