Você está na página 1de 14

FACULTAD DE INFORMÁTICA Y ELECTRÓNICA

CONTROL Y REDES INDUSTRIALES


SEMINARIO DE ESTADÍSTICA

INTEGRANTES:
Alex Colcha
Nicolás Hernández
José Luis Coba

 EJERCICIO DE ANOVA Y DISEÑOS DE BLOQUES

EJERCICIO DE ANOVA
12. En un centro de investigación se realiza un estudio para comparar varios
tratamientos que, al aplicarse previamente a los frijoles crudos, reducen su
tiempo de cocción. Estos tratamientos son a base de bicarbonato de sodio
(NaHCO3) y cloruro de sodio o sal común (NaCl). El primer tratamiento es el de
control, que consiste en no aplicar ningún tratamiento. El tratamiento T2 es el
remojo en agua con bicarbonato de sodio, el T3 es remojar en agua con sal
común y el T4 es remojar en agua con una combinación de ambos ingredientes
en proporciones iguales. La variable de respuesta es el tiempo de cocción en
minutos. Los datos se muestran en la siguiente tabla:

a) ¿De qué manera el experimentador debe aleatorizar los experimentos y el


material experimental?
b) Dé ejemplos de factores que deben estar fijos durante las pruebas
experimentales, para que no afecten los resultados y las conclusiones.
c) Formule y pruebe la hipótesis de que las medias de los tratamientos son
iguales.
d) Obtenga el diagrama de caja y el gráfico de medias, después interprételos.
e) ¿Hay algún tratamiento mejor? ¿Cuál es el tiempo de cocción esperado para
el mejor tratamiento?
f) Algo importante a cuidar en un experimento es que no haya efectos colaterales
no deseados, causados por el tratamiento ganador; en este caso, piense en los
posibles efectos colaterales que podría causar el mejor tratamiento.
g) ¿Se cumplen los supuestos del modelo? Verifique gráficamente.
h) Pruebe la hipótesis de igualdad de varianzas entre tratamientos (que
corresponde a un supuesto).
DATOS
𝛼 = 0,05

Prueba de Normalidad

PASO 1: Plantear la hipótesis nula (Ho) y la alternativa (H1)

Ho: Los tiempos de cocción para frijoles crudos en los cuatro tratamientos siguen una
distribución normal.

H1: Los tiempos de cocción para frijoles crudos en los cuatro tratamientos no siguen
una distribución normal.

Tabla 1. Prueba de Normalidad


Pruebas de normalidad

Tratamientos sobre Kolmogorov-Smirnova Shapiro-Wilk


frijoles crudos
Estadísti gl Sig. Estadísti gl Sig.
co co

,194 7 ,200* ,939 7 ,627


Control

,202 7 ,200* ,920 7 ,470


T2
Tiempo de cocción
en minutos ,219 7 ,200* ,941 7 ,651
T3

,123 7 ,200* ,985 7 ,979


T4

*. Este es un límite inferior de la significación verdadera.

a. Corrección de la significación de Lilliefors


PASO 2: Toma de decisión

Utilizando el estadístico de Shapiro-Wilk, las probabilidades de los tiempos de cocción


para frijoles en los 4 tratamientos son mayores al nivel de significancia, por lo que se
acepta la hipótesis nula, es decir, los tiempos de cocción de los 4 tratamientos siguen
una distribución normal.

Prueba de Igualdad de varianzas

PASO 1: Plantear la hipótesis nula (Ho) y la alternativa (H1)

Ho: 𝜎1 2= 𝜎2 2 = 𝜎3 2 = 𝜎4 2 (Las varianzas de los tiempos de cocción de los 4 tratamientos son


iguales)

H1: 𝜎𝑖 2 ≠ 𝜎𝑗 2 𝑖≠ j i=j = 1,2,3,4 (Al menos hay una pareja de varianzas de los tiempos de
cocción que son diferentes)

Tabla 2. Prueba de homogeneidad de varianzas


Prueba de homogeneidad de varianzas

Tiempo de cocción en minutos

Estadístico de gl1 gl2 Sig.


Levene

,153 3 24 ,927

PASO 2: Toma de decisión

Según la prueba de Levene, la probabilidad 0,927 es mayor al nivel de significancia, por


lo que, no se rechaza la hipótesis nula, es decir, las varianzas de los tiempos de cocción
de los frijoles en los 4 tratamientos son iguales.

Independencia

Por la forma como se diseñó el experimento, esta condición de independencia entre los
grupos se cumple, dado que las muestras para las respectivas muestras se asignaron
al azar para los diferentes métodos.

Prueba Anova

PASO 1: Plantear la hipótesis nula (Ho) y la alternativa (H1)

Ho: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 (La media de los tiempos de cocción de los 4 tratamientos son iguales)
H1: 𝜇𝑖 ≠ 𝜇𝑗 𝑖≠ j i=j = 1,2,3,4 (Al menos hay una pareja de las medias de tiempos de cocción
que son diferentes)

PASO 2: Seleccionar el nivel de significancia

Para la prueba de hipótesis se utilizará un nivel de significancia del 5%


α = 5%

PASO 3: Prueba Anova

Tabla 3. Anova de un factor


ANOVA de un factor
Tiempo de cocción en minutos

Suma de gl Media F Sig.


cuadrados cuadrática

Inter-grupos 95041,250 3 31680,417 1558,966 ,000


Intra-grupos 487,714 24 20,321
Total 95528,964 27

PASO 4: Toma de decisión

En base a la prueba ANOVA, la probabilidad de 0,000 es menor al nivel de significancia,


por lo que se rechaza la hipótesis nula y se acepta la alternativa, es decir, al menos hay
una pareja de medias de tiempos de cocción de frijoles que son diferentes.

Prueba Post Hoc

PASO 1: Plantear la hipótesis nula (Ho) y la alternativa (H1)

Ho: 𝜇𝑖 = 𝜇𝑗 (Al menos hay una pareja de las medias de los tiempos de cocción de los 4 tratamientos
son iguales)

H1: 𝜇𝑖 ≠ 𝜇𝑗 𝑖≠ j i=j = 1,2,3,4 (Al menos hay una pareja de las medias de tiempos de cocción
que son diferentes)
PASO 2: Prueba Post Hoc

Tabla 4. Prueba post hoc para 4 tratamientos


Comparaciones múltiples
Variable dependiente: Tiempo de cocción en minutos
HSD de Tukey

(I) Tratamientos (J) Tratamientos Diferencia Error Sig. Intervalo de confianza al


sobre frijoles crudos sobre frijoles crudos de medias típico 95%
(I-J) Límite Límite
inferior superior

T2 129,429* 2,410 ,000 122,78 136,08

Control T3 146,857* 2,410 ,000 140,21 153,50

T4 122,714* 2,410 ,000 116,07 129,36


Control -129,429* 2,410 ,000 -136,08 -122,78
T2 T3 17,429* 2,410 ,000 10,78 24,08
T4 -6,714* 2,410 ,047 -13,36 -,07
Control -146,857* 2,410 ,000 -153,50 -140,21
T3 T2 -17,429* 2,410 ,000 -24,08 -10,78
T4 -24,143* 2,410 ,000 -30,79 -17,50
Control -122,714* 2,410 ,000 -129,36 -116,07

T4 T2 6,714* 2,410 ,047 ,07 13,36

T3 24,143* 2,410 ,000 17,50 30,79

*. La diferencia de medias es significativa al nivel 0.05.

Tabla 5. Medias de cada tratamiento en subconjuntos homogéneos


Tiempo de cocción en minutos
HSD de Tukeya

Tratamientos sobre frijoles N Subconjunto para alfa = 0.05


crudos 1 2 3 4

T3 7 61,43
T2 7 78,86
T4 7 85,57
Control 7 208,29
Sig. 1,000 1,000 1,000 1,000

Se muestran las medias para los grupos en los subconjuntos homogéneos.


a. Usa el tamaño muestral de la media armónica = 7,000.
PASO 3: Toma de decisión

En base a la prueba Post Hoc de Tukey y teniendo en cuenta que las probabilidades
son menores al nivel de significancia, se concluye todas las medias de tiempos de
cocción de frijoles crudos son diferentes. En base a la tabla 5 de subconjuntos
homogéneos, se concluye que el tratamiento 3, referido a remojar en agua con sal
común los frijoles crudos, es el que hace el menor tiempo de cocción, por lo que se
recomendaría implementar este nuevo tratamiento de preparación.
EJERCICIO DE DISEÑOS DE BLOQUES
11. En una empresa lechera se tienen varios silos para almacenar leche
(cisternas de 60 000 L). Un aspecto crítico para que se conserve la leche es la
temperatura de almacenamiento. Se sospecha que en algunos silos hay
problemas, por ello, durante cinco días se decide registrar la temperatura a cierta
hora crítica. Obviamente la temperatura de un día a otro es una fuente de
variabilidad que podría impactar la variabilidad total.

a) En este problema, ¿cuál es el factor de tratamiento y cuál el factor de bloque?


b) Suponga un DBCA, formule las hipótesis adecuadas y el modelo estadístico.
c) ¿Hay diferencia entre los silos?
d) ¿La temperatura de un día a otro es diferente?
e) Revise residuos, ¿hay algún problema evidente?

Literal A: ¿cuál es el factor de tratamiento y cuál el factor de bloque?


El factor de tratamiento corresponde a los silos de almacenamiento de leche
representados con las letras: A, B, C, D, E y el factor de bloque corresponde a los días
de la semana de lunes a viernes.

Prueba de Normalidad
PASO 1: Plantear la hipótesis nula (Ho) y la alternativa (H1)

Ho: las temperaturas de almacenamiento de la leche de los 5 silos siguen una


distribución normal.

H1: las temperaturas de almacenamiento de la leche de los 5 silos no siguen una


distribución normal.
Tabla 1. Prueba de Normalidad
Pruebas de normalidad

SILO PARA Kolmogorov-Smirnova Shapiro-Wilk


ALMACENAR Estadísti gl Sig. Estadísti gl Sig.
LECHE co co

A ,258 5 ,200* ,885 5 ,334

B ,246 5 ,200* ,956 5 ,777


TEMPERATURA DE
C ,141 5 ,200* ,979 5 ,928
ALMACENAMIENTO
D ,245 5 ,200* ,931 5 ,601

E ,318 5 ,109 ,701 5 ,010

*. Este es un límite inferior de la significación verdadera.


a. Corrección de la significación de Lilliefors

PASO 2: Toma de decisión

Utilizando el estadístico de Shapiro-Wilk, las probabilidades de las temperaturas de


almacenamiento de la leche de los 5 silos son mayores al nivel de significancia a
excepción de silo E, que posee una probabilidad menor al nivel de significancia. Sin
embargo, se asume que todos los silos siguen una distribución normal por lo que se
acepta la hipótesis nula.

Prueba de Igualdad de varianzas para silos

PASO 1: Plantear la hipótesis nula (Ho) y la alternativa (H1)

Ho: 𝜎1 2= 𝜎2 2 = 𝜎3 2 = 𝜎4 2 (Las varianzas de las temperaturas de almacenamiento de la leche de


los 5 silos son iguales)

H1: 𝜎𝑖 2 ≠ 𝜎𝑗 2 𝑖≠ j i=j = A,B,C,D,E (Al menos hay una pareja de varianzas de las
temperaturas de almacenamiento de la leche de los 5 silos que son diferentes)

Tabla 2. Prueba de homogeneidad de varianzas respecto a los silos


Prueba de homogeneidad de varianzas
TEMPERATURA DE ALMACENAMIENTO

Estadístico de gl1 gl2 Sig.


Levene

,482 4 20 ,749
PASO 2: Toma de decisión

Según la prueba de Levene, la probabilidad 0,749 es mayor al nivel de significancia, por


lo que, no se rechaza la hipótesis nula, es decir, las varianzas de las temperaturas de
almacenamiento de la leche de los 5 silos son iguales.

Prueba de Igualdad de varianzas para los días de registro

PASO 1: Plantear la hipótesis nula (Ho) y la alternativa (H1)

Ho: 𝜎1 2= 𝜎2 2 = 𝜎3 2 = 𝜎4 2 (Las varianzas de los días de registro para medir la temperatura de la


leche son iguales)

H1: 𝜎𝑖 2 ≠ 𝜎𝑗 2 𝑖≠ j i=j = A,B,C,D,E (Al menos hay una pareja de varianzas de los días de
registro para medir la temperatura de la leche que son diferentes)

Tabla 3. Prueba de homogeneidad de varianzas respecto a los días de registro


Prueba de homogeneidad de varianzas
TEMPERATURA DE ALMACENAMIENTO

Estadístico de gl1 gl2 Sig.


Levene

2,168 4 20 ,110

PASO 2: Toma de decisión

Según la prueba de Levene, la probabilidad 0,110 es mayor al nivel de significancia, por


lo que, no se rechaza la hipótesis nula, es decir, las varianzas de los días de registro
para medir la temperatura de la leche son iguales.

Prueba de interacción de los factores

La figura no presenta ningún tipo de tendencia curvilínea, es decir, no hay muestra ni


evidencia de interacción entre el factor de tratamiento que son los silos y el factor de
bloque que son los días de la semana.
Figura 1. Diagrama de dispersión

Diseño de bloques completos al azar

Literal B: Suponga un DBCA, formule las hipótesis adecuadas y el modelo estadístico.

PASO 1: Plantear la hipótesis nula (Ho) y la alternativa (H1)

Ho: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 (La media de la temperatura de almacenamiento de la leche de los


5 silos son iguales)

H1: 𝜇𝑖 ≠ 𝜇𝑗 para algún 𝑖≠ j i=j = A, B, C, D, E (Al menos hay una pareja de las medias
de la temperatura de almacenamiento de la leche que son diferentes)

PASO 2: Seleccionar el nivel de significancia

Para la prueba de hipótesis se utilizará un nivel de significancia del 5%


α = 5%
PASO 3: Diseño de bloques

Tabla 4. Pruebas de los efectos inter-sujetos

Pruebas de los efectos inter-sujetos


Variable dependiente: TEMPERATURA DE ALMACENAMIENTO

Origen Suma de gl Media F Sig.


cuadrados tipo cuadrática
III

Modelo corregido 14,220a 8 1,778 1,101 ,412


Intersección 349,690 1 349,690 216,526 ,000
SILO 4,460 4 1,115 ,690 ,609
DIA 9,760 4 2,440 1,511 ,246
Error 25,840 16 1,615
Total 389,750 25
Total corregida 40,060 24

a. R cuadrado = ,355 (R cuadrado corregida = ,032)

Literal C: ¿Hay diferencia entre los silos?

PASO 4: Toma de decisión

En base a la prueba de diseño de bloques completos al azar, la probabilidad de los silos


de almacenamiento de 0,609 y la de los días de registro de 0,246, son mayores al nivel
de significancia, por lo que, no se rechaza la hipótesis nula, es decir, la media
temperatura de almacenamiento de la leche es igual en todos los silos, y los diferentes
días de la semana no representan ningún efecto a considerar.

Prueba Post Hoc

PASO 1: Plantear la hipótesis nula (Ho) y la alternativa (H1)

Ho: 𝜇𝑖 = 𝜇𝑗 ( Las medias de la temperatura de almacenamiento de la leche de los 5 silos son iguales)

H1: 𝜇𝑖 ≠ 𝜇𝑗 𝑖≠ j i=j = 1,2,3,4 (Al menos hay una pareja de las medias de la temperatura de
almacenamiento de la leche de los 5 silos que son diferentes)
PASO 2: Prueba Post Hoc

Tabla 5. Comparaciones múltiples silos


Comparaciones múltiples
Variable dependiente: TEMPERATURA DE ALMACENAMIENTO
Bonferroni

(I)SILO PARA (J)SILO PARA Diferencia Error Sig. Intervalo de confianza


ALMACENAR LECHE ALMACENAR LECHE de típ. 95%
medias (I- Límite Límite
J) inferior superior

B -,900 ,8037 1,000 -3,514 1,714

C -,100 ,8037 1,000 -2,714 2,514


A
D -1,000 ,8037 1,000 -3,614 1,614

E -,200 ,8037 1,000 -2,814 2,414


A ,900 ,8037 1,000 -1,714 3,514
C ,800 ,8037 1,000 -1,814 3,414
B
D -,100 ,8037 1,000 -2,714 2,514
E ,700 ,8037 1,000 -1,914 3,314
A ,100 ,8037 1,000 -2,514 2,714
B -,800 ,8037 1,000 -3,414 1,814
C
D -,900 ,8037 1,000 -3,514 1,714
E -,100 ,8037 1,000 -2,714 2,514
A 1,000 ,8037 1,000 -1,614 3,614
B ,100 ,8037 1,000 -2,514 2,714
D
C ,900 ,8037 1,000 -1,714 3,514
E ,800 ,8037 1,000 -1,814 3,414
A ,200 ,8037 1,000 -2,414 2,814

B -,700 ,8037 1,000 -3,314 1,914


E
C ,100 ,8037 1,000 -2,514 2,714

D -,800 ,8037 1,000 -3,414 1,814

Basadas en las medias observadas.


El término de error es la media cuadrática(Error) = 1,615.

Literal D: ¿La temperatura de un día a otro es diferente?


Tabla 6. Comparaciones múltiples días de registro
Comparaciones múltiples
Variable dependiente: TEMPERATURA DE ALMACENAMIENTO
Bonferroni

(I)DIAS DE (J)DIAS DE Diferencia Error Sig. Intervalo de confianza


REGISTRO REGISTRO de medias típ. 95%
(I-J) Límite Límite
inferior superior

MARTES -,400 ,8037 1,000 -3,014 2,214

MIERCOLES -,100 ,8037 1,000 -2,714 2,514


LUNES
JUEVES 1,400 ,8037 1,000 -1,214 4,014

VIERNES ,400 ,8037 1,000 -2,214 3,014


LUNES ,400 ,8037 1,000 -2,214 3,014
MIERCOLES ,300 ,8037 1,000 -2,314 2,914
MARTES
JUEVES 1,800 ,8037 ,397 -,814 4,414
VIERNES ,800 ,8037 1,000 -1,814 3,414
LUNES ,100 ,8037 1,000 -2,514 2,714
MARTES -,300 ,8037 1,000 -2,914 2,314
MIERCOLES
JUEVES 1,500 ,8037 ,804 -1,114 4,114
VIERNES ,500 ,8037 1,000 -2,114 3,114
LUNES -1,400 ,8037 1,000 -4,014 1,214
MARTES -1,800 ,8037 ,397 -4,414 ,814
JUEVES
MIERCOLES -1,500 ,8037 ,804 -4,114 1,114
VIERNES -1,000 ,8037 1,000 -3,614 1,614
LUNES -,400 ,8037 1,000 -3,014 2,214

MARTES -,800 ,8037 1,000 -3,414 1,814


VIERNES
MIERCOLES -,500 ,8037 1,000 -3,114 2,114

JUEVES 1,000 ,8037 1,000 -1,614 3,614

Basadas en las medias observadas.


El término de error es la media cuadrática(Error) = 1,615.
Tabla 7. Tabla comparativa entre silos de almacenamiento

TEMPERATURA DE ALMACENAMIENTO
DHS de Bonferroni a,b

SILO PARA ALMACENAR N Subconjunto


LECHE 1

A 5 3,300
C 5 3,400
E 5 3,500
B 5 4,200
D 5 4,300
Sig. ,727

Se muestran las medias de los grupos de subconjuntos


homogéneos.
Basadas en las medias observadas.
El término de error es la media cuadrática(Error) = 1,615.
a. Usa el tamaño muestral de la media armónica = 5,000
b. Alfa = ,05.

PASO 3: Toma de decisión

En base a la prueba Post Hoc de Bonferroni y teniendo en cuenta que las probabilidades
son mayores al nivel de significancia, se ratifica y concluye que todas las medias de
temperatura de almacenamiento de la leche en los 5 silos son iguales, por lo que la
empresa no debería preocuparse, ya que la temperatura para conservar la leche se
mantiene en valores adecuados.
Si la empresa necesita saber que silo es el que mejor mantiene la temperatura de la
leche, tomando en cuenta para ello un valor de referencia, se debe dirigir a la tabla 7,
donde se muestra los valores de temperatura registrados.

Você também pode gostar