Você está na página 1de 47

DISEÑO COMPLETAMENTE ALEATORIZADO

EJEMPLO 1
Los datos que se presentan a continuación conforman los valores de presión
(psi) hallados en un resorte de torsión para sostener poleas de transporte de
concreto u otro material, para diferentes ángulos que se formaron entre las
vueltas del resorte en posición vertical.
Ángulo (°)
68 70 74 82 89
84 83 87 86 89 90
86 85 86 86 90 91
85 89 87 91
87 89 87 91
87 88 88
89 90
a. Formule la hipótesis y el modelo estadístico para el modelo.
b. Realice el análisis de varianza para estos datos, a fin de estudiar si los
ángulos afectan los valores de presión del resorte de torsión. Use 𝛼 = 0.05
c. Analice los residuales del experimento
d. Verifique el supuesto de normalidad
e. Analice las pruebas de comparación múltiple Tukey y Fisher

a. Formule la hipótesis y el modelo estadístico para el modelo.


 Hipótesis:
𝐻𝑜 : 𝑢1 = 𝑢2 = 𝑢3 = 𝑢4 = 𝑢5

𝐻1 : 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 5𝑢𝑖 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠

 Modelo estadístico para el modelo


𝑦𝑖𝑗 = 𝑢 + 𝜏𝑗 + 𝜀𝑖𝑗

𝑑𝑜𝑛𝑑𝑒:
𝑦𝑖𝑗 = 𝑉𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑝𝑟𝑒𝑠𝑖ó𝑛 𝑑𝑒𝑙 𝑟𝑒𝑠𝑜𝑟𝑡𝑒 𝑑𝑒 𝑡𝑜𝑟𝑠𝑖ó𝑛
𝜏𝑗 = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑜𝑠 á𝑛𝑔𝑢𝑙𝑜𝑠

b. Realice el análisis de varianza para estos datos, a fin de estudiar si los


ángulos afectan los valores de presión del resorte de torsión.
Use 𝜶 = 𝟎. 𝟎𝟓

1. Suposiciones:
 Se tiene 5 muestras independientes
 Cada provisión 𝑁(𝑢𝑗 ,𝜎𝑗2 )
 Poblaciones con variaciones homogéneas: 𝜎12 = 𝜎22 = 𝜎32 = 𝜎42 =
𝜎52 = 𝜎 2
 ∑ ∑ 𝜏𝑗=0 𝑦 𝜀𝑖𝑗 → 𝐷𝑁𝐼(𝑂, 𝜎 2 )
2. Nivel de significancia ∝=0.05
3. Cálculos
Fuente GL SC CM F P
ángulo 4 73.78 18.45 8.02 0.000
Error 20 45.98 2.30
Total 24 119.76

S = 1.516 R-cuad. = 61.61% R-cuad.(ajustado) = 53.93%

4. Establecer la decisión y conclusiones

𝑃 = 𝑃(𝐹4,20 > 8.02)

𝑃 = 0.00
Como 𝑃 = 0.000 <∝=0.05 entonces se rechaza la Hipótesis nula y se acepta
la Hipótesis alternativa. Por ello se concluye que los ángulos tienen una
influencia significativa en los valores de presión del resorte de torsión.

c. Analice los residuales del experimento


Residuos vs. ángulo
(la respuesta es valores de presión)

1
Residuo

-1

-2

-3

70 75 80 85 90
ángulo

De la gráfica podemos concluir que el ángulo de 70 grados genera mayor


variabilidad o dispersión de los valores de presión del resorte de torsión
vs. ajustes
(la respuesta es valores de presión)

1
Residuo

-1

-2

-3

85 86 87 88 89 90 91
Valor ajustado
Gráfica de caja de valores de presión

91

90

valores de presión 89

88

87

86

85

84

83

82
68 70 74 82 89
ángulo

De la gráfica podemos concluir que el ángulo de 89 grados genera menor


dispersión en los valores de presión del resorte de torsión. Además dicho
ángulo y el ángulo de 82 producen mayores valores de presión del resorte de
torsión

d. Verifique el supuesto de normalidad


Gráfica de probabilidad de RESID1
Normal
99
Media -5.68434E-16
Desv.Est. 1.384
95 N 25
KS 0.121
90
Valor P >0.150
80
70
Porcentaje

60
50
40
30
20

10

1
-4 -3 -2 -1 0 1 2 3 4
RESID1

𝐻𝑜 =Los residuos del experimento se ajustan a una distribución normal


𝐻1 = Los residuos del experimento no se ajustan a una distribución normal
Como 𝑝 = 0.15 > 𝛼 = 0.05 entonces se acepta la hipótesis nula y se
rechaza la hipótesis alternativa. Se concluye que los residuos del
experimento se ajustan a una distribución normal. Por lo tanto el modelo
empleado es idóneo.
e. Analice las pruebas de comparación múltiple Tukey y Fisher
Agrupar información utilizando el método de Tukey

ángulo N Media Agrupación


89 2 90.500 A
82 4 90.250 A
74 11 87.545 A B
70 6 86.000 B
68 2 85.000 B
Las medias que no comparten una letra son significativamente
diferentes.

Agrupar información utilizando el método de Fisher

ángulo N Media Agrupación


89 2 90.500 A
82 4 90.250 A
74 11 87.545 B
70 6 86.000 B C
68 2 85.000 C

Las medias que no comparten una letra son significativamente


diferentes.

Mediante el análisis de comparación múltiple se llega a la conclusión que los


ángulos que generan mayores valores de presión del resorte de torsión son
82 y 89 grados.

EJEMPLO 2

Se consideran seis estaciones totales diferentes para llevar a cabo


levantamientos taquimétricos de un terreno. Las estaciones totales se comparan
con respecto al margen de error que generan en la medición de distancias. Se
emplea una muestra aleatoria de 4 superficies para cada estación total. Para
determinar si el margen de error medio varía de una estación a otra. Los datos
siguientes son las mediciones de los errores en milímetros.

Estación
total
1 2 3 4 5 6
17.5 16.4 20.3 14.6 17.5 18.3
16.9 19.2 15.7 16.7 19.2 16.2
15.8 17.7 17.8 20.8 16.5 17.5
18.6 15.4 18.9 18.9 20.5 20.1
a. Formule la hipótesis y el modelo estadístico para el modelo.
b. Realice el análisis de varianza para estos datos, a fin de estudiar si las
estaciones totales afectan los márgenes de error. Use 𝛼 = 0.05
c. Analice los residuales del experimento
d. Verifique el supuesto de normalidad
e. Analice las pruebas de comparación múltiple Tukey y Fisher

a. Formule la hipótesis y el modelo estadístico para el modelo.


 Hipótesis:
𝐻𝑜 : 𝑢1 = 𝑢2 = 𝑢3 = 𝑢4 = 𝑢5 = 𝑢6

𝐻1 : 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 6𝑢𝑖 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠

 Modelo estadístico para el modelo


𝑦𝑖𝑗 = 𝑢 + 𝜏𝑗 + 𝜀𝑖𝑗

𝑑𝑜𝑛𝑑𝑒:
𝑦𝑖𝑗 = 𝑀𝑎𝑟𝑔𝑒𝑛 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟
𝜏𝑗 = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎𝑠 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠

b. Realice el análisis de varianza para estos datos, a fin de estudiar si las


estaciones totales afectan los márgenes de error. Use 𝜶 = 𝟎. 𝟎𝟓

1. Suposiciones:
 Se tiene 6 muestras independientes
 Cada provisión 𝑁(𝑢𝑗 ,𝜎𝑗2 )
 Poblaciones con variaciones homogéneas: 𝜎12 = 𝜎22 = 𝜎32 = 𝜎42 =
𝜎52 = 𝜎62 = 𝜎 2
 ∑ ∑ 𝜏𝑗=0 𝑦 𝜀𝑖𝑗 → 𝐷𝑁𝐼(𝑂, 𝜎 2 )
2. Nivel de significancia ∝=0.05
3. Cálculos
Fuente GL SC CM F P
Estación total 5 5.34 1.07 0.31 0.902
Error 18 62.64 3.48
Total 23 67.98

S = 1.865 R-cuad. = 7.85% R-cuad.(ajustado) = 0.00%

4. Establecer la decisión y conclusiones

𝑃 = 𝑃(𝐹5,18 > 0.31)

𝑃 = 0.902
Como 𝑃 = 0.902 >∝=0.05 entonces se acepta la Hipótesis nula y se rechaza
la Hipótesis alternativa. Por ello se concluye que las estaciones totales no
influyen de manera significativa en los márgenes de error.

c. Analice los residuales del experimento


Residuos vs. Estación total
(la respuesta es Margen de error)

1
Residuo

-1

-2

-3

-4
1 2 3 4 5 6
Estación total

De la gráfica podemos concluir que en la estación total 4 existe mayor


variabilidad o dispersión de los márgenes de error
vs. ajustes
(la respuesta es Margen de error)

1
Residuo

-1

-2

-3

-4
17.0 17.2 17.4 17.6 17.8 18.0 18.2 18.4
Valor ajustado

Gráfica de caja de Margen de error


21

20

19
Margen de error

18

17

16

15

14
1 2 3 4 5 6
Estación total

De la gráfica podemos concluir que en la estación total 4 existe mayor


variabilidad o dispersión de los márgenes de error. Además podemos concluir
que los intervalos de confianza son casi iguales estadísticamente, puesto que
se traslapan entre ellos.

d. Verifique el supuesto de normalidad


Gráfica de probabilidad de RESID1
Normal
99
Media -1.48030E-16
Desv.Est. 1.650
95 N 24
KS 0.098
90
Valor P >0.150
80
70
Porcentaje

60
50
40
30
20

10

1
-4 -3 -2 -1 0 1 2 3 4
RESID1

𝐻𝑜 =Los residuos del experimento se ajustan a una distribución normal


𝐻1 = Los residuos del experimento no se ajustan a una distribución normal
Como 𝑝 = 0.15 > 𝛼 = 0.05 entonces se acepta la hipótesis nula y se
rechaza la hipótesis alternativa. Se concluye que los residuos del
experimento se ajustan a una distribución normal. Por lo tanto el modelo
empleado es idóneo.

e. Analice las pruebas de comparación múltiple Tukey y Fisher

Agrupar información utilizando el método de Tukey

Estación
total N Media Agrupación
5 4 18.425 A
3 4 18.175 A
6 4 18.025 A
4 4 17.750 A
1 4 17.200 A
2 4 17.175 A

Las medias que no comparten una letra son significativamente


diferentes.
Agrupar información utilizando el método de Fisher

Estación
total N Media Agrupación
5 4 18.425 A
3 4 18.175 A
6 4 18.025 A
4 4 17.750 A
1 4 17.200 A
2 4 17.175 A

Las medias que no comparten una letra son significativamente


diferentes.
Mediante el análisis de comparación múltiple se llega a la conclusión que
estadísticamente los diferentes niveles del factor estación total son iguales,
corroborando el gráfico de cajas.
EJEMPLO 3:
Para estudiar la confiabilidad de ciertos tableros electrónicos para carros, se
someten a un envejecimiento acelerado durante 100 horas a determinada
temperatura, y como variable de interés se mide la intensidad de la corriente que
circula entre dos puntos, cuyos puntos aumentan con el deterioro. Se probaron
20 módulos repartidos de manera equitativamente en cinco temperaturas y los
resultados obtenidos fueron los siguientes:
20°C 40°C 60°C 80°C 100°C
15 17 23 28 45
18 21 19 32 51
13 11 25 34 57
12 16 22 31 48
f. Formule la hipótesis y el modelo estadístico para el modelo.
g. Realice el análisis de varianza para estos datos, a fin de estudiar si la
temperatura afecta la intensidad de la corriente promedio.
h. ¿La temperatura afecta la variabilidad de las intensidades? Es decir, verifique
si hay igual varianza entre los diferentes tratamientos.

a. Formule la hipótesis y el modelo estadístico para el modelo.


 Hipótesis:
𝐻𝑜 : 𝑢1 = 𝑢2 = 𝑢3 = 𝑢4 = 𝑢5

𝐻1 : 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 5𝑢𝑖 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠

 Modelo estadístico para el modelo


𝑦𝑖𝑗 = 𝑢 + 𝜏𝑗 + 𝜀𝑖𝑗

𝑑𝑜𝑛𝑑𝑒:
𝑦𝑖𝑗 = 𝐼𝑛𝑡𝑒𝑛𝑠𝑖𝑑𝑎𝑑 𝑑𝑒 𝑙𝑎 𝑐𝑜𝑟𝑟𝑖𝑒𝑛𝑡𝑒 𝑒𝑛𝑡𝑟𝑒 𝑑𝑜𝑠 𝑝𝑢𝑛𝑡𝑜𝑠
𝜏𝑗 = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑡𝑒𝑚𝑝𝑒𝑟𝑎𝑡𝑢𝑟𝑎

b. Realice el análisis de varianza para estos datos, a fin de estudiar si la


temperatura afecta la intensidad de la corriente promedio.

1. Suposiciones:
 Se tiene 5 muestras independientes
 Cada provisión 𝑁(𝑢𝑗 ,𝜎𝑗2 )
 Poblaciones con variaciones homogéneas: 𝜎12 = 𝜎22 = 𝜎32 = 𝜎42 =
𝜎52 = 𝜎 2
 ∑ ∑ 𝜏𝑗=0 𝑦 𝜀𝑖𝑗 → 𝐷𝑁𝐼(𝑂, 𝜎 2 )

2. Nivel de significancia ∝=0.05


𝑇
3. Prueba estadística 𝐹𝑜 = 𝐸𝑦𝑦
𝑦𝑦
4. Cálculos

Fuente GL SC CM F P
Temperatura 4 3411.8 853.0 68.05 0.000
Error 15 188.0 12.5
Total 19 3599.8

S = 3.540 R-cuad. = 94.78% R-cuad.(ajustado) = 93.38%


5. Establecer la región crítica

𝑇𝑦𝑦
𝐹𝑜 =
𝐸𝑦𝑦

853
𝐹𝑜 = = 68.05
12.5
𝐹(0.05,4,15) = 3.05

6. Establecer la decisión y conclusiones


Como 𝐹𝑜 = 68.05 es mayor que 𝐹(0.05,4,15) = 3.05 entonces se rechaza la
𝐻𝑜 : 𝑢1 = 𝑢2 = 𝑢3 = 𝑢4 = 𝑢5 y se acepta la 𝐻1 : 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 5𝑢𝑖 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠

𝑃 = 𝑃(𝐹4,15 > 68.05)

𝑃 = 0.00
Como 𝑃 = 0.000 <∝=0.05 entonces se rechaza la Hipótesis nula y se acepta
la Hipótesis alternativa. Por ello se concluye que la temperatura tiene una
influencia significativa en la intensidad de corriente promedio.

7. Interpretaciones gráficas
vs. ajustes
(la respuesta es Intensidad de corriente)
7.5

5.0

2.5
Residuo

0.0

-2.5

-5.0

10 20 30 40 50
Valor ajustado

Residuos vs. Temperatura


(la respuesta es Intensidad de corriente)
7.5

5.0

2.5
Residuo

0.0

-2.5

-5.0

10 20 30 40 50 60 70 80 90 100
Temperatura
De la gráfica podemos concluir que la Temperatura de 100°C genera una
mayor dispersión de la intensidad de corriente promedio

Gráfica de probabilidad de RESID1


Normal
99
Media 0
Desv.Est. 3.146
95 N 20
KS 0.156
90
Valor P >0.150
80
70
Porcentaje

60
50
40
30
20

10

1
-8 -6 -4 -2 0 2 4 6 8
RESID1

𝐻𝑜 =Los residuos del experimento se ajustan a una distribución normal


𝐻1 = Los residuos del experimento no se ajustan a una distribución normal
Como 𝑝 = 0.15 > 𝛼 = 0.05 entonces se acepta la hipótesis nula y se
rechaza la hipótesis alternativa. Se concluye que los residuos del
experimento se ajustan a una distribución normal. Por lo tanto el modelo
empleado es idóneo.

Gráfica de caja de Intensidad de corriente


60

50
Intensidad de corriente

40

30

20

10
20 40 60 80 100
Temperatura

De la gráfica podemos concluir que la temperatura de 100°C presenta


mayor variabilidad o dispersión de sus datos.

8. Comparaciones múltiples
Agrupar información utilizando el método de Tukey

Temperatura N Media Agrupación


100 4 50.250 A
80 4 31.250 B
60 4 22.250 C
40 4 16.250 C D
20 4 14.500 D

Las medias que no comparten una letra son significativamente


diferentes.
Agrupar información utilizando el método de Fisher

Temperatura N Media Agrupación


100 4 50.250 A
80 4 31.250 B
60 4 22.250 C
40 4 16.250 D
20 4 14.500 D

Las medias que no comparten una letra son significativamente


diferentes.

Mediante el análisis de comparación múltiple se llega a la conclusión


que la temperatura que genera mayor intensidad de corriente promedio
es la temperatura de 100°C

c. ¿La temperatura afecta la variabilidad de las intensidades? Es decir,


verifique si hay igual varianza entre los diferentes tratamientos.
𝐻𝑜 = 𝜎12 = 𝜎22 = 𝜎32 = 𝜎42 = 𝜎42 = 𝜎 2

𝐻1 = 𝜎𝑖2 ≠ 𝜎𝑗2 𝑝𝑎𝑟𝑎 𝑎𝑙𝑔ú𝑛 𝑖 ≠ 𝑗


 El estadístico de prueba es:
𝑞
𝑋𝑜2 = 2.3026
𝑐
 Hallamos q, c

ICs de 95% individuales para la media


basados en Desv.Est. agrupada
Nivel N Media Desv.Est. -+---------+---------+---------+--------
20 4 14.500 2.646 (--*--)
40 4 16.250 4.113 (---*--)
60 4 22.250 2.500 (---*--)
80 4 31.250 2.500 (--*--)
100 4 50.250 5.123 (--*--)
-+---------+---------+---------+--------
12 24 36 48

 Hallamos 𝑆𝑝2
3(2.62 + 4.12 + 2.52 + 2.52 + 5.12 )
𝑆𝑝2 = = 12.416
15
 Hallamos q=1.22
17
 Hallamos c=15
 Reemplazamos en el estadístico de prueba
1.22
𝑋𝑜2 = 2.3026 = 1.08
17
15
 2
Hallamos 𝑋(0.05,4) = 9.49
 Comparamos el valor crítico y el estadístico de prueba y establecemos
conclusiones

2
Como 𝑋𝑜2 = 1.08 es menor que 𝑋(0.05,4) = 9.49 entonces se acepta la
Hipótesis nula y se rechaza la Hipótesis alternativa

DISEÑO DE BLOQUES COMPLETOS ALEATORIOS

EJEMPLO 1
Una compañía de ingenieros decide investigar si 4 laboratorios miden el mismo
coeficiente de elasticidad característico de las arenas. Para ello se seleccionan
4 tipos de arena: 1 (muy blanda), 2(blanda), 3(consistencia media), 4(rígida), las
cuales fueron analizadas en cada uno de los laboratorios. Después de un mes
se obtuvieron los siguientes resultados en MPa:

Tipos de
arena
Laboratorio 1 2 3 4
1 2.6 3.3 7.5 11.1
2 2.4 4.3 8.8 12.3
3 2.3 3.4 8.3 12.1
4 2.1 3.7 7.9 11.5

a. En este problema ¿Cuál es el factor tratamiento y cuál es el factor bloque?


b. Formule las hipótesis adecuadas y el modelo estadístico.
c. Con un nivel de significancia de 0.05. ¿Es posible concluir que los
laboratorios no tienen ningún efecto en el coeficiente de elasticidad de las
arenas? ¿Los tipos de arena influyen en el coeficiente de elasticidad de las
arenas?
d. Analice los residuales del experimento
e. Verifique el supuesto de normalidad

a. En este problema ¿Cuál es el factor tratamiento y cuál es el factor


bloque?
 Factor tratamiento: Laboratorio
 Factor bloque: Tipos de arena

b. Formule las hipótesis adecuadas y el modelo estadístico.

 Modelo estadístico
𝑦𝑖𝑗 = 𝑢 + 𝜏𝑖 + 𝛽𝑗 +𝜀𝑖𝑗

𝑑𝑜𝑛𝑑𝑒:
𝑦𝑖𝑗 = 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑒𝑙𝑎𝑠𝑡𝑖𝑐𝑖𝑑𝑎𝑑 𝑑𝑒 𝑙𝑎𝑠 𝑎𝑟𝑒𝑛𝑎𝑠
𝜏𝑖 = 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑙𝑎𝑏𝑜𝑟𝑎𝑡𝑜𝑟𝑖𝑜𝑠
𝛽𝑗 = 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑡𝑖𝑝𝑜𝑠 𝑑𝑒 𝑎𝑟𝑒𝑛𝑎

 Hipótesis adecuadas
𝐻𝑜 : 𝜏1 = 𝜏2 = 𝜏3 = 𝜏4 = 0
Los laboratorios no influyen de manera significativa en el coeficiente
de elasticidad de las arenas
𝐻1 : 𝜏𝑖 ≠ 0
Al menos un laboratorio influye de manera significativa en el
coeficiente de elasticidad de las arenas
𝐻𝑜 : 𝛽1 = 𝛽 = 𝛽3 = 𝛽4 = 0
Los tipos de arena no influyen de manera significativa en el
coeficiente de elasticidad de las arenas
𝐻1 : 𝛽𝑗 ≠ 0
Al menos un tipo de arena influye de manera significativa en el
coeficiente de elasticidad de las arenas

c. Con un nivel de significancia de 0.05. ¿Es posible concluir que los


laboratorios no tienen ningún efecto en el coeficiente de elasticidad de
las arenas? ¿Los tipos de arena influyen en el coeficiente de elasticidad
de las arenas?
Fuente GL SC Sec. SC Ajust. CM Ajust. F P
Laboratorio 3 1.525 1.525 0.508 4.36 0.037
Tipos de arena 3 221.615 221.615 73.872 633.19 0.000
Error 9 1.050 1.050 0.117
Total 15 224.190

 Con respecto a los tratamientos


Como 𝑃 = 0.037 <∝=0.05 entonces se rechaza la Hipótesis nula y se
acepta la Hipótesis alternativa.
Se concluye que al menos un laboratorio influye de manera
significativa en el coeficiente de elasticidad de las arenas

 Con respecto a los bloques


Como 𝑃 = 0.00 <∝=0.05 entonces se rechaza la Hipótesis nula y se
acepta la Hipótesis alternativa.
Se concluye que al menos un tipo de arena influye de manera
significativa el coeficiente de elasticidad de las arenas

d. Analice los residuales del experimento


Residuos vs. Tipos de arena
(la respuesta es Coeficiente de elasticidad)
0.75

0.50

0.25
Residuo

0.00

-0.25

-0.50
1.0 1.5 2.0 2.5 3.0 3.5 4.0
Tipos de arena

Existen indicios de que el tipo de arena 1, tiene una variabilidad mayor en el


coeficiente de las arenas cuando se trata con los 4 laboratorios, que los otros
bloques
Residuos vs. Laboratorio
(la respuesta es Coeficiente de elasticidad)
0.75

0.50

0.25
Residuo

0.00

-0.25

-0.50
1.0 1.5 2.0 2.5 3.0 3.5 4.0
Laboratorio

De acuerdo a la gráfica en el laboratorio 1 existe mayor variabilidad o


dispersión de sus datos. En cambio en el laboratorio 4 existe menor
variabilidad

e. Verifique el supuesto de normalidad


Gráfica de probabilidad de RESID1
Normal
99
Media -4.71845E-16
Desv.Est. 0.2646
95 N 16
KS 0.103
90
Valor P >0.150
80
70
Porcentaje

60
50
40
30
20

10

1
-0.75 -0.50 -0.25 0.00 0.25 0.50
RESID1

𝐻𝑜 = Los residuos del experimento se ajustan a una distribución normal


𝐻1 = Los residuos del experimento no se ajustan a una distribución normal

Como 𝑝 = 0.15 > 𝛼 = 0.05 entonces se acepta la hipótesis nula y se rechaza


la hipótesis alternativa. Se concluye que los residuos del experimento se
ajustan a una distribución normal. Por lo tanto el modelo aplicado es idóneo.

EJEMPLO 2

Un grupo de ingenieros decide investigar la eficacia de 4 diferentes


termómetros bimetálicos en la medición de la duración del fraguado del
concreto. Para ello se midieron 5 temperaturas diferentes, durante 28 días. Los
resultados obtenidos fueron los siguientes (días.horas):
Temperatura
Termómetros 1(10°C) 2(15°C) 3(20°C) 4(22°C) 5(23°C)
1 12.8 10.6 11.7 10.7 11
2 11.7 14.2 11.8 9.9 13.8
3 11.5 14.7 13.6 10.7 15.9
4 12.6 16.5 15.4 9.6 17.1

a. En este problema ¿Cuál es el factor tratamiento y cuál es el factor bloque?


b. Formule las hipótesis adecuadas y el modelo estadístico.
c. Con un nivel de significancia de 0.05. ¿Es posible concluir que los
termómetros bimetálicos no tienen ningún efecto en la duración del fraguado
del concreto? ¿La temperatura influye en la duración del fraguado del
concreto?
d. Analice los residuales del experimento
e. Verifique el supuesto de normalidad
a. En este problema ¿Cuál es el factor tratamiento y cuál es el factor
bloque?
 Factor tratamiento: termómetros bimetálicos
 Factor bloque: temperatura

b. Formule las hipótesis adecuadas y el modelo estadístico


 Modelo estadístico
𝑦𝑖𝑗 = 𝑢 + 𝜏𝑖 + 𝛽𝑗 +𝜀𝑖𝑗

𝑑𝑜𝑛𝑑𝑒:
𝑦𝑖𝑗 = 𝑑𝑢𝑟𝑎𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑓𝑟𝑎𝑔𝑢𝑎𝑑𝑜 𝑑𝑒𝑙 𝑐𝑜𝑛𝑐𝑟𝑒𝑡𝑜
𝜏𝑖 = 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑡𝑒𝑟𝑚ó𝑚𝑒𝑡𝑟𝑜𝑠 𝑏𝑖𝑚𝑒𝑡á𝑙𝑖𝑐𝑜𝑠
𝛽𝑗 = 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑡𝑒𝑚𝑝𝑒𝑟𝑎𝑡𝑢𝑟𝑎

 Hipótesis adecuadas
𝐻𝑜 : 𝜏1 = 𝜏2 = 𝜏3 = 𝜏4 = 0
Los termómetros bimetálicos no influyen de manera significativa en la
duración del fraguado del concreto
𝐻1 : 𝜏𝑖 ≠ 0
Al menos un termómetro bimetálico influye de manera significativa en
la duración del fraguado del concreto
𝐻𝑜 : 𝛽1 = 𝛽 = 𝛽3 = 𝛽4 = 𝛽5 = 0
La temperatura no influye de manera significativa en la duración del
fraguado del concreto
𝐻1 : 𝛽𝑗 ≠ 0
Al menos una temperatura influye de manera significativa en la
duración del fraguado del concreto

c. Con un nivel de significancia de 0.05. ¿Es posible concluir que los


termómetros bimetálicos no tienen ningún efecto en la duración del
fraguado del concreto? ¿La temperatura influye en la duración del
fraguado del concreto?
Fuente GL SC Sec. SC Ajust. CM Ajust. F P
Termómetro 3 23.238 23.238 7.746 3.33 0.057
Temperatura 4 45.283 45.283 11.321 4.86 0.015
Error 12 27.937 27.937 2.328
Total 19 96.458

 Con respecto a los tratamientos


Como 𝑃 = 0.057 >∝=0.05 entonces se acepta la Hipótesis nula y se
rechaza la Hipótesis alternativa.
Se concluye que los termómetros bimetálicos no influyen de manera
significativa en la duración del fraguado del concreto

 Con respecto a los bloques


Como 𝑃 = 0.015 <∝=0.05 entonces se rechaza la Hipótesis nula y se
acepta la Hipótesis alternativa.
Se concluye que al menos una temperatura influye de manera
significativa en la duración del fraguado del concreto
d. Analice los residuales del experimento

Residuos vs. Temperatura


(la respuesta es Duración del fraguado)

1
Residuo

-1

-2

1 2 3 4 5
Temperatura

Existen indicios de que en las temperaturas existe una ligera diferencia en


cuanto a las variabilidades, cuando se trabaja con las cinco temperaturas.
Residuos vs. Termómetro
(la respuesta es Duración del fraguado)

1
Residuo

-1

-2

1.0 1.5 2.0 2.5 3.0 3.5 4.0


Termómetro

De la gráfica se concluye que en el primer termómetro bimetálico existe


mayor variabilidad o dispersión de sus datos

e. Verifique los supuestos de normalidad


Gráfica de probabilidad de RESID1
Normal
99
Media 7.993606E-16
Desv .Est. 1.213
95 N 20
KS 0.154
90
Valor P >0.150
80
70
Porcentaje

60
50
40
30
20

10

1
-3 -2 -1 0 1 2 3
RESID1

𝐻𝑜 = Los residuos del experimento se ajustan a una distribución normal


𝐻1 = Los residuos del experimento no se ajustan a una distribución normal

Como 𝑝 = 0.15 > 𝛼 = 0.05 entonces se acepta la hipótesis nula y se rechaza


la hipótesis alternativa. Se concluye que los residuos del experimento se
ajustan a una distribución normal. Por lo tanto el modelo aplicado es idóneo.

EJEMPLO 3
En una empresa lechera se tienen varios silos para almacenar leche (cisternas de 60
000L). Un aspecto crítico para que se conserve la leche es la temperatura de
almacenamiento. Se sospecha que en algunos silos hay problemas, por ello, durante
días se decide registrar la temperatura a cierta hora crítica. Obviamente la
temperatura de un día a otro es una fuente de variabilidad que podría impactar la
variabilidad total
Día
Silo Lunes Martes Miércoles Jueves Viernes
A 4.0 4.0 5.0 0.5 3.0
B 5.0 6.0 2.0 4.0 4.0
C 4.5 4.0 3.5 2.0 3.0
D 2.5 4.0 6.5 4.5 4.0
E 4.0 4.0 3.5 2.0 4.0
f. En este problema ¿Cuál es el factor tratamiento y cuál es el factor bloque?
g. Suponga un DBCA, formule las hipótesis adecuadas y el modelo estadístico.
h. ¿Hay diferencia entre los silos?
i. ¿La temperatura de un día a otro es diferente?
j. Revise residuos. ¿Hay un problema evidente?

a. En este problema ¿Cuál es el factor tratamiento y cuál es el factor


bloque?
 Factor tratamiento: Silos
 Factor bloque: Días

b. Suponga un DBCA, formule las hipótesis adecuadas y el modelo


estadístico.
 Modelo estadístico
𝑦𝑖𝑗 = 𝑢 + 𝜏𝑖 + 𝛽𝑗 +𝜀𝑖𝑗

𝑑𝑜𝑛𝑑𝑒:
𝑦𝑖𝑗 = 𝑡𝑒𝑚𝑝𝑒𝑟𝑎𝑡𝑢𝑟𝑎 𝑑𝑒 𝑙𝑎 𝑙𝑒𝑐ℎ𝑒
𝜏𝑖 = 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑠𝑖𝑙𝑜𝑠
𝛽𝑗 = 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑑í𝑎𝑠

 Hipótesis adecuadas
𝐻𝑜 : 𝜏1 = 𝜏2 = 𝜏3 = 𝜏4 = 𝜏5 = 0
Los silos no influyen de manera significativa en la temperatura de la
leche
𝐻1 : 𝜏𝑖 ≠ 0
Al menos un tipo de silo influye de manera significativa en la
temperatura de la leche
𝐻𝑜 : 𝛽1 = 𝛽 = 𝛽3 = 𝛽4 = 𝛽5 = 0
Los días no influyen de manera significativa en la temperatura de la
leche
𝐻1 : 𝛽𝑗 ≠ 0
Al menos un día influye de manera significativa en la temperatura de
la leche

c. ¿Hay diferencia entre los silos?


𝑇𝑦𝑦
5. Prueba estadísticas para tratamientos 𝐹𝑜 = 𝐸
𝑦𝑦
6. Cálculos
Fuente GL SC Sec. SC Ajust. CM Ajust. F P
Silos 4 9.760 9.760 2.440 1.51 0.246
Días 4 4.460 4.460 1.115 0.69 0.609
Error 16 25.840 25.840 1.615
Total 24 40.060

S = 1.27083 R-cuad. = 35.50% R-cuad.(ajustado) = 3.25%


7. Establecer la decisión y conclusiones
𝑇𝑦𝑦
𝐹𝑜 =
𝐸𝑦𝑦

2.44
𝐹𝑜 = = 1.51
1.615
𝐹(0.05,4,16) = 3
Como 𝐹𝑜 = 1.51 es menor que 𝐹(0.05,4,16) = 3 entonces se acepta
la 𝐻𝑜 : 𝜏1 = 𝜏2 = 𝜏3 = 𝜏4 = 𝜏5 = 0 y se rechaza la 𝐻1 : 𝜏𝑖 ≠ 0
𝑃 = 𝑃(𝐹4,16 > 1.51)

𝑃 = 0.246
Como 𝑃 = 0.246 >∝=0.05 entonces se acepta la Hipótesis nula y se
rechaza la Hipótesis alternativa.
Se concluye que los silos no influyen de manera significativa en la
temperatura de la leche.
Además se concluye que no existe diferencia entre los silos.
d. ¿La temperatura de un día a otro es diferente?
𝐵𝑦𝑦
1. Prueba estadísticas para tratamientos 𝐹𝑜 =
𝐸𝑦𝑦
2. Cálculos
Fuente GL SC Sec. SC Ajust. CM Ajust. F P
Silos 4 9.760 9.760 2.440 1.51 0.246
Días 4 4.460 4.460 1.115 0.69 0.609
Error 16 25.840 25.840 1.615
Total 24 40.060

S = 1.27083 R-cuad. = 35.50% R-cuad.(ajustado) = 3.25%


3. Establecer la decisión y conclusiones
𝐵𝑦𝑦
𝐹𝑜 =
𝐸𝑦𝑦

1.115
𝐹𝑜 = = 0.69
1.615
𝐹(0.05,4,16) = 3
Como 𝐹𝑜 = 0.69 es menor que 𝐹(0.05,4,16) = 3 entonces se acepta la
𝐻𝑜 : 𝛽1 = 𝛽 = 𝛽3 = 𝛽4 = 𝛽5 = 0 y se rechaza la 𝐻1 : 𝛽𝑗 ≠ 0

𝑃 = 𝑃(𝐹4,16 > 0.69)

𝑃 = 0.609
Como 𝑃 = 0.609 >∝=0.05 entonces se acepta la Hipótesis nula y se
rechaza la Hipótesis alternativa.
Se concluye que los días no influyen de manera significativa en la
temperatura de la leche.
Además se concluye que la temperatura de un día a otro no es diferente.
e. Revise residuos. ¿Hay un problema evidente?
Residuos vs. Silos
(la respuesta es Temperatura)
2

0
Residuo

-1

-2

-3
1 2 3 4 5
Silos

De la gráfica podemos concluir que el silo 3 presenta mayor variabilidad o


dispersión de sus datos, es decir genera mayor dispersión en la temperatura
de la leche y que el silo 5 presenta menor variabilidad.
Residuos vs. Días
(la respuesta es Temperatura)
2

0
Residuo

-1

-2

-3
1 2 3 4 5
Días

De la gráfica podemos concluir que el día jueves presenta una variabilidad


mayor en la temperatura de la leche, cuando se trata con los 5 silos, que los
otros días. Además se puede observar que el día miércoles presenta una
menor variabilidad en la temperatura de la leche cuando se trata con los 5
silos.
Gráfica de probabilidad de RESID1
Normal
99
Media -2.66454E-16
Desv.Est. 1.038
95 N 25
KS 0.204
90
Valor P <0.010
80
70
Porcentaje

60
50
40
30
20

10

1
-3 -2 -1 0 1 2 3
RESID1

𝐻𝑜 = Los residuos del experimento se ajustan a una distribución normal


𝐻1 = Los residuos del experimento no se ajustan a una distribución normal
Como 𝑝 = 0.01 < 𝛼 = 0.05 entonces se rechaza la hipótesis nula y se acepta
la hipótesis alternativa. Se concluye que los residuos del experimento no se
ajustan a una distribución normal. Por lo tanto el modelo aplicado no es
idóneo.

DISEÑO CUADRADO LATINO

EJEMPLO 1
Se estudia el efecto de cinco diferentes catalizadores (A, B, C, D y E) sobre el
tiempo de reacción de un proceso químico. Cada lote de material sólo permite
cinco corridas y cada corrida requiere aproximadamente 1.5 horas, por lo que
sólo se pueden realizar cinco corridas diarias. El experimentador decide correr
los experimentos con un diseño en cuadro latino para controlar activamente a
los lotes y días. Los datos obtenidos son:

Día
Lote 1 2 3 4 5
1 A=8 B=7 D=1 C=7 E=3
2 C=11 E=2 A=7 D=3 B=8
3 B=4 A=9 C=10 E=1 D=5
4 D=6 C=8 E=6 B=6 A=10
5 E=4 D=2 B=3 A=8 C=8

a. ¿Cómo se aleatorizó el experimento?


b. Anote la ecuación del modelo y las hipótesis estadísticas correspondientes
c. ¿Existen diferencias entre los tratamientos? ¿Cuáles tratamientos son
diferentes entre sí?
d. ¿Los factores de ruido, lote y día afectan el tiempo de reacción del proceso?
e. Dibuje los gráficos de medias para los tratamientos, los lotes y los días. ¿Cuál
tratamiento es mejor?
f. Verifique los supuestos del modelo, considerando que los datos se obtuvieron
columna por columna, día a día

a. ¿Cómo se aleatorizó el experimento?


Se aleatorizó mediante un diseño en cuadro latino. Primero se construyó el
cuadro latino estándar más sencillo. A continuación se aleatorizó el orden de
las columnas (días9, luego el orden de los renglones (lotes). Finalmente los
tratamientos a comparar (catalizadores) se asignaron en forma aleatoria a las
letras latinas.

b. Anote la ecuación del modelo y las hipótesis estadísticas


correspondientes
 Ecuación del modelo
𝑦𝑖𝑗ℎ = 𝑢 + 𝜏𝑖 + 𝛽𝑗 +𝛾ℎ + 𝜀𝑖𝑗ℎ
𝑑𝑜𝑛𝑑𝑒:
𝑦𝑖𝑗ℎ = 𝑇𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑟𝑒𝑎𝑐𝑐𝑖ó𝑛 𝑑𝑒 𝑢𝑛 𝑝𝑟𝑜𝑐𝑒𝑠𝑜 𝑞𝑢í𝑚𝑖𝑐𝑜
𝑢 = 𝑀𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙
𝜏𝑖 = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑐𝑎𝑡𝑎𝑙𝑖𝑧𝑎𝑑𝑜𝑟𝑒𝑠
𝛽𝑗 = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑝𝑟𝑜𝑑𝑢𝑐𝑖𝑑𝑜 𝑝𝑜𝑟 𝑙𝑜𝑠 𝑙𝑜𝑡𝑒𝑠
𝛾ℎ = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑝𝑟𝑜𝑑𝑢𝑐𝑖𝑑𝑜 𝑝𝑜𝑟 𝑙𝑜𝑠 𝑑í𝑎𝑠
𝜀𝑖𝑗ℎ = 𝐸𝑟𝑟𝑜𝑟 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙

 Hipótesis estadísticas
 Con respecto a los tratamientos (catalizadores)
𝐻𝑜 : 𝜏1 = 𝜏2 = 𝜏3 = 𝜏4 = 𝜏5 = 0
Los catalizadores no influyen de manera significativa en el
tiempo de reacción del proceso químico
𝐻1 : 𝜏𝑖 ≠ 0
Al menos un catalizador influye de manera significativa en el
tiempo de reacción del proceso químico

 Con respecto a las filas (lotes)


𝐻𝑜 : 𝛽1 = 𝛽 = 𝛽3 = 𝛽4 = 𝛽5 = 0
Los lotes de material no influyen de manera significativa en el
tiempo de reacción del proceso químico

𝐻1 : 𝛽𝑗 ≠ 0
Al menos un lote de material influye de manera significativa en
el tiempo de reacción del proceso químico

 Con respecto a las columnas (Días)


𝐻𝑜 : 𝛾1 = 𝛾2 = 𝛾3 = 𝛾4 = 𝛾5 = 0
Los días no influyen de manera significativa en el tiempo de
reacción del proceso químico
𝐻1 : 𝛾ℎ ≠ 0
Al menos un día influye de manera significativa en el tiempo de
reacción del proceso químico

c. ¿Existen diferencias entre los tratamientos? ¿Cuáles tratamientos son


diferentes entre sí?
Gráfica de intervalos de Tiempo de reacción
95% IC para la media
12

10
Tiempo de reacción

0
A B C D E
Catalizador

Después de haber observado la gráfica concluimos que los tratamiento D y E


generan menor tiempo de reacción del proceso químico. Además dichos
tratamientos difieren en media poblacional de A y C. Como el tratamiento B se
traslapa con los otros tratamientos, quiere decir que las respuestas medias de
los tratamientos con respecto a B, son iguales estadísticamente.

d. ¿Los factores de ruido, lote y día afectan el tiempo de reacción del


proceso?
Fuente GL SC Sec. SC Ajust. CM Ajust. F P
Catalizador 4 141.440 141.440 35.360 11.31 0.000
Lote 4 15.440 15.440 3.860 1.23 0.348
Día 4 12.240 12.240 3.060 0.98 0.455
Error 12 37.520 37.520 3.127
Total 24 206.640
 Con respecto a los tratamientos (Catalizadores)
Como 𝑃 = 0.00 <∝=0.05 entonces se rechaza la Hipótesis nula y se
acepta la Hipótesis alternativa. Se concluye que al menos un
catalizador influye de manera significativa en el tiempo de reacción del
proceso químico.

 Con respecto a las filas (Lotes)


Como 𝑃 = 0.34 >∝=0.05 entonces se acepta la Hipótesis nula y se
rechaza la Hipótesis alternativa. Se concluye que los lotes de material
no influyen de manera significativa en el tiempo de reacción del
proceso químico.

 Con respecto a las columnas (Días)


Como 𝑃 = 0.455 >∝=0.05 entonces se acepta la Hipótesis nula y se
rechaza la Hipótesis alternativa. Se concluye que los días no influyen
de manera significativa en el tiempo de reacción del proceso químico
e. Dibuje los gráficos de medias para los tratamientos, los lotes y los días.
¿Cuál tratamiento es mejor?

Gráfica de intervalos de Tiempo de reacción


95% IC para la media
12

10
Tiempo de reacción

0
A B C D E
Catalizador

Después de observar la gráfica concluyo que los mejor tratamientos son los
catalizadores D y E, puesto que produce un tiempo de reacción menor que los
otros tratamientos. Lo que se busca con el catalizador es acelerar la reacción
química.

Gráfica de intervalos de Tiempo de reacción


95% IC para la media
12

10
Tiempo de reacción

0
1 2 3 4 5
Lote

De la gráfica concluyo que los lotes no influyen significativamente en el


tiempo de reacción, puesto que como los intervalos se traslapan,
estadísticamente todos son iguales.
Gráfica de intervalos de Tiempo de reacción
95% IC para la media

10

8
Tiempo de reacción

0
1 2 3 4 5
Día

De la gráfica concluyo que los días no influyen significativamente en el tiempo


de reacción, porque como los intervalos se traslapan, estadísticamente en
todos son iguales.

f. Verifique los supuestos del modelo, considerando que los datos se


obtuvieron columna por columna, día a día

Gráfica de probabilidad de RESID1


Normal
99
Media 0
Desv.Est. 1.250
95 N 25
KS 0.119
90
Valor P >0.150
80
70
Porcentaje

60
50
40
30
20

10

1
-3 -2 -1 0 1 2 3
RESID1

𝐻𝑜 = Los residuos del experimento se ajustan a una distribución normal


𝐻1 = Los residuos del experimento no se ajustan a una distribución normal
Como 𝑝 = 0.150 > 𝛼 = 0.05 entonces se acepta la hipótesis nula y se rechaza
la hipótesis alternativa. Se concluye que los residuos del experimento se
ajustan a una distribución normal. Por lo tanto el modelo aplicado es idóneo.
vs. ajustes
(la respuesta es Tiempo de reacción)
3

1
Residuo

-1

-2

2 3 4 5 6 7 8 9 10 11
Valor ajustado

Podemos concluir que se cumple el supuesto de varianza constante, puesto


que en la gráfica los residuos se ubican aleatoriamente dentro de una banda
horizontal, su dispersión vertical es la misma a lo largo del gráfico
vs. orden
(la respuesta es Tiempo de reacción)
3

1
Residuo

-1

-2

2 4 6 8 10 12 14 16 18 20 22 24
Orden de observación

EJEMPLO 2
Al comparan varios fertilizantes de diferentes variedades de cierto cultivo, es
típico que se deba considerar el gradiente de fertilidad del suelo (factor
columna) o los efectos residuales de cultivos previos (factor renglón).
Considerando estos factores de bloques, Gomez y Gomez (1984) plantean un
experimento en cuadro latino para comparar en cuanto a rendimiento en
toneladas por hectárea, tres variedades de maíz híbrido (A, B, C) y una variedad
de control (D). Para ellos se utiliza un campo agrícola cuadrado de 16
hectáreas, dividido en parcelas de una hectárea. Los datos de rendimiento
obtenidos en cada parcela se muestran a continuación
Ren/Col 1 2 3 4
1 1.640(B) 1.210(D) 1.425(C) 1.345(A)
2 1.475(C) 1.185(A) 1.400(D) 1.290(B)
3 1.670(A) 0.710(C) 1.665(B) 1.180(D)
4 1.565(D) 1.290(B) 1.655(A) 0.660(C)
a. ¿Cuál de los factores de bloque tuvo efectos?
b. ¿Se habrían detectados las mismas diferencias en los tratamientos con un
diseño completamente al azar?
c. ¿Y con un diseño en bloques al azar?

a. ¿Cuál de los factores de bloque tuvo efectos?

 Ecuación del modelo


𝑦𝑖𝑗ℎ = 𝑢 + 𝜏𝑖 + 𝛽𝑗 +𝛾ℎ + 𝜀𝑖𝑗ℎ
𝑑𝑜𝑛𝑑𝑒:
𝑦𝑖𝑗ℎ = 𝑅𝑒𝑛𝑑𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒𝑙 𝑚𝑎𝑖𝑧
𝑢 = 𝑀𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙
𝜏𝑖 = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎𝑠 𝑣𝑎𝑟𝑖𝑒𝑑𝑎𝑑𝑒𝑠 𝑑𝑒 𝑚𝑎𝑖𝑧
𝛽𝑗 = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑝𝑟𝑜𝑑𝑢𝑐𝑖𝑑𝑜 𝑝𝑜𝑟 𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑎𝑙𝑒𝑠 𝑑𝑒 𝑐𝑢𝑙𝑡𝑖𝑣𝑜𝑠 𝑝𝑟𝑒𝑣𝑖𝑜𝑠
𝛾ℎ = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑝𝑟𝑜𝑑𝑢𝑐𝑖𝑑𝑜 𝑝𝑜𝑟 𝑒𝑙 𝑔𝑟𝑎𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑓𝑒𝑟𝑡𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒𝑙 𝑠𝑢𝑒𝑙𝑜
𝜀𝑖𝑗ℎ = 𝐸𝑟𝑟𝑜𝑟 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙

 𝛼 = 0.05
 Hipótesis estadísticas
 Con respecto a los tratamientos (Variedades de maíz)
𝐻𝑜 : 𝜏1 = 𝜏2 = 𝜏3 = 𝜏4 = 0
Las variedades de maíz no influyen de manera significativa en
el rendimiento de maíz
𝐻1 : 𝜏𝑖 ≠ 0
Al menos una variedad de maíz influye de manera significativa
en el rendimiento de maíz

 Con respecto a las filas (Residuales de cultivos previos)


𝐻𝑜 : 𝛽1 = 𝛽 = 𝛽3 = 𝛽4 = 𝛽5 = 0
Los residuales de cultivos previos no influyen de manera
significativa en el rendimiento de maíz

𝐻1 : 𝛽𝑗 ≠ 0
Al menos un residual de cultivo influye de manera significativa
en el rendimiento de maíz

 Con respecto a las columnas (Gradiente de fertilidad del suelo)


𝐻𝑜 : 𝛾1 = 𝛾2 = 𝛾3 = 𝛾4 = 𝛾5 = 0
El gradiente de fertilidad del suelo no influye de manera
significativa en el rendimiento del maiz

𝐻1 : 𝛾ℎ ≠ 0
Al menos un gradiente de fertilidad influye de manera
significativa en el rendimiento de maíz
 Cálculos:
Fuente GL SC Sec. SC Ajust. CM Ajust. F
P
Variedad de maiz 3 0.42684 0.42684 0.14228 6.59
0.025
Res de cult p 3 0.03015 0.03015 0.01005 0.47
0.717
Gradiente 3 0.82734 0.82734 0.27578 12.77
0.005
Error 6 0.12958 0.12958 0.02160
Total 15 1.41392

 Establecemos conclusiones
 Con respecto a los tratamientos (Variedades de maíz)
Como 𝑃 = 0.025 <∝=0.05 entonces se rechaza la Hipótesis
nula y se acepta la Hipótesis alternativa. Se concluye que al
menos una variedad de maíz influye de manera significativa en
el rendimiento de maíz. Además existen diferencias entre ellos.

 Con respecto a las filas (Residuales de cultivos previos)


Como 𝑃 = 0.717 >∝=0.05 entonces se acepta la Hipótesis nula
y se rechaza la Hipótesis alternativa. Se concluye que los
residuales de cultivos previos no influyen de manera
significativa en el rendimiento de maíz

 Con respecto a las columnas (Gradiente de fertilidad del suelo)


Como 𝑃 = 0.005 <∝=0.05 entonces se rechaza la Hipótesis
nula y se acepta la Hipótesis alternativa. Se concluye que al
menos un gradiente de fertilidad influye de manera significativa
en el rendimiento de maíz

 Para determinar si existen diferencias entre tratamientos analizamos la


siguiente gráfica
Gráfica de caja de Rendimiento
1.8

1.6

1.4
Rendimiento

1.2

1.0

0.8

0.6
A B C D
Variedad de maiz

De la gráfica podemos concluir que en la variedad de maíz C, existe


mayor variabilidad o dispersión de sus datos. Además las variedades
A y B generan mayor rendimiento de maíz que la variedad C y la
variedad de control D
 Verificamos el supuesto de normalidad

Gráfica de probabilidad de RESID1


Normal
99
Media 9.020562E-17
Desv .Est. 0.09295
95 N 16
KS 0.197
90
Valor P 0.094
80
70
Porcentaje

60
50
40
30
20

10

1
-0.2 -0.1 0.0 0.1 0.2
RESID1

𝐻𝑜 = Los residuos del experimento se ajustan a una distribución normal


𝐻1 = Los residuos del experimento no se ajustan a una distribución normal
Como 𝑝 = 0.094 > 𝛼 = 0.05 entonces se acepta la hipótesis nula y se rechaza
la hipótesis alternativa. Se concluye que los residuos del experimento se
ajustan a una distribución normal. Por lo tanto el modelo aplicado es idóneo.

b. ¿Se habrían detectados las mismas diferencias en los tratamientos con


un diseño completamente al azar?
No, puesto que no solamente al menos un nivel los tratamientos (Variedades
de maíz) influyen de manera significativa en la variable dependiente, también
tenemos al menos otro nivel de factor (Gradiente de fertilidad del suelo) que
influye de manera significativa en el experimento.

c. ¿Y con un diseño en bloques al azar?


Sí, puesto que existen dos factores: los tratamientos (Variedades de maíz) y
el gradiente de fertilidad del suelo, donde al menos un nivel influye de manera
significativa en el experimento.

DISEÑO CUADRADO GRECOLATINO

EJEMPLO 1
Un investigador está interesado en el efecto del porcentaje de lisina y del
porcentaje de proteína en la producción de vacas lecheras. Se consideran siete
niveles en cada factor.
% 𝒍𝒊𝒔𝒊𝒏𝒂: 𝟎. 𝟎 (𝑨), 𝟎. 𝟏(𝑩), 𝟎. 𝟐(𝑪), 𝟎. 𝟑(𝑫), 𝟎. 𝟒(𝑬), 𝟎. 𝟓(𝑭), 𝟎. 𝟔(𝑮)
% 𝒑𝒓𝒐𝒕𝒆í𝒏𝒂: 𝟐(𝜶), 𝟒(𝜷), 𝟔(𝝌), 𝟖(𝜹), 𝟏𝟎(𝜺), 𝟏𝟐(𝝋), 𝟏𝟒(𝜸)
Para el estudio se seleccionan siete vacas al azar, a las cuales se les da un
seguimiento de siete periodos de tres meses. Lo datos en galones de leche
fueron los siguientes:

Vaca/Periodo 1 2 3 4 5 6 7
1 304 436 350 504 417 519 432
(𝐴𝛼) (𝐵𝜀) (𝐶𝛽) (𝐷𝜑) (𝐸𝜒) (𝐹𝛾) (𝐺𝛿)
2 381 505 425 564 494 350 413
(𝐵𝛽) (𝐶𝜑) (𝐷𝜒) (𝐸𝛾) (𝐹𝛿) (𝐺𝛼) (𝐴𝜀)
3 432 566 479 357 461 340 502
(𝐶𝜒) (𝐷𝛾) (𝐸𝛿) (𝐹𝛼) (𝐺𝜀) (𝐴𝛽) (𝐵𝜑)
4 442 372 536 366 495 425 507
(𝐷𝛿) (𝐸𝛼) (𝐹𝜀) (𝐺𝛽) (𝐴𝜑) (𝐵𝜒) (𝐶𝛾)
5 496 449 493 345 509 481 380
(𝐸𝜀) (𝐹𝛽) (𝐺𝜑) (𝐴𝜒) (𝐵𝛾) (𝐶𝛿) (𝐷𝛼)
6 534 421 352 427 346 478 397
(𝐹𝜑) (𝐺𝜒) (𝐴𝛾) (𝐵𝛿) (𝐶𝛼) (𝐷𝜀) (𝐸𝛽)
7 543 386 435 485 406 554 410
(𝐺𝛾) (𝐴𝛿) (𝐵𝛼) (𝐶𝜀) (𝐷𝛽) (𝐸𝜑) (𝐹𝜒)

a. Analice el experimento. ¿Qué factores tienen efecto en la producción de


leche?
b. Interprete los resultados usando gráficos de medias.
c. ¿Cómo puedes explicar la falta de efectos en vacas y periodos?
d. ¿Qué porcentajes de lisina y proteína dan mejores resultados?
e. Verifique los supuestos del modelo

a. Analice el experimento. ¿Qué factores tienen efecto en la producción


de leche?
 Ecuación del modelo
𝑦𝑖𝑗ℎ𝑙 = 𝑢 + 𝜏𝑖 + 𝛽𝑗 +𝛾ℎ + 𝛿𝑙 + 𝜀𝑖𝑗ℎ𝑙
𝑑𝑜𝑛𝑑𝑒:
𝑦𝑖𝑗ℎ𝑙 = 𝑃𝑟𝑜𝑑𝑢𝑐𝑐𝑖ó𝑜𝑛 𝑑𝑒 𝑙𝑒𝑐ℎ𝑒 (𝑔𝑎𝑙𝑜𝑛𝑒𝑠)
𝑢 = 𝑀𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙
𝜏𝑖 = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒𝑠 𝑑𝑒 𝑙𝑖𝑠𝑖𝑛𝑎
𝛿𝑙 = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒𝑠 𝑑𝑒 𝑝𝑟𝑜𝑡𝑒í𝑛𝑎
𝛽𝑗 = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑝𝑟𝑜𝑑𝑢𝑐𝑖𝑑𝑜 𝑝𝑜𝑟 𝑙𝑎𝑠 𝑣𝑎𝑐𝑎𝑠
𝛾ℎ = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑝𝑟𝑜𝑑𝑢𝑐𝑖𝑑𝑜 𝑝𝑜𝑟 𝑙𝑜𝑠 𝑝𝑒𝑟𝑖𝑜𝑑𝑜𝑠
𝜀𝑖𝑗ℎ𝑙 = 𝐸𝑟𝑟𝑜𝑟 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙

 Hipótesis estadísticas
 Con respecto a los tratamientos (Porcentaje de lisina)Cuadrado
latino
𝐻𝑜 : 𝜏1 = 𝜏2 = 𝜏3 = 𝜏4 = 𝜏5 = 𝜏6 = 𝜏7 = 0
Los porcentajes de lisina no influyen de manera significativa en
la producción de leche
𝐻1 : 𝜏𝑖 ≠ 0
Al menos un porcentaje de lisina influye de manera significativa
en la producción de leche

 Con respecto a las filas (Vaca)


𝐻𝑜 : 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 𝛽5 = 𝛽6 = 𝛽7 = 0
Las vacas no influyen de manera significativa en la producción
de leche

𝐻1 : 𝛽𝑗 ≠ 0
Al menos una vaca influye de manera significativa en la
producción de leche

 Con respecto a las columnas (Periodo)


𝐻𝑜 : 𝛾1 = 𝛾2 = 𝛾3 = 𝛾4 = 𝛾5 = 𝛾6 = 𝛾7 = 0
Los periodos no influyen de manera significativa en la
producción de leche

𝐻1 : 𝛾ℎ ≠ 0
Al menos un periodo influye de manera significativa en la
producción de leche

 Con respecto a los tratamientos (Porcentaje de proteína)


Cuadrado greco-latino
𝐻𝑜 : 𝛿1 = 𝛿2 = 𝛿3 = 𝛿4 = 𝛿5 = 𝛿6 = 𝛿7 = 0
Los porcentajes de proteína no influyen de manera significativa
en la producción de leche

𝐻1 : 𝛿ℎ ≠ 0
Al menos un porcentaje de proteína influye de manera
significativa en la producción de leche

 Cálculos
Fuente GL SC Sec. SC Ajust. CM Ajust. F P
Porcentaje de lisina 6 42783.6 42783.6 7130.6 7.23 0.000
Vaca 6 8754.4 8754.4 1459.1 1.48 0.227
Periodo 6 1761.0 1761.0 293.5 0.30 0.932
Porcentaje de proteína 6 145879.6 145879.6 24313.3 24.66 0.000
Error 24 23662.8 23662.8 985.9
Total 48 222841.3

 Establecemos conclusiones
 Con respecto a los tratamientos (Porcentaje de lisina)Cuadrado
latino
Como 𝑃 = 0.00 <∝=0.05 entonces se rechaza la Hipótesis nula
y se acepta la Hipótesis alternativa. Se concluye que al menos
un porcentaje de lisina influye de manera significativa en la
producción de leche
 Con respecto a las filas (Vaca)
Como 𝑃 = 0.227 >∝=0.05 entonces se acepta la Hipótesis nula
y se rechaza la Hipótesis alternativa. Se concluye que las
vacas no influyen de manera significativa en la producción de
leche

 Con respecto a las columnas (Periodo)


Como 𝑃 = 0.932 >∝=0.05 entonces se acepta la Hipótesis nula
y se rechaza la Hipótesis alternativa. Se concluye que los
periodos no influyen de manera significativa en la producción
de leche

 Con respecto a los tratamientos (Porcentaje de proteína)


Cuadrado greco-latino
Como 𝑃 = 0.00 <∝=0.05 entonces se rechaza la Hipótesis nula
y se acepta la Hipótesis alternativa. Se concluye que al menos
un porcentaje de proteína influye de manera significativa en la
producción de leche
b. Interprete los resultados usando gráficos de medias.

Gráfica de intervalos de Producción de leche


95% IC para la media
550

500
Producción de leche

450

400

350

300
A B C D E F G
Porcentaje de lisina

Gráfica de intervalos de Producción de leche


95% IC para la media

525

500
Producción de leche

475

450

425

400

375

350
1 2 3 4 5 6 7
Vaca
Gráfica de intervalos de Producción de leche
95% IC para la media
550

500
Producción de leche

450

400

350
1 2 3 4 5 6 7
Periodo

Gráfica de intervalos de Producción de leche


95% IC para la media
600

550
Producción de leche

500

450

400

350

300
a b c d e f g
Porcentaje de proteína

De las gráficas podemos concluir que los factores que tienen efecto en la
producción de leche son los porcentajes de lisina y proteína, puesto que no
todos sus intervalos se traslapan en la gráfica lo que quiere decir que
estadísticamente no son iguales en cuanto a la producción de leche.

c. ¿Cómo puedes explicar la falta de efectos en vacas y periodos?


Gráfica de caja de Producción de leche
600

550

Producción de leche
500

450

400

350

300
1 2 3 4 5 6 7
Vaca

Gráfica de caja de Producción de leche


600

550
Producción de leche

500

450

400

350

300
1 2 3 4 5 6 7
Periodo

Esto se puede explicar mediante el análisis de las gráficas, puesto que como
se puede observar, los diferentes niveles de los factores vaca y periodo
presentan una variabilidad casi homogénea en la producción de leche.
Además, en ambas gráficas los intervalos se traslapan, lo que
estadísticamente quiere decir que los niveles de los factores vacas y periodos
son iguales en cuanto a la producción de leche.

d. ¿Qué porcentajes de lisina y proteína dan mejores resultados?


Gráfica de caja de Producción de leche
600

550
Producción de leche

500

450

400

350

300
A B C D E F G
Porcentaje de lisina
De la gráfica podemos concluir que el porcentaje de lisina que da mejores
resultados es el porcentaje E, puesto que genera mayor producción de leche.
Gráfica de caja de Producción de leche
600

550
Producción de leche

500

450

400

350

300
a b c d e f g
Porcentaje de proteína

De la gráfica podemos concluir que el porcentaje de proteína que da mejores


resultados es el porcentaje g, puesto que genera mayor producción de leche

e. Verifique los supuestos del modelo

Gráfica de probabilidad de RESID1


Normal
99
Media 4.756286E-14
Desv .Est. 22.20
95 N 49
KS 0.064
90
Valor P >0.150
80
70
Porcentaje

60
50
40
30
20

10

1
-75 -50 -25 0 25 50
RESID1

𝐻𝑜 = Los residuos del experimento se ajustan a una distribución normal


𝐻1 = Los residuos del experimento no se ajustan a una distribución normal
Como 𝑝 = 0.150 > 𝛼 = 0.05 entonces se acepta la hipótesis nula y se rechaza
la hipótesis alternativa. Se concluye que los residuos del experimento se
ajustan a una distribución normal. Por lo tanto el modelo aplicado es idóneo.
vs. ajustes
(la respuesta es Producción de leche)

50

25
Residuo

-25

-50

-75
300 350 400 450 500 550 600
Valor ajustado

Podemos concluir que probablemente no se cumple el supuesto de varianza


constante, puesto que en la gráfica los residuos se ubican aleatoriamente
dentro de una banda horizontal, su dispersión vertical no es la misma a lo
largo del gráfico

vs. orden
(la respuesta es Producción de leche)

50

25
Residuo

-25

-50

-75
1 5 10 15 20 25 30 35 40 45
Orden de observación

EJEMPLO 2
El ingeniero encargado de una obra desea saber la importancia que tiene
utilizar el hormigón A, hormigón B, hormigón C, hormigón D y hormigón E.
después de unos exámenes sobre densidad, impermeabilidad, durabilidad,
resistencia térmica, docilidad; obtuvo la matriz de información basados en los
siguientes datos con un α= 0.05, se podría afirmar que existen diferencias en
su preparación.
Exámenes Uso
1 2 3 4 5
Densidad A B C 76 D E
92 88 73 65
Impermeabilidad B C D 72 E A
85 70 56 80
Durabilidad C D E 76 A B
67 70 85 89
Resistencia D E A 90 B C
térmica 67 65 84 78
Docilidad E A B 86 C D
72 90 76 73
383 383 400 374 385

1. Resultados al ingresar los datos al minitab

Análisis de varianza

Fuente DF Adj SS Adj MS F-Value P-Value


--TIPO DE HORMIGON 4 1747.60 436.90 21.24 0.000
TIPO DE EXAMEN 4 142.80 35.70 1.74 0.207
USO 4 70.80 17.70 0.86 0.515
Error 12 246.80 20.57
Total 24 2208.00

2. CONCLUCIONES:

 Como p-value para el tipo de hormigón = 0.000 ˂ 0.05, se RECHAZA H₀ y se


concluye que al menos un tipo de hormigón SI influye de manera significativa en
la importancia.
 Como p-value para el tipo de examen = 0.207 > 0.05, se ACEPTA H₀ y se concluye
que el tipo de examen NO influye de manera significativa en la importancia.
 Como p-value para el uso = 0.515 > 0.05, se ACEPTA H₀ y se concluye que el uso
NO influye de manera significativa en la importancia.
EJEMPLO 3
Un ingeniero desarrolla un experimento para comparar cinco procedimientos
de fabricación de ladrillo de concreto, en el cual usa material de cinco mezclas
preparadas cada una de ellas en cada uno de cinco días consecutivos y
preparados en cinco máquinas diferentes.
Días
Mezclas 1 2 3 4 5
1 𝐴𝛼 1 𝐵𝛾 0 𝐶𝜀 4 𝐷𝛽 0 𝐸𝛿 1
2 𝐵𝛽 3 𝐶𝛿 4 𝐷𝛼 1 𝐸𝛾 5 𝐴𝜀 3
3 𝐶𝛾 2 𝐷𝜀 5 𝐸𝛽 0 𝐴𝛿 0 𝐵𝛼 -1
4 𝐷𝛿 -1 𝐸𝛼 2 𝐴𝛾 1 𝐵𝜀 1 𝐶𝛽 4
5 𝐸𝜀 0 𝐴𝛽 1 𝐵𝛿 -3 𝐶𝛼 -3 𝐷𝛾 1
a. ¿Qué factores influyen en la fabricación de ladrillo de concreto?
b. Interprete gráficas de los factores procedimientos de fabricación y máquinas
c. Verifique el supuesto de normalidad

a. ¿Qué factores influyen en la fabricación de ladrillo de concreto?



Ecuación del modelo
𝑦𝑖𝑗ℎ𝑙 = 𝑢 + 𝜏𝑖 + 𝛽𝑗 +𝛾ℎ + 𝛿𝑙 + 𝜀𝑖𝑗ℎ𝑙
𝑑𝑜𝑛𝑑𝑒:
𝑦𝑖𝑗ℎ𝑙 = 𝐹𝑎𝑏𝑟𝑖𝑐𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎𝑑𝑟𝑖𝑙𝑙𝑜 𝑑𝑒 𝑐𝑜𝑛𝑐𝑟𝑒𝑡𝑜
𝑢 = 𝑀𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙
𝜏𝑖 = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑝𝑟𝑜𝑑𝑒𝑐𝑖𝑚𝑖𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑓𝑎𝑏𝑟𝑖𝑐𝑎𝑐𝑖ó𝑛
𝛿𝑙 = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎𝑠 𝑚á𝑞𝑢𝑖𝑛𝑎𝑠
𝛽𝑗 = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑝𝑟𝑜𝑑𝑢𝑐𝑖𝑑𝑜 𝑝𝑜𝑟 𝑙𝑎𝑠 𝑚𝑒𝑧𝑐𝑙𝑎𝑠
𝛾ℎ = 𝐸𝑓𝑒𝑐𝑡𝑜 𝑝𝑟𝑜𝑑𝑢𝑐𝑖𝑑𝑜 𝑝𝑜𝑟 𝑙𝑜𝑠 𝑑í𝑎𝑠
𝜀𝑖𝑗ℎ𝑙 = 𝐸𝑟𝑟𝑜𝑟 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑎𝑙

 Hipótesis estadísticas
 Con respecto a los tratamientos (Procedimientos de
fabricación) Cuadrado latino
𝐻𝑜 : 𝜏1 = 𝜏2 = 𝜏3 = 𝜏4 = 𝜏5 = 0
Los procedimientos de fabricación no influyen de manera
significativa en la fabricación de ladrillo de concreto
𝐻1 : 𝜏𝑖 ≠ 0
Al menos un procedimiento de fabricación influye de manera
significativa en la fabricación de ladrillo de concreto

 Con respecto a las filas (Mezclas)


𝐻𝑜 : 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 𝛽5 = 0
Las mezclas no influyen de manera significativa en la
fabricación de ladrillo de concreto

𝐻1 : 𝛽𝑗 ≠ 0
Al menos una mezcla influye de manera significativa en la
fabricación de ladrillo de concreto

 Con respecto a las columnas (Días)


𝐻𝑜 : 𝛾1 = 𝛾2 = 𝛾3 = 𝛾4 = 𝛾5 = 0
Los días no influyen de manera significativa en la fabricación
de ladrillo de concreto

𝐻1 : 𝛾ℎ ≠ 0
Al menos un día influye de manera significativa en la
fabricación de ladrillo de concreto

 Con respecto a los tratamientos (máquinas) Cuadrado greco-


latino
𝐻𝑜 : 𝛿1 = 𝛿2 = 𝛿3 = 𝛿4 = 𝛿5 = 0
Las máquinas no influyen de manera significativa en la
fabricación de ladrillo de concreto

𝐻1 : 𝛿ℎ ≠ 0
Al menos una máquina influye de manera significativa en la
fabricación de ladrillo de concreto

 Cálculos
Fuente GL SC Sec. SC Ajust. CM Ajust. F P
Procedimientos de fabricación 4 12.960 12.164 3.041 0.98 0.471
Mezclas 4 40.160 41.318 10.330 3.32 0.070
Días 4 11.760 10.964 2.741 0.88 0.517
Máquinas 4 22.767 22.767 5.692 1.83 0.217
Error 8 24.912 24.912 3.114
Total 24 112.560

 Establecemos conclusiones
 Con respecto a los tratamientos (Procedimientos de
fabricación)Cuadrado latino
Como 𝑃 = 0.471 >∝=0.05 entonces se acepta la Hipótesis nula
y se rechaza la Hipótesis alternativa. Se concluye que los
procedimientos de fabricación no influyen de manera
significativa en la fabricación de ladrillo de concreto
 Con respecto a las filas (Mezclas)
Como 𝑃 = 0.070 >∝=0.05 entonces se acepta la Hipótesis nula
y se rechaza la Hipótesis alternativa. Se concluye que las
mezclas no influyen de manera significativa en la fabricación
de ladrillo de concreto

 Con respecto a las columnas (Días)


Como 𝑃 = 0.517 >∝=0.05 entonces se acepta la Hipótesis nula
y se rechaza la Hipótesis alternativa. Se concluye que los días
no influyen de manera significativa en la fabricación de ladrillo
de concreto
 Con respecto a los tratamientos (Máquinas) Cuadrado greco-
latino
Como 𝑃 = 0.217 >∝=0.05 entonces se acepta la Hipótesis nula
y se rechaza la Hipótesis alternativa. Se concluye que las
máquinas no influyen de manera significativa en la fabricación
de ladrillo de concreto
b. Interprete gráficas de los factores procedimientos de fabricación y
máquinas
Gráfica de caja de Ladrillo de concreto

3
Ladrillo de concreto

-1

-2

-3

-4
A B C D E
Procedimientos de fabricación

De la gráfica podemos concluir que el procedimiento de fabricación A existe


menor variabilidad o dispersión de sus datos.

Gráfica de intervalos de Ladrillo de concreto


95% IC para la media

4
Ladrillo de concreto

-2

-4
A B C D E
Procedimientos de fabricación

De la gráfica podemos concluir que como los intervalos se traslapan,


entonces estadísticamente los procedimientos de fabricación son iguales
Gráfica de caja de Ladrillo de concreto

3
Ladrillo de concreto
2

-1

-2

-3

-4
a b c d e
Máquinas

De la gráfica podemos concluir que la máquina d existe mayor variabilidad o


dispersión de sus datos
Gráfica de intervalos de Ladrillo de concreto
95% IC para la media
5.0

2.5
Ladrillo de concreto

0.0

-2.5

-5.0
a b c d e
Máquinas

De la gráfica podemos concluir que como los intervalos se traslapan quiere


decir estadísticamente que la fabricación de ladrillo de concreto en las
máquinas es igual.

c. Verifique el supuesto de normalidad


Gráfica de probabilidad de RESID1
Normal
99
Media 3.641532E-16
Desv .Est. 1.019
95 N 25
KS 0.118
90
Valor P >0.150
80
70
Porcentaje

60
50
40
30
20

10

1
-3 -2 -1 0 1 2 3
RESID1
𝐻𝑜 = Los residuos del experimento se ajustan a una distribución normal
𝐻1 = Los residuos del experimento no se ajustan a una distribución normal
Como 𝑝 = 0.150 > 𝛼 = 0.05 entonces se acepta la hipótesis nula y se rechaza
la hipótesis alternativa. Se concluye que los residuos del experimento se
ajustan a una distribución normal. Por lo tanto el modelo aplicado es idóneo.

EJEMPLO 3
Una compañía distribuidora ubicada en los suburbios está interesada en
estudiar la diferencia en costos (tiempo y gasolina) entre las cuatro rutas A, B, C
y D que llevan a la zona comercial. Deciden correr un experimento en cuadro
grecolatino controlando los factores de bloque chofer, marca de vehículo (a, b,
c y d) y día de la semana. El experimento se realiza en dos semanas diferentes,
en los cuales no hay días festivos y quincenas. Los costos observados se
observa en la siguiente tabla:

Chofer/Día Lunes Martes Miércoles Jueves


Carlos 825(D,a) 585(C,c) 550(B,b) 580(A,d)
Enrique 650(A,c) 540(B,a) 580(C,d) 850(D,b)
Genaro 700(C,b) 650(D,d) 635(A,a) 450(B,c)
Luis 475(B,d) 560(A,b) 650(D,c) 670(C,a)

a) Haga el análisis de varianza de este experimento.


Use   0.05

Modelo:
yij = μ +  j +  j +  h +  l +Ɛij
Las hipótesis a probar son:
I) Con respecto a las rutas (tratamientos):

H o  1   2  ...   b  0 )
H1   i  0
II) Con respecto a los choferes (filas):

H o  1  2  ...  b  0
H1   j  0

III) Con respecto a los días (columnas):

H o :  1  ... k  0
H1 :  h  0
IV) Con respecto a la marca de los vehículos (tratamientos):

H o : 1  ... k  0
H1 :  h  0

Cálculo:
Se realizan los cálculos para obtener las estimaciones en la tabla ANOVA; es decir: El
ANOVA resultante se muestra en la siguiente tabla:

Fuente de Grados de Suma de Suma de Distribución F


variación libertad cuadrados cuadrados Fc
medios
Tratamientos 3 116769 38922.8 47.06
Filas 3 10156 3385.4 4.09
Columnas 3 14706 4902.1 5.93
Tratamientos 3 31831 10610.4 12.83
Error/Residual 3 2481 827.1
TOTAL 15 175944

F (0.05, 3,3)= 9.27 y F  47.06

F (0.05, 3,3)= 9.27 y F  4.09

F (0.05, 3,3)= 9.27 y F  5.93

F (0.05, 3,3)= 9.27 y F  12.83

 Como F >F (0.05, 3,3), entonces se rechaza H0 y se concluye que a un 95% de


confianza que las rutas influye de manera significativa en los costos.
 Como F < F (0.05, 3,3), entonces se acepta H0 y se concluye que a un 95% de
confianza que los choferes no influye de manera significativa en los costos.
 Como F < F (0.05, 3,3), entonces se acepta H0 y se concluye que a un 95% de
confianza que los días no influye de manera significativa en los costos.
 Como F >F (0.05, 3,3), entonces se rechaza H0 y se concluye que a un 95% de
confianza que las marcas de automóviles influye de manera significativa en
los costos.

EN MINITAB

 Como p- value para las rutas = 0.005<0.05, Se rechaza H0 y se concluye


que las rutas influye de manera significativa en los costos.
 Como p- value para los choferes = 0.139>0.05, Se acepta H0 y se concluye
que los choferes no influye de manera significativa en los costos.
 Como p- value para los días = 0.089>0.05, Se acepta H0 y se concluye que
los días no influye de manera significativa en los precios.
 Como p-value para la marca = 0.032<0.05, se rechaza H0 y se concluye
que las marcas influye de manera significativa en los precios.

Você também pode gostar