Escolar Documentos
Profissional Documentos
Cultura Documentos
TUMBES
TEMA:
ANALISIS DE VARIANZA DE DOS
FACTORES O DOS VIAS
ASIGNATURA:
ESTADISTICA APLICADA
DOCENTE:
CASTAÑEDA GUZMAN WALTER
INTEGRANTE:
CARRILLO URBINA MILTON
CHUQUIHUANGA OCAMPOS KEIKO
ESPINOZA ALBURQUEQUE ERICK
IMAN PEÑA ANGIE
LOPEZ SILVA MIKSY
CICLO:
V
TUMBES - PERU
INDICE
INTRODUCCION………………………………………………………………………3
EJEMPLO………………………………………………………………………………8
EJEMPLO……………………………………………………………………………..13
EJERCICIOS PROPUESTOS………………………………………………………17
BIBLIOGRAFIA……………………………………………………………………….34
2
INTRODUCCION
Hasta ahora se ha visto el modelo de análisis de la varianza con un factor que
es una variable cualitativa cuyas categorías sirven para clasificar las medidas
de otra variable cuantitativa en grupos cuyas medias se desea comparar. Así,
podremos comparar el peso medio de aves agrupándolas por especies, la
variable de clasificación o factor es la especie y la variable dependiente es el
peso. En el tema actual se ampliará el modelo para incluir dos factores en lugar
de uno solo. Por ejemplo, cuando se pretenda comparar el peso medio de aves
agrupándolas por especie y por sexo.
3
ANALISIS DE VARIANZA DE DOS FACTORES O DOS VIAS
Factor fijo: Los niveles incluidos en el experimento son los únicos relevantes
para la investigación. Por ejemplo, extracción con bueyes, chapulín y tractor de
orugas; medición de diámetros con forcípula y cinta diamétrica; medición de pH
con dos instrumentos.
Las combinaciones de los dos tipos de factores brindan los siguientes modelos
de ANDEVA:
4
Una observación individual se representa como:
𝒀𝒊𝒋𝒌 𝒊 = 𝟏, …𝒂 𝒋 = 𝟏, … 𝒃 𝒌 = 𝟏, … 𝒏
El primer subíndice indica el nivel del primer factor, el segundo el nivel del
segundo factor y el tercero la observación dentro de la muestra. Los factores
pueden ser ambos de efectos fijos (se habla entonces de modelo I), de efectos
aleatorios (modelo II) o uno de efectos fijos y el otro de efectos
aleatorios (modelo mixto). El modelo matemático de este análisis es:
Dónde:
𝛍 Es la media global,
5
A las condiciones de muestreo aleatorio, normalidad e independencia, este
modelo añade la de aditividad de los efectos de los factores.
La tabla de análisis de varianza de dos vías con una observación por celda al
igual que en el análisis de varianza de una vía, el objetivo del diseño es repartir
la varianza total, en tres componentes: efecto de filas (tratamiento 1), columnas
(tratamiento 2) y error. Los supuestos del análisis son los mismos que para el
diseño de una vía, a saber: errores independientes; con una distribución
normal, varianzas homogéneas y aditividad en los efectos principales.
El modelo lineal que describe la relación entre los componentes del diseño es:
En donde:
PASOS:
6
Hipótesis:
Ho: Hipótesis Nula
H1: Hipótesis Alternativa
Nivel de significancia:
∝ =?
Estadísticas:
𝑇2
FACTOR: 𝐶 = 𝑟𝑥𝑘
GRAFICO:
𝐹𝐶
𝐶𝑀𝐶
=
𝐶𝑀𝐸
CONCLUSIÓN:
• Decisión
• Interpretación.
7
EJEMPLO:
Suponga que usted haya experimentado con levadura para una receta de
panes dulces. Parece ser que la cantidad de azúcar y la temperatura del
agua afectan el tamaño de los panes. Basándose en los siguientes datos,
usted realiza un análisis de varianza para averiguar lo que es significativo
de estas recetas (utilizar α=0.05).
SOLUCION:
• HIPOTESIS:
HIPOTESIS PARA LAS COLUMNAS
Ho: La temperatura de agua afecta el tamaño de los panes de manera igual.
H1: La temperatura de agua afecta el tamaño de los panes de manera
diferente.
• NIVEL DE SIGNIFICANCIA:
α = 0.05
8
Levadura: Tamaño de los panes dulces Sumas x
Agua Agua Agua
Fría Tibia Caliente
Poco Azúcar 75 87 60 222 74
Azúcar Normal 74 82 55 211 70.33
Mucho Azúcar 70 79 53 202 67.33
Sumas 219 248 168 T = 635
x 73 82.67 56 X = 70.56
• GLOBAL:
T = 635 T2 = 403225 N=9
2
ƩƩ𝑋𝑖𝑗 =752 + 742 +… + 552 + 532 = 45969
𝑇2 403225
C= = = 44802.78
𝑁 9
• 𝑆𝐶𝑇 = ƩƩ𝑋𝑖𝑗2 − 𝐶
SCT = 45969 – 44802.78
SCT = 1166.22
1
• 𝑆𝐶𝐶 = 𝑟 Ʃ𝑘 𝑇𝑖2 − 𝑐
2192 + 2482 +1682
𝑆𝐶𝐶 = − 44802.78
3
SCC= 𝟏𝟎𝟗𝟑. 𝟓𝟓
1
• 𝑆𝐶𝐹 = 𝐾 ∑𝑖𝑗=𝑖 𝑇𝐽2 − 𝐶
2222 + 2112 +2022
𝑆𝐶𝐹 = − 44802.78
3
SCF = 66.87
9
CUADRO DE ANOVA
ANOVA
Origen de Suma de Grados Promedio F Valor
Variaciones Cuadrados Libertad Cuadrados Crítico
Columnas 1093.55 2 546.78 377.09 6.94
Filas 66.87 2 33.44 23.06 6.94
Error 5.8 4 1.45
Total 1166.22 8
• CONCLUSION:
• Para el caso del agua que son las columnas:
Decisión: Dado que Fo> Ft , no se rechaza la Ho
Interpretación: Se puede concluir que no existe diferencia significativa en
el tamaño de los panes respecto a la temperatura del agua.
10
ANDEVA DE DOS VÍAS CON MAS DE UNA OBSERVACIÓN POR
CELDA
PASOS:
Las hipótesis
11
Para calcular las sumas des cuadrados se ejecutan las siguientes
equivalencias
GRAFICO:
CONCLUSIÓN:
• Decisión
• Interpretación
12
EJEMPLO:
La empresa P&C realiza una investigación para determinar si el rendimiento de
sus empleados está influenciado por el nivel de capacitación y el turno de
trabajo. Para realizar este estudio, se diseñó un experimento de dos factores: el
factor A: capacitación del personal con tres niveles, 𝐴1 = Buena𝐴2 =
Regular𝐴3 = Ninguna y el factor B: turno de trabajo con tres niveles, 𝐵1 =
Mañana𝐵2 = Tarde𝐵3 = Noche. En cada combinación de los niveles de
capacitación y de turno, se midieron los rendimientos de 4 empleados
(replicas).
En la medición de los rendimientos se utilizó un procedimiento cuyos resultados
son tiempos en minutos, indicando que a menor tiempo mayor rendimiento. Los
tiempos de rendimientos observados se dan en la tabla:
13
Solución:
La variable respuesta o dependiente es X= rendimientos de los
empleados en minutos
14
𝐻1 = Algunos de estos promedios de los rendimientos de los
trabajadores en minutos de las diferentes capacitaciones en los
diferentes turnos son diferentes.
Para la interacción:
Tabla ANOVA
(𝑋… )2 (223)2
𝐶= = = 1381.361
𝑎𝑏𝑛 3𝑥3𝑥4
3 3 4
2
𝑆𝐶𝑇 = ∑ ∑ ∑(𝑋𝑖𝑗𝑘 ) − 𝐶 = (4)2 + (5)2 + ⋯ + (6)2 + (7)2 − 1381.361
𝐼=1 𝐽=! 𝑘=1
𝑆𝐶𝑇 = 37.639
3
1 1
𝑆𝐶𝐴 = ∑(𝑋𝑖.. )2 − 𝐶 = (65)2 + (76)2 + (82)2 − 1381.361 = 12.389
3𝑥4 12
𝑖=!
3
1 1
𝑆𝐶𝐵 = ∑(𝑋.𝑗. )2 − 𝐶 = (71)2 + (77)2 + (75)2 − 1381.361 = 1.556
3𝑥4 12
𝑖=!
2
(𝑋 )
𝑆𝐶𝐴𝐵 = ∑3𝐼=1 ∑3𝑗=! 𝑖𝑗. − (𝐶 + 𝑆𝐶𝐴 + 𝑆𝐶𝐵)
𝑛
15
Región critica
Para los turnos:
𝑅𝐶 = 𝐹0.95 (2.27)⦌ = 3.35
Para la interacción:
𝑅𝐶 = 𝐹0.95 (4.27)⦌ = 2.73
Conclusión:
Para la interacción:
Decisión: dado que 𝐹𝐴𝑥𝐵 = 0.129 < 2.73 aceptamos la hipótesis nula
Interpretación: con el 95% de confianza se concluye que si existe
interacción entre los turnos y en las capacitaciones.
16
EJERCICIOS PROPUESTOS
PROBLEMA N° 1:
Un comerciante de automóviles realiza una prueba para determinar si la
cantidad de tiempo en minutos que necesita para una afinación de motor
depende de si se emplea un analizador computarizado o un analizador
electrónico.
ANALIZADOR
COMPUTARIZADO ELECTRONICO
COMPACTO 50 42
AUTOMOVIL MEDIANO 55 44
GRANDE 63 46
Use α= 0.05 y realice una prueba para determinar si existe una diferencia
significativa entre los tratamientos.
SOLUCION:
1. OBTENCION DE MEDIAS
17
Media del analizador computarizado:
50+55+63 = 168
168
= 56
3
Media global
50+55+63+42+44+46 = 300
300
= 50
6
18
3. TABLA DE ANOVA
PRUEBA DE VALOR:
VALOR-p <∝
0.045331 > 0.05
Se rechaza la hipotesis H0, nos indica que las medias son iguales.
5. CONCLUSION:
Se concluye que en base al analis realizado para este problema en
particular,se concluye que no importa el tipo de analizador, ya sea
computarizado o electronico, que se use para realizar una afinacion en un
auto, este no afectara los minutos correspondientes al proceso.
19
PROBLEMA N° 2:
Suponiendo que se quiere investigar si la producción de tres diferentes
máquinas es igual, tomando en cuenta la experiencia de los operadores a un
nivel de significancia del 5%.
Experiencia Máquinas
En años Maq 1 Maq 2 Maq 3
1 27 21 25
2 31 33 35
3 42 39 39
4 38 41 37
5 45 46 45
Solución:
• HIPOTESIS:
HIPOTESIS PARA LAS COLUMNAS
Ho: El promedio de producción de las maquinas son iguales.
H1: El promedio de producción de las maquinas difiere en al menos una.
• NIVEL DE SIGNIFICANCIA:
α = 0.05
20
Experiencia Máquinas
1 27 21 25 73 24.33
2 31 33 35 99 33
3 42 39 39 120 40
4 38 41 37 116 38.67
5 45 46 45 136 45.33
• GLOBAL:
T = 544 T2 = 295936 N = 15
2
ƩƩ𝑋𝑖𝑗 =272 + 312 +… + 372 + 452 = 20536
𝑇2 295936
C= = = 19729.07
𝑁 15
• 𝑆𝐶𝑇 = ƩƩ𝑋𝑖𝑗2 − 𝐶
SCT = 20536 – 19729.07
SCT = 806.93
1
• 𝑆𝐶𝐶 = 𝑟 Ʃ𝑘 𝑇𝑖2 − 𝑐
1832 + 1802 +1812
𝑆𝐶𝐶 = − 19729.07
5
SCC = 0.93
1
• 𝑆𝐶𝐹 = 𝐾 ∑𝑖𝑗=𝑖 𝑇𝐽2 − 𝐶
732 + 992 +1202 +1162 +1362
𝑆𝐶𝐹 = − 19729.07
3
SCF = 764.93
CONCLUSION:
PROBLEMA N° 3:
22
Una academia de futbol realiza una investigación para determinar si el
rendimiento de sus deportistas está influenciado por su alimentación y por la
cantidad de horas de entrenamiento diarias. Para realizar el estudio, se
considera: el factor A: alimentación con tres niveles, A1 = Buena A2 = Regular
A3 = Mala y el factor B: horas de entrenamiento, B1 = 2 horas B2 = 4 horas B3
= 6 horas. En cada combinación de los niveles de alimentación y de horas de
entrenamiento, se midieron los rendimientos de 4 deportistas. En la medición
de los rendimientos se realizó una competencia individual cuyos resultados son
tiempos en minutos, indicando que a menor tiempo mayor rendimiento. Los
tiempos de rendimientos observados se dan en la tabla:
Al nivel de significancia =0.05 ¿existe interacción entre los niveles de los
factores capacitación y turnos de trabajo?
A = ALIMENTACION
B = HORAS A1 A2 A3
10 12 15 11 12 11
B1
8 16 10 13 12 14
11 9 11 12 14 16
B2
13 14 10 14 11 16
14 15 9 12 12 9
B3
10 9 11 10 9 11
HIPOTESIS:
Para las horas de entrenamiento:
Para la alimentación:
23
𝐻0 = El promedio de los rendimientos de los deportistas en minutos de
la diferente alimentación en las diferentes horas de entrenamiento es
igual.
Para la interacción:
Calculamos variables:
24
(𝑋… )2 (426)2
𝐶= = = 5041
𝑎𝑏𝑛 3𝑥3𝑥4
3 3 4
2
𝑆𝐶𝑇 = ∑ ∑ ∑(𝑋𝑖𝑗𝑘 ) − 𝐶 = (10)2 + (8)2 + ⋯ + (9)2 + (11)2 − 5041
𝐼=1 𝐽=! 𝑘=1
𝑆𝐶𝑇 = 175
3
1 1
𝑆𝐶𝐴 = ∑(𝑋𝑖.. )2 − 𝐶 = [(141)2 + (138)2 + (147)2 − 5041 = 3.5
3𝑥4 12
𝑖=!
3
1 1
𝑆𝐶𝐵 = ∑(𝑋.𝑗. )2 − 𝐶 = [(144)2 + (151)2 + (131)2 − 5041 = 17.17
3𝑥4 12
𝑖=!
3 3 2
(𝑋𝑖𝑗. )
𝑆𝐶𝐴𝐵 = ∑ ∑ − (𝐶 + 𝑆𝐶𝐴 + 𝑆𝐶𝐵)
𝑛
𝐼=1 𝑗=!
𝑆𝐶𝐴𝐵 = 21.83
FV SC GL CM F F(0.05)
A = alimentación 3.5 2 1.75 0.36 3.35
B = horas de 17.17 2 8.59 1.75 3.35
entrenamiento
Interacción 21.83 4 5.46 1.11 2.73
Error 132.5 27 4.91
Total 175 35
Conclusión:
25
Para las horas de entrenamiento:
Para la alimentación:
Para la interacción:
PROBLEMA N° 4:
26
En unos laboratorios se está estudiando los factores que influyen en la
resistencia de un tipo particular de fibra. Se eligen al azar cuatro máquinas y
tres operarios y se realiza un experimento factorial usando fibras de un mismo
lote de producción. Los resultados obtenidos se muestran en la tabla adjunta.
Analizar los resultados y obtener las conclusiones apropiadas.
A= MÀQUINAS
B= OPERARIOS A B C D
HIPOTESIS:
Para los operarios:
Para la interacción:
27
𝐻0 = Si existe interacción entre los operarios y las máquinas.
Calculamos variables:
28
Tabla ANOVA:
(𝑋… )2 (2695)2
𝐶= = = 302626.04
𝑎𝑏𝑛 3𝑥2𝑥4
3 3 4
2
𝑆𝐶𝑇 = ∑ ∑ ∑(𝑋𝑖𝑗𝑘 ) − 𝐶 = (109)2 + (110)2 + ⋯ + (117)2 − 302626.04
𝐼=1 𝐽=! 𝑘=1
𝑆𝐶𝑇 = 262,97
3
1 1
𝑆𝐶𝐴 = ∑(𝑋𝑖.. )2 − 𝐶 = [(879)2 + (889)2 + (927)2 − 302626.04 = 12.46
3𝑥2 6
𝑖=!
3
1 1
𝑆𝐶𝐵 = ∑(𝑋.𝑗. )2 − 𝐶 = [(671)2 + (673)2 + (670)2 + (681)2 − 302626.04
4𝑥2 8
𝑖=!
𝑆𝐶𝐵 = 160.33
3 3 2
(𝑋𝑖𝑗. )
𝑆𝐶𝐴𝐵 = ∑ ∑ − (𝐶 + 𝑆𝐶𝐴 + 𝑆𝐶𝐵)
𝑛
𝐼=1 𝑗=!
𝑆𝐶𝐴𝐵 = 44.67
FV SC GL CM F F(0.05)
29
A = máquinas 12.46 3 4.15 1.10 3.49
B = operarios 160.34 2 80.17 21.14 3.89
Interacción 44.67 6 7.45 1.96 3.00
Error 45.50 12 3.79
Total 262.97 23
Conclusión:
Para la interacción:
30
PROBLEMA N° 5:
Suponiendo que se quiere investigar si la producción de tres diferentes
empresas es igual, tomando en cuenta la experiencia de los empleados a un
nivel de significancia del 5%.
Experiencia EMPRESAS
En años Emp1 Emp2 Emp3
1 29 23 27
2 33 35 37
3 44 41 41
4 40 43 39
5 47 48 47
Solución:
• HIPOTESIS:
HIPOTESIS PARA LAS COLUMNAS
Ho: El promedio de producción de las empresas son iguales.
H1: El promedio de producción de las empresas difiere en al menos una.
• NIVEL DE SIGNIFICANCIA:
α = 0.05
31
Experiencia EMPRESAS
1 29 25 28 82 27.33
2 35 36 39 110 36.67
3 44 41 41 126 42
4 40 43 42 125 41.67
5 47 49 47 143 47.67
• GLOBAL:
T = 586 T2 = 343396 N = 15
2
ƩƩ𝑋𝑖𝑗 =292 + 352 +… + 422 + 472 = 23622
𝑇2 343396
C= = = 22893.07
𝑁 15
• 𝑆𝐶𝑇 = ƩƩ𝑋𝑖𝑗2 − 𝐶
SCT = 23622– 22893.07
SCT = 728.93
1
• 𝑆𝐶𝐶 = 𝑟 Ʃ𝑘 𝑇𝑖2 − 𝑐
1952 + 1942 +1972
𝑆𝐶𝐶 = − 22893.07
5
SCC = 0.93
1
• 𝑆𝐶𝐹 = 𝐾 ∑𝑖𝑗=𝑖 𝑇𝐽2 − 𝐶
822 + 1102 +1262 +1252 +1432
𝑆𝐶𝐹 = − 22893.07
3
SCF = 698.26
32
• 𝑆𝐶𝐸 = 𝑆𝐶𝑇 − (𝑆𝐶𝐶 + 𝑆𝐶𝐹)
SCE = 728.93 – (0.93+ 698.26) = 29.74
TABLA ANOVA
ANOVA
Origen de Suma de Grados Cuadrados F Valor
Variaciones Cuadrados Libertad Medios Crítico
Columnas 0.93 2 0.465 0.47 4.46
CONCLUSION:
33
BIBLIOGRAFIA
34