Escolar Documentos
Profissional Documentos
Cultura Documentos
El análisis de varianza
Universidad de Córdoba
Montería – 2015
1 Análisis de varianza
Introducción
Hipótesis que se prueba con el ANOVA
Ejemplos
Contenido
1 Análisis de varianza
Introducción
Hipótesis que se prueba con el ANOVA
Ejemplos
Introducción
Ejemplo
Porcentaje Observaciones
de algodón 1 2 3 4 5
15 7 7 15 11 9
20 12 17 12 18 18
25 14 18 18 19 19
30 19 25 22 19 23
35 7 10 11 15 11
Boxplots
25
20
y
15
10
15 20 25 30 35
Trat
Morales & Morales ANOVA Noviembre de 2015 6 / 55
Análisis de varianza Introducción
Experimento unifactorial
Análisis de varianza
X
El análisis de varianza (ANOVA) es la herramienta diseñada para
probar la hipótesis si las medias de dos o mas poblaciones son
iguales.
Análisis de varianza
X
El análisis de varianza (ANOVA) es la herramienta diseñada para
probar la hipótesis si las medias de dos o mas poblaciones son
iguales.
Efectos fijo
Cuando se seleccionan los a tratamientos de manera específica.
1 Se desea probar hipótesis sobre las medias de tratamientos.
2 También se puede desear comparar los efectos de los
tratamientos.
3 Las conclusiones no pueden extenderse a tratamientos similares
que no fueron considerados.
4 Esto se conoce como modelo de efectos fijos.
Efectos aleatorios
Cuando se seleccionan los a tratamientos de una población grade de
posibles tratamientos.
1 Se desea estar en posibilidad de extender las conclusiones a
todos los tratamientos contenidos en la población hayan sido o no
considerados en el experimento.
2 Los efectos de tratamientos τi son variables aleatorias.
3 Se desea probar hipótesis sobre la variabilidad de los τi y se
intenta estimar esta variabilidad.
4 Esto se conoce como modelo de efectos aleatorios o de
componentes de varianza.
X
El interés recae en probar la igualdad de las medias de los a
tratamientos
H0 : µ1 = µ2 = · · · = µa
versus
H1 : µi 6= µj Para algún par i, j con i 6= j
H0 : τ1 = τ2 = · · · = τa = 0
versus
H1 : τi 6= 0 al menos para una i
Definiciones
1 Total de las observaciones bajo el i−ésimo tratamiento: yi·
2 Promedio de las observaciones bajo el i−ésimo tratamiento: y i·
3 Total de todas las observaciones: y··
4 Promedio de todas las observaciones: y ··
5 Lo anterior expresado en forma matemática
n
X
yi· = yij y i· = yi· /n
j=1
Xa X n
y·· = yij y ·· = y·· /N
i=1 j=1
a X
X n a
X a X
X n
(yij − y ·· )2 = n (y i· − y ·· )2 + (yij − y i· )2
i=1 j=1 i=1 i=1 j=1
Pa Pn 2
i=1 j=1 (yij − y ·· ) = Suma de cuadrados total.
SST rat = n ai=1 (y i· − y ·· )2 = Suma de cuadrados de
P
los
tratamientos
Pa Pn 2
i=1 j=1 (yij − y i· ) = Suma de cuadrados del error
E(SST rat )
El valor esperado de la suma de cuadrados de tratamientos es
a
X
E(SST rat ) = (a − 1)σ 2 + n τi2
i=1
n ai=1 τi2
P
SST rat
E = σ2 +
a−1 a−1
E(SSE )
El valor esperado de la suma de cuadrados del error es
an − 1 = (a − 1) + a(n − 1)
Estadístico F
CMT rat
F0 =
CME
F0 > Fα,a−1,a(n−1)
Fórmulas computacionales
a X
n
X
2 y··2
SCT = yij −
N
i=1 j=1
a
X y··2
SCT rat = yi·2 −
N
i=1
SCE = SCT − SCT rat
Ejemplo: Continuación
1 Gran media: y ·· = 15.04
2 Medias de cada tratamiento y 1· = 9.8, y 2· = 15.4, y 3· = 17.6,
y 4· = 21.6, y 5· = 10.8.
3 Varianza muestral s2 = 26.54.
4 Suma de cuadrados total SCT = (N − 1)s2 = 24 × 26.54 = 636.96
5 Suma de cuadrados de tratamientos
Ejemplo: Continuación
1 Gran media: y ·· = 15.04
2 Medias de cada tratamiento y 1· = 9.8, y 2· = 15.4, y 3· = 17.6,
y 4· = 21.6, y 5· = 10.8.
3 Varianza muestral s2 = 26.54.
4 Suma de cuadrados total SCT = (N − 1)s2 = 24 × 26.54 = 636.96
5 Suma de cuadrados de tratamientos
Ejemplo: Continuación
1 Gran media: y ·· = 15.04
2 Medias de cada tratamiento y 1· = 9.8, y 2· = 15.4, y 3· = 17.6,
y 4· = 21.6, y 5· = 10.8.
3 Varianza muestral s2 = 26.54.
4 Suma de cuadrados total SCT = (N − 1)s2 = 24 × 26.54 = 636.96
5 Suma de cuadrados de tratamientos
Ejemplo: Continuación
1 Gran media: y ·· = 15.04
2 Medias de cada tratamiento y 1· = 9.8, y 2· = 15.4, y 3· = 17.6,
y 4· = 21.6, y 5· = 10.8.
3 Varianza muestral s2 = 26.54.
4 Suma de cuadrados total SCT = (N − 1)s2 = 24 × 26.54 = 636.96
5 Suma de cuadrados de tratamientos
Ejemplo: Continuación
1 Gran media: y ·· = 15.04
2 Medias de cada tratamiento y 1· = 9.8, y 2· = 15.4, y 3· = 17.6,
y 4· = 21.6, y 5· = 10.8.
3 Varianza muestral s2 = 26.54.
4 Suma de cuadrados total SCT = (N − 1)s2 = 24 × 26.54 = 636.96
5 Suma de cuadrados de tratamientos
Ejemplo: Continuación
1 Gran media: y ·· = 15.04
2 Medias de cada tratamiento y 1· = 9.8, y 2· = 15.4, y 3· = 17.6,
y 4· = 21.6, y 5· = 10.8.
3 Varianza muestral s2 = 26.54.
4 Suma de cuadrados total SCT = (N − 1)s2 = 24 × 26.54 = 636.96
5 Suma de cuadrados de tratamientos
Trat<-rep(c(15,20,25,30,35),each=5)
Trat<-factor(Trat)
y<-c(7,7,15,11,9,12,17,12,18,18,14,18,18,
19,19,19,25,22,19,23,7,10,11,15,11)
datos<-data.frame(Trat=Trat,y=y)
mod<-lm(y~Trat)
anova(mod)
Emulsión
Tabla 1 2 3 4
1 79 69 83 75
2 82 52 79 78
3 57 62 85 78
4 79 61 78 73
5 83 60 75 71
Ejercicio 1, solución
1 Gran media: y ·· = 72.95
2 Medias de cada tratamiento (emulsión) y 1· = 76, y 2· = 60.8,
y 3· = 80, y 4· = 75.
3 Varianza muestral s2 = 92.99737.
4 Suma de cuadrados total
SCT = (N − 1)s2 = 19 × 92.99737 = 1766.95
5 Suma de cuadrados de tratamientos
SCT rat = 5 × (76 − 72.95)2 + 5 × (60.8 − 72.95)2
+ 5 × (80 − 72.95)2 + 5 × (75 − 72.95)2 = 1054.15
6 Suma de cuadrados del error
SCE = (79 − 76)2 + · · · + (83 − 76)2
+ (69 − 60.8)2 + · · · + (60 − 60.8)2
+ (83 − 80)2 + · · · + (75 − 80)2
+ (75 − 75)2 + · · · + (71 − 75)2 = 712.8
Morales & Morales ANOVA Noviembre de 2015 29 / 55
Análisis de varianza Ejemplos
Ejercicio 1, solución
1 Gran media: y ·· = 72.95
2 Medias de cada tratamiento (emulsión) y 1· = 76, y 2· = 60.8,
y 3· = 80, y 4· = 75.
3 Varianza muestral s2 = 92.99737.
4 Suma de cuadrados total
SCT = (N − 1)s2 = 19 × 92.99737 = 1766.95
5 Suma de cuadrados de tratamientos
SCT rat = 5 × (76 − 72.95)2 + 5 × (60.8 − 72.95)2
+ 5 × (80 − 72.95)2 + 5 × (75 − 72.95)2 = 1054.15
6 Suma de cuadrados del error
SCE = (79 − 76)2 + · · · + (83 − 76)2
+ (69 − 60.8)2 + · · · + (60 − 60.8)2
+ (83 − 80)2 + · · · + (75 − 80)2
+ (75 − 75)2 + · · · + (71 − 75)2 = 712.8
Morales & Morales ANOVA Noviembre de 2015 29 / 55
Análisis de varianza Ejemplos
Ejercicio 1, solución
1 Gran media: y ·· = 72.95
2 Medias de cada tratamiento (emulsión) y 1· = 76, y 2· = 60.8,
y 3· = 80, y 4· = 75.
3 Varianza muestral s2 = 92.99737.
4 Suma de cuadrados total
SCT = (N − 1)s2 = 19 × 92.99737 = 1766.95
5 Suma de cuadrados de tratamientos
SCT rat = 5 × (76 − 72.95)2 + 5 × (60.8 − 72.95)2
+ 5 × (80 − 72.95)2 + 5 × (75 − 72.95)2 = 1054.15
6 Suma de cuadrados del error
SCE = (79 − 76)2 + · · · + (83 − 76)2
+ (69 − 60.8)2 + · · · + (60 − 60.8)2
+ (83 − 80)2 + · · · + (75 − 80)2
+ (75 − 75)2 + · · · + (71 − 75)2 = 712.8
Morales & Morales ANOVA Noviembre de 2015 29 / 55
Análisis de varianza Ejemplos
Ejercicio 1, solución
1 Gran media: y ·· = 72.95
2 Medias de cada tratamiento (emulsión) y 1· = 76, y 2· = 60.8,
y 3· = 80, y 4· = 75.
3 Varianza muestral s2 = 92.99737.
4 Suma de cuadrados total
SCT = (N − 1)s2 = 19 × 92.99737 = 1766.95
5 Suma de cuadrados de tratamientos
SCT rat = 5 × (76 − 72.95)2 + 5 × (60.8 − 72.95)2
+ 5 × (80 − 72.95)2 + 5 × (75 − 72.95)2 = 1054.15
6 Suma de cuadrados del error
SCE = (79 − 76)2 + · · · + (83 − 76)2
+ (69 − 60.8)2 + · · · + (60 − 60.8)2
+ (83 − 80)2 + · · · + (75 − 80)2
+ (75 − 75)2 + · · · + (71 − 75)2 = 712.8
Morales & Morales ANOVA Noviembre de 2015 29 / 55
Análisis de varianza Ejemplos
Ejercicio 1, solución
1 Gran media: y ·· = 72.95
2 Medias de cada tratamiento (emulsión) y 1· = 76, y 2· = 60.8,
y 3· = 80, y 4· = 75.
3 Varianza muestral s2 = 92.99737.
4 Suma de cuadrados total
SCT = (N − 1)s2 = 19 × 92.99737 = 1766.95
5 Suma de cuadrados de tratamientos
SCT rat = 5 × (76 − 72.95)2 + 5 × (60.8 − 72.95)2
+ 5 × (80 − 72.95)2 + 5 × (75 − 72.95)2 = 1054.15
6 Suma de cuadrados del error
SCE = (79 − 76)2 + · · · + (83 − 76)2
+ (69 − 60.8)2 + · · · + (60 − 60.8)2
+ (83 − 80)2 + · · · + (75 − 80)2
+ (75 − 75)2 + · · · + (71 − 75)2 = 712.8
Morales & Morales ANOVA Noviembre de 2015 29 / 55
Análisis de varianza Ejemplos
Ejercicio 1, solución
1 Gran media: y ·· = 72.95
2 Medias de cada tratamiento (emulsión) y 1· = 76, y 2· = 60.8,
y 3· = 80, y 4· = 75.
3 Varianza muestral s2 = 92.99737.
4 Suma de cuadrados total
SCT = (N − 1)s2 = 19 × 92.99737 = 1766.95
5 Suma de cuadrados de tratamientos
SCT rat = 5 × (76 − 72.95)2 + 5 × (60.8 − 72.95)2
+ 5 × (80 − 72.95)2 + 5 × (75 − 72.95)2 = 1054.15
6 Suma de cuadrados del error
SCE = (79 − 76)2 + · · · + (83 − 76)2
+ (69 − 60.8)2 + · · · + (60 − 60.8)2
+ (83 − 80)2 + · · · + (75 − 80)2
+ (75 − 75)2 + · · · + (71 − 75)2 = 712.8
Morales & Morales ANOVA Noviembre de 2015 29 / 55
Análisis de varianza Ejemplos
Ejercicio 1, solución
Cuadrados medios y razón F
Ejercicio 1, solución
Cuadrados medios y razón F
Ejercicio 1, solución
Cuadrados medios y razón F
Ejercicio 1, solución
Cuadrados medios y razón F
Razón F
351.3833
F = = 7.887392
44.55
Morales & Morales ANOVA Noviembre de 2015 30 / 55
Análisis de varianza Ejemplos
Ejercicio 1, solución
Tabla de análisis de varianza
Ejercicio 1, solución
Valor de la tabla
Ejercicio 1, solución
Valor de la tabla
Decisión
Como 7.8873 es mayor que 5.29 se rechaza la hipótesis, se concluye
que si hay diferencia en la clasificación promedio.
Ejercicio 1, solución
Valor de la tabla
Decisión
Como 7.8873 es mayor que 5.29 se rechaza la hipótesis, se concluye
que si hay diferencia en la clasificación promedio.
Contenido
1 Análisis de varianza
Introducción
Hipótesis que se prueba con el ANOVA
Ejemplos
Ejemplo
Un estudio reciente comparó los salarios iniciales de los nuevos
graduados en diversos campos. Una parte de los resultados se
presenta en la siguiente tabla. A un nivel del 5 % ¿Parece que hay
diferencia en los salarios promedio?
Ejemplo
SIC = Sistemas de información por computador.
MC = Métodos cuantitativos.
Contenido
1 Análisis de varianza
Introducción
Hipótesis que se prueba con el ANOVA
Ejemplos
Y i· − µi
T =p
CME /n
tiene distribución T con a(n − 1) grados de libertad
Morales & Morales ANOVA Noviembre de 2015 43 / 55
Intervalos de confianza para la media de los tratamientos
Y i· − µi
T =p
CME /n
tiene distribución T con a(n − 1) grados de libertad
Morales & Morales ANOVA Noviembre de 2015 43 / 55
Intervalos de confianza para la media de los tratamientos
Y i· − µi
T =p
CME /n
tiene distribución T con a(n − 1) grados de libertad
Morales & Morales ANOVA Noviembre de 2015 43 / 55
Intervalos de confianza para la media de los tratamientos
Y i· − µi
T =p
CME /n
tiene distribución T con a(n − 1) grados de libertad
Morales & Morales ANOVA Noviembre de 2015 43 / 55
Intervalos de confianza para la media de los tratamientos
Y i· − µi
T =p
CME /n
tiene distribución T con a(n − 1) grados de libertad
Morales & Morales ANOVA Noviembre de 2015 43 / 55
Intervalos de confianza para la media de los tratamientos
Y i· − Y j·
Y i· − Y i· − (µi − µj )
T = p
2CME /n
Y i· − Y j·
Y i· − Y i· − (µi − µj )
T = p
2CME /n
Y i· − Y j·
Y i· − Y i· − (µi − µj )
T = p
2CME /n
Y i· − Y j·
Y i· − Y i· − (µi − µj )
T = p
2CME /n
Código R
mod<-lm(y~Trat)
confint(mod)
Código R
Trat<-relevel(Trat,ref="20")
mod2<-lm(y~Trat)
confint(mod2)
Contenido
1 Análisis de varianza
Introducción
Hipótesis que se prueba con el ANOVA
Ejemplos
X2 X4 X3 X1
X2 X4 X3 X1