Escolar Documentos
Profissional Documentos
Cultura Documentos
ANLISIS DE LA VARIANZA
ANLISIS DE LA VARIANZA, MLG
Facultad Ciencias Econmicas y Empresariales
Departamento de Economa Aplicada
Profesor: Santiago de la Fuente Fernndez
En general, cada conjunto muestral se caracteriza por estar afectado por un tratamiento especifico,
que eventualmente puede influir en los valores que tome la variable objeto de estudio.
Originalmente, el anlisis de la varianza se utiliz para determinar si las cosechas, que se obtenan
con distintos tratamientos o niveles de fertilizantes, diferan o no. As, en este caso, las parcelas
tratadas con un determinado nivel de fertilizantes constituyen una poblacin.
Se denomina factor a la variable que supuestamente ejerce una influencia sobre la variable estudiada
a la que se denomina dependiente. En el caso anterior, el factor es el fertilizante y la variable
dependiente la cosecha.
El modelo terico de referencia en el anlisis de la varianza es muy sencillo, y viene expresado por
cualquiera de las expresiones alternativas que se adjuntas, que son equivalentes:
Yg = g + g g = 1, 2,", G
Modelos tericos en el anlisis de la varianza: Y = + +
g g g = 1, 2,", G
g
En las dos formulaciones, considerando G poblaciones, cada valor de la variable es igual a una media
terica ms una variable aleatoria ( g ) , que implcitamente tiene de media cero.
1 1
En el modelo terico Yg = g + g la media de cada poblacin es igual a un parmetro ( g )
En el modelo terico Yg = + g + la media de cada poblacin se define mediante dos
g
parmetros: una media general () y un parmetro (g ) que recoge la discrepancia especfica de
cada poblacin respecto a la media general. En este caso, las discrepancias estn sujetas a que su
suma sea nula.
HIPTESIS SOBRE LA POBLACIN: Para especificar un modelo se requiere establecer hiptesis acerca
de los elementos que aparecen en el mismo. Las hiptesis estadsticas que se adoptan se refieren a la
poblacin y, en consecuencia, al proceso de obtencin de la muestra.
Hiptesis estadsticas sobre la poblacin: Yg N(g , 2 )
2
Hiptesis de Homocedasticidad: Las varianzas de todas las poblaciones son idnticas
Cada una de las poblaciones tiene una distribucin normal
De Yg N(g , 2 ) se desprende que la variable aleatoria g N(g , 2 )
Se supone que se ha obtenido una muestra aleatoria independiente de cada una de las G
poblaciones.
H0 : 1 = 2 = " = G
MODELO Yg = g + son iguales
g H : No todas las
1 g
H0 : 1 = 2 = " = G
MODELO Yg = + g + son iguales
g H : No todas las
1 g
En el anlisis de la varianza se distingue entre modelo de efectos fjos y modelo de efectos aleatorios.
En el modelo de efectos fjos, los grupos, o niveles, del factor o factores investigados se fijan de
antemano. Por ello, las conclusiones que se extraen en el anlisis nicamente pueden aplicarse a
los niveles analizados. El modelo de efectos fijos es el ms utilizado en el mundo de la empresa.
El tamao de la muestra total es (n), que es igual a la suma de los tamaos de las muestras de cada
uno de los grupos: n1 + n2 + " + nG = N
La media muestral global se obtiene sumando todos los valores de la muestra y dividiendo por el
tamao de la muestra total:
G ng
Y
g=1i =1
gi
Y=
N
Dentro de cada grupo se puede obtener la correspondiente media muestral. En este sentido, la media
del grupo g vendr dada por:
ng
Y i=1
gi
Yg =
ng
La desviacin de cada observacin con respecto a la media global es (Ygi Y) , que puede
descomponerse de la forma:
Si la expresin anterior se suma para todos los grupos y para todos los individuos de cada grupo de la
muestra, se obtiene:
ng ng ng ng
iG g 2
G g 2 gG gi 2
G g gi g
(Y Y) = (Y Y) + (Y Y ) + 2 (Y Y) (Y Y )
g =1 i=1
g =1 i=1
g =1 i=1
g =1 i=1
[1]
G ng G ng
el trmino (Yg Y) (Yg i Yg ) (Yg Y) . (Y gi
Yg ) = 0
=
g =1 i=1 g =1 i=1
S C T SC F SC F SC R
SC R
ng gi ng g ng gi g ng gi g
G
2
G
2 gG 2 gG 2
G
2
(Y Y) = (Y Y) + (Y Y ) = n . (Y Y) + (Y Y )
g =1 i=1
g =1 i=1
g =1 i=1
g =1
g =1 i=1
Y g=1i =1
gi
La restriccin viene determinada por el clculo de Y . Una vez calculada la media global Y =
N
se puede obtener un dato (por ejemplo, YGn ) de la siguiente forma:
YGn = N Y11 Y12 " """" YG1 YG2 " YG(N1)
Y Y1n
es decir, al tomar desviaciones respecto a la media, como la suma total de las desviaciones es nula, se
puede calcular una desviacin dadas las dems.
La restriccin viene dada por el clculo de Y . Las g medias muestrales son datos independientes con
la salvedad de que vienen sometidos a una restriccin de la media general.
n1 Y1 + n2 Y2 + " + nG YG = N Y
Grados de libertad (SCR) = N (nmero total de datos menos nmero total de grupos)
G
Dado que la media muestral de cada grupo acta como una restriccin en el clculo de las
desviaciones de dicho grupo.
MEDIA CUADRTICA: En el anlisis de la varianza se define una media cuadrtica como el cociente
entre cada suma de cuadrados y sus correspondientes grados de libertad, teniendo las siguientes
definiciones:
Suma cuadrados desviacin
Suma cuadrados Suma cuadrados desviacin no explicada por el factor
desviacin total explicada por el factor SC R
SC T S CF
G ng gi G ng g G ng gi g
2 2 2
(Y Y) = (Y Y) + (Y Y )
g= 1 i= 1 g= 1 i= 1 g=
1 i= 1
(N 1) gl (G 1) gl (N G) gl
G ng gi
(Y Y)2
Media cuadrtica total (MCT): SCT g=1i=1
MCT = =
N1 N1
G ng g
(Y Y)2
Media cuadrtica del factor (MCF): SCF g=1i =1
MCF = =
G1 G1
G ng gi g
(Y Y )2
Media cuadrtica residual (MCR): SCR g=1i =1
MCR = =
NG NG
2
La media cuadrtica residual (MCR), a la que se designa por S , es unR estimador insesgado de la
2
E S
=E
2 SCR 2
varianza , es decir: =
R
NG
SCF
MCF G 1
F= = F (G1) , (NG)
MCR SCR
NG
Fuente variacin
Factor
Residual
Total
H0 : 1 = 2 = " = G
MODELO Yg = g + g H : No todas las son iguales
1 g
Por este motivo, en lugar de utilizar la expresin de aceptar la hiptesis nula, es ms correcto decir
no rechazar la hiptesis nula, ya que cuando se da esta circunstancia lo que realmente ocurre es que
no se dispone de suficiente evidencia emprica para rechazar la hiptesis nula. Si se tiene en cuenta
esta reserva, se puede utilizar de forma indistinta las expresiones de aceptar y no rechazar.
Los programas informticos suelen ofrecer, junto al estadstico aplicado, el nivel de significacin
crtico, al que se denomina ' , asociado a dicho estadstico. Para designar a este valor en algunos
programas se utilizan las expresiones pvalue o significatividad.
Pr ob F , (G1) , (nG) > = ' (p value)
F
En la grfica se ilustra el clculo de ' a partir del estadstico F, donde se observa que la operacin de
determinar ' es la inversa de buscar el valor de las tablas para un nivel de significacin dado.
Determinado ' (pvalue) se rechaza la hiptesis nula para todo nivel de significacin tal que
> p value ; por el contrario, se acepta la hiptesis nula cuando < p value .
El nivel de significacin crtico es, pues, un indicador del nivel de admisibilidad de la hiptesis nula,
cuanto mayor sea el nivel de significacin crtico (pvalue), mayor confianza se puede depositar en la
hiptesis nula.
2
Hiptesis de Homocedasticidad: Las varianzas de todas las poblaciones son idnticas
Cada una de las poblaciones tiene una distribucin normal.
De Yg N(g , 2 ) se desprende que la variable aleatoria g N(g , 2 )
Los contrastes de las hiptesis bsicas se efectan a partir de los residuos, que se definen:
gi = Ygi g = Yg i Yg
En tal caso, el estadstico F no se ve muy afectado por el hecho de que no exista homocedasticidad,
siempre que las muestras de los diferentes grupos sean del mismo o similar tamao. En este
sentido, algunos autores afirman que el no cumplimiento de la hiptesis de homocedasticidad
puede afectar a los contrastes del anlisis de la varianza cuando la razn entre los tamaos
muestrales del grupo ms grande y el grupo ms pequeo es mayor que 2.
Sin embargo, cuando los datos se obtienen de forma secuencial puede ocurrir que este supuesto
no se cumpla. Una forma de averiguar si ocurre esta circunstancia es mediante la representacin
grfica de los residuos. Si los residuos siguen una cierta estela, en lugar de estar distribuidos de
forma aleatoria en torno al eje de abscisas, ser un indicio de falta de independencia.
b) La variabilidad total explicada por el factor viene dada por la medida de bondad del ajuste.
Un valor prximo a 1 del coeficiente de determinacin indica que la mayor parte de la variabilidad
total puede atribuirse al factor, mientras que un valor prximo a 0 significa que el factor explica
muy poco de esa variabilidad total.
Por el contrario, si se rechaza la hiptesis nula de igualdad es conveniente investigar qu grupos han
sido determinantes en ese rechazo. A este tipo de investigacin complementaria y posterior a los
contrastes bsicos del anlisis de la varianza se denomina anlisis expost.
En el anlisis expost se pueden aplicar dos tipos de procedimientos: (a) Intervalos de confianza
individuales. (b) Comparaciones mltiples.
Con cualquiera de los dos procedimientos se trata de determinar en qu medida difieren las medias
de las distintas poblaciones.
SR2 es el valor de la
Construyendo el intervalo de confianza I = Y t t , donde
(1) g
2
, (NG)
ng 2
, (NG)
t de Student con (N G) grados de libertad que deja a la de la masa probabilstica.
2
derecha
De este modo se pueden construir intervalos de confianza individuales para cada una de las medias
poblacionales, sin tener en cuenta una visin de conjunto.
H0 : p = q
H1 : p q
*
Si el nivel de significacin para el contraste de cada una de las hiptesis es ,
denominando RHj al suceso de rechazar la igualdad de dos medias en la comparacin jsima
*
cuando ambas son iguales, se verificar que: Pr ob (RH ) = j
ya que la probabilidad del suceso RH, que es la unin de sucesos individuales RHj , debe de ser
menor o igual que la suma de probabilidades de cada uno de los sucesos individuales, pues stos
no son mutuamente excluyentes.
Si es el nivel de significacin global deseado para el conjunto de las comparaciones, se verificar
que: c.*
1 1
X X > t* , (NG)
2
S +
p q R
Np Nq
*
Cuando el nmero de comparaciones a realizar es elevado, entonces, para un dado, ser
muy pequeo. Es decir, la regin crtica ser relativamente muy reducida. Algunos autores
proponen utilizar la aproximacin de Bonferroni cuando el nmero de comparaciones no es muy
elevado, aplicando en otro caso algn procedimiento alternativo como pueda ser el de Schef.
SCFA
G k 2 2
Y eta :
SCT =
2
2
Y
g =1 i=1 N
=
SCT
=
Y
2
2 2
SCF
A (G
1)MCR
G
Yg2 = SC Intergrupos SPSS epsilon :
SCF = SCT
g =1 ng N SCFA (G 1)MCR
2
omega : 2 =
G ng
G
g2
Y SCT + MCR
SCR = Y = SC ErrorSPSS
2
gi
ng donde, MCR =
g =1 i=1 g =1
SCR N G
(media cuadrtica
residual)
Ejemplo 1. La tabla refleja las puntuaciones obtenidas por catorce operarios adiestrados en una
determinada tcnica, aplicando tres mtodos alternativos.
Son significativamente diferentes los resultados obtenidos con los tres mtodos?.
Mtodo A
En este caso existen tres poblaciones distintas, a cada una de las cuales se ha aplicado un mtodo
diferente. Se establecen las hiptesis:
H0: 1 = 2 = (Los tres mtodos producen idnticos resultados)
H 1: 3 ( No producen los mismos resultados)
j j'
Mtodo A
6
7
8
7
Y1 = 28
2
3 k Y 112
2
SCT = Ygi
2
= 908 = 12
g =1 i=1 N 14
2 2
G
Y Y 282 432 412 1122
SCISPSS = SCF = g = + + =6
g =1 ng N 4 5 5 14
3 ng 2
3
Yg 282 43 412
2
g =1 i=1 g =1 ng 4 5 5
SCT 12
Media cuadrtica total: MCT = = = 0,92
N 1 14 1
MCF 3
El estadstico F que se obtiene: F = = = 5, 5
MCR 0, 545
Para un nivel de significacin = 0, 05 (fiabilidad del 95%), el valor del estadstico terico FSnedecor:
F , (G1) , (NG) = F0 ,05; 2 ,11 = 3,98
MCF = 3,98
Siendo, F(G1) , (NG) = F(31) , (14 3) = MCR = 5, 5 > F , (G1) , (nG) = F0 ,05; (31) , (14 3)
Se rechaza la hiptesis nula, concluyendo que los tres mtodos no producen los mismos resultados.
Fuente Suma de
variacin cuadrados
Factor SCF = 6
Residual SCR = 6
Total SCT = 12
Por el contrario, para un nivel de significacin del 1% ( = 0, 01) no se rechaza la hiptesis nula,
aceptando que los tres mtodos producen idnticos resultados. Advirtase que en este caso,
MCF = 7,20
F =F = = 5, 5 < F =F
(G1) , (NG) (31) , (14 3) , (G1) , (NG) 0 ,01; (31) , (14 3)
MCR
Dado que el tamao de la muestra en los tres grupos es muy similar, el no cumplimiento de la
hiptesis de homoscedasticidad no afectara de forma importante al contraste realizado.
2 SCF 6
El coeficiente de determinacin que se obtiene: R = = = 0, 5
SCT 12
En el caso de rechazo de la hiptesis nula del anlisis de la varianza se procede a realizar un estudio ex
post. En este sentido, se construyen intervalos de confianza individuales para cada una de las tres
medias poblacionales y aplicar el mtodo de Bonferroni para comparar las medias de los tres mtodos
de entrenamiento tomados dos a dos.
SR
2
Con una fiabilidad del 95%, el valor de la tStudent con n G = 14 3 = 11 grados de libertad, que deja
un 2,5% de masa probabilstica a su derecha es: t = 2,201 .
0 ,025 , 11
SR 0, 545
2
4 [
1 : I0 ,95 = Y1 t 0 ,025 , (14 3) = 7 2,201 = 6,188 ; 7,812]
n1
SR 0, 545
2
5 [
2 : I0 ,95 = Y2 t 0 ,025 , (14 3) = 8,6 2,201 = 7,873 ; 9,327]
n2
SR 0, 545
2
5 [
3 : I0 ,95 = Y3 t 0 ,025 , (14 3) = 8,2 2,201 = 7, 473 ; 8,927]
n3
Se puede observar que entre los intervalos del primer y segundo grupo no existe ningn
solapamiento.
G(G 1) 3(3 1)
Los contrastes mltiples de comparacin de medias que se pueden realizar: c = = =3.
2 2
Las hiptesis a contrastar son las siguientes:
H0 : 1 = 2 H0 : 1 = 3 H0 : 2 = 3
H : H : H :
1 1 2 1 1 3 1 2 3
Para realizar estos contrastes mltiples se aplica el procedimiento de Bonferroni, con un nivel de
*
significacin global = 0, 05 , siendo el nivel de significacin crtico = 0, 05 3 = 0, 01667 .
El valor de la tStudent es: t0 ,01667 , 11 = 2,82
1 1
X X > t* , (NG)
2
S +
p q R
Np N q
1 1 6 7 8,6 = 1 1
X X 1,6 > 2,82 0, 545 + = 1,39
1 2 0 ,01667 , 11 R N
N2 4 5
1
se rechaza la hiptesis nula de igualdad de medias H0 : 1 = 2
1 1 1 1
X1 X3 6 7 8,2 = 1,2 < 2,82
4 5+ = 1,39
N 0, 545
0 ,01667 , 11 R
1 N3
Como conclusin se rechaza la hiptesis de que las medias de los tres grupos son iguales, resultando
las diferencias ms significativas entre los grupos 1 y 2. Por el contrario, no existen evidencias para
rechazar la hiptesis de que las medias de los grupos 2 y 3 sean iguales.
SPSS: Cuando la variable categrica tiene tres o ms categoras (por ejemplo, tres grupos) se aplica el
Anlisis de la Varianza (ANOVA de una va), que permite no solo saber si hay diferencias en las medias
entre los diferentes grupos sino tambin explorar entre qu grupos estn o no esas diferencias (a travs
de los llamados contrastes a posteriori 'expost').
El anlisis de la varianza puede considerarse en parte como una extensin de la prueba t para dos
muestras:
Analizar > Pruebas no paramtricas > 2 muestras independientes ( k muestras independientes)
Un aspecto importante del ANOVA es que es exigente sobre los requisitos en la distribucin de la
variable cuantitativa, en concreto sobre dos aspectos:
CRITERIO DE NORMALIDAD: La variable cuantitativa se debe distribuir segn una Ley Normal en
cada uno de los grupos que se comparan. Las pruebas de normalidad con la opcin:
Analizar > Comparar medias > ANOVA de un factor Post hoc / No asumiendo varias iguales
Con el contraste de hiptesis de ShapiroWilk, el segundo grupo tiene un pvalor = 0,006 < 0, 05 y no
verifica la hiptesis de normalidad
Despus del anlisis, no es demasiado correcto aplicar un anlisis ANOVA, ya que la variable
tratamiento no se distribuye como una normal en los grupos de comparacin. Con carcter instructivo
se lleva a cabo el contraste.
En la ventana de SPSS: Analizar > Comparar medias > ANOVA de un factor
El Visor muestra un cuadro resumen con los estadsticos descriptivos (de la variable
cuantitativa) ms relevantes en cada grupo que se va a contrastar: las medias (y sus IC0,95), las
desviaciones tpicas y los valores mximo y mnimo.
El test de Levene se utiliza para contrastar la hiptesis nula de igualdad de varianzas, cuando el
(pvalor) se acepta la hiptesis nula; en caso contrario, se rechaza la hiptesis nula.
Como el pvalor = 0,801 > 0, 05 , se acepta la hiptesis nula de igualdad de varianzas (criterio de
homocedasticidad)
Por ltimo, aparece la salida del ANOVA propiamente dicho, con sus diferentes componentes o
fuentes de variabilidad: Intergrupos e Intragrupos.
La variabilidad Intragrupos representa la dispersin que no es explicada por el factor de
agrupamiento (variable categrica), y que sera explicable slo por el azar.
En este caso, pvalor = 0,022 < 0, 05 , rechazando la hiptesis nula con un nivel de significacin de 0,05,
concluyendo que los tres entrenamientos no producen los mismos resultados.
La tabla de comparaciones mltiples (prueba Post hoc) identifica qu diferencias de medias son o no
significativas categora a categora segn los diferentes contrastes. Los valores marcados con un
asterisco indican diferencia de medias significativa.
En el cuadro de comparaciones mltiples, cada grupo de edad se compara con los otros
dos, obtenindose en cada contraste la diferencia de medias, el IC0,95, el error estndar y el
pvalor .
Por el contrario, no existen evidencias para rechazar la hiptesis nula de igual de medias entre los
grupos 2 y 3.
Totales
H : 1 = 2 = " = G
Hiptesis: 0
H1 : No todas las son iguales
g
Independencia
Normalidad
Supuestos:
Homocedasticidad
Aditividad (los tratamientos no int eractan con los sujetos)
SCT = SCFA + SCFB + SCR
G k 2
Y
SCT =
2
Y
g =1 i=1 N
2 2
Yg Y
G
SCFA = = SC Intergrupos SPSS
g =1 k N
2 2
K
Y Y i
SCFB = = SC Intersujetos SPSS
i=1 G N
2
G k G Y K Y i
2
Y
2
SCR = Y
2 g
+ = SC Error
g =1 i=1
g =1
gi
i=1 G N
SPSS
TABLA ANOVA:
Fuente
variacin
Intergrupos
Intersujetos
Eror
Total
Rojo
Verde
Azul
TOTAL Y1 = 60
2
3 7 Y 411
2
SCT = Y
2
= gi8453 = 8453 8043, 86 = 409,14
g =1 N 21
i=1
2 2
3
Y169Y2 1092 1332 4112
SC IntergruposSPSS = SCFA = g
= + + = 8304, 43 8043, 86 = 260, 57
g =1 k N 7 7 7 21
2 2
K
Y
2
Y 2 2 2 2 2 2 411
60
2 + 56 + 66 + 57 + 55 + 56 +
61
SCFB i
SPSS = = = 8074, 33 8043, 86 =
SC
Intersujetos = 30, 47
i=1 G N 21
3
G k G K 2 2
Y
2 T T
= SCR = Y
2gi g i
SC + = 8453 8304, 43 8074, 33 + 8043, 86 = 118,1
ErrorSPSS
g =1 i=1 g =1 i=1 G N
k
Fuente Suma d
variacin cuadrad
Intergrupos SCFA = 26
Intersujetos SCFB = 30
Eror SCR = 11
Siendo F = 13,24 > 6,93 = F0,01 ; 6 Con una fiabilidad del 99%, se rechaza la hiptesis nula de
2 , 12 igualdad de medias.
donde,
media g efecto del nivel g del factor j efecto del nivel j del factor B
global A
= = ( )
g =1
g
j=1
j
g =1 j=1
gj
=0
En el anlisis de la varianza con dos factores, se mantienen las hiptesis de poblaciones con
distribucin normal e igual varianza para cada combinacin de niveles de los dos factores. Es decir, se
mantienen las hiptesis bsicas de la varianza con un factor con la nica diferencia de que ahora la
media terica viene definida por tres trminos.
H0 : 1 = 2 = " = G = 0
Hiptesis nula e hiptesis alternativa sobre el factor A:
H1 : No todas g son nulas
H0 : 1 = 2 = " = J = 0
Hiptesis nula e hiptesis alternativa sobre el factor B:
H1 : No todas J son nulas
A los efectos individuales se les denominan tambin efectos principales. Es conveniente realizar el
contraste correspondiente a los efectos principales. El motivo es que la presencia del efecto
interaccin dificulta la interpretacin de los efectos principales.
DESCOMPOSICIN DE LA VARIANZA
Antes de realizar la descomposicin de la varianza se construye una tabla de doble entrada que
recoge la muestra disponible para cada combinacin de los factores A y B. En las filas se indican los
distintos niveles del factor A y en las columnas los distintos niveles del factor B.
1
2
......
G
Marginal B
El cuadro con las medias muestrales para cada combinacin de los factores A y B:
1
2
......
G
Marginal B
Considerando todas las celdas (excepto las marginales), de forma anloga a como se hizo con un
factor, se puede realizar la siguiente descomposicin:
suma de cuadrados total
S C T
G J ng j
(Y
g =1 j=1 i=1
g ji
Y)2 = (Y Y)2 + (Y Y )2
G J ng j
El primer
g =1 j=1 i=1
trmino
respecto a la media muestral global. En el triple sumatorio: el primero se refiera a los distintos
valores del factor A, el segundo a los distintos niveles del factor B, y el tercero a los datos de cada
celda.
G J ng j
(Y
g ji g ji
2
El Y ) es la suma de cuadrados residual (SCR)
g =1 j=1 i=1
trmino
G J ng j
El
trmino g =1 j=1 i=1
Ahora bien, estas diferencias A qu se deben?. Pueden deberse bien a la influencia del factor A,
bien a la influencia del factor B, o bien a la interaccin entre ambos factores.
G J ng j G J gj gj
(Y n
g ji
2
Y) = (Y Y)2 =
g =1 j=1 i=1 g =1 j=1
gG J gj 2 jG J gj 2
G J gj gj g 2
j
= n (Y Y) + n (Y Y) + n (Y Y Y + Y)
g= 1 j= 1 g= 1 j= 1 g= 1 j= 1
Los trminos primero y segundo del segundo miembro son las sumas de cuadrados de los
factores A y B respectivamente. A estas sumas se denominan SCFA y SCFB . El ltimo trmino, con
una configuracin menos clara, refleja la interaccin de los factores A y B.
En efecto, si los dos primeros trminos del segundo miembro reflejan el efecto individual de cada
uno de los factores, entonces el trmino restante debe reflejar el efecto conjunto, o de
interaccin, entre los factores A y B, es decir, el efecto de estos dos factores no recogido
individualmente. El efecto de interaccin ser denominado SCF
AB
suma de cuadrados total suma de cuadrados de los factores suma de cuadrados residual
S C T S CF SC R
G J ng j ng j ng j
G J G J
(Y (Y (Y
g ji g ji g ji g ji
2 2 2
Sustituyendo en la expresin: Y) = Y) + Y )
g =1 j=1 i=1 g =1 j=1 i=1 g =1 j=1 i=1
Los grados de libertad de SCT son igual al nmero total de datos menos 1, es decir, (N 1)
Los grados de libertad de SCFA son igual al nmero total de grupos menos 1, (G 1)
Los grados de libertad de SCFB son igual al nmero total de grupos menos 1, (J 1)
El nmero total de combinaciones de niveles de los factores A y B es igual a GJ. Ahora bien, una
vez, calculadas las medias marginales por filas y por columnas, los grados de libertad de SCFAB se
reducen a (G 1)(J 1)
Los grados de libertad de SCR son igual al nmero total de datos menos el nmero total de celdas,
es decir, (N GJ)
Los grados de libertad de la SCT es igual a la suma de los grados de libertad de cada uno de los
componentes, es decir:
N 1 G 1 ( G 1 ) (N G J )
J 1 (J 1)
gl (SCT) = gl (SCFA ) gl (SCFB ) gl (SCFAB ) gl (SCR)
+ + +
Fuente
variacin
Factor A A
G1
Factor B
AB F=
Interaccin (G 1)(J 1) MCR
Residual
Total
En el anlisis de la varianza con dos factores sigue siendo vlido dicho coeficiente como una medida
general del efecto de los factores sobre la variable dependiente.
Independencia:
Las GJ muestras de
tamao n son
aleatorias e
independientes.
Normalidad:
Las GJ poblaciones de
donde se extraen las GJ
# # muestras son normales.
# #
Homocedasticidad: Las GJ
poblaciones de tienen,
todas ellas la misma
varianza.
SUMATOTAL
DE CUADRADOS: SCT = SCFA + SCFB + SCFAB + SCR
G J
Yi Y
2 2
Y Y 2 Y
2 j Y2
n G J
SCFA g=1 SCFB
SCT =
2
igj = =
i=1 g =1 j=1 N n. J N j=1
n.G N
G J gj G g Y2
J j G J
Y Y Y
2 2 2 n G J 2
Y
SCR = Yigj
2 gj g
SCFAB = g =1 j=1
g =1
j=1
+ =1 j=1
Ejemplo 3. Se trata de estudiar el efecto de las variables Edad y Fumar sobre la Ansiedad Social.
Fumar
Edad
1
3
En cada caso, las hiptesis a contrastar son las siguientes:
(a) Efecto A: Categora edad
Bajo los supuestos de Independencia, Normalidad y Homocedasticidad, se calculan los estadsticos del
contraste.
Fu
Edad
3,91
5, 01
Y11 = 21, 4
1 4, 44
Y11 = 4,28
3,33
4,71
5,65
6, 49
Y21 = 28,7
2 5, 47
Y21 = 5,754
5,72
5, 44
4,94
7,13
Y31 = 29,6
3 5, 54
Y31 = 5,938
5,92
6,16
Y1 = 79,86
TOTAL
Y1 = 5,324
J=2 n=5 N = 5.3.2 = 30 5 3 2
G=3 Y
i=1 g =1 j=1
2
igj
= 1106,28
2
5 3 2 Y 175,12
2
igj
i=1 g =1 j=1
SCT =
2
Y = 1106,28 = 84, 04
N 30
G i 3i
2 2
g =1 g =1
SCFA = = = + + = 28, 44
n. J N 5.2 30 5.2 5.2 5.2 30
J j j2
79, 862 95, 262 175,12
2
Y Y
2 Y Y
2
2 2
SCFB = = j=1 = + = 7,90
j=1
G J 3 2
Y2
gj
n G J 5 3 2
SCR =
Y 2
ig
Y2
= Y
i=1 g =1 j=1
2
igj
g =1 j=1
=
j g = 1 j =1 n
i=1 g =1 j=1
n
2
21, 40 25,902 28,772 42,232 29,692 27,132
= 1106,28 + + + + + = 34,80
5 5 5 5 5 5
SCFAB = SCT SCFA SCFB SCR = 84, 04 28, 44 7,90 34,80 = 12,89
G J gj G g Y2
J j 3gj 2 3 g 2 j Y2
Y
2 2 2 2 2 2
Y Y Y Y Y
g=1j=1 g=1 j=1 g=1j=1 g=1 j=1
o bien, SCFAB = + = +
n n. J n.G N 5 5.2 5.3 30
Factor B SCFB =
Interaccin SCFAB =
Residual SCR =
Total SCT = 8
27
SELECCIN DEL MODELO: Analizar > Modelo lineal general > Univariante > Modelo
En este cuadro es posible construir el modelo de inters introduciendo los factores tratamiento y sus
interacciones a nuestro criterio. Por defecto est el modelo Factorial completo (que incluye a todos los
factores tratamiento introducidos previamente y a todas sus interacciones). Si se desea un modelo
alternativo, por ejemplo un modelo de dos vas principales (esto es, sin interaccin) entonces:
Se deja por defecto Suma de cuadrados Tipo III. Es el procedimiento ms utilizado. Proporciona la
descomposicin de las sumas de cuadrados tal y como se ha visto anteriormente.
La suma de cuadrados Tipo III explicada por un factor A es igual a la diferencia entre la suma de
cuadrados residual del modelo completo (con todos los factores) sin el factor A y la suma de
cuadrados residual del modelo completo. Es independiente del orden de introduccin de los factores
tratamiento y produce una descomposicin ortogonal de modo que las sumas de cuadrados suman la
suma de cuadrados total.
28 28
CONTRASTES PERSONALIZADOS: Analizar > Modelo lineal general > Univariante > Contrastes
1. Elegir en el cuadro Factores: el factor tratamiento sobre cuyos niveles se ejecutarn los
contrastes. Por ejemplo, marcar nivel (Ninguno).
OPCIONES: Analizar > Modelo lineal general > Univariante > Opciones
Estadsticos descriptivos: Proporciona la media muestral, la desviacin tpica muestral y el tamao
para cada nivel y combinacin de niveles.
Estimaciones del tamao del efecto: Marcando esta opcin se aade al cuadro ANOVA el coeficiente
2
para cada fuente de variacin incluida en el modelo. Con el objeto de medir el efecto de cada
factor (y de la interaccin) separadamente se utilizan estadsticos eta cuadrados parciales, que se
definen:
2 SCFA SCFB SCFAB
A = = 0, 50
2
B = = 0,185 2AB = = 0,270
SCFA + SCR SCFB + SCR SCFAB + SCR
Potencia observada: Marcando esta opcin se aade al cuadro ANOVA una nueva columna con el
valor de la potencia del Ftest para cada fuente de variacin incluida en el modelo. El valor de la
potencia se entender como la capacidad de la prueba de hiptesis para, con un nivel de significacin
igual al prefijado, detectar una diferencia real (poblacional) entre los niveles de la fuente de variacin
igual a la diferencia observada en las muestras.
NOTA: La potencia de un contraste se define como la probabilidad de rechazar la hiptesis nula
cuando es falsa.
Si se marcan las casillas Estimaciones del tamao del efecto y Potencia observada, el cuadro ANOVA
en el Visor de Resultados ser:
Se observan coeficientes 2 bajos para todas las fuentes de variacin, siendo el mayor el
correspondiente a la interaccin (0,967). En todos los caos la potencia es alta lo que sugiere una alta
capacidad del test para rechazar la hiptesis nula con diferencias reales iguales a las observadas.
Estimaciones de los parmetros: Marcando esta opcin se obtendr un cuadro con las estimaciones
de los parmetros del modelo.
Atendiendo a la interpretacin de los parmetros estimados por el SPSS expuesta, la informacin
puede esquematizarse como sigue:
1 = 0, 512
( )11 = 1, ( )21 = 3,204
412
siendo:
5. La Tabla proporciona adems los intervalos de confianza para cada parmetro y los coeficientes
2
y potencia observada para cada contraste de los parmetros.
Pruebas de homogeneidad: Ofrece los resultados de la prueba de Levene para testar la hiptesis nula
de igualdad de varianzas de la variable respuesta en todas las poblaciones definidas por
combinaciones de los niveles de los factores.
La Prueba de Levene conduce a un estadstico igual a 2,706 que en una F5,24 deja a su derecha una cola
de probabilidad 0,045, siendo p valor = 0, 045 < = 0, 05 , no se acepta la hiptesis nula de igualdad
de varianzas (criterio de homocedasticidad).
El diagrama consiste en un grfico de puntos: cada uno representa una poblacin (combinacin de
niveles) donde la media se representa en la abscisa y la desviacin tpica (o varianza) en la ordenada.
El objetivo es detectar si la varianza depende de la media (es frecuente comprobar que la respuesta
crezca cuando lo hace la media).
Los residuos se muestran tipificados (divididos por la raz cuadrada del error cuadrtico medio
estimado).
Este grfico matricial da una idea si se verifican los supuestos de independencia, homogeneidad de
varianzas y falta de ajuste. En efecto:
Si existe Independencia, el grfico de dispersin ResiduosObservados no debera mostrar pauta
de variacin (lnea, curva, ). Grfico de coordenadas (1, 3) o (3, 1) en la matriz.
En un modelo con Buen Ajuste a los Datos, la nube de puntos PronosticadosObservados debiera
mostrar un perfil cercano a la linealidad (a ms linealidad mejor ajuste). Grfico de coordenadas
(1, 2) o (2, 1) en la matriz.
MODELO FACTORIAL COMPLETO E INCOMPLETO
Se dice que un modelo para anlisis de la varianza es un modelo factorial completo cuando se incluyen
en el mismo los efectos de todos los factores (efectos principales) y todas las interacciones entre los
mismos. En el caso de dos factores es un modelo factorial completo el que incluye el factor A, el factor
B y la interaccin entre los factores A y B.
La existencia de interacciones entre los factores complica la interpretacin de los efectos principales,
ya que la influencia de un factor se reparte entre el efecto principal y los efectos de interaccin con
otros factores.
Por esta razn es aconsejable no realizar contrastes para cada factor cuando el trmino de interaccin
es estadsticamente significativo. En esta situacin, el efecto total de un factor depende de como se
combine con otros factores. Por ello, los efectos de todos los factores sobre la variable dependiente
deben analizarse conjuntamente. El grfico de interaccin es til para examinar la variable conjunta.
En el grfico de interaccin, en el caso de dos factores, se representan las medias de las casillas del
cuadro uniendo por una lnea las medias correspondientes a cada fila, es decir, a un determinado
nivel del factor A.
1
2
......
G
Marginal B
Si las lneas son ms o menos paralelas indicarn que los efectos son de carcter aditivo, es decir, que
no existen efectos cruzados entre los dos factores. Cualquier otra configuracin ser indicio de no
independencia.
En todo caso, conviene aplicar inicialmente un anlisis factorial completo. Si resulta que algunos
efectos de interaccin no son estadsticamente significativos entonces en un anlisis subsiguiente se
eliminan dichos efectos del modelo. Un modelo de este tipo es un modelo factorial incompleto.
En el caso de dos factores, la interaccin AxB se elimina cuando sta no es representativa. El modelo
terico se formula entonces de la siguiente forma:
Yg i = + g + j + g j g = 1, 2, " , G j = 1, 2, modelo de efectos principales
" ,J
En el siguiente cuadro se refleja la tabla de anlisis de la varianza con dos factores en un modelo de
efectos principales, es decir, un modelo sin interaccin.
Factor A A
G1
Factor B
Residual
Total
Los efectos diferenciales y se estiman mediante las diferencias entre la media muestral
j j
global y la media de cada grupo: = Y Y = Y Y
g g
, G J
Si los tamaos muestrales de los grupos son iguales entre s dentro de un mismo factor, se
G J
verifica: = = 0
g =1
g
j=1
j
de que los efectos diferenciales son nulos, entonces en un anlisis expost se puede contrastar la
hiptesis de que cada uno de los efectos diferenciales es nulo. Planteando un problema de
comparaciones mltiples.
Tipo 1
Tipo
Planta
Tipo 2
Existen dos factores tratamiento: 'Niveles de agua' (con tres niveles de efectos fijos) y 'Tipo de planta'
(con dos niveles de efectos fijos).
Para cada tratamiento se obtienen 5 respuestas de la variable 'Crecimiento de la longitud del tallo' de
otras tantas unidades experimentales. Se crea as un diseo balanceado (de 5 rplicas), aleatorio y de
tamao 30.
Al disponer de rplicas es posible contrastar la existencia de interaccin entre los niveles de los dos
factores tratamiento, de manera que el modelo matemtico es el propio de un diseo completo de
dos vas.
71,3 (1)
Y11 = 363 Y12 = 510,2 Y13 = 617,9
Tipo planta 75,1 (4)
1 69,0 (5) Y = 72,60
73,2 (7) 11
74,4 (22)
Y21 = 355,1 Y22 = 428, 70,4
4 (13) Y23 = 529,1
Tipo planta 73,2 (15)
2 71,1 (23) Y = 71, 02
71,2 (24) 21
69,2 (27)
Y1 = 718,1
Total
J=3 n=5 N = 5.2.3 = 30 5 2 3
Y1 = 71,81
= 272890,99
G=2 Y 2
ig
j
i=1 g =1 j=1
2
5 2 3 Y 2803,7
2
ig j
SCT = Y
2
= 272890,99 = 10866,534
i=1 g =1 j=1
N 30
Gi i
2
Y Y 1491,12 1312, 6
2 2
Y
2
Y
2 2803, 7
2 2
g =1 g =1
+ A=
SCF = = = 1062,075
n. J N 5. 3 5.3 5. 3 30
30
jJ j 3
Y Y 718,12 93g 8j , 6 1147 2803, 7
2 2 2
2 2
T Y
2 2
SCFB = = = + + = 9200,201
j=1 j=1
n. G N 5. 2 5 . 2 5 . 2 5 . 2 30
30
G J 2 3
n G J gj 5 2 3
SCR =
Y 2
ig
Y2
= Yi g j
2
i=1 g =1 j=1 Y2
j g = 1 j =1 g =1 j=1
i=1 g =1 j=1
n =
n
2
363 510,2
2
617,9
2
355,1
2
428, 4
2
529,1
2
= 272890,99 + + + + = 202, 424
+
5 5 5 5 5 5
SCFAB = SCT SCFA SCFB SCR = 10866, 534 1062, 075 9200,201 202, 424 = 401,834
Fuente Suma de
G J gj g Y2J j
variacin
G gj
2 3 2 g 3 j Y2 cuadrados
Y Y Y Y Y Y
2 2 2 2 2
2
Factor Ao bien, SCFAB g=1j=1 g=1 j=1 g=1j=1 g=1 j= 1 SCFA = 1062,075
= + = +
n n.J n.G N 5 5.3 5.2
30 SCFB = 9200,201
Factor B
MCFAB =
(G 1
Factores fijos: Se introducen las variables conteniendo los niveles de los factores de tratamiento
con efectos fijos (ya que sus efectos sobre la respuesta desean ser comparados y son el objeto de
la investigacin). En el ejemplo, variables tipo y nivel.
Factores aleatorios: Se introducen los niveles de los factores tratamiento con efectos aleatorios
(los niveles son una muestra aleatoria de una poblacin mayor y por ello no son el objetivo de la
investigacin ya que la inferencia se realiza sobre la poblacin y no sobre la muestra). Introducir
tantas variables como factores de tratamiento. En el ejemplo, ninguna variable es de efectos
aleatorios por lo que queda vaco.
Ponderacin MCP: Variable de pesos para computar los estimadores mnimo cuadrticos de
manera ponderada. De utilidad cuando no se tiene homocedasticidad.
Al introducir las variables y pulsar Aceptar se obtiene la siguiente salida por defecto:
La notacin en SPSS:
SC Total corregido = SC Tipo + SC Nivel + SC Tipo * Nivel + SC Error
SCT SCFA
SCFB SCFAB SCR
Cuando se desea un modelo alternativo, por ejemplo un modelo de dos vas principales (esto es, sin
interaccin) entonces:
Se deja por defecto Suma de cuadrados Tipo III, porque es el procedimiento ms utilizado.
Proporciona la descomposicin de las sumas de cuadrados tal y como ya se ha visto.
La Suma de cuadrados Tipo III explicada por un factor A es igual a la diferencia entre la suma de
cuadrados residual del modelo completo (con todos los factores) sin el factor A y la suma de
cuadrados residual del modelo completo. Es independiente del orden de introduccin de los factores
tratamiento y produce una descomposicin ortogonal de modo que las sumas de cuadrados suman la
suma de cuadrados total.
Cuando el diseo es balanceado, la descomposicin en suma de cuadrados Tipo III coincide con la
descomposicin en suma de cuadrados Tipo I.
Analizar > Modelo lineal general > Univariante > Contrastes
En el cuadro de Factores se elige el factor tratamiento sobre cuyos niveles se ejecutarn los
contrastes. Por ejemplo, marcar Nivel (Ninguno).
En Contrastes se abre una persiana donde se selecciona la familia de contrastes de inters,
pulsando despus el botn Cambiar.
Para algunos contrastes es posible modificar la categora o nivel de referencia.
Contrastes Desviacin: Familia de I 1 contrastes comparando el efecto de cada nivel del factor
(menos el de referencia) con el efecto promedio global.
Contrastes Simples: Familia de I 1 contrastes comparando el efecto de cada nivel del factor con
el efecto del nivel elegido como referencia.
Contrastes Diferencia: Familia de I 1 contrastes comparando el efecto de cada nivel del factor
(menos el primero) con el efecto promedio de los niveles anteriores.
H(1)
0 :
2 1 = 0 frente (1) : 2 1 0
H1
(2) 1 (2) 1
H0 : 3 (1 +
2 ) = 0 frente H
1 : 3 1( +2 ) 0
2 2
"" """" """ """ """" """ "
H(I1) :
1 ) = 0 frente H(I1) : 1 )0
( ( + + " +
+ + "
+ 0 I 1 2 I1 1 I 1 2 I1
I I
1 1
Contrastes Helmert: Familia de I 1 contrastes comparando el efecto de cada nivel del factor
(menos el ltimo) con el efecto promedio de los niveles subsiguientes.
(1) 1 1
H : ( + + " + ) = 0 frente ( + + " + ) 0
(1)
0 H1 :
I I
2 3 I 1 1 2 3 I
1 1
(2) 1 1
H : ( + + " + ) = 0 frente ( + + " + ) 0
(2)
0 H2 :
I I
3 4 I 1 2 3 4 I
1 1
"" """" "" " """ """" """ " """ """ """"
H(1)
0 :
2 1 = 0 frente H(1)1 2 1 0
:
H(2)
0 :
3 2 = 0 frente H(2)1 3 2 0
:
En presencia de interaccin los contrastes deben realizarse sobre los niveles combinados y no sobre los
efectos marginales. En otras palabras, no es informativo ejecutar este procedimiento con interaccin
significativa.
Es el caso de este ejercicio, aunque a efectos de mostrar la salida que genera esta herramienta,
suponemos que se desea realizar los contrastes de Helmert para los efectos del factor tratamiento
nivel del agua. La salida del Visor de SPSS muestra:
En este caso, los contrastes de Helmert son dos:
(1) 1 (1) 1
H0 : 1 (2 + 3 ) = 0 frente 1H 1: 2 ( 3+ ) 0
2 2
siendo j el efecto marginal del nivel del agua jsimo. La resolucin particular de cada uno de ellos
se realiza bajo el supuesto de independencia y normalidad, mediante la t de Student con un nmero
de grados de libertad igual al empleado para estimar el error. En general:
Se rechaza H0 : = 0 (con
i
i i
i
i
= 0 ) al nivel de significacin si:
I ni
Como el cuadrado de una t de Student con g.l. grados de libertad es igual a una distribucin F de
FisherSnedecor con 1 y g.l. grados de libertad t2 , g.l. = F , 1 , g.l., el criterio para rechazar la hiptesis nula
2 2
anterior se puede escribir:
2 i
2
El valor de i 2i se denomina Suma de Cuadrados
2
i i
i n
I ni
i I i
i
> F Explicada por el contraste i i
SCMR 2
,1 ,
g.l. i
1
La estimacin del contraste 1 (2 + 3 ) presenta un p valor = 0 < 0, 05 , rechazando la
2
(1) 1
hiptesis nula H : ( + ) = 0 . De otra parte, el intervalo de confianza no cubre el 0, lo
que 0 1 2 3
2
conduce a la misma conclusin.
La estimacin del contraste 2 presenta un p valor = 0 < 0, 05 , rechazando la hiptesis nula
3
H(2) 3 = 0 . El intervalo de confianza no cubre el 0, lo que conduce a la misma conclusin.
0 : 2
El segundo cuadro, Resultados de la prueba, muestra la suma de cuadrados explicada por los dos
contrastes Helmert y la correspondiente Ftest con dos grados de libertad (uno por contraste) y 24
grados de libertad que muestra la significacin estadstica conjunta de ambos contrastes.
Ofrece la posibilidad de realizar contrastes de rango mltiple con los niveles de aquellos factores
tratamiento que se desee. Como en el caso anterior, las comparaciones Post hoc para los efectos
marginales slo deben realizarse en el supuesto de no interaccin. Se solicitan los procedimientos de
Tukey y Bonferroni para los niveles del factor tratamiento 'nivel del agua' y ninguno para el otro
factor.
Para la obtencin de un grfico de las tres medidas estimadas se procede de la siguiente forma:
Para el factor del Nivel del agua, anlogamente para el factor Tipo:
1. Marcar Nivel en el campo Factores y pasarlo al campo Eje horizontal. En el campo Grficos
marcar Aadir. De este modo, el factor Nivel se incorpora al campo Grficos.
2. Marcar Tipo en el campo Factores y pasarlo al campo Eje horizontal. En el campo Grficos marcar
Aadir. De este modo, el factor Tipo se incorpora al campo Grficos.
Para visualizar el denominado Grfco de Interaccin entre los dos factores tratamiento:
Se marca Nivel en el campo Factores y se lleva al campo Eje horizontal. Se marca Tipo en el Campo
Factores y se lleva al campo Lneas distintas. Se pulsa Aadir en el campo Grficos, quedando
aadido Nivel*Tipo que responde al grfico de interaccin.
El crecimiento del tipo 1 ha sido superior en igual longitud promedio tanto con el nivel 2 como con
el nivel 3 de agua y, anlogamente, el nivel 3 de agua fue igual o mejor para el crecimiento con
independencia del tipo de planta.
Sin embargo, este comportamiento no se ha mantenido con el nivel 1 de agua, estando aqu la
posible interaccin. Probablemente el nivel 1 de agua sea el menos exitoso, especialmente con un
comportamiento malo para el tipo 1 de plantas.
En el campo Medias marginales estimadas se puede indicar al SPSS que proporciones estimaciones
de las medias de todos los niveles de una fuente de variacin de inters (es decir, de los factores
incluidos en el diseo o interaccin de factores, sean estas interacciones incluidas o no en el diseo).
Para ello, se trasladan las fuentes de inters desde la lista Factores e interacciones de los factores a
la lista Mostrar las medias para.
Sealar que, como ejemplo, el cuadro de medias estimadas para los niveles de la interaccin
Tipo*Nivel no es el mismo para un modelo completo que para un modelo de efectos principales.
Al sealar Comparar los efectos principales se realizan las comparaciones de medias dos a dos
(pairwise comparisons) de todos los niveles de los efectos principales con tres posibles criterios que se
seleccionarn en la lista desplegable de Ajustes del intervalo de confianza:
49 49
Bonferroni y Sidak suponen diferentes correcciones para controlar la tasa de error tipo I, siendo
recomendables cuando hay que realizar un nmero muy grande de comparaciones dos a dos.
+ 11 = + 1 + 1 + ( )11
concluyendo que, para este modelo, la estimacin coincide con la media muestral de los crecimientos
alcanzados con las plantas de tipo 1 tratadas con nivel de agua 1.
2
Estimacin del tamao del efecto: En el cuadro ANOVA se aade el coeficiente para cada
fuente de variacin incluida en el modelo.
2
= 0,840 2 2
A = 0,978B = 0,665
AB
52 52
es por tanto una estimacin de la proporcin de varianza explicada por diferencias entre los
niveles de la fuente de variacin una vez eliminado el efecto de las otras fuentes de variacin
incluidas en el modelo.
2
Se observan coeficientes altos para todas las fuentes de variacin, siendo el menor el
correspondiente a la interaccin (0,665).
53 53
El modelo estimado se resume:
En los grficos de (media, desviacin tpica) y (media, varianza) se pone de manifiesto que las medidas
de dispersin dependen de la media.
El grfico 1 muestra que los niveles con mayor y menor crecimiento medio conducen a desviaciones
tpicas muy semejantes y, aparentemente, no parece claro que la dispersin de ambos grficos pueda
achacarse a una relacin determinista, lo que concuerda con el hecho de que la Prueba de Levene no
encuentra significacin estadstica.
Grfico de los residuos: Se trata de un grfico matricial de puntos enfrentando Valores
Observados (variable respuesta) con Valores Pronosticados (por el mtodo estimado) y los
Residuos( valores observados menos valores pronosticados).
Los residuos se muestran tipificados (divididos por la raz cuadrada del error cuadrtico medio
estimado).
En los estudios empricos, en general, el investigador tiene un papel pasivo con respecto a la
informacin, es decir, no interviene en la generacin de los datos limitndose a su observacin.
Cuando el anlisis de la varianza se realiza con datos procedentes de un diseo experimental, a los
niveles del factor se les denomina generalmente tratamientos.
En muchas ocasiones el investigador se puede encontrar con la situacin de que, adems del factor o
factores de tratamiento, existen otros factores que ejercen una influencia decisiva sobre la variable
dependiente. Si el tamao de la muestra es reducido, los resultados del experimento pueden venir
afectados por el hecho de que no sean homogneos los elementos que se han asignado a cada
tratamiento debido precisamente a la presencia de estos otros factores que tienen una influencia
decisiva, pero que no estn controlados.
El diseo por bloques tiene por finalidad controlar los errores provocados por el impacto desigual que
pueden tener dichos factores no controlados, a los que se les denomina factores de bloque, en los
distintos tratamientos.
En el diseo por bloques se forman grupos homogneos, o bloques, es decir, se toman elementos de
un mismo nivel (o de una misma combinacin de niveles) de los factores de bloque. Despus, y de
forma aleatoria, se asignan los elementos de cada bloque a los distintos tratamientos.
As pues, en el diseo por bloques se van a distinguir dos tipos de factores: factores de tratamiento y
factores de bloque. Los primeros se introducen para analizar su efecto sobre la variable dependiente,
mientras que los factores de bloque se utilizan para reducir los errores en el experimento.
Sealar que en el diseo por bloques se adopta el supuesto de noexistencia de interaccin entre los
factores de tratamiento y los factores de bloque.
Los diseos por bloques ms importantes son: diseo por bloques completos al azar, el diseo de
medidas repetidas y el diseo de cuadros latinos.
ANOVA DISEO POR BLOQUES
Fuente variacin
Interseccin
Factor Tratamiento
Factor Bloqueo
Residual (Error)
Total
Total corregida
g =1 j=1
cinSPSS N g =1 j=1 N
2
G
T T2 SPSS
J
T
2
T
2
g =1 J
g
N j=1 G j N
donde,
Z j = 1 en el j simo bloqueo
Z = 0 en otro bloqueo distint o del j simo
j
Ejemplo 5. En una investigacin se desea analizar la concentracin de mercurio en el encfalo, la
musculatura y los tejidos oculares de truchas expuestas a dosis letales (0,30 unidades txicas) de
metilo de mercurio. Diez truchas elegidas aleatoriamente arrojaron las concentraciones expuestas en
la tabla (en microgramos de mercurio por gramo de tejido).
Nmero de trucha
1
2
3
4
5
6
7
8
9
10
Las fuentes de variacin controladas en el experimento son: Un factor tratamiento (Tejido) con tres
niveles de efectos fijos: Encfalo, Musculatura y Ojos. Un factor de bloqueo (trucha) del que se han
tomado de modo aleatorio 10 bloques o niveles de bloqueo (10 ejemplares).
Se trata de bloques completos (de tamao 3, igual al nmero de niveles del factor tratamiento) pero
no aleatorizados. La variable respuesta o dependiente es la Concentracin de Mercurio (en
microgramos por gramo de tejido).
Al tratarse de bloques completos de tamao igual al nmero de niveles del factor tratamiento no es
posible testar la existencia de interaccin entre el factor tratamiento y el factor de bloqueo, de modo
que el modelo matemtico es anlogo al de un diseo de dos vas de efectos principales con una sola
rplica:
Ygj = + g + j +
gj
G1 J1
El modelo matemtico utilizando variables dummy es: Ygj = GJ +
g=1
g Xg +
j=1
j
Z j + gj
1
2
3
4
5
6
7
8
9
10
TOTAL
G J 3 10 SC Inter sec Y
2
SCT = Y =
2
cin
= = 32,199
SPSS SPSS
gj gj
g =1 j=1 g =1 j=1 gj
N
2
G J Y 3 10 Y
2
31, 08
2
= Y
2 2
SCT corregido SPSS
= Y = 37, 923 = 37, 923 32,199 = 5, 724
gj
g =1 j=1 N g =1 j=1 N 30
2
G Y Y
2
15, 14
2 2 2 2
SC Intergrupos SPSS 10 , 85 5, 09 31, 08
= SC Tejido =
g
+ + = 37,285 32,199 = 5, 086
= 10
g =1 J N 10 10 30
J 2 2
SC BloqueoSPSS = SC Trucha = Y j Y =
j=1 G N
Y
2 g
SC ErrorSPSS = SCR = + = 37, 923 37,285 32,293 + 32,199 = 0, 544
g =1 j=1
gi
g =1 J j=1 G N
G1 J1
Modelo matemtico: Ygj = GJ +
g=1
g
Xg +
j=1
j
Z j + gj
6
(G 1)(J 1) 18
La hiptesis nula de que no hay diferencias entre las concentraciones medias de mercurio de
los tres tejidos considerados (encfalo, musculatura y ojos):
H : =0 =1 2 3
MC Intergrupos
F=
se contrasta a travs del estadstico MCR
SC Intergrupos 5, 086
MC Intergrupos = MC tejido = = = 2, 543
G1
2
MC Intergrupos 2, 543
F= = = 84,147
MCR 0,
03022
Siendo F = 84,147 > F ; (G1), (G1)( J1) = F0 ,05; 2 , 18 = 3, 5546 se rechaza la hiptesis nula, concluyendo
que
existen diferencias significativas en las concentraciones medias de mercurio en los
tejidos considerados.
A la vista de los resultados, se puede concluir que no es eficiente bloquear puesto que las
diferencias entre los bloques (truchas) solo explica el 1,64% de la variabilidad de la concentracin
de mercurio, porcentaje irrelevante con un coste para el procedimiento dado (se han invertido
sin
necesidad J 1 = 9 grados de libertad en estimar los efectos del bloque).
Para realizar el anlisis con SPSS: Analizar > Modelo lineal general > Univariante
Es irrelevante introducir el factor de bloqueo (trucha) como de efectos fijos o de efectos aleatorios ya
que no interesa realizar contraste alguno sobre sus niveles.
Analizar > Modelo lineal general > Univariante > Post hoc
Para realizar las comparaciones dos a dos de las medidas de concentracin de mercurio en los tres
tipos de tejido analizados atendiendo a controlar la tasa de error de tipo I global.
En este caso, al tratarse de slo 3 niveles de tejido podra tener sentido el criterio de Bonferroni. Se
selecciona Bonferroni, Scheff, Duncan y Tukey.
Analizar > Modelo lineal general > Univariante > Opciones
O bien,
Prueba de los efectos intersujetos. Proporciona el cuadro ANOVA que se muestra en la tabla
adjunta.
No hay que considerar la prueba F para los efectos bloque (trucha), es recomendable vaciar las celdas
relativas a la misma y visualizar ANOVA como se muestra a continuacin:
Como ya se haba calculado manualmente:
3 10 SC Inter sec 2
T
Total = SCTSPSS = Ygj2 = 37, 923 cinSPSS
= = 32,199
g =1 j=1
N
2
3 10
T
Total corregida = SCT corregidoSPSS = Ygj2 = 5, 724
g =1 j=1
N
2
3
T T
2
SPSS
10
T
2
T
2
g =1 J
g
N j=1 G j N
2
3 10 3
Tg 10
Ti
2 2
T
SC ErrorSPSS = SCR = Y + = 0, 544
2
gi
g =1 j=1 g =1 J i=1 G N
G1 J1
Modelo matemtico corregido: Ygj GJ =
g=1
g Xg +
j=1
j
Z j + gj
SCR 0, 544 2
) = 0, 03022
MCR = = = 0, 030 6 = Var (gj
(G 1)(J 1) 18
Estimacin de los parmetros. Proporciona las estimaciones para los parmetros del modelo,
sus errores tpicos, intervalos de confianza y cantidades de inters para contrastar la hiptesis
nula de que estos parmetros sean iguales a 0 (estadstico t, nivel crtico, potencia observada,
2
coeficiente ).
G1 J1
El modelo matemtico utilizando variables 'dummy': Ygj = GJ +
g=1
g
Xg +
j=1
j
Zj + gj
Grficos de perfil
Para tener una idea clara del grfico de perfil de los tejidos, esto es, de la distancia que separa los
puntos hay que advertir que el error estimado para las medias es 0,055.
En el grfico de perfil para los bloques se observan unas diferencias insignificantes.
Los residuos se muestran tipificados (divididos por la raz cuadrada del error cuadrtico medio
estimado).
Este grfico matricial da una idea si se verifican los supuestos de independencia, homogeneidad de
varianzas y falta de ajuste. En efecto:
En un modelo con Buen Ajuste a los Datos, la nube de puntos PronosticadosObservados debiera
mostrar un perfil cercano a la linealidad (a ms linealidad mejor ajuste). Grfico de coordenadas
(1, 2) o (2, 1) en la matriz.
El grfico matricial permite intuir que las hiptesis de homogeneidad de varianzas, independencia y
bondad de ajuste estn presentes, validando en cierto modo el anlisis desarrollado.
DISEO EXPERIMENTAL CON UN FACTOR ANIDADO o JERARQUICO
DISEO FACTORIAL: Todos los niveles de cada factor estn combinados con todos los niveles de los
restantes factores.
Niveles Factor A
1
2
3
4
MODELO JERRQUICO O ANIDADO: Ciertos niveles del factor B estn ligados a ciertos niveles del
factor A.
Niveles Factor A
1
2
3
4
La presencia de un nivel de B depende de la de un cierto nivel de A. En este caso, se dice que el factor
B est anidado en el factor A, indicando con la notacin B j(i) que el jsimo nivel de B corresponde con
el isimo nivel de A.
MODELO EQUILIBRADO: Factor anidado con el mismo nmero de observaciones por celda.
MODELO NOEQUILIBRADO: Factor anidado con distinto nmero de observaciones por celda.
1. DISTINTO NMERO DE NIVELES DEL FACTOR ANIDADO POR CADA NIVEL DEL
FACTOR PRINCIPAL
MODELO ESTADSTICO
Media global
j(i) Efecto producido por el nivel jsimo del factor B dentro del nivel isimo del factor A
(j = 1, 2, " , bi )
K Nmero de rplicas (k = 1, 2, " , K)
N Nmero de observaciones: N = k bi
i
(ij)k Error experimental. Se asume que los (ij)k son todos ellos independientes e idnticamente
distribuidos segn una N(0, )
NO HAY INTERACCIN: CADA NIVEL DEL FACTOR B NO APARECE CON CADA NIVEL DEL FACTOR A.
Y Y
ijk
I J K I J K I J K I J K I J K
i ij i ijk ij
2 2 2 2 2
Y = Y + (Y Y ) + (Y Y ) + (Y Y )
i=1 j= 1 k= 1 i=1 j= 1 k= 1 i=1 j= 1 k= 1 i=1 j= 1 k= 1
i=1 j= 1 k= 1
ijk
I J K I J K I J K I J K I J K
i ij i ijk ij
2 2 2 2 2
Y = Y + (Y Y ) + (Y Y ) + (Y Y )
i=1 j= 1 k= 1 i=1 j= 1 k= 1 i=1 j= 1 k= 1 i=1 j= 1 k= 1
i=1 j= 1 k= 1
i ij i ijk ij
2 2 2 2
Y Y ) = (Y Y ) + (Y Y ) + (Y Y )
i=1 j= 1 k= 1 i=1 j= 1 k= 1 i=1 j= 1 k= 1 i=1 j= 1
k= 1
I J K
ijk
I J K i I 2 2
SCA = (Y Y )2 = 1 Yi Y
b
i=1
i=1 j=1 k =1 K i N
I J K
Y
I J I 2
1 i
SCB(A) = (Y Y ) =
ij ij
K b
2 2
Y i
siendo Xi la variable que toma el valor 1 en el isimo nivel del factor A y 0 en otro caso, y Z j la
variable que toma el valor 1 en el jsimo nivel del factor B y 0 en otro caso.
MODELO DE EFECTOS FIJOS: Los estimadores por mnimos cuadrados de j(i) = + i + j(i) son nicos
y son j(i) = Yij . Sin embargo existen infinitas soluciones para estimar los parmetros , i y j(i) ,
siendo necesario imponer restricciones.
= Y
Y
= i Y
i
= Yij Yi
j(i)
En el SPSS se plantea el mismo modelo pero los efectos se computan con las restricciones I = 0 y
= i , siendo I y J los ltimos cdigos de los niveles del Factor A y del factor B anidado
J(i)
0
respectivamente.
Intersec cin
= YI J
Con este criterio, los efectos en el SPSS se estiman: i = Yi J YIJ
j(i)
= Yij Yi J
Interseccin
Factor A
Factor B en A
Error
Total
Total corregida
y
i
Interseccin
Factor A
Factor B en A
Error
Total
Total corregida
Ejemplo 6. Una entidad bancaria tiene siete sucursales en tres ciudades. En la direccin de recursos
humanos de la entidad estn interesados en conocer si la diferente captacin de clientes, controlada
por el volumen de sus cuentas corrientes, entre unas sucursales y otras, as mismo entre ciudades, se
debe al hecho de ser las ciudades diferentes econmicamente, al trabajo de los directores de las
sucursales, o ambas cosas a la vez.
Con la intencin de controlar estas posibles fuentes de variabilidad, se analizan dos factores: Factor
Ciudades y Factor Sucursales. Se decide utilizar un diseo factorial jerrquico (los niveles del Factor
Sucursales no pueden combinarse con todos y cada uno de los niveles del Factor Ciudades).
Se toma una muestra de tres cuentas corrientes en cada sucursal, en cientos de euros.
C. C. / Sucursal
1
2
3
Yij
Yi
Y
3 7 3 3 7 3 2 2
21190
ijk
i=1 j=1 k =1 2 Y
SCT = Y = 21680486 SCInter sec cin 2 = = = 21381719, 05
Y N 21
= i=1 j=1 k =1
3 7 3
(Y
ijk
SCT corregida =
2
Y ) = SCT SCInter sec cin = 21680486 21381719, 05 = 298766,95
i=1 j=1 k =1
3 7 3 i 2 2 2 2 2 2 2
Yi Y 1 6819
+ 9369 + 5002 21190 = 291204,12
3
SCA = (Y Y ) = 1 =
i=1 j=1 k =1 K i=1 b i N 3 2 3 2 21
I J K
I J
1 ij
1 a
Y
2
ij i
i=1 j=1 k =1 K K bi
12 3
17Y 3 2
1
SCB(A) =
K Yij
i=1 j=1 K b
i=1
i
i
= 34552 + 33642 + 31662 + 31432 + 30602 + 24872 + 25152
3
2
9369 50022
1 2
6819
+ + = 3583, 5
3 2 3 2
Fuentes Variacin
Interseccin
Factor A
Factor B en A
Error
Total
Total corregida
SCB(A) 3583, 50
SCA 291204 ,12 MCB(A) = = = 895,875
MCA = = = 145602, (R I) 4
06
I1 2
SCT 298766, 95
MCT = = =
SCE 3979, 33 14938,347 (N 1) 20
MCE = = = 284,238
R (K 1) 14
Los estimadores por mnimos cuadrados de j(i) = + i + son nicos y son j(i) = Yij . Sin
j(i)
embargo, existen infinitas soluciones para estimar los parmetros , i y j(i) , siendo necesario
imponer restricciones.
En el SPSS se plantea el mismo modelo pero los efectos se computan con las restricciones I = 0 y
= i , siendo I y J los ltimos cdigos de los niveles del Factor A y del factor B anidado
J(i)
0
respectivamente.
3 = 0
Los efectos en el SPSS se estiman con las restricciones:
= 2(1) 2(3)
=0
= 3(2)
= YI J = Y32 = (2515 / 3) = (Interseccin)
838,333
1 = Y
12 32
Y = (3364 / 3) (2515 / 3) = 283
i = Yi J 6 2 = Y23 Y32 = (3060 / 3) (2515 / 3) =
181,667
YIJ
3 = Y32 Y32 = (2515 / 3) (2515 / 3) = 0
1(1) = Y = (3455 / 3) (3364 / 3) = 30,333
11 Y12
2(3)
= Y23 Y23 = (3060 / 3) (3060 / 3) = 0
3(1) = Y31 Y32 = (2487 / 3) (2515 / 3) = 9,333
= (2515 / 3) (2515 / 3) = 0
3(2) = Y32 Y32
MODELO DE EFECTOS FIJOS: Ciudades (Factor A) y Sucursales (Factor B) son de efectos fijos.
H0 (A) : i = 0 y H0 [B(A)] : j(i) = 0
F. Variacin
Factor A
Factor B en A
Error
MCA 145602, 06 FB( A) MCB(A) 895, 875
FA = = = 512,254 = = = 3,152
MCE 284,238 MCE 284,238
la hiptesis nula, la captacin de clientes es significativamente distinta en los tres tipos de ciudades,
consecuencia del hecho de su distinto carcter econmico.
Entrada de datos en SPSS: Analizar > Modelo lineal general > Univariante
Analizar > Modelo lineal general > Univariante > Modelo
Es necesario utilizar el editor de sintaxis para informar al SPSS que se trata de un diseo jerarquizado.
En Opciones:
2. IGUAL NMERO DE NIVELES DEL FACTOR ANIDADO EN TODOS LOS NIVELES DEL
FACTOR PRINCIPAL (DISEO BALANCEADO)
Ejemplo 7. Dos fabricantes comercializan tres filtros muy utilizados en respiradores comerciales para
la proteccin de partculas de materia. Para comparar los filtros se realizaron tres rplicas de prueba
independientes con cada filtro, evalundose el porcentaje de penetracin mediante una prueba
estndar de aerosol.
Rplicas \ Filtro
1
2
3
Los niveles del factor 'Tipo de Filtro' estn anidados en los niveles del factor 'Fabricante': En
Fabricante 1 se ubican los niveles Filtro 1, Filtro 2 y Filtro 3. En Fabricante 2 se ubican los niveles Filtro
4, Filtro 5 y Filtro 6.
Se trata por tanto de un diseo jerarquizado o anidado en dos etapas.
Rplicas \ Filtro
2 3 3 2 3 3
Y2 14,32
2
ijk
i=1 j=1 k =1
SCT = Y = 17,
2
SCInter sec cin 2 = = = 11,392
Y N 18
3072 = i=1 j=1 k =1
2 3 3
ijk
2 3 3 i 2 2 2 2 2
SCA = (Y Y ) = 1
2
Yi Y = 1 4,26 + 10, 06 11,392 = 1,869
i=1 j=1 k =1 K i=1
I N 3 3 3
2 3 2 2
1 ij 1 2
Y 1 2 1 10, 06
4,26
SCB(A) = 3,34 + 0, 53 + 0,39 + 2,69 + 2,1 + 5,27
2 2 2 2 2 2 2
Y + =
bi = 3
i
K i=1 j=1 K i=1 3 3 3
= 17, 0025 13,2612 = 3,7413
SCE = SCT corregida SCA SCB(A) SCE = 5,915 1,869 3,741 = 0,305
6
Fuentes Variacin
Interseccin
Factor A
Factor B en A
Error
Total
Total corregida
MODELO DE EFECTOS FIJOS: Ciudades (Factor A) y Sucursales (Factor B) son de efectos fijos.
H0 (A) : i = 0 H [B(A)] : = 0
0 j(i)
y
SCB(A) 3, 741
SCA 1, 869 MCB(A) = = =
MCA = = = 1,869 0,935 (R I) 4
I1 1
En el SPSS se plantea el mismo modelo pero los efectos se computan con las restricciones I = 0 y
= i , siendo I y J los ltimos cdigos de los niveles del Factor A y del factor B anidado
J(i)
0
respectivamente.
2 = 0
En el ejemplo, I = 2 y J = 3, de modo que las restricciones son:
3(1) = 3(2) = 0
=Y Y = (0,39 / 3) (0,39 / 3) = 0
13 13
= Y Y 6
ij iJ
j(i)
1(2) = Y21 Y23 = (2,69 / 3) (5,27 / 3) = 0,86
2(2) = Y Y23 = (2,1 / 3) (5,27 / 3) = 1, 057
22
3(2) =
Y23 Y23 = (5,27 / 3) (5,27 / 3) = 0
ESTIMACIN DE LOS PARMETROS
Interseccin
[fabricante 1]
[fabricante 2]
[Filtro 1] ([Fabricante 1])
[Filtro 2] ([Fabricante 1]) El modelo estadstico utilizando variables 'dummy':
[Filtro 3] ([Fabricante 1])
J1 I1
J1
[Filtro 4] ([Fabricante 2]) Y = + j(I) Z j + i + j(i) Z j Xi +
[Filtro 5] ([Fabricante 2]) j=1 i=1
j=1
[Filtro 6] ([Fabricante 2])
Y = 1,757 + [ 1,627 + 0,983 . Z1 + 0, 047 . Z2 ] . X1 + [ 0,860 . Z1 1, 057 . Z2 ] . X2 +
Analizar > Modelo lineal general > Univariante > Post hoc
Analizar > Modelo lineal general > Univariante > Pegar
Es necesario utilizar el editor de sintaxis para informar al SPSS que se trata de un diseo jerarquizado.
En consonancia con los comentarios expuestos, el contraste de Levene rechaza la hiptesis nula de
homocedasticidad [p valor = 0, 01 < 0, 05] , es decir, se rechaza la hiptesis de igualdad de varianzas.
siendo,
X1 Variable que toma el valor 1 cuando el porcentaje de penetracin se mide en un filtro del primer
fabricante y 0 en otro caso.
Zj Variable que toma el valor 1 si se trata del jsimo filtro y 0 en otro caso.
DISEO JERARQUICO FACTORIAL: MODELO JERRQUICO Y FACTORES CRUZADOS
Factor B
Nivel 1 Nivel 2
Factor C 1 2 3 Yi1 1 2 3 Yi2 Yi
Factor A
Y113
Y1122 Y1132 Y1212 Y1222 Y1232
Y111
Y112
Y121
Y122
Y123
Y213
Y211
Y212
Y221
Y222
Y223
Y311
Y323
Y1112
1
#
Y111 l
Y2111
Y2112
2 #
Y211 l
Y3111
Y3112
Y322
Y312
Y313
Y321
3 #
Y311 l
Y j k
Y j
Media global
k ( j ) Efecto producido por el nivel ksimo del Factor C dentro del nivel jsimo del Factor B,
donde (k = 1, 2, ", K)
I J
2 Y
i
Y
2 2
2
j
Y
SCA = Yi=1
j=1
SCB =
JKL N IKR N
I J
Y
2
ij 2
i=1 j=1 Y
SC(A x B) = SCA
SCB KR N
I J K
Y
2 2 2
ij k J K Y I J Y J Y2j
jk ij
SC [(A x C) (B)] =
i=1 j=1 k =1 +
R
j=1 k =1 IR KR IKR
i=1 j=1 j=1
Factor A
Factor B
C en B
AxB
(A x C) en B
Error
Total corregida
Ejemplo 8. Para mejorar la rapidez de ensamblaje en una lnea de produccin se estudia la
interseccin manual de componentes electrnicos en circuitos impresos.
Se disean tres aparatos para ensamblar y dos distribuciones del lugar de trabajo, seleccionando a
cuatro operadores en cada lnea de distribucin en dos localidades diferentes. Se obtienen dos
rplicas de cada combinacin de tratamientos de este diseo.
Los tiempos de ensamblaje se muestran en la siguiente tabla:
Aparato / Operadores
Factor B
Distribucin 1 Distribucin 2
Factor C 1 2 3 4 Yi1 1 2 3 4 Yi2 Yi
Factor A
22 23 28 25 Y11 26 27 28 24 Y12 Y1
1 24 24 29 23 198 28 25 25 23 206 404
30 29 Y21
2 30 27 29 30 24 28 Y22 Y2
27 28
32 25 228 28 27 23 30
25 24 219 447
3 27 26 Y31 27 26 24 28 Y32 Y3
21 22
25 23 193 25 24 27 27
208 401
Y j k 149 150 171 149 163 159 151 160 633 1252
619
Y j 619 633
2
3 2 4 2 Y 12522
SCT = Yi j 2k r = 32956 SCInter sec cin = = = 32656,33
i=1 j=1 k =1 r =1 N 48
2
3 2 4 2 Y
SCT corregida = Y2i j k = SCT SCInter sec cin = 32956 32656,33 = 299,67
N
r
i=1 j=1 k =1 r =1
3 2
Y
Yi
2
2
1 1252
404 + 447 +
2 2
SCA = i=1
= = 32739,13 32656,33 = 82,80
4012
JKR N 16 48
2
Y
2
2 2
j Y 1 1252
619 + 633
j=1 2 2
SCB = = = 32660, 41 32656,33 = 4, 08
IKR N 24 48
3 2
Y ij Y
22
1 1252
2
198 + 228 + 193 + 206 + 219 + 208
i=1 j=1 2 2 2 2 2 2
SC(A x B) = SCA SCB = =
KR N 8 48
= 32762,25 32656,33 82,80 4, 08 = 19, 04
3 2
Y 2
Y 2j 1
2
( 619 + 633 )
2
i=1 j=1
jk
= 149 + 150 + 171 + 149 + 163 + 159 + 151 +
2 2 2 2 2 2 2 =
SC C (B) = 2
160
IR IKR 6 24
= 32732,33 32660, 42 = 71,91
Factor B
Distribucin 1 Distribucin 2
Factor C 1 2 3 4 Yi1 1 2 3 4 Yi2 Yi
Factor A
46 47 57 48 Y11 54 52 53 47 Y12 Y1
1
111
112 113 114
198 121 122 123 124
206 404
57 57 62 52 Y21 57 57 47 58 Y22 Y2
2
211
212 213 214 221 222 223 224
228 219 447
46 46 52 49 Y31 52 50 51 55 Y32 Y3
3
311
312 313 314 321 322 323 324
193 208 401
Y j k 149 150 171 149 163 159 151 160 633 1252
619
Y j 619 633
3 2 4 2 4 3 2 j
Yi j k Y j k
2
Y2
i j Y
2
j
2
SC [ A x C (B)] =
i=1 j=1k =1 j=1k =1 i=1 j=1 =1
+ J =
R IR KR IKR
46 + 47 + 57 + " + 51 + 55
2 2 2 2 2
0 , 27 6 0 ,0 1 4 0 ,0 6 4 0 ,2 4 0 0 , 22 0 0 ,1 8 7
82,80 4,08 19,04 71,91 65,84 56
1= + + + + +
29 9,6 7 29 9, 67 2 9 9,6 7 29 9, 67 29 9,6 7
2 99 ,6 7
Coeficiente Determinacin 0,813 Variacin no
Explicada
TABLA ANOVA: DISEO JERRQUICO FACTORIAL
Factor Variacin
Factor A
Factor B
C en B
AxB
(A x C) en B
Error
Total corregida
SCA 82, 80 SCB 4 , 08 SC C (B) 71, 91
MCA = = = 41, 40 MCB = = = 4, 08 MC C (B) = = =
11,99
I1 2 (J I) 1 J (K 1) 6
SC [ A B] 19, 04 SC [ A C 65, 84
MC [ A B ] = = = 9, MC [ A C (B)] = = = 5, 49
(B)]
52
(I 1)(J 1) J(I 1)(K 1) 12
2
SCR 56
MCR = = = 2,33 SCT 299, 67
IJK (R I) MCT = (N 1)= 47 = 6,38
24
MCA 41, 40 MC B 4 ,08 = 0,34
F = = = 7, 54 F = =
MC [ A C (B)]
A B
5, 49 MC C (B) 11,99
MC [ A B] 9,52 MC [ A C 5, 49
(B)]
FAxB = = = 1,73 FAC (B) = MCR = = 2,36
MC[ A C(B)
] 5, 2,33
49
Entrada de datos en SPSS: Analizar > Modelo lineal general > Univariante
99
Pulsando Aceptar en el Visor de Resultados:
Para obtener la informacin deseada es necesario cambiar la ltima fila [/DESIGN =] por:
100
100
El Factor C (Operarios) est anidado en B y se declara el Factor A (aparatos):
102
102
103
103