Você está na página 1de 114

Gestin Aeronutica: Estadstica Terica

Facultad Ciencias Econmicas y Empresariales


Departamento de Economa Aplicada
Profesor: Santiago de la Fuente Fernndez

ANLISIS DE LA VARIANZA
ANLISIS DE LA VARIANZA, MLG
Facultad Ciencias Econmicas y Empresariales
Departamento de Economa Aplicada
Profesor: Santiago de la Fuente Fernndez

MODELOS DE ANLISIS DE LA VARIANZA


El anlisis de la varianza es un mtodo estadstico para determinar s diversos conjuntos de muestras
aleatorias de una determinada variable proceden de la misma poblacin o de poblaciones distintas.

En general, cada conjunto muestral se caracteriza por estar afectado por un tratamiento especifico,
que eventualmente puede influir en los valores que tome la variable objeto de estudio.

Originalmente, el anlisis de la varianza se utiliz para determinar si las cosechas, que se obtenan
con distintos tratamientos o niveles de fertilizantes, diferan o no. As, en este caso, las parcelas
tratadas con un determinado nivel de fertilizantes constituyen una poblacin.

Se denomina factor a la variable que supuestamente ejerce una influencia sobre la variable estudiada
a la que se denomina dependiente. En el caso anterior, el factor es el fertilizante y la variable
dependiente la cosecha.

En el anlisis de la varianza, el factor cuya influencia se quiere corroborar se introduce de forma


discreta, independientemente que sea de naturaleza continua o no. As, la cantidad de fertilizante
aplicada tiene una naturaleza intrnsecamente continua pero en un estudio de anlisis de la varianza
solamente se consideran un nmero determinado de niveles. Cuando el factor sea de naturaleza
discreta, que ser la situacin ms frecuente, se utilizan de forma equivalente los trminos de grupo o
nivel para referirse a una caracterstica concreta.

El anlisis de la varianza, especialmente por la difusin de programas de ordenador, es conocido por


las siglas inglesas ANOVA (ANalysis Of VAriance).

ANLISIS DE LA VARIANZA CON UN FACTOR


El anlisis de la varianza es un caso de aplicacin de un contraste de hiptesis a un modelo lineal
especfico.

Tomando como referencia, un modelo, en un contraste de hiptesis se requiere la formulacin de


una hiptesis nula y otra alternativa, la construccin de un estadstico (a partir de los datos
muestrales) con una distribucin conocida y el establecimiento de una regin de aceptacin y otra de
rechazo.

El modelo terico de referencia en el anlisis de la varianza es muy sencillo, y viene expresado por
cualquiera de las expresiones alternativas que se adjuntas, que son equivalentes:
Yg = g + g g = 1, 2,", G
Modelos tericos en el anlisis de la varianza: Y = + +
g g g = 1, 2,", G
g

En las dos formulaciones, considerando G poblaciones, cada valor de la variable es igual a una media
terica ms una variable aleatoria ( g ) , que implcitamente tiene de media cero.

1 1
En el modelo terico Yg = g + g la media de cada poblacin es igual a un parmetro ( g )
En el modelo terico Yg = + g + la media de cada poblacin se define mediante dos
g
parmetros: una media general () y un parmetro (g ) que recoge la discrepancia especfica de
cada poblacin respecto a la media general. En este caso, las discrepancias estn sujetas a que su
suma sea nula.

HIPTESIS SOBRE LA POBLACIN: Para especificar un modelo se requiere establecer hiptesis acerca
de los elementos que aparecen en el mismo. Las hiptesis estadsticas que se adoptan se refieren a la
poblacin y, en consecuencia, al proceso de obtencin de la muestra.
Hiptesis estadsticas sobre la poblacin: Yg N(g , 2 )

2
Hiptesis de Homocedasticidad: Las varianzas de todas las poblaciones son idnticas
Cada una de las poblaciones tiene una distribucin normal
De Yg N(g , 2 ) se desprende que la variable aleatoria g N(g , 2 )

HIPTESIS SOBRE LA OBTENCIN DE LA MUESTRA: Las hiptesis sobre el proceso de obtencin de la


muestra facilita la realizacin del proceso de inferencia a partir de la informacin disponible.

Se supone que se ha obtenido una muestra aleatoria independiente de cada una de las G
poblaciones.

H0 : 1 = 2 = " = G
MODELO Yg = g + son iguales
g H : No todas las
1 g

H0 : 1 = 2 = " = G
MODELO Yg = + g + son iguales
g H : No todas las
1 g

En lo sucesivo, en el anlisis de la varianza con un solo factor se elige el modelo Yg = g + g , mientras


que en el anlisis de la varianza con dos factores se utilizar la formulacin Yg = + g + g

En el anlisis de la varianza se distingue entre modelo de efectos fjos y modelo de efectos aleatorios.

En el modelo de efectos fjos, los grupos, o niveles, del factor o factores investigados se fijan de
antemano. Por ello, las conclusiones que se extraen en el anlisis nicamente pueden aplicarse a
los niveles analizados. El modelo de efectos fijos es el ms utilizado en el mundo de la empresa.

En el modelo de efectos aleatorios los niveles utilizados se extraen de forma aleatoria de un


conjunto amplio de niveles. En consecuencia, los resultados del anlisis son vlidos para el
conjunto de niveles que se ha tenido en cuenta en el diseo inicial.

En el caso de ms de un factor, pueden disearse un modelo de efectos mixtos si se tienen en


cuenta simultneamente factores de efectos fijos y factores de efectos aleatorios.
DESCOMPOSICIN DE LA VARIANZA DE UN FACTOR
En cada poblacin se pueden extraer muestras de distintos tamaos. En esta lnea, ng ser el tamao
de la muestra del grupo g.

El tamao de la muestra total es (n), que es igual a la suma de los tamaos de las muestras de cada
uno de los grupos: n1 + n2 + " + nG = N

La media muestral global se obtiene sumando todos los valores de la muestra y dividiendo por el
tamao de la muestra total:

G ng

Y
g=1i =1
gi
Y=
N

Dentro de cada grupo se puede obtener la correspondiente media muestral. En este sentido, la media
del grupo g vendr dada por:

ng

Y i=1
gi
Yg =
ng

Cada Yg es un estimador insesgado de g , es decir, E Yg = g

La desviacin de cada observacin con respecto a la media global es (Ygi Y) , que puede
descomponerse de la forma:

desviacin cada desviacin explicada desviacin no explicada


o bs er va ci n p or el f ac t or (des via ci n re s idual)

(Ygi Y) = (Yg Y) + (Yg i Yg )

elevando al cuadrado ambos miembros de la expresin anterior:

(Yg i Y)2 = (Yg Y) (Yg i Yg


2
= (Yg 2Y) + (Yg i 2Yg + 2 (Yg Y) (Yg i Yg )
+ ) )

Si la expresin anterior se suma para todos los grupos y para todos los individuos de cada grupo de la
muestra, se obtiene:
ng ng ng ng
iG g 2
G g 2 gG gi 2
G g gi g
(Y Y) = (Y Y) + (Y Y ) + 2 (Y Y) (Y Y )

g =1 i=1

g =1 i=1

g =1 i=1

g =1 i=1
[1]

G ng G ng
el trmino (Yg Y) (Yg i Yg ) (Yg Y) . (Y gi
Yg ) = 0
=
g =1 i=1 g =1 i=1

La expresin [1] queda:


Suma cuadrados Suma cuadrados desviacin Suma cuadrados
desviacin desviacin total explicada por el factor no explicada
por el factor
SC T S SC R
CF
ng gi ng g ng gi 2g
G G G
2 2
(Y Y) = (Y Y) + (Y Y )
g =1 i=1
g =1 i=1
g =1 i=1

S C T SC F SC F SC R
SC R
ng gi ng g ng gi g ng gi g
G
2
G
2 gG 2 gG 2
G
2
(Y Y) = (Y Y) + (Y Y ) = n . (Y Y) + (Y Y )

g =1 i=1
g =1 i=1

g =1 i=1

g =1

g =1 i=1

A su vez, la suma de cuadrados de la desviacin no explicada, denominada suma de cuadrados de la


desviacin residual (SCR) o variabilidad residual, puede expresarse como agregacin de la suma de
cuadrados de desviaciones residuales correspondientes a cada uno de los grupos:
SCR = SCR1 + SCR2 + " + SCRG

ESTADSTICO F: GRADOS DE LIBERTAD


Grados de libertad (SCT) = N 1 (nmero total de datos menos G ng
uno)

Y g=1i =1
gi
La restriccin viene determinada por el clculo de Y . Una vez calculada la media global Y =
N
se puede obtener un dato (por ejemplo, YGn ) de la siguiente forma:
YGn = N Y11 Y12 " """" YG1 YG2 " YG(N1)
Y Y1n

es decir, al tomar desviaciones respecto a la media, como la suma total de las desviaciones es nula, se
puede calcular una desviacin dadas las dems.

Grados de libertad (SCF) = G 1 (nmero total de grupos menos uno)

La restriccin viene dada por el clculo de Y . Las g medias muestrales son datos independientes con
la salvedad de que vienen sometidos a una restriccin de la media general.
n1 Y1 + n2 Y2 + " + nG YG = N Y

Grados de libertad (SCR) = N (nmero total de datos menos nmero total de grupos)
G

Dado que la media muestral de cada grupo acta como una restriccin en el clculo de las
desviaciones de dicho grupo.

gl (SCT) = gl (SCF) + gl (SCR) = (G 1) + (N G) = N 1

MEDIA CUADRTICA: En el anlisis de la varianza se define una media cuadrtica como el cociente
entre cada suma de cuadrados y sus correspondientes grados de libertad, teniendo las siguientes
definiciones:
Suma cuadrados desviacin
Suma cuadrados Suma cuadrados desviacin no explicada por el factor
desviacin total explicada por el factor SC R
SC T S CF

G ng gi G ng g G ng gi g

2 2 2
(Y Y) = (Y Y) + (Y Y )
g= 1 i= 1 g= 1 i= 1 g=

1 i= 1

(N 1) gl (G 1) gl (N G) gl

G ng gi
(Y Y)2
Media cuadrtica total (MCT): SCT g=1i=1
MCT = =
N1 N1

G ng g
(Y Y)2
Media cuadrtica del factor (MCF): SCF g=1i =1
MCF = =
G1 G1

G ng gi g
(Y Y )2
Media cuadrtica residual (MCR): SCR g=1i =1
MCR = =
NG NG

2
La media cuadrtica residual (MCR), a la que se designa por S , es unR estimador insesgado de la
2
E S
=E
2 SCR 2
varianza , es decir: =
R
NG

Para el contraste de la hiptesis nula H0 , asumiendo el cumplimiento de las hiptesis estadsticas,


para el contraste del anlisis de la varianza con un factor se utiliza el estadstico de contraste:

SCF
MCF G 1
F= = F (G1) , (NG)
MCR SCR
NG

Fuente variacin

Factor

Residual

Total

H0 : 1 = 2 = " = G
MODELO Yg = g + g H : No todas las son iguales
1 g

No se rechaza H0 si F(G1) , (nG) < F , (G1) , (nG)


M CF
= MCR
REGLA DE DECISIN:

Se rechaza H0 si F(G1) , (nG) MCF > F , (G1) , (nG)


= MCR
El valor de indica la probabilidad de cometer un error
de tipo I, es decir, de rechazar la hiptesis nula cuando
es cierta. Si se rechaza la hiptesis nula con la evidencia
de la informacin muestral se dice que ese rechazo
implica una conclusin fuerte.
Sin embargo, la aceptacin de la hiptesis nula es una
conclusin dbil debido a que se desconoce cul es la
probabilidad de no rechazar la hiptesis nula cuando
debera ser rechazada, es decir, se desconoce la
probabilidad de cometer un error tipo II.

Por este motivo, en lugar de utilizar la expresin de aceptar la hiptesis nula, es ms correcto decir
no rechazar la hiptesis nula, ya que cuando se da esta circunstancia lo que realmente ocurre es que
no se dispone de suficiente evidencia emprica para rechazar la hiptesis nula. Si se tiene en cuenta
esta reserva, se puede utilizar de forma indistinta las expresiones de aceptar y no rechazar.

Los programas informticos suelen ofrecer, junto al estadstico aplicado, el nivel de significacin
crtico, al que se denomina ' , asociado a dicho estadstico. Para designar a este valor en algunos
programas se utilizan las expresiones pvalue o significatividad.
Pr ob F , (G1) , (nG) > = ' (p value)

F

En la grfica se ilustra el clculo de ' a partir del estadstico F, donde se observa que la operacin de
determinar ' es la inversa de buscar el valor de las tablas para un nivel de significacin dado.

Determinado ' (pvalue) se rechaza la hiptesis nula para todo nivel de significacin tal que
> p value ; por el contrario, se acepta la hiptesis nula cuando < p value .

El nivel de significacin crtico es, pues, un indicador del nivel de admisibilidad de la hiptesis nula,
cuanto mayor sea el nivel de significacin crtico (pvalue), mayor confianza se puede depositar en la
hiptesis nula.

La utilizacin del pvalue (nivel de significacin crtico)


implica dar la vuelta al problema del contraste de
hiptesis. As en lugar de fijar a priori un nivel de
significacin, se calcula un valor pvalue que permita
determinar a posteriori para que niveles de significacin
se puede rechazar la hiptesis nula
VALIDACIN DEL MODELO
Se analizan dos tipos de cuestiones diferentes:

a) Se cumplen en el modelo las hiptesis bsicas adoptadas?

b) Es importante la variabilidad total explicada por el factor?

a) La validez del estadstico F construido est condicionada al cumplimiento de las hiptesis


estadsticas bsicas del modelo formuladas: Yg = g + , Yg N( g , 2 )
g

2
Hiptesis de Homocedasticidad: Las varianzas de todas las poblaciones son idnticas
Cada una de las poblaciones tiene una distribucin normal.
De Yg N(g , 2 ) se desprende que la variable aleatoria g N(g , 2 )

Los contrastes de las hiptesis bsicas se efectan a partir de los residuos, que se definen:

gi = Ygi g = Yg i Yg

HIPTESIS DE NORMALIDAD: Se puede verificar mediante alguno de los contrastes existentes,


como por ejemplo el contraste de KolmogorovSmirnov. Como un indicador de si los residuos se
aproximan o no a una distribucin normal, son tiles los grficos denominados QQ.
En estos grficos se representan los valores observados de los residuos y los valores esperados en
el caso de que siguieran una distribucin normal.

Ahora bien, Cules son los efectos de la no normalidad en el anlisis de la varianza?.


El hecho de que los residuos no se aproximen a una distribucin normal en general no afecta de
forma importante al estadstico F, que est basado en el supuesto de normalidad.
La razn se debe a que, como se estn comparando medias, puede ser vlida la aplicacin del
teorema central del lmite a datos procedentes de una distribucin no normal.

HIPTESIS DE HOMOCEDASTICIDAD: Para determinar si la varianza permanece constante a travs


de los distintos grupos (es decir, para verificar el cumplimiento de la hiptesis de
homocedasticidad) se utilizan, entre otros, los contrastes de Cochranne, Barlett y Box.

El problema que se plantea con la aplicacin de dichos contrastes de homocedasticidad es que la


validez de los mismos est condicionada al cumplimiento de la hiptesis de normalidad.

En tal caso, el estadstico F no se ve muy afectado por el hecho de que no exista homocedasticidad,
siempre que las muestras de los diferentes grupos sean del mismo o similar tamao. En este
sentido, algunos autores afirman que el no cumplimiento de la hiptesis de homocedasticidad
puede afectar a los contrastes del anlisis de la varianza cuando la razn entre los tamaos
muestrales del grupo ms grande y el grupo ms pequeo es mayor que 2.

En algunos casos, la no homocedasticidad de los datos puede corregirse aplicando el modelo


Yg = g + al logaritmo de la variable, en lugar de hacerlo a la variable original.
g
El grfico desviacin tpicamedia, que representa en ordenadas la desviacin tpica de cada grupo
y en abscisas la media respectiva, puede ser un instrumento sencillo para determinar si es o no
adecuada la transformacin logartmica. La transformacin logartmica sera pertinente cuando los
puntos desviaciones tpicasmedias muestren una tendencia creciente de carcter
aproximadamente lineal.

HIPTESIS DE INDEPENDENCIA: En la formulacin de hiptesis se adopta el supuesto de que se


han obtenido muestras aleatorias independientes dentro de cada uno de los grupos.

Sin embargo, cuando los datos se obtienen de forma secuencial puede ocurrir que este supuesto
no se cumpla. Una forma de averiguar si ocurre esta circunstancia es mediante la representacin
grfica de los residuos. Si los residuos siguen una cierta estela, en lugar de estar distribuidos de
forma aleatoria en torno al eje de abscisas, ser un indicio de falta de independencia.

b) La variabilidad total explicada por el factor viene dada por la medida de bondad del ajuste.

MEDIDA DE BONDAD DE AJUSTE: Para determinar si es importante la parte de la variabilidad total


explicada por el factor se utiliza el coeficiente de determinacin.
(tambin denominado eta cuadrado 2 )
Coeficiente de determinacin: 2 SCF
R = SCT

Un valor prximo a 1 del coeficiente de determinacin indica que la mayor parte de la variabilidad
total puede atribuirse al factor, mientras que un valor prximo a 0 significa que el factor explica
muy poco de esa variabilidad total.

ANLISIS DE LA VARIANZA CON DOS GRUPOS


H : = 2
Sean dos grupos, que se designan por 1 y 2, la hiptesis nula y alternativa son: 0 1
H1 : 1 2
Y1 Y2 t(N2)
Estadstico para el contraste en el anlisis de la t=
1 1
varianza con un factor y dos grupos: SR2 +
N1 N2

ANLISIS EXPOST: COMPARACIONES MLTIPLES


En el caso de que en un anlisis de la varianza se acepte la hiptesis nula de que los distintos grupos
tienen la misma media puede darse por concluido el estudio del caso.

Por el contrario, si se rechaza la hiptesis nula de igualdad es conveniente investigar qu grupos han
sido determinantes en ese rechazo. A este tipo de investigacin complementaria y posterior a los
contrastes bsicos del anlisis de la varianza se denomina anlisis expost.

En el anlisis expost se pueden aplicar dos tipos de procedimientos: (a) Intervalos de confianza
individuales. (b) Comparaciones mltiples.
Con cualquiera de los dos procedimientos se trata de determinar en qu medida difieren las medias
de las distintas poblaciones.

(a) INTERVALOS DE CONFIANZA INDIVIDUALES: Bajo la hiptesis de normalidad, la media muestral de


un grupo (por ejemplo, el grupo g) se distribuye

g
Y
g
Yg N g , en consecuencia, N [ 0 ,1]
ng
ng

La media cuadrtica residual es un estimador insesgado del parmetro 2 , es decir,
SCR
2
= S
E 2 =E =
S 2

R R
NG
Yg g Yg g
Al sustituir en la expresin , se tiene: t(NG)
2
R
ng ng S

SR2 es el valor de la
Construyendo el intervalo de confianza I = Y t t , donde
(1) g
2
, (NG)
ng 2
, (NG)


t de Student con (N G) grados de libertad que deja a la de la masa probabilstica.
2
derecha

De este modo se pueden construir intervalos de confianza individuales para cada una de las medias
poblacionales, sin tener en cuenta una visin de conjunto.

(b) COMPARACIONES MLTIPLES: Existen diferentes procedimientos para realizar comparaciones


mltiples de medias poblacionales. Los mtodos ms conocidos para la construccin de intervalos
de confianza conjuntos son los de Tukey, Scheff y Bonferroni.

INTERVALO DE CONFIANZA DE BONFERRONI


G(G 1)
Si existen G grupos, el nmero de comparaciones que se pueden realizar es c = , la
2
hiptesis a contrastar en cada una de estas comparaciones es:

H0 : p = q

H1 : p q

*
Si el nivel de significacin para el contraste de cada una de las hiptesis es ,
denominando RHj al suceso de rechazar la igualdad de dos medias en la comparacin jsima
*
cuando ambas son iguales, se verificar que: Pr ob (RH ) = j

Denominando RH al suceso de rechazar la igualdad de medias en una o ms comparaciones cuando


todas las medias son iguales, se tendr que:
*
c
Pr ob (RHj ) = c.
Pr ob (RH)
i=1

ya que la probabilidad del suceso RH, que es la unin de sucesos individuales RHj , debe de ser
menor o igual que la suma de probabilidades de cada uno de los sucesos individuales, pues stos
no son mutuamente excluyentes.
Si es el nivel de significacin global deseado para el conjunto de las comparaciones, se verificar
que: c.*

Cuando se desea un nivel de significacin global de , la aproximacin de Bonferroni consiste en


*
tomar para cada una de las comparaciones individuales un nivel de significacin de =
c
*
Es decir, en la aproximacin de Bonferroni se toma la cota inferior de c. para establecer el
nivel de significacin de cada contraste individual.

La aplicacin del contraste de Bonferroni, tambin conocido como contraste de la diferencia


significativa mnima modificada (LSD, en siglas inglesas) llevar a rechazar la hiptesis nula
H0 : p = q , para un nivel de significacin global , cuando:

1 1
X X > t* , (NG)
2
S +
p q R
Np Nq

*
Cuando el nmero de comparaciones a realizar es elevado, entonces, para un dado, ser
muy pequeo. Es decir, la regin crtica ser relativamente muy reducida. Algunos autores
proponen utilizar la aproximacin de Bonferroni cuando el nmero de comparaciones no es muy
elevado, aplicando en otro caso algn procedimiento alternativo como pueda ser el de Schef.

ANOVA DE UN FACTOR: TRATAMIENTO DE DATOS


Niveles
del factor

Medidas de tamao del efecto: Estimacin de la proporcin


SCT = SCF +
SCR de varianza explicada.

SCFA
G k 2 2
Y eta :
SCT =
2
2
Y
g =1 i=1 N
=
SCT
=
Y
2
2 2
SCF
A (G
1)MCR
G
Yg2 = SC Intergrupos SPSS epsilon :
SCF = SCT
g =1 ng N SCFA (G 1)MCR
2
omega : 2 =
G ng
G
g2
Y SCT + MCR
SCR = Y = SC ErrorSPSS
2


gi

ng donde, MCR =
g =1 i=1 g =1
SCR N G
(media cuadrtica
residual)
Ejemplo 1. La tabla refleja las puntuaciones obtenidas por catorce operarios adiestrados en una
determinada tcnica, aplicando tres mtodos alternativos.
Son significativamente diferentes los resultados obtenidos con los tres mtodos?.

Mtodo A

En este caso existen tres poblaciones distintas, a cada una de las cuales se ha aplicado un mtodo
diferente. Se establecen las hiptesis:
H0: 1 = 2 = (Los tres mtodos producen idnticos resultados)
H 1: 3 ( No producen los mismos resultados)
j j'

Supuestos: Independencia, Normalidad, Homocedasticidad

Mtodo A
6
7
8
7

Y1 = 28
2
3 k Y 112
2
SCT = Ygi
2
= 908 = 12
g =1 i=1 N 14
2 2
G
Y Y 282 432 412 1122
SCISPSS = SCF = g = + + =6
g =1 ng N 4 5 5 14
3 ng 2
3
Yg 282 43 412
2

= SCR = Ygi = 908 + + =6


2
SCE SPSS


g =1 i=1 g =1 ng 4 5 5
SCT 12
Media cuadrtica total: MCT = = = 0,92
N 1 14 1

Media cuadrtica del factor: MCF = SCF = 6 = 3


G1 3
1
Media cuadrtica residual:
SCR 6
MCR = = = 0, 545
N G 14
3

MCF 3
El estadstico F que se obtiene: F = = = 5, 5
MCR 0, 545
Para un nivel de significacin = 0, 05 (fiabilidad del 95%), el valor del estadstico terico FSnedecor:
F , (G1) , (NG) = F0 ,05; 2 ,11 = 3,98

MCF = 3,98
Siendo, F(G1) , (NG) = F(31) , (14 3) = MCR = 5, 5 > F , (G1) , (nG) = F0 ,05; (31) , (14 3)

Se rechaza la hiptesis nula, concluyendo que los tres mtodos no producen los mismos resultados.

Fuente Suma de
variacin cuadrados

Factor SCF = 6

Residual SCR = 6

Total SCT = 12

Por el contrario, para un nivel de significacin del 1% ( = 0, 01) no se rechaza la hiptesis nula,
aceptando que los tres mtodos producen idnticos resultados. Advirtase que en este caso,
MCF = 7,20
F =F = = 5, 5 < F =F
(G1) , (NG) (31) , (14 3) , (G1) , (NG) 0 ,01; (31) , (14 3)
MCR

Dado que el tamao de la muestra en los tres grupos es muy similar, el no cumplimiento de la
hiptesis de homoscedasticidad no afectara de forma importante al contraste realizado.

2 SCF 6
El coeficiente de determinacin que se obtiene: R = = = 0, 5
SCT 12

En el caso de rechazo de la hiptesis nula del anlisis de la varianza se procede a realizar un estudio ex
post. En este sentido, se construyen intervalos de confianza individuales para cada una de las tres
medias poblacionales y aplicar el mtodo de Bonferroni para comparar las medias de los tres mtodos
de entrenamiento tomados dos a dos.
SR
2

Los intervalos de confianza vienen dados por la expresin: I(1) = Yg t , (NG)


2 ng

Con una fiabilidad del 95%, el valor de la tStudent con n G = 14 3 = 11 grados de libertad, que deja
un 2,5% de masa probabilstica a su derecha es: t = 2,201 .
0 ,025 , 11

Los intervalos de confianza para las medias (1 , 2 , 3 ) sern:

SR 0, 545
2

4 [
1 : I0 ,95 = Y1 t 0 ,025 , (14 3) = 7 2,201 = 6,188 ; 7,812]
n1

SR 0, 545
2

5 [
2 : I0 ,95 = Y2 t 0 ,025 , (14 3) = 8,6 2,201 = 7,873 ; 9,327]
n2

SR 0, 545
2

5 [
3 : I0 ,95 = Y3 t 0 ,025 , (14 3) = 8,2 2,201 = 7, 473 ; 8,927]
n3

Se puede observar que entre los intervalos del primer y segundo grupo no existe ningn
solapamiento.

G(G 1) 3(3 1)
Los contrastes mltiples de comparacin de medias que se pueden realizar: c = = =3.
2 2
Las hiptesis a contrastar son las siguientes:
H0 : 1 = 2 H0 : 1 = 3 H0 : 2 = 3
H : H : H :
1 1 2 1 1 3 1 2 3

Para realizar estos contrastes mltiples se aplica el procedimiento de Bonferroni, con un nivel de
*
significacin global = 0, 05 , siendo el nivel de significacin crtico = 0, 05 3 = 0, 01667 .
El valor de la tStudent es: t0 ,01667 , 11 = 2,82

Aplicando el criterio de Bonferroni, se rechaza la hiptesis nula H0 : p = q , para un nivel de


significacin global , cuando:

1 1
X X > t* , (NG)
2
S +
p q R
Np N q

Entre la media del grupo 1 y la media del grupo 2 se verifica:

1 1 6 7 8,6 = 1 1
X X 1,6 > 2,82 0, 545 + = 1,39
1 2 0 ,01667 , 11 R N
N2 4 5
1
se rechaza la hiptesis nula de igualdad de medias H0 : 1 = 2

Entre la media del grupo 1 y la media del grupo 3 se verifica:

1 1 1 1
X1 X3 6 7 8,2 = 1,2 < 2,82
4 5+ = 1,39
N 0, 545
0 ,01667 , 11 R
1 N3

no se rechaza la hiptesis nula de igualdad de medias H0 : 1 = 3

Entre la media del grupo 2 y la media del grupo 3 se verifica:


1 1 1 1
X2 X3 6 8,6 8,2 = 0, 4 < 2,82
5 +5 =
0, 545 1,31
0 ,01667 , 11 R
N2 N3

no se rechaza la hiptesis nula de igualdad de medias H0 : 2 = 3

Como conclusin se rechaza la hiptesis de que las medias de los tres grupos son iguales, resultando
las diferencias ms significativas entre los grupos 1 y 2. Por el contrario, no existen evidencias para
rechazar la hiptesis de que las medias de los grupos 2 y 3 sean iguales.

SPSS: Cuando la variable categrica tiene tres o ms categoras (por ejemplo, tres grupos) se aplica el
Anlisis de la Varianza (ANOVA de una va), que permite no solo saber si hay diferencias en las medias
entre los diferentes grupos sino tambin explorar entre qu grupos estn o no esas diferencias (a travs
de los llamados contrastes a posteriori 'expost').

El anlisis de la varianza puede considerarse en parte como una extensin de la prueba t para dos
muestras:
Analizar > Pruebas no paramtricas > 2 muestras independientes ( k muestras independientes)

Un aspecto importante del ANOVA es que es exigente sobre los requisitos en la distribucin de la
variable cuantitativa, en concreto sobre dos aspectos:

CRITERIO DE NORMALIDAD: La variable cuantitativa se debe distribuir segn una Ley Normal en
cada uno de los grupos que se comparan. Las pruebas de normalidad con la opcin:

Analizar > Estadsticos Descriptivos > Explorar

CRITERIO DE HOMOCEDASTICIDAD: Las varianzas de la distribucin de la variable cuantitativa en las


poblaciones de las que provienen los grupos que se comparan deben de ser homogneas. Este
segundo criterio es menos exigente para hacer el contraste. Las pruebas de homoscedasticidad con
la opcin:

Analizar > Comparar medias > ANOVA de un factor Post hoc / No asumiendo varias iguales

En un principio, hay que comprobar si se cumple el requisito de normalidad en la distribucin de


la variable cuantitativa en todos y cada uno de los estratos o grupos que establece la variable
categrica. Para ello, Analizar > Estadsticos Descriptivos > Explorar
El Visor de SPSS ofrece informacin sobre los estadsticos descriptivos:

Intervalos de confianza de los tres


grupos, respectivamente:
[5,70 8,30] , [7,92 9,28] y
[7,16 9,24]

Los intervalos se superponen en


parte de su recorrido, por lo que es
probable que no existan diferencias
en las medias y que el tratamiento
de entrenamiento no se asocie en
la poblacin de la que proviene la
muestra analizada.
Con respecto a los tests de normalidad, segn el contraste de hiptesis de KolmogorovSmirnov se
acepta la hiptesis nula (los datos analizados siguen una distribucin normal) cuando el (pvalor) ;
en caso contrario, se rechaza. En este caso, solo en el tercer grupo con pvalor = 0,20 0, 05 se acepta
la hiptesis de normalidad.

Con el contraste de hiptesis de ShapiroWilk, el segundo grupo tiene un pvalor = 0,006 < 0, 05 y no
verifica la hiptesis de normalidad

Despus del anlisis, no es demasiado correcto aplicar un anlisis ANOVA, ya que la variable
tratamiento no se distribuye como una normal en los grupos de comparacin. Con carcter instructivo
se lleva a cabo el contraste.
En la ventana de SPSS: Analizar > Comparar medias > ANOVA de un factor

En la pestaa Post hoc... (contrastes o


comparaciones mltiples a posteriori) se
seleccionan alguno de los procedimientos
que ofrecen. El ms habitual es el de
Bonferroni (tambin el de Schefe).
En la pestaa Opciones..., se solicita una Prueba de
homogeneidad de varianzas y, si se desea, un resumen de los
principales Descriptivos en cada grupo de comparacin.

El Visor muestra un cuadro resumen con los estadsticos descriptivos (de la variable
cuantitativa) ms relevantes en cada grupo que se va a contrastar: las medias (y sus IC0,95), las
desviaciones tpicas y los valores mximo y mnimo.

Luego, aparece un test para evaluar la homogeneidad


de varianzas (el mismo que se aplicaba en el
procedimiento comparacin de medias en dos
grupos independientes Prueba T), el test de Levene.

El test de Levene se utiliza para contrastar la hiptesis nula de igualdad de varianzas, cuando el
(pvalor) se acepta la hiptesis nula; en caso contrario, se rechaza la hiptesis nula.
Como el pvalor = 0,801 > 0, 05 , se acepta la hiptesis nula de igualdad de varianzas (criterio de
homocedasticidad)

Por ltimo, aparece la salida del ANOVA propiamente dicho, con sus diferentes componentes o
fuentes de variabilidad: Intergrupos e Intragrupos.
La variabilidad Intragrupos representa la dispersin que no es explicada por el factor de
agrupamiento (variable categrica), y que sera explicable slo por el azar.

El estadstico F de Snedecor (F = 5, 5) tiene un valor pvalue asociado de 0, 022 , que siendo (p


valor) se aceptara la hiptesis nula de que los tres mtodos de entrenamiento producen
idnticos resultados.

En este caso, pvalor = 0,022 < 0, 05 , rechazando la hiptesis nula con un nivel de significacin de 0,05,
concluyendo que los tres entrenamientos no producen los mismos resultados.
La tabla de comparaciones mltiples (prueba Post hoc) identifica qu diferencias de medias son o no
significativas categora a categora segn los diferentes contrastes. Los valores marcados con un
asterisco indican diferencia de medias significativa.

En el cuadro de comparaciones mltiples, cada grupo de edad se compara con los otros
dos, obtenindose en cada contraste la diferencia de medias, el IC0,95, el error estndar y el
pvalor .

Se observa que solo la diferencia de medias entre el grupo 1 y 2 es significativa, el


pvalor = 0,026 < 0,05 , lo que hacer rechazar la hiptesis nula de igualdad de medias.

Por el contrario, no existen evidencias para rechazar la hiptesis nula de igual de medias entre los
grupos 2 y 3.

ANOVA DE UN FACTOR CON MEDIDAS REPETIDAS


TRATAMIENTO DE LOS DATOS
Niveles
del factor

Totales

H : 1 = 2 = " = G
Hiptesis: 0
H1 : No todas las son iguales
g
Independencia

Normalidad

Supuestos:
Homocedasticidad

Aditividad (los tratamientos no int eractan con los sujetos)

SCT = SCFA + SCFB + SCR
G k 2
Y
SCT =
2
Y
g =1 i=1 N

2 2
Yg Y
G
SCFA = = SC Intergrupos SPSS

g =1 k N
2 2
K
Y Y i
SCFB = = SC Intersujetos SPSS
i=1 G N
2
G k G Y K Y i
2
Y
2

SCR = Y
2 g
+ = SC Error

g =1 i=1
g =1
gi
i=1 G N
SPSS

TABLA ANOVA:
Fuente
variacin

Intergrupos

Intersujetos

Eror

Total

Ejemplo 2. Se toma un grupo de 7 personas y se les muestran seales de distintos colores,


midiendo la distancia en que comienzan a reconocer cada seal, los resultados obtenidos han sido:

Niveles del factor

Rojo
Verde
Azul
TOTAL Y1 = 60
2
3 7 Y 411
2
SCT = Y
2
= gi8453 = 8453 8043, 86 = 409,14
g =1 N 21
i=1

2 2
3
Y169Y2 1092 1332 4112
SC IntergruposSPSS = SCFA = g
= + + = 8304, 43 8043, 86 = 260, 57
g =1 k N 7 7 7 21
2 2
K
Y
2
Y 2 2 2 2 2 2 411
60
2 + 56 + 66 + 57 + 55 + 56 +
61
SCFB i

SPSS = = = 8074, 33 8043, 86 =
SC
Intersujetos = 30, 47
i=1 G N 21
3
G k G K 2 2
Y
2 T T
= SCR = Y
2gi g i
SC + = 8453 8304, 43 8074, 33 + 8043, 86 = 118,1
ErrorSPSS
g =1 i=1 g =1 i=1 G N
k

MCFA SCR 118 , 1


SCFA 260, 57
= = = MCR = =
(G 1)(K1) =12
9, 84
130,28
G1 2
SCT 409,14 MCFA 130,28
MCT = = = 20, F= = = 13,24
MCR 9,84
45
N1 20

Fuente Suma d
variacin cuadrad

Intergrupos SCFA = 26

Intersujetos SCFB = 30

Eror SCR = 11

Total SCT = 409

Siendo F = 13,24 > 6,93 = F0,01 ; 6 Con una fiabilidad del 99%, se rechaza la hiptesis nula de
2 , 12 igualdad de medias.

ANLISIS DE LA VARIANZA CON VARIOS FACTORES


En el anlisis de la varianza con dos factores aparece una novedad en relacin con el anlisis
de la varianza con un solo factor: la interaccin entre factores.

MODELO E HIPTEIS: El modelo para el anlisis de la varianza con dos factores:


Yg i = + + j + ( )g j + g = 1, 2, " , G j = 1, 2, " , J
g g j

donde,
media g efecto del nivel g del factor j efecto del nivel j del factor B
global A

( )g j efecto de interaccin de los niveles g y j correspondientes a los factores A y B


respectivamente. Teniendo en cuenta que ( ) es una notacin usual para referirse al
trmino de interaccin, no un producto de parmetros.
En este modelo representa la media global, mientras que g , y ( miden efectos
j )g j
diferenciales. Por esta razn, estos ltimos parmetros estn sujetos a la restriccin:
G J G J

= = ( )
g =1
g
j=1
j
g =1 j=1
gj
=0

En el anlisis de la varianza con dos factores, se mantienen las hiptesis de poblaciones con
distribucin normal e igual varianza para cada combinacin de niveles de los dos factores. Es decir, se
mantienen las hiptesis bsicas de la varianza con un factor con la nica diferencia de que ahora la
media terica viene definida por tres trminos.
H0 : 1 = 2 = " = G = 0
Hiptesis nula e hiptesis alternativa sobre el factor A:
H1 : No todas g son nulas

H0 : 1 = 2 = " = J = 0
Hiptesis nula e hiptesis alternativa sobre el factor B:
H1 : No todas J son nulas

Hiptesis nula e hiptesis alternativa H0 : ( )g j = 0 g = 1, 2, " , G j = 1, 2, " , J


sobre la interaccin entre A y B: H : No todas ( ) son nulas
1 gj

A los efectos individuales se les denominan tambin efectos principales. Es conveniente realizar el
contraste correspondiente a los efectos principales. El motivo es que la presencia del efecto
interaccin dificulta la interpretacin de los efectos principales.

DESCOMPOSICIN DE LA VARIANZA

Antes de realizar la descomposicin de la varianza se construye una tabla de doble entrada que
recoge la muestra disponible para cada combinacin de los factores A y B. En las filas se indican los
distintos niveles del factor A y en las columnas los distintos niveles del factor B.

Niveles del factor A

1
2
......
G
Marginal B

El cuadro con las medias muestrales para cada combinacin de los factores A y B:

Niveles del factor A

1
2
......
G
Marginal B

Considerando todas las celdas (excepto las marginales), de forma anloga a como se hizo con un
factor, se puede realizar la siguiente descomposicin:
suma de cuadrados total
S C T
G J ng j

(Y
g =1 j=1 i=1
g ji
Y)2 = (Y Y)2 + (Y Y )2

G J ng j

(Y Y)2 , denominado SCT, refleja la suma de cuadrados total con


g ji

El primer
g =1 j=1 i=1
trmino
respecto a la media muestral global. En el triple sumatorio: el primero se refiera a los distintos
valores del factor A, el segundo a los distintos niveles del factor B, y el tercero a los datos de cada
celda.

G J ng j

(Y
g ji g ji
2
El Y ) es la suma de cuadrados residual (SCR)
g =1 j=1 i=1
trmino

G J ng j

(Y Y)2 , denominado SCF (suma de cuadrados de los factores), registra las


g ji

El
trmino g =1 j=1 i=1

diferencias al cuadrado entre la media de cada celda y la media global.

Ahora bien, estas diferencias A qu se deben?. Pueden deberse bien a la influencia del factor A,
bien a la influencia del factor B, o bien a la interaccin entre ambos factores.

Para aislar estas influencias se descompone, con sencillas manipulaciones algebraicas, de la


siguiente forma:

G J ng j G J gj gj
(Y n
g ji
2
Y) = (Y Y)2 =
g =1 j=1 i=1 g =1 j=1

gG J gj 2 jG J gj 2
G J gj gj g 2
j
= n (Y Y) + n (Y Y) + n (Y Y Y + Y)
g= 1 j= 1 g= 1 j= 1 g= 1 j= 1

SCFA SCFB SCFAB

Los trminos primero y segundo del segundo miembro son las sumas de cuadrados de los
factores A y B respectivamente. A estas sumas se denominan SCFA y SCFB . El ltimo trmino, con
una configuracin menos clara, refleja la interaccin de los factores A y B.

En efecto, si los dos primeros trminos del segundo miembro reflejan el efecto individual de cada
uno de los factores, entonces el trmino restante debe reflejar el efecto conjunto, o de
interaccin, entre los factores A y B, es decir, el efecto de estos dos factores no recogido
individualmente. El efecto de interaccin ser denominado SCF
AB

suma de cuadrados total suma de cuadrados de los factores suma de cuadrados residual
S C T S CF SC R
G J ng j ng j ng j
G J G J

(Y (Y (Y
g ji g ji g ji g ji
2 2 2
Sustituyendo en la expresin: Y) = Y) + Y )
g =1 j=1 i=1 g =1 j=1 i=1 g =1 j=1 i=1

La descomposicin en el anlisis de la varianza con dos factores:


SCT = SCFA + SCFB + SCFAB + SCR

GRADOS DE LIBERTAD Y CONSTRUCCIN DEL ESTADSTICO

Los grados de libertad de SCT son igual al nmero total de datos menos 1, es decir, (N 1)

Los grados de libertad de SCFA son igual al nmero total de grupos menos 1, (G 1)

Los grados de libertad de SCFB son igual al nmero total de grupos menos 1, (J 1)

El nmero total de combinaciones de niveles de los factores A y B es igual a GJ. Ahora bien, una
vez, calculadas las medias marginales por filas y por columnas, los grados de libertad de SCFAB se
reducen a (G 1)(J 1)

Los grados de libertad de SCR son igual al nmero total de datos menos el nmero total de celdas,
es decir, (N GJ)
Los grados de libertad de la SCT es igual a la suma de los grados de libertad de cada uno de los
componentes, es decir:
N 1 G 1 ( G 1 ) (N G J )
J 1 (J 1)
gl (SCT) = gl (SCFA ) gl (SCFB ) gl (SCFAB ) gl (SCR)
+ + +

En la tabla se recoge el anlisis de la varianza para el caso de dos factores:

Fuente
variacin

Factor A A
G1
Factor B

AB F=
Interaccin (G 1)(J 1) MCR

Residual

Total

MEDIDAS DE LOS EFECTOS DE LOS FACTORES

En el anlisis de la varianza con un factor se utiliza el coeficiente de determinacin (o estadstico eta


al cuadrado) como una medida de variabilidad total explicada por el factor.

En el anlisis de la varianza con dos factores sigue siendo vlido dicho coeficiente como una medida
general del efecto de los factores sobre la variable dependiente.

Con objeto de medir el efecto de cada factor (y de la interaccin) separadamente se utilizan


estadsticos eta cuadrados parciales, que se definen:
2 SCFA SCFB SCFAB
A = 2
B = 2 =
SCFA + SCR SCF
B + SCR SCFAB + SCR
AB

TRATAMIENTO DE LOS DATOS N = nGJ observaciones

Niveles factor A Supuestos:

Independencia:
Las GJ muestras de
tamao n son
aleatorias e
independientes.

Normalidad:
Las GJ poblaciones de
donde se extraen las GJ
# # muestras son normales.
# #
Homocedasticidad: Las GJ
poblaciones de tienen,
todas ellas la misma
varianza.

SUMATOTAL
DE CUADRADOS: SCT = SCFA + SCFB + SCFAB + SCR

G J

Yi Y
2 2
Y Y 2 Y
2 j Y2
n G J
SCFA g=1 SCFB
SCT =
2
igj = =
i=1 g =1 j=1 N n. J N j=1

n.G N

G J gj G g Y2
J j G J

Y Y Y
2 2 2 n G J 2
Y
SCR = Yigj
2 gj g
SCFAB = g =1 j=1
g =1
j=1
+ =1 j=1

n n. J n.G N i=1 g =1 j=1 n

Ejemplo 3. Se trata de estudiar el efecto de las variables Edad y Fumar sobre la Ansiedad Social.

Fumar

Edad
1

3
En cada caso, las hiptesis a contrastar son las siguientes:
(a) Efecto A: Categora edad

H0 : La media de edad en cada categora es la misma


H : Las medias no son iguales
1

(b) Efecto B: Fumar

H0 : La media no difiere entre fumadores y no fumadores


H : Las medias no son iguales
1

(c) Efecto interaccin: Edad x Fumar

Bajo los supuestos de Independencia, Normalidad y Homocedasticidad, se calculan los estadsticos del
contraste.

Fu
Edad
3,91
5, 01
Y11 = 21, 4
1 4, 44
Y11 = 4,28
3,33
4,71
5,65
6, 49
Y21 = 28,7
2 5, 47
Y21 = 5,754
5,72
5, 44
4,94
7,13
Y31 = 29,6
3 5, 54
Y31 = 5,938
5,92
6,16
Y1 = 79,86
TOTAL
Y1 = 5,324
J=2 n=5 N = 5.3.2 = 30 5 3 2
G=3 Y
i=1 g =1 j=1
2
igj
= 1106,28

2
5 3 2 Y 175,12
2

igj
i=1 g =1 j=1
SCT =
2
Y = 1106,28 = 84, 04
N 30

G i 3i

Y Y 47, 302 712 56, 82 175,12


2 2 2
Y
2 175,12

2 2
g =1 g =1
SCFA = = = + + = 28, 44
n. J N 5.2 30 5.2 5.2 5.2 30
J j j2
79, 862 95, 262 175,12
2
Y Y
2 Y Y
2

2 2

SCFB = = j=1 = + = 7,90
j=1

n.G N 5.3 30 5.3 5.3 30


gj

G J 3 2

Y2
gj
n G J 5 3 2

SCR =
Y 2
ig
Y2
= Y
i=1 g =1 j=1
2
igj

g =1 j=1
=
j g = 1 j =1 n
i=1 g =1 j=1
n

2
21, 40 25,902 28,772 42,232 29,692 27,132
= 1106,28 + + + + + = 34,80
5 5 5 5 5 5

SCT = SCFA + SCFB + SCFAB + SCFAB = SCT SCFA SCFB SCR


SCR

SCFAB = SCT SCFA SCFB SCR = 84, 04 28, 44 7,90 34,80 = 12,89

G J gj G g Y2
J j 3gj 2 3 g 2 j Y2
Y
2 2 2 2 2 2
Y Y Y Y Y
g=1j=1 g=1 j=1 g=1j=1 g=1 j=1
o bien, SCFAB = + = +
n n. J n.G N 5 5.2 5.3 30

Anlisis de la varianza con dos factores


Fuente Suma de
variacin cuadrados

Factor A MCFA = SCFA =

Factor B SCFB =

Interaccin SCFAB =

Residual SCR =

Total SCT = 8

SCFA 28, 44 MCFB SCFB MCFAB


MCFA = = = 14,22 = = 7,90 SCF 12, 89
G1 2 J1 = (G AB1)(J = 1) 2= 6,
44
SCR 34 , 80 SCT 84 , 04
MCR = = = 1, MCT = = = 2,89
N1 29
45
NGJ 24 MCFAB 6,44
MCFB 7, 90 F= = = 4, 44
F= = = 5, 44 MCR 1, 45
MCFA 14 , 22 MCR 1, 45
F= = = 9,80
MCR 1, 45
2 SCFA 28, 44 2 SCFB 7, 90
A = = = 0, 50 B = = = 0,185
SCFA + SCR 28, 44 + 34,80 SCFB + SCR 7,90 + 34,80
SCFAB 12, 89
AB = = = 0,270
2
SCFAB + SCR 12,89 + 34,80
Para realizar el anlisis con SPSS: Analizar > Modelo lineal general > Univariante

27
SELECCIN DEL MODELO: Analizar > Modelo lineal general > Univariante > Modelo

En este cuadro es posible construir el modelo de inters introduciendo los factores tratamiento y sus
interacciones a nuestro criterio. Por defecto est el modelo Factorial completo (que incluye a todos los
factores tratamiento introducidos previamente y a todas sus interacciones). Si se desea un modelo
alternativo, por ejemplo un modelo de dos vas principales (esto es, sin interaccin) entonces:

1. Marcar Personalizado. Se activan los campos que le siguen.

2. En Construir trminos seleccionar Efectos principales, marcar Edad(F) en el campo Factores y


covariables y pulsar la flecha en Construir trminos. El factor Edad(F) ya formar parte del
modelo al aparecer en el campo Modelo.

3. Hacer lo propio con el factor Fumar(F).

Se deja por defecto Suma de cuadrados Tipo III. Es el procedimiento ms utilizado. Proporciona la
descomposicin de las sumas de cuadrados tal y como se ha visto anteriormente.
La suma de cuadrados Tipo III explicada por un factor A es igual a la diferencia entre la suma de
cuadrados residual del modelo completo (con todos los factores) sin el factor A y la suma de
cuadrados residual del modelo completo. Es independiente del orden de introduccin de los factores
tratamiento y produce una descomposicin ortogonal de modo que las sumas de cuadrados suman la
suma de cuadrados total.

En ocasiones tambin es de utilidad la Suma de cuadrados Tipo I. Se conoce como el mtodo de


descomposicin jerrquica de la suma de cuadrados. La suma de cuadrados Tipo I explicada por un
factor A es igual a la diferencia entre la suma de cuadrados residual del modelo construido con los
factores incluidos hasta ese momento menos el factor A y la suma de cuadrados residual del modelo
con A incluido.
Cuando el diseo es balanceado la descomposicin en suma de cuadrados Tipo III coincide con la
descomposicin en suma de cuadrados Tipo I.

28 28
CONTRASTES PERSONALIZADOS: Analizar > Modelo lineal general > Univariante > Contrastes

En este epgrafe es posible realizar inferencia sobre 'contrastes' personalizados. De entrada se


proporcionan en este cuadro de dilogo una serie de contrastes que pueden resultar de inters sobre
los efectos marginales. El procedimiento es:

1. Elegir en el cuadro Factores: el factor tratamiento sobre cuyos niveles se ejecutarn los
contrastes. Por ejemplo, marcar nivel (Ninguno).

2. Ir a Contraste: abrir la persiana del subcuadro y seleccionar la familia de contrastes de inters.


Pulsar entonces el botn Cambiar. Por ejemplo, si se selecciona Desviacin, al pulsar Cambiar
aparecer el contenido del subcuadro Factores: ese modificar y aparecer nivel(Desviacin).

3. Para algunos contrastes es posible modificar la categora o nivel de referencia.

OPCIONES: Analizar > Modelo lineal general > Univariante > Opciones
Estadsticos descriptivos: Proporciona la media muestral, la desviacin tpica muestral y el tamao
para cada nivel y combinacin de niveles.

Estimaciones del tamao del efecto: Marcando esta opcin se aade al cuadro ANOVA el coeficiente
2
para cada fuente de variacin incluida en el modelo. Con el objeto de medir el efecto de cada
factor (y de la interaccin) separadamente se utilizan estadsticos eta cuadrados parciales, que se
definen:
2 SCFA SCFB SCFAB
A = = 0, 50
2
B = = 0,185 2AB = = 0,270
SCFA + SCR SCFB + SCR SCFAB + SCR

Potencia observada: Marcando esta opcin se aade al cuadro ANOVA una nueva columna con el
valor de la potencia del Ftest para cada fuente de variacin incluida en el modelo. El valor de la
potencia se entender como la capacidad de la prueba de hiptesis para, con un nivel de significacin
igual al prefijado, detectar una diferencia real (poblacional) entre los niveles de la fuente de variacin
igual a la diferencia observada en las muestras.
NOTA: La potencia de un contraste se define como la probabilidad de rechazar la hiptesis nula
cuando es falsa.

Si se marcan las casillas Estimaciones del tamao del efecto y Potencia observada, el cuadro ANOVA
en el Visor de Resultados ser:

Se observan coeficientes 2 bajos para todas las fuentes de variacin, siendo el mayor el
correspondiente a la interaccin (0,967). En todos los caos la potencia es alta lo que sugiere una alta
capacidad del test para rechazar la hiptesis nula con diferencias reales iguales a las observadas.

Estimaciones de los parmetros: Marcando esta opcin se obtendr un cuadro con las estimaciones
de los parmetros del modelo.
Atendiendo a la interpretacin de los parmetros estimados por el SPSS expuesta, la informacin
puede esquematizarse como sigue:

1. Los parmetros que se igualan a 0 por redundantes son:

3 = 2 = ()12 = ()22 = ( )31 = ( )32 = 0

2. Los dems parmetros se estiman, siendo:


= 5, 426
2 = 3, 020
1 =
0,246

1 = 0, 512
( )11 = 1, ( )21 = 3,204
412

3. El modelo estimado se resume (empleando variables dummy) como:

Y = 5, 426 0,246 . X1 + 3, 020. X2 + 0, 512. Z1 1, 412. X1 . Z1 3,204 . X2 . Z1 +

siendo:

X1 = 1 si la edad es del tipo 1 y X1 = 0 en otro caso


X2 = 1 si la edad es del tipo 2 y X 2 = 0 en otro caso
Z1 = 1 si fuma y Z1 = 0 en caso de no fumar
4. Excepto en los casos 2 y ( )21 , los parmetros no son significativamente distintos de cero y por
tanto no tienen peso significativo en el modelo estimado.

5. La Tabla proporciona adems los intervalos de confianza para cada parmetro y los coeficientes
2
y potencia observada para cada contraste de los parmetros.
Pruebas de homogeneidad: Ofrece los resultados de la prueba de Levene para testar la hiptesis nula
de igualdad de varianzas de la variable respuesta en todas las poblaciones definidas por
combinaciones de los niveles de los factores.

La Prueba de Levene conduce a un estadstico igual a 2,706 que en una F5,24 deja a su derecha una cola
de probabilidad 0,045, siendo p valor = 0, 045 < = 0, 05 , no se acepta la hiptesis nula de igualdad
de varianzas (criterio de homocedasticidad).

Diagramas de dispersin x nivel: Aporta informacin grfica sobre la homogeneidad de la varianza,


completando la informacin recogida en Pruebas de homogeneidad.

El diagrama consiste en un grfico de puntos: cada uno representa una poblacin (combinacin de
niveles) donde la media se representa en la abscisa y la desviacin tpica (o varianza) en la ordenada.

El objetivo es detectar si la varianza depende de la media (es frecuente comprobar que la respuesta
crezca cuando lo hace la media).

Grfico de los residuos: Es un grfico matricial de puntos enfrentando Valores Observados de la


variable respuesta, Valores Pronosticados por el modelo estimado para la variable respuesta, y
Residuos (valores observados menos valores pronosticados por el modelo estimado).

Los residuos se muestran tipificados (divididos por la raz cuadrada del error cuadrtico medio
estimado).

Este grfico matricial da una idea si se verifican los supuestos de independencia, homogeneidad de
varianzas y falta de ajuste. En efecto:
Si existe Independencia, el grfico de dispersin ResiduosObservados no debera mostrar pauta
de variacin (lnea, curva, ). Grfico de coordenadas (1, 3) o (3, 1) en la matriz.

Si existe Homocedasticidad, el grfico de dispersin ResiduosPronosticados es de inters puesto


que la dispersin de los residuos debe de ser similar para todos los valores pronosticados. Grfico
de coordenadas (2, 3) o (3, 2) en la matriz.

En un modelo con Buen Ajuste a los Datos, la nube de puntos PronosticadosObservados debiera
mostrar un perfil cercano a la linealidad (a ms linealidad mejor ajuste). Grfico de coordenadas
(1, 2) o (2, 1) en la matriz.
MODELO FACTORIAL COMPLETO E INCOMPLETO

Se dice que un modelo para anlisis de la varianza es un modelo factorial completo cuando se incluyen
en el mismo los efectos de todos los factores (efectos principales) y todas las interacciones entre los
mismos. En el caso de dos factores es un modelo factorial completo el que incluye el factor A, el factor
B y la interaccin entre los factores A y B.

En el caso de tres factores, a los que denominaremos A, B y C, se pueden distinguir interacciones de


primer orden y de segundo orden. Son interacciones de primer orden las que tienen lugar entre cada
par de factores (AxB, AxC, CxB), mientras que la interaccin conjunta de los tres factores (AxBxC) es
una interaccin de tercer orden. Estos conceptos son fcilmente generalizables al caso de un mayor
nmero de factores.

La existencia de interacciones entre los factores complica la interpretacin de los efectos principales,
ya que la influencia de un factor se reparte entre el efecto principal y los efectos de interaccin con
otros factores.

Por esta razn es aconsejable no realizar contrastes para cada factor cuando el trmino de interaccin
es estadsticamente significativo. En esta situacin, el efecto total de un factor depende de como se
combine con otros factores. Por ello, los efectos de todos los factores sobre la variable dependiente
deben analizarse conjuntamente. El grfico de interaccin es til para examinar la variable conjunta.

En el grfico de interaccin, en el caso de dos factores, se representan las medias de las casillas del
cuadro uniendo por una lnea las medias correspondientes a cada fila, es decir, a un determinado
nivel del factor A.

Niveles del factor A

1
2
......
G
Marginal B

Si las lneas son ms o menos paralelas indicarn que los efectos son de carcter aditivo, es decir, que
no existen efectos cruzados entre los dos factores. Cualquier otra configuracin ser indicio de no
independencia.

En todo caso, conviene aplicar inicialmente un anlisis factorial completo. Si resulta que algunos
efectos de interaccin no son estadsticamente significativos entonces en un anlisis subsiguiente se
eliminan dichos efectos del modelo. Un modelo de este tipo es un modelo factorial incompleto.

En el caso de dos factores, la interaccin AxB se elimina cuando sta no es representativa. El modelo
terico se formula entonces de la siguiente forma:
Yg i = + g + j + g j g = 1, 2, " , G j = 1, 2, modelo de efectos principales
" ,J

Cuando se prescinde del efecto de interaccin en el anlisis, la descomposicin de la suma total de


cuadrados se define de la siguiente forma:
SCT = SCFA + SCFB + SCR
Comparando con la descomposicin del SCT = SCFA + SCFB + SCFAB + SCR
anlisis de la varianza del modelo completo:

se observa que dentro de la SCR se incluye implcitamente al componente SCFAB

En el siguiente cuadro se refleja la tabla de anlisis de la varianza con dos factores en un modelo de
efectos principales, es decir, un modelo sin interaccin.

Anlisis de la varianza con dos factores, modelo de efectos principales


Fuente variacin

Factor A A
G1
Factor B

Residual

Total

ESTIMACIN DE LOS EFECTOS DIFERENCIALES Y ANLISIS EXPOST


En el modelo Yg = g + del anlisis de la varianza con un factor, las medias de cada grupo Yg son un
g
estimador de cada una de las medias poblacionales g .
En el modelo Yg i = + g + j + ( )g j + g j , o en Yg i = + + j + g j , los coeficientes y
el g
miden los efectos diferenciales respecto a la media global .
El estimador de la media global es la media = Y
muestral:

Los efectos diferenciales y se estiman mediante las diferencias entre la media muestral
j j
global y la media de cada grupo: = Y Y = Y Y
g g
, G J

Las estimaciones estn sometidas por construccin a la restriccin: n


g =1
g
g = n j j = 0
j=1

Si los tamaos muestrales de los grupos son iguales entre s dentro de un mismo factor, se
G J
verifica: = = 0
g =1
g
j=1
j

Al rechazar la hiptesis nula sobre los factores A o B:


H0 : 1 = 2 = " = G = H0 : 1 = 2 = " = J = 0
0
H : No todas son nulas
1 H1 : No todas J son nulas
g

de que los efectos diferenciales son nulos, entonces en un anlisis expost se puede contrastar la
hiptesis de que cada uno de los efectos diferenciales es nulo. Planteando un problema de
comparaciones mltiples.

Utilizando la aproximacin de Bonferroni se pueden construir intervalos de confianza conjuntos


para cada uno de los efectos diferenciales. Si en un caso se encuentra el valor 0 dentro de un
intervalo, se concluye que dicho efecto no es significativamente distinto de 0.
Ejemplo 4. Se realiza un experimento para estudiar el efecto del nivel del agua sobre la longitud del
tallo de dos tipos de plantas de guisantes. Para ello se utilizaron tres niveles de agua, los datos
obtenidos se reflejan en la tabla adjunta, figurando en rojo el orden temporal de la toma de datos.

Nivel del agua

Tipo 1

Tipo
Planta

Tipo 2

Existen dos factores tratamiento: 'Niveles de agua' (con tres niveles de efectos fijos) y 'Tipo de planta'
(con dos niveles de efectos fijos).

Los niveles se cruzan formando un total de 6 observaciones o condiciones experimentales diferentes.

Para cada tratamiento se obtienen 5 respuestas de la variable 'Crecimiento de la longitud del tallo' de
otras tantas unidades experimentales. Se crea as un diseo balanceado (de 5 rplicas), aleatorio y de
tamao 30.

Al disponer de rplicas es posible contrastar la existencia de interaccin entre los niveles de los dos
factores tratamiento, de manera que el modelo matemtico es el propio de un diseo completo de
dos vas.

Nivel del agua

71,3 (1)
Y11 = 363 Y12 = 510,2 Y13 = 617,9
Tipo planta 75,1 (4)
1 69,0 (5) Y = 72,60
73,2 (7) 11

74,4 (22)
Y21 = 355,1 Y22 = 428, 70,4
4 (13) Y23 = 529,1
Tipo planta 73,2 (15)
2 71,1 (23) Y = 71, 02
71,2 (24) 21
69,2 (27)
Y1 = 718,1
Total
J=3 n=5 N = 5.2.3 = 30 5 2 3
Y1 = 71,81
= 272890,99
G=2 Y 2
ig

j
i=1 g =1 j=1

2
5 2 3 Y 2803,7
2

ig j

SCT = Y
2
= 272890,99 = 10866,534
i=1 g =1 j=1
N 30
Gi i
2

Y Y 1491,12 1312, 6
2 2
Y
2
Y
2 2803, 7

2 2
g =1 g =1
+ A=
SCF = = = 1062,075
n. J N 5. 3 5.3 5. 3 30
30

jJ j 3
Y Y 718,12 93g 8j , 6 1147 2803, 7
2 2 2
2 2
T Y

2 2

SCFB = = = + + = 9200,201
j=1 j=1
n. G N 5. 2 5 . 2 5 . 2 5 . 2 30

30

G J 2 3


n G J gj 5 2 3

SCR =
Y 2
ig
Y2
= Yi g j
2

i=1 g =1 j=1 Y2
j g = 1 j =1 g =1 j=1
i=1 g =1 j=1
n =
n
2
363 510,2
2
617,9
2
355,1
2
428, 4
2
529,1
2
= 272890,99 + + + + = 202, 424
+
5 5 5 5 5 5

SCT = SCFA + SCFB + SCFAB + SCFAB = SCT SCFA SCFB SCR


SCR

SCFAB = SCT SCFA SCFB SCR = 10866, 534 1062, 075 9200,201 202, 424 = 401,834
Fuente Suma de
G J gj g Y2J j
variacin
G gj
2 3 2 g 3 j Y2 cuadrados
Y Y Y Y Y Y
2 2 2 2 2
2

Factor Ao bien, SCFAB g=1j=1 g=1 j=1 g=1j=1 g=1 j= 1 SCFA = 1062,075
= + = +
n n.J n.G N 5 5.3 5.2
30 SCFB = 9200,201
Factor B

Anlisis de la varianza con dos factores


Interaccin SCFAB = 401,834

Residual SCR = 202, 424


MCF =
Total SCT = 10866,534
MCF =

MCFAB =
(G 1

2 SCFA 1062, 075 2 SCFB 9200, 201


A = = = 0,840 B = = = 0,978
A SCF + SCR 1062, 075 + 202, 424 B SCF + SCR 9200,201 + 202, 424
SCFAB 401, 834
= = = 0,665
2
AB
SCFAB + SCR 401,834 + 202, 424
Entrada de datos en SPSS: Analizar > Modelo lineal general > Univariante

Dependiente: Se introduce la variable respuesta (necesariamente cuantitativa y unidimensional).


En el ejemplo, la variable crecimiento de los tallos de guisantes.

Factores fijos: Se introducen las variables conteniendo los niveles de los factores de tratamiento
con efectos fijos (ya que sus efectos sobre la respuesta desean ser comparados y son el objeto de
la investigacin). En el ejemplo, variables tipo y nivel.

Factores aleatorios: Se introducen los niveles de los factores tratamiento con efectos aleatorios
(los niveles son una muestra aleatoria de una poblacin mayor y por ello no son el objetivo de la
investigacin ya que la inferencia se realiza sobre la poblacin y no sobre la muestra). Introducir
tantas variables como factores de tratamiento. En el ejemplo, ninguna variable es de efectos
aleatorios por lo que queda vaco.

Covariables: Introducir las covariables (factor de control en el modelo no categrico sino


continuo). En el ejemplo no hay covariables por lo que este campo queda vaco.

Ponderacin MCP: Variable de pesos para computar los estimadores mnimo cuadrticos de
manera ponderada. De utilidad cuando no se tiene homocedasticidad.

Al introducir las variables y pulsar Aceptar se obtiene la siguiente salida por defecto:

El cuadro Factores intersujetos proporciona un resumen de las


etiquetas de valor de cada nivel y el nmero de observaciones de cada
nivel.
La tabla Prueba de los efectos intersujetos proporciona el cuadro ANOVA. Lo proporciona para dos
posibles descomposiciones de la suma de cuadrados global segn que en el modelo la respuesta
aparezca en bruto (Suma de Cuadrados Total (Total = SCT) o con la constante sustrada (Suma de
Cuadrados Corregida).
El modelo en bruto Yigj = + i + j + ( )ij + igj
es:

La notacin en SPSS equivale a:

SC Total = SC Inter sec cin + SC Tipo + SC Nivel + SC Tipo * Nivel + SC Error


El modelo corregido (sustrayendo la constante): Yigj = i + j + ( )ij + igj

La notacin en SPSS:
SC Total corregido = SC Tipo + SC Nivel + SC Tipo * Nivel + SC Error
SCT SCFA
SCFB SCFAB SCR

Analizar > Modelo lineal general > Univariante > Modelo


Por defecto aparece el modelo Factorial completo (que incluye a todos los factores tratamiento
introducidos y a todas sus interacciones).

Cuando se desea un modelo alternativo, por ejemplo un modelo de dos vas principales (esto es, sin
interaccin) entonces:

Marcar Personalizado, activando los campos que le siguen.


En Construir trminos se selecciona Efectos Principales, marcar tipo (F) en el campo Factores y
covariables y pulsar la flecha Construir trminos. El factor tipo (F) ya formar parte del modelo al
aparecer en el campo Modelo.
Se hace lo mismo con el factor nivel (F).

Se deja por defecto Suma de cuadrados Tipo III, porque es el procedimiento ms utilizado.
Proporciona la descomposicin de las sumas de cuadrados tal y como ya se ha visto.

La Suma de cuadrados Tipo III explicada por un factor A es igual a la diferencia entre la suma de
cuadrados residual del modelo completo (con todos los factores) sin el factor A y la suma de
cuadrados residual del modelo completo. Es independiente del orden de introduccin de los factores
tratamiento y produce una descomposicin ortogonal de modo que las sumas de cuadrados suman la
suma de cuadrados total.

En ocasiones tambin es de utilidad la Suma de cuadrados de Tipo I, conocida como el mtodo de


descomposicin jerrquica de la suma de cuadrados.
La suma de cuadrados de Tipo I explicada por un factor A es igual a la diferencia entre la suma de
cuadrados residual del modelo construido con los factores incluidos hasta ese momento menos el
factor A y la suma de cuadrados residual del modelo con A incluido.

Cuando el diseo es balanceado, la descomposicin en suma de cuadrados Tipo III coincide con la
descomposicin en suma de cuadrados Tipo I.
Analizar > Modelo lineal general > Univariante > Contrastes

En el cuadro de Factores se elige el factor tratamiento sobre cuyos niveles se ejecutarn los
contrastes. Por ejemplo, marcar Nivel (Ninguno).
En Contrastes se abre una persiana donde se selecciona la familia de contrastes de inters,
pulsando despus el botn Cambiar.
Para algunos contrastes es posible modificar la categora o nivel de referencia.

La familia de contrastes posibles:

Contrastes Desviacin: Familia de I 1 contrastes comparando el efecto de cada nivel del factor
(menos el de referencia) con el efecto promedio global.

H(i)0 : i = 0 frente a (i) : i 0


H1

para 1 i I 1 si la categora de referencia es la ltima o para 2 i I si la categora


de referencia es la primera.

Contrastes Simples: Familia de I 1 contrastes comparando el efecto de cada nivel del factor con
el efecto del nivel elegido como referencia.

H(i)0 : i 1 = 0 frente (i) : i 1 0 para 2 i I si la categora de referencia es la primera.


H1

H(i)0 : i I = 0 frente (i) : i I para 1 i I 1 si la categora de referencia es la ultima.


H1 0

Contrastes Diferencia: Familia de I 1 contrastes comparando el efecto de cada nivel del factor
(menos el primero) con el efecto promedio de los niveles anteriores.

H(1)
0 :
2 1 = 0 frente (1) : 2 1 0
H1
(2) 1 (2) 1
H0 : 3 (1 +
2 ) = 0 frente H
1 : 3 1( +2 ) 0
2 2
"" """" """ """ """" """ "

H(I1) :
1 ) = 0 frente H(I1) : 1 )0
( ( + + " +
+ + "
+ 0 I 1 2 I1 1 I 1 2 I1
I I
1 1
Contrastes Helmert: Familia de I 1 contrastes comparando el efecto de cada nivel del factor
(menos el ltimo) con el efecto promedio de los niveles subsiguientes.
(1) 1 1
H : ( + + " + ) = 0 frente ( + + " + ) 0
(1)
0 H1 :
I I
2 3 I 1 1 2 3 I

1 1

(2) 1 1
H : ( + + " + ) = 0 frente ( + + " + ) 0
(2)
0 H2 :
I I
3 4 I 1 2 3 4 I

1 1

"" """" "" " """ """" """ " """ """ """"

H(I01) : I1 I = 0 frente (I1) : I1 I 0


H1

Contrastes Repetidos: Familia de I 1 contrastes comparando el efecto de pares de niveles


adyacentes, cada uno (excepto el primero) con el que le precede.

H(1)
0 :
2 1 = 0 frente H(1)1 2 1 0
:

H(2)
0 :
3 2 = 0 frente H(2)1 3 2 0
:

"" """" """ """ """"

H(I01) : I I1 = 0 frente (I1) : I I1 0


H1

Contrastes Polinmicos: Familia de I 1 contrastes ortogonales de tendencia polinmica (lineal,


cuadrtica, cbica, , hasta grado I 1 ).

En presencia de interaccin los contrastes deben realizarse sobre los niveles combinados y no sobre los
efectos marginales. En otras palabras, no es informativo ejecutar este procedimiento con interaccin
significativa.
Es el caso de este ejercicio, aunque a efectos de mostrar la salida que genera esta herramienta,
suponemos que se desea realizar los contrastes de Helmert para los efectos del factor tratamiento
nivel del agua. La salida del Visor de SPSS muestra:
En este caso, los contrastes de Helmert son dos:

(1) 1 (1) 1
H0 : 1 (2 + 3 ) = 0 frente 1H 1: 2 ( 3+ ) 0
2 2

H(2) : = 0 frente H(2) : 0


0 2 3 1 2 3

siendo j el efecto marginal del nivel del agua jsimo. La resolucin particular de cada uno de ellos
se realiza bajo el supuesto de independencia y normalidad, mediante la t de Student con un nmero
de grados de libertad igual al empleado para estimar el error. En general:

Se rechaza H0 : = 0 (con
i
i i
i
i
= 0 ) al nivel de significacin si:

i siendo la media muestral de las ni observaciones


i i
i
> t en el isimo nivel y SCMR la suma de cuadrados

2 , gl (SCMR) media residual.
SCMR i 2

I ni
Como el cuadrado de una t de Student con g.l. grados de libertad es igual a una distribucin F de
FisherSnedecor con 1 y g.l. grados de libertad t2 , g.l. = F , 1 , g.l., el criterio para rechazar la hiptesis nula
2 2
anterior se puede escribir:

Se rechaza H0 : = 0 (con = 0 ) al nivel de significacin si:


i
i i
i
i

2 i
2
El valor de i 2i se denomina Suma de Cuadrados
2


i i


i n
I ni
i I i
i
> F Explicada por el contraste i i
SCMR 2
,1 ,
g.l. i

1
La estimacin del contraste 1 (2 + 3 ) presenta un p valor = 0 < 0, 05 , rechazando la
2
(1) 1
hiptesis nula H : ( + ) = 0 . De otra parte, el intervalo de confianza no cubre el 0, lo
que 0 1 2 3
2
conduce a la misma conclusin.
La estimacin del contraste 2 presenta un p valor = 0 < 0, 05 , rechazando la hiptesis nula
3
H(2) 3 = 0 . El intervalo de confianza no cubre el 0, lo que conduce a la misma conclusin.
0 : 2

El segundo cuadro, Resultados de la prueba, muestra la suma de cuadrados explicada por los dos
contrastes Helmert y la correspondiente Ftest con dos grados de libertad (uno por contraste) y 24
grados de libertad que muestra la significacin estadstica conjunta de ambos contrastes.

Siendo p valor = 0 < 0, 05 no se acepta la hiptesis nula de igualdad de varianzas (criterio de


homocedasticidad).
Analizar > Modelo lineal general > Univariante > Post hoc

Ofrece la posibilidad de realizar contrastes de rango mltiple con los niveles de aquellos factores
tratamiento que se desee. Como en el caso anterior, las comparaciones Post hoc para los efectos
marginales slo deben realizarse en el supuesto de no interaccin. Se solicitan los procedimientos de
Tukey y Bonferroni para los niveles del factor tratamiento 'nivel del agua' y ninguno para el otro
factor.

Analizar > Modelo lineal general > Univariante > Grficos

Para la obtencin de un grfico de las tres medidas estimadas se procede de la siguiente forma:

Para el factor del Nivel del agua, anlogamente para el factor Tipo:

1. Marcar Nivel en el campo Factores y pasarlo al campo Eje horizontal. En el campo Grficos
marcar Aadir. De este modo, el factor Nivel se incorpora al campo Grficos.
2. Marcar Tipo en el campo Factores y pasarlo al campo Eje horizontal. En el campo Grficos marcar
Aadir. De este modo, el factor Tipo se incorpora al campo Grficos.

Para visualizar el denominado Grfco de Interaccin entre los dos factores tratamiento:

Se marca Nivel en el campo Factores y se lleva al campo Eje horizontal. Se marca Tipo en el Campo
Factores y se lleva al campo Lneas distintas. Se pulsa Aadir en el campo Grficos, quedando
aadido Nivel*Tipo que responde al grfico de interaccin.

En el Visor de SPSS aparecen los grficos:


48
En el grfico de interaccin se observa que aparentemente no existe interaccin entre tipos de planta
y los dos ltimos niveles de agua:

El crecimiento del tipo 1 ha sido superior en igual longitud promedio tanto con el nivel 2 como con
el nivel 3 de agua y, anlogamente, el nivel 3 de agua fue igual o mejor para el crecimiento con
independencia del tipo de planta.

Sin embargo, este comportamiento no se ha mantenido con el nivel 1 de agua, estando aqu la
posible interaccin. Probablemente el nivel 1 de agua sea el menos exitoso, especialmente con un
comportamiento malo para el tipo 1 de plantas.

Analizar > Modelo lineal general > Univariante > Opciones

En el campo Medias marginales estimadas se puede indicar al SPSS que proporciones estimaciones
de las medias de todos los niveles de una fuente de variacin de inters (es decir, de los factores
incluidos en el diseo o interaccin de factores, sean estas interacciones incluidas o no en el diseo).
Para ello, se trasladan las fuentes de inters desde la lista Factores e interacciones de los factores a
la lista Mostrar las medias para.

Sealar que, como ejemplo, el cuadro de medias estimadas para los niveles de la interaccin
Tipo*Nivel no es el mismo para un modelo completo que para un modelo de efectos principales.

Al sealar Comparar los efectos principales se realizan las comparaciones de medias dos a dos
(pairwise comparisons) de todos los niveles de los efectos principales con tres posibles criterios que se
seleccionarn en la lista desplegable de Ajustes del intervalo de confianza:

DMS (Mnima Diferencia Significativa) consiste en utilizar el criterio de la t de Student para


comparar dos muestras independientes, no considerando por tanto la tasa de error tipo I global.

49 49
Bonferroni y Sidak suponen diferentes correcciones para controlar la tasa de error tipo I, siendo
recomendables cuando hay que realizar un nmero muy grande de comparaciones dos a dos.

En un modelo factorial completo, un cuadrado de dilogo como el de la figura adjunta:

El Visor de Resultados da una salida como la que se muestra:


51
Se observa que el crecimiento medio estimado del tallo de guisantes de las plantas de tipo 1 tratadas
con el nivel de agua 1 es 72,60. En el modelo factorial completo este crecimiento medio se obtiene
mediante:

+ 11 = + 1 + 1 + ( )11

Su estimador se calcula a travs de las estimaciones mnimocuadrticas de sus parmetros:


+ + + ( = Y = 72,60

1 1 ) 11 11

concluyendo que, para este modelo, la estimacin coincide con la media muestral de los crecimientos
alcanzados con las plantas de tipo 1 tratadas con nivel de agua 1.

Estadsticos descriptivos: Proporciona la media muestral, la desviacin tpica muestral y el tamao


para cada nivel y combinacin de niveles.

2
Estimacin del tamao del efecto: En el cuadro ANOVA se aade el coeficiente para cada
fuente de variacin incluida en el modelo.

2
= 0,840 2 2
A = 0,978B = 0,665
AB

52 52
es por tanto una estimacin de la proporcin de varianza explicada por diferencias entre los
niveles de la fuente de variacin una vez eliminado el efecto de las otras fuentes de variacin
incluidas en el modelo.

2
Se observan coeficientes altos para todas las fuentes de variacin, siendo el menor el
correspondiente a la interaccin (0,665).

Potencia: La potencia de un contraste es la probabilidad de rechazar la hiptesis nula cuando es


falsa.
El valor de la potencia se entiende como la capacidad de la prueba de hiptesis para detectar una
diferencia real (poblacional) entre los niveles de la fuente de variacin igual a la diferencia
observada entre las muestras.
En todos los casos la potencia es igual a 1, lo que sugiere una alta capacidad de Ftest para
rechazar la hiptesis nula con diferencias reales iguales a las observadas.

Estimacin de los parmetros:

53 53
El modelo estimado se resume:

Y = 105,82 + 17,76. X1 34,80. Z1 20,140. Z2 16,180. X1 Z1 1, 400. X1 Z2 +


X1 = 1 si la planta es de tipo 1, en otro caso vale 0
donde las variables son dummy: Z1 = 1 si es tratada con el nivel 1 de agua, en otro caso vale 0
Z2 = 1 si es tratada con el nivel 2 de agua, en otro caso vale 0

Pruebas de homogeneidad: La prueba de Levene para testar la hiptesis nula de igualdad de


varianzas de la variable crecimiento en todas las poblaciones definidas por combinaciones de los
niveles de factores conduce a un estadstico igual a 1,130 que en una F5, 24 deja a su derecha una
cola de probabilidad 0,372.

Siendo p valor = 0, 372 > 0, 05 no se rechaza la hiptesis nula de homogeneidad de varianzas de la


variable crecimiento del tallo de guisantes en las 6 poblaciones definidas (combinacin del tipo de
planta y nivel de agua considerados), validando as una de las hiptesis estructurales del modelo
propuesto (homoscedasticidad).
Diagrama de dispersin x nivel: Complementa las pruebas de homogeneidad (contraste de
Levene). El diagrama consiste en un grfico de puntos, cada uno representa una poblacin
(combinacin de niveles) de modo que la abscisa es la media y la ordenada la desviacin tpica o la
varianza. El objetivo es destacar si la varianza depende de la media (es frecuente comprobar que
la respuesta crezca cuando lo hace la media).

En los grficos de (media, desviacin tpica) y (media, varianza) se pone de manifiesto que las medidas
de dispersin dependen de la media.

El grfico 1 muestra que los niveles con mayor y menor crecimiento medio conducen a desviaciones
tpicas muy semejantes y, aparentemente, no parece claro que la dispersin de ambos grficos pueda
achacarse a una relacin determinista, lo que concuerda con el hecho de que la Prueba de Levene no
encuentra significacin estadstica.
Grfico de los residuos: Se trata de un grfico matricial de puntos enfrentando Valores
Observados (variable respuesta) con Valores Pronosticados (por el mtodo estimado) y los
Residuos( valores observados menos valores pronosticados).

Los residuos se muestran tipificados (divididos por la raz cuadrada del error cuadrtico medio
estimado).

El grfico matricial da una idea de si se verifican los supuestos de independencia, homogeneidad de


varianzas y falta de ajuste.

Independencia: El grfico de dispersin ResiduosObservados no debera mostrar una pauta


de variacin sistemtica (lnea, curva, )

Homoscedasticidad: El grfico de dispersin ResiduosPronosticados debera mostrar una


dispersin de residuos similar para todos los valores pronosticados.

Ajuste de los datos: El grfico de dispersin PronosticadosObservados debera mostrar un


perfil cercano a la linealidad, cunto mas lineal mejor ajuste.

ResiduosObservados: Grfico de coordenadas (1, 3) o (3, 1) en la matriz, se dispersa formando


un crculo, redundando en su aleatoriedad, corroborando la hiptesis de independencia.

ResiduosPronosticados: Grfico de coordenadas (2, 3) o (3, 2) en la matriz, muestra una


dispersin semejante para cada valor pronosticado. Algo mayor para las medias pronosticadas en
lugar 4 y 5 en orden creciente, pero sin relevancia aparente.

PronosticadosObservados: Grfico de coordenadas (1, 2) o (2, 1) en la matriz, se ajusta a una


relacin lineal, ratificando el buen nivel de ajuste del modelo estimado.
DISEO EXPERIMENTAL: EL DISEO POR BLOQUES

En los estudios empricos, en general, el investigador tiene un papel pasivo con respecto a la
informacin, es decir, no interviene en la generacin de los datos limitndose a su observacin.

En algunas ocasiones, sin embargo, el investigador tiene la posibilidad de disear un experimento, as


en el rea de investigacin de mercados se pueden encontrar numerosos ejemplos de diseo
experimental.

En el diseo de experimentos se debe aplicar el principio de aleatorizacin del experimento que


consiste en asignar de forma aleatoria los elementos o individuos a los distintos niveles del factor,
para todo aquello que no est controlado por el investigador.

Cuando el anlisis de la varianza se realiza con datos procedentes de un diseo experimental, a los
niveles del factor se les denomina generalmente tratamientos.

Cuando se aplica el principio de aleatorizacin y no se introduce ninguna variable de control en el


experimento, entonces se dice que el diseo est completamente aleatorizado, en el sentido de que
elementos del diseo son asignados completamente al azar a cada uno de los tratamientos.

En muchas ocasiones el investigador se puede encontrar con la situacin de que, adems del factor o
factores de tratamiento, existen otros factores que ejercen una influencia decisiva sobre la variable
dependiente. Si el tamao de la muestra es reducido, los resultados del experimento pueden venir
afectados por el hecho de que no sean homogneos los elementos que se han asignado a cada
tratamiento debido precisamente a la presencia de estos otros factores que tienen una influencia
decisiva, pero que no estn controlados.

El diseo por bloques tiene por finalidad controlar los errores provocados por el impacto desigual que
pueden tener dichos factores no controlados, a los que se les denomina factores de bloque, en los
distintos tratamientos.

En el diseo por bloques se forman grupos homogneos, o bloques, es decir, se toman elementos de
un mismo nivel (o de una misma combinacin de niveles) de los factores de bloque. Despus, y de
forma aleatoria, se asignan los elementos de cada bloque a los distintos tratamientos.

As pues, en el diseo por bloques se van a distinguir dos tipos de factores: factores de tratamiento y
factores de bloque. Los primeros se introducen para analizar su efecto sobre la variable dependiente,
mientras que los factores de bloque se utilizan para reducir los errores en el experimento.

Sealar que en el diseo por bloques se adopta el supuesto de noexistencia de interaccin entre los
factores de tratamiento y los factores de bloque.

Los diseos por bloques ms importantes son: diseo por bloques completos al azar, el diseo de
medidas repetidas y el diseo de cuadros latinos.
ANOVA DISEO POR BLOQUES
Fuente variacin
Interseccin

Factor Tratamiento

Factor Bloqueo

Residual (Error)

Total

Total corregida

G J SC Inter sec T2 SCT corregidoSPSS G J


T2
SCTSPSS = Ygj = = Ygj2
2

g =1 j=1
cinSPSS N g =1 j=1 N

2
G
T T2 SPSS
J
T
2
T
2


g =1 J
g
N j=1 G j N

SCT corregido = SCT SC Inter sec cin = SC Intergrupos + SC Bloqueo SC Error


+
gl (N1) gl (N1) gl (G1) gl (J1) gl (G1)(J1)
G1 J1
El modelo matemtico utilizando variables 'dummy' es : Ygj = GJ +
g=1
g
Xg +
j=1
j
Z j + gj

donde,

Xi = 1 en el i simo nivel del factor tratamiento



X i = 0 en otro dist int o del i simonivel del factor tratamiento

Z j = 1 en el j simo bloqueo
Z = 0 en otro bloqueo distint o del j simo
j
Ejemplo 5. En una investigacin se desea analizar la concentracin de mercurio en el encfalo, la
musculatura y los tejidos oculares de truchas expuestas a dosis letales (0,30 unidades txicas) de
metilo de mercurio. Diez truchas elegidas aleatoriamente arrojaron las concentraciones expuestas en
la tabla (en microgramos de mercurio por gramo de tejido).

Nmero de trucha
1
2
3
4
5
6
7
8
9
10

Las fuentes de variacin controladas en el experimento son: Un factor tratamiento (Tejido) con tres
niveles de efectos fijos: Encfalo, Musculatura y Ojos. Un factor de bloqueo (trucha) del que se han
tomado de modo aleatorio 10 bloques o niveles de bloqueo (10 ejemplares).

Se trata de bloques completos (de tamao 3, igual al nmero de niveles del factor tratamiento) pero
no aleatorizados. La variable respuesta o dependiente es la Concentracin de Mercurio (en
microgramos por gramo de tejido).

Al tratarse de bloques completos de tamao igual al nmero de niveles del factor tratamiento no es
posible testar la existencia de interaccin entre el factor tratamiento y el factor de bloqueo, de modo
que el modelo matemtico es anlogo al de un diseo de dos vas de efectos principales con una sola
rplica:

Ygj = + g + j +
gj

Ygj concentracin de mercurio en el tejido gsimo (g = 1, 2, 3) de la jsima trucha


concentracin media de mercurio
g efecto diferencial (respecto a la media ) en la concentracin de mercurio del tejido gsimo
j efecto diferencial (respecto a la media ) en la concentracin de mercurio de la jsima trucha
gj parte de la respuesta Ygj no explicada por el modelo, asumiendo que los gj son todos ellos
independientes e idnticamente distribuidos segn una N(0, )
Se establece la hiptesis nula: H0 : 1 = 2 = 3 no existe diferencia en la concentracin
media de mercurio en los tejidos

G1 J1
El modelo matemtico utilizando variables dummy es: Ygj = GJ +
g=1
g Xg +
j=1
j
Z j + gj

Siendo Xg = 1 cuando la concentracin de mercurio se tom en el tejido gsimo y Xg = 0 en otro


caso, y Z = 1 si la concentracin de mercurio se tom de la jsima trucha y 0 en otro caso.
j
FACTOR DE BLOQUEO: Truchas Nmero de trucha

1
2
3
4
5
6
7
8
9
10
TOTAL
G J 3 10 SC Inter sec Y
2

SCT = Y =
2
cin

= = 32,199


SPSS SPSS

gj gj
g =1 j=1 g =1 j=1 gj
N
2
G J Y 3 10 Y
2
31, 08
2

= Y
2 2
SCT corregido SPSS
= Y = 37, 923 = 37, 923 32,199 = 5, 724
gj
g =1 j=1 N g =1 j=1 N 30
2
G Y Y
2
15, 14
2 2 2 2
SC Intergrupos SPSS 10 , 85 5, 09 31, 08
= SC Tejido =
g
+ + = 37,285 32,199 = 5, 086
= 10
g =1 J N 10 10 30
J 2 2
SC BloqueoSPSS = SC Trucha = Y j Y =

j=1 G N

3,122 + 2, 94 + 2, 97 + 3, 4 + 3 + 2, 98 + 2, 89 + 3,24 + 3,22 +


2 2 2 2 2 2 2 2 2 2
31, 08
3, 32
= = 32,293 32,199 = 0,
094
3 30
2
3 10 3 Y 10 Y i
2
Y
2

Y
2 g
SC ErrorSPSS = SCR = + = 37, 923 37,285 32,293 + 32,199 = 0, 544

g =1 j=1
gi
g =1 J j=1 G N
G1 J1
Modelo matemtico: Ygj = GJ +
g=1
g
Xg +
j=1
j
Z j + gj

S C T = SC Inter sec cin + SC Intergrupos + SC SC Error


Bloqueo +
gl (N) gl (1) gl (G1) gl (J1) gl (G1)(J1)

37,923 = 32,199 + 5, 086 + 0, 094 + 0, 544


G1 J1
Modelo matemtico corregido: Ygj GJ =
g=1
g
Xg +
j=1
j
Z j + gj

SCT corregido = SCT SC Inter sec cin = SC Intergrupos + SC SC Error


Bloqueo +
gl (N1) gl (N1) gl (G1) gl (J1) gl (G1)(J1)
5,724 = 37,923 32,199 = 5, 086 + 0, 094 + 0, 544
2
La estimacin insesgada de la varianza residual (error) = Var ( ) viene expresada
gj por la media
cuadrtica residual MCR:

SCR 0, 544 = Var ( ) = 0, 03022


2
MCR = = = 0, 030 gj

6
(G 1)(J 1) 18

La hiptesis nula de que no hay diferencias entre las concentraciones medias de mercurio de
los tres tejidos considerados (encfalo, musculatura y ojos):
H : =0 =1 2 3

MC Intergrupos
F=
se contrasta a travs del estadstico MCR

SC Intergrupos 5, 086
MC Intergrupos = MC tejido = = = 2, 543
G1
2

MC Intergrupos 2, 543
F= = = 84,147
MCR 0,
03022

Siendo F = 84,147 > F ; (G1), (G1)( J1) = F0 ,05; 2 , 18 = 3, 5546 se rechaza la hiptesis nula, concluyendo
que
existen diferencias significativas en las concentraciones medias de mercurio en los
tejidos considerados.

Los coeficientes de determinacin parciales (porcentaje atribuido a cada fuente de variacin):

SCT corregido = SC Intergrupos + SC Bloqueo + SC Error

SCT corregido SC Intergrupos SC Bloqueo SC Error


1= = + +
SCT corregido SCT corregido SCT corregido SCT corregido
8 8 ,89 % 1,6 9, 50 %
4%

5, 086 0, 094 0, 544


5,724 = 5, 086 + 0, 094 + 0, 6 1= + +
5,724 5,724 5,724
544

Variabilidad de la concentracin de mercurio explicada por diferencia entre tejidos: 88,89%


Variabilidad de la concentracin de mercurio explicada por diferencias entre truchas: 1,64%
Variabilidad de la concentracin de mercurio no explicada por el modelo formulado: 9,50%
Variabilidad concentracin de mercurio explicada por el modelo formulado:
88,89+1,64=90.53%

A la vista de los resultados, se puede concluir que no es eficiente bloquear puesto que las
diferencias entre los bloques (truchas) solo explica el 1,64% de la variabilidad de la concentracin
de mercurio, porcentaje irrelevante con un coste para el procedimiento dado (se han invertido
sin
necesidad J 1 = 9 grados de libertad en estimar los efectos del bloque).

Para realizar el anlisis con SPSS: Analizar > Modelo lineal general > Univariante
Es irrelevante introducir el factor de bloqueo (trucha) como de efectos fijos o de efectos aleatorios ya
que no interesa realizar contraste alguno sobre sus niveles.

Analizar > Modelo lineal general > Univariante > Modelo

Analizar > Modelo lineal general > Univariante > Contrastes


El botn Contrastes se deja sin activar, ya
que no se analiza un contraste
personalizado sobre los efectos del factor
tejido.

Obviamente no se realizan contrastes sobre


los efectos de los bloques.

Analizar > Modelo lineal general > Univariante > Grficos

Analizar > Modelo lineal general > Univariante > Post hoc

Para realizar las comparaciones dos a dos de las medidas de concentracin de mercurio en los tres
tipos de tejido analizados atendiendo a controlar la tasa de error de tipo I global.

Insistir en que no se solicitan comparaciones Post hoc para los bloques.

En este caso, al tratarse de slo 3 niveles de tejido podra tener sentido el criterio de Bonferroni. Se
selecciona Bonferroni, Scheff, Duncan y Tukey.
Analizar > Modelo lineal general > Univariante > Opciones

En el Visor de Resultados se informa de que los diagramas de dispersin de algunas combinaciones


de niveles de factores no se pueden construir por tener menos de dos observaciones. Obviamente
en este caso se refiere a cualquier combinacin [nivel de tejido bloque (trucha)] ya que tiene un
nico dato y en consecuencia dispersin cero.
Se cambia la vista de
Estadsticos descriptivos en
Paneles de Pivotado de SPSS

O bien,

Habiendo realizado el cambio correspondiente en Paneles de Pivotado:


Contraste de Levene sobre la igualdad de las varianzas. Este contraste no se puede realizar en
este caso porque tiene en cuenta tantos grupos como combinaciones de factores que existan. En
estas circunstancias, al disponer tan slo de una observacin por grupo no quedan grados de
libertad suficientes para estimar el error y no puede realizarse la prueba F del cuadro ANOVA. De
ah el resultado que aparece en la tabla adjunta, donde las celdas para el estadstico F y para el
nivel crtico (significacin) aparecen vacas y los grados de libertad del denominador (gl2) son
iguales a cero.

Prueba de los efectos intersujetos. Proporciona el cuadro ANOVA que se muestra en la tabla
adjunta.

No hay que considerar la prueba F para los efectos bloque (trucha), es recomendable vaciar las celdas
relativas a la misma y visualizar ANOVA como se muestra a continuacin:
Como ya se haba calculado manualmente:
3 10 SC Inter sec 2
T
Total = SCTSPSS = Ygj2 = 37, 923 cinSPSS
= = 32,199
g =1 j=1
N

2
3 10
T
Total corregida = SCT corregidoSPSS = Ygj2 = 5, 724
g =1 j=1
N
2
3
T T
2
SPSS
10
T
2
T
2


g =1 J
g
N j=1 G j N
2
3 10 3
Tg 10
Ti
2 2
T
SC ErrorSPSS = SCR = Y + = 0, 544
2
gi

g =1 j=1 g =1 J i=1 G N
G1 J1
Modelo matemtico corregido: Ygj GJ =
g=1
g Xg +
j=1
j
Z j + gj

SCT corregido = SCT SC Inter sec cin = SC Intergrupos + SC Bloqueo SC Error


+
gl (301) gl (301) gl (31) gl (101) gl (31)(101)

5,724 = 37,923 32,199 = 5, 086 + 0, 094 + 0, 544


2
La estimacin insesgada de la varianza residual (error) = Var ( gj ) viene expresada por la media
cuadrtica residual MCR:

SCR 0, 544 2
) = 0, 03022
MCR = = = 0, 030 6 = Var (gj
(G 1)(J 1) 18

Estimacin de los parmetros. Proporciona las estimaciones para los parmetros del modelo,
sus errores tpicos, intervalos de confianza y cantidades de inters para contrastar la hiptesis
nula de que estos parmetros sean iguales a 0 (estadstico t, nivel crtico, potencia observada,
2
coeficiente ).
G1 J1
El modelo matemtico utilizando variables 'dummy': Ygj = GJ +
g=1
g
Xg +
j=1
j
Zj + gj

Y = 0, 546 + 1, 005 . X1 0, 576 . X2 0, 033 . Z1 0, 093 . Z2 0, 083 . Z3 0, 60 . Z4


+ +
0, 073 . Z5 0, 080 . Z6 0, 110 . Z7 0, 007 . Z8 0, 033 . Z10 +
+ +

Pruebas Post hoc


Se pone de manifiesto que todas las pruebas comparando las concentraciones de mercurio de dos
tejidos cualesquiera resultan significativas.

A modo de ejemplo se reproduce la siguiente tabla, cuadro de Subconjuntos homogneos generado a


partir de las pruebas de Tukey, Duncan y Schefe.

Grficos de perfil

Para tener una idea clara del grfico de perfil de los tejidos, esto es, de la distancia que separa los
puntos hay que advertir que el error estimado para las medias es 0,055.
En el grfico de perfil para los bloques se observan unas diferencias insignificantes.

Grfico de los residuos

Es un grfico matricial de puntos enfrentando Valores Observados de la variable respuesta, Valores


Pronosticados por el modelo estimado para la variable respuesta, y Residuos (valores observados
menos valores pronosticados por el modelo estimado).

Los residuos se muestran tipificados (divididos por la raz cuadrada del error cuadrtico medio
estimado).

Este grfico matricial da una idea si se verifican los supuestos de independencia, homogeneidad de
varianzas y falta de ajuste. En efecto:

Si existe Independencia, el grfico de dispersin ResiduosObservados no debera mostrar pauta


de variacin (lnea, curva, ). Grfico de coordenadas (1, 3) o (3, 1) en la matriz.

Si existe Homocedasticidad, el grfico de dispersin ResiduosPronosticados es de inters puesto


que la dispersin de los residuos debe de ser similar para todos los valores pronosticados. Grfico
de coordenadas (2, 3) o (3, 2) en la matriz.

En un modelo con Buen Ajuste a los Datos, la nube de puntos PronosticadosObservados debiera
mostrar un perfil cercano a la linealidad (a ms linealidad mejor ajuste). Grfico de coordenadas
(1, 2) o (2, 1) en la matriz.
El grfico matricial permite intuir que las hiptesis de homogeneidad de varianzas, independencia y
bondad de ajuste estn presentes, validando en cierto modo el anlisis desarrollado.
DISEO EXPERIMENTAL CON UN FACTOR ANIDADO o JERARQUICO

DISEO FACTORIAL: Todos los niveles de cada factor estn combinados con todos los niveles de los
restantes factores.

Niveles Factor A
1
2
3
4

MODELO JERRQUICO O ANIDADO: Ciertos niveles del factor B estn ligados a ciertos niveles del
factor A.

Niveles Factor A
1
2
3
4

La presencia de un nivel de B depende de la de un cierto nivel de A. En este caso, se dice que el factor
B est anidado en el factor A, indicando con la notacin B j(i) que el jsimo nivel de B corresponde con
el isimo nivel de A.

MODELO EQUILIBRADO: Factor anidado con el mismo nmero de observaciones por celda.
MODELO NOEQUILIBRADO: Factor anidado con distinto nmero de observaciones por celda.

DISEO JERRQUICO CON UN FACTOR ANIDADO Y EL MISMO NMERO DE


OBSERVACIONES POR CELDA

1. DISTINTO NMERO DE NIVELES DEL FACTOR ANIDADO POR CADA NIVEL DEL
FACTOR PRINCIPAL

MODELO ESTADSTICO

Modelo estadstico: Yijk = + i + j(i) + (ij)k

Media global

i Efecto del nivel isimo del factor A (i = 1, 2, " , I)

j(i) Efecto producido por el nivel jsimo del factor B dentro del nivel isimo del factor A
(j = 1, 2, " , bi )
K Nmero de rplicas (k = 1, 2, " , K)
N Nmero de observaciones: N = k bi
i

R Nmero total de niveles del factor B: R = bi


i

(ij)k Error experimental. Se asume que los (ij)k son todos ellos independientes e idnticamente
distribuidos segn una N(0, )

NO HAY INTERACCIN: CADA NIVEL DEL FACTOR B NO APARECE CON CADA NIVEL DEL FACTOR A.

MODELO JERRQUICO CON UN FACTOR ANIDADO (NOBALANCEADO)


Factor A
Nivel 1 Nivel 2 Nivel 3
Obser / Factor B 1 2 1 2 3 1 2
1 Y111 Y121 Y211 Y221 Y231 Y311 Y321
2 Y112 Y122 Y212 Y222 Y232 Y312 Y322
3 Y113 Y123 Y213 Y223 Y233 Y313 Y323
# # # # # # #
K Y11K Y12K Y21K Y22K Y23K Y31K Y32K
Yij Y11 Y12 Y21 Y22 Y23 Y31 Y32
Y1 (b1 = 2) Y2 (b = 3) Y3 (b3 = 2)
Yi 2

Y Y

En el modelo matemtico asociado: Yijk = + i + j(i) + (ij)k

La descomposicin de la suma de cuadrados para el modelo:

ijk
I J K I J K I J K I J K I J K


i ij i ijk ij

2 2 2 2 2
Y = Y + (Y Y ) + (Y Y ) + (Y Y )
i=1 j= 1 k= 1 i=1 j= 1 k= 1 i=1 j= 1 k= 1 i=1 j= 1 k= 1
i=1 j= 1 k= 1

SC Total SC Interseccin SCA SCB(A) SC Error

En el modelo matemtico corregido asociado: Yijk = i + j(i) + (ij)k

La descomposicin de la suma de cuadrados para el modelo corregido:

La descomposicin de la suma de cuadrados para el modelo:

ijk
I J K I J K I J K I J K I J K


i ij i ijk ij

2 2 2 2 2
Y = Y + (Y Y ) + (Y Y ) + (Y Y )
i=1 j= 1 k= 1 i=1 j= 1 k= 1 i=1 j= 1 k= 1 i=1 j= 1 k= 1
i=1 j= 1 k= 1

SC Total SC Interseccin SCA SCB(A) SC Error

En el modelo matemtico corregido asociado: Yijk = i + j(i) + (ij)k

La descomposicin de la suma de cuadrados para el modelo corregido:


ijkI J K I J K I J K I J K


i ij i ijk ij

2 2 2 2
Y Y ) = (Y Y ) + (Y Y ) + (Y Y )
i=1 j= 1 k= 1 i=1 j= 1 k= 1 i=1 j= 1 k= 1 i=1 j= 1
k= 1

SC Total corregida SCA SCB(A) SC Error

siendo, SCT corregida = SCA + SCB(A) + SCE 2 SCA + SCB(A)


R = SCT

SCInter sec cin I J K 2


Y

I J K
SCT =
2
2
=
= N
Yijk Y
i=1 j=1 k =1 i=1 j=1 k =1

I J K
ijk

SCT corregida = (Y Y )2 = SCT SCInter sec cin


i=1 j=1 k =1

I J K i I 2 2
SCA = (Y Y )2 = 1 Yi Y

b
i=1
i=1 j=1 k =1 K i N

I J K
Y
I J I 2
1 i
SCB(A) = (Y Y ) =
ij ij

K b
2 2
Y i

i=1 j=1 k =1 i=1 j=1 i=1 i


I J K
1 I J
SCE = Yijk Y
2 2
ij = SCT corregida SCA SCB(A)

i=1 j=1 k =1 k i=1 j=1

El modelo estadstico utilizando variables 'dummy' es:


J1 I1
J1

Y =+
j=1
j(I) Zj+
i=1
+ Z i
j=1
j(i) j

Xi +

siendo Xi la variable que toma el valor 1 en el isimo nivel del factor A y 0 en otro caso, y Z j la
variable que toma el valor 1 en el jsimo nivel del factor B y 0 en otro caso.

MODELO DE EFECTOS FIJOS: Los estimadores por mnimos cuadrados de j(i) = + i + j(i) son nicos
y son j(i) = Yij . Sin embargo existen infinitas soluciones para estimar los parmetros , i y j(i) ,
siendo necesario imponer restricciones.

Habitualmente se imponen las restricciones:


i
=0 y j(i)
= i , resultando los estimadores:
0
i j


= Y

Y
= i Y
i

= Yij Yi

j(i)
En el SPSS se plantea el mismo modelo pero los efectos se computan con las restricciones I = 0 y
= i , siendo I y J los ltimos cdigos de los niveles del Factor A y del factor B anidado
J(i)

0
respectivamente.
Intersec cin
= YI J


Con este criterio, los efectos en el SPSS se estiman: i = Yi J YIJ


j(i)
= Yij Yi J

TABLA ANOVA PARA EL MODELO DE EFECTOS FIJOS

Interseccin

Factor A

Factor B en A

Error

Total

Total corregida

MODELO DE EFECTOS FIJOS

Es habitual imponer las restricciones: i = 0



j
j(i)
=0 i

y
i

ECUACIN BSICA DEL ANLISIS DE LA VARIANZA: SCT = SCA + SCB(A) + SCE


H0 : i = 0 i
HIPTESIS ESTABLECIDAS: = i , j
H0 : j(i)
0

MODELO DE EFECTOS ALEATORIOS

Los niveles de A son una muestra aleatoria de una poblacin N(0 , A )


Los niveles de B son una muestra aleatoria de una poblacin N(0 , B )
Contrastes:
0 A
2 2
H : 0= 0 B y H : = 0 , respectivamente.

MODELO DE EFECTOS MIXTOS

A es el factor de efectos fijos, H0 : 1 = 0


2
B es el factor de efectos aleatorios,
0 B H : =0
TABLA ANOVA PARA MODELO DE EFECTOS ALEATORIOS Y MIXTOS

Interseccin

Factor A

Factor B en A

Error

Total

Total corregida

Ejemplo 6. Una entidad bancaria tiene siete sucursales en tres ciudades. En la direccin de recursos
humanos de la entidad estn interesados en conocer si la diferente captacin de clientes, controlada
por el volumen de sus cuentas corrientes, entre unas sucursales y otras, as mismo entre ciudades, se
debe al hecho de ser las ciudades diferentes econmicamente, al trabajo de los directores de las
sucursales, o ambas cosas a la vez.
Con la intencin de controlar estas posibles fuentes de variabilidad, se analizan dos factores: Factor
Ciudades y Factor Sucursales. Se decide utilizar un diseo factorial jerrquico (los niveles del Factor
Sucursales no pueden combinarse con todos y cada uno de los niveles del Factor Ciudades).
Se toma una muestra de tres cuentas corrientes en cada sucursal, en cientos de euros.

MODELO JERRQUICO CON UN FACTOR ANIDADO (NOBALANCEADO)

C. C. / Sucursal
1
2
3
Yij
Yi
Y

3 7 3 3 7 3 2 2
21190
ijk
i=1 j=1 k =1 2 Y
SCT = Y = 21680486 SCInter sec cin 2 = = = 21381719, 05
Y N 21
= i=1 j=1 k =1
3 7 3

(Y
ijk

SCT corregida =
2
Y ) = SCT SCInter sec cin = 21680486 21381719, 05 = 298766,95
i=1 j=1 k =1

3 7 3 i 2 2 2 2 2 2 2
Yi Y 1 6819
+ 9369 + 5002 21190 = 291204,12
3
SCA = (Y Y ) = 1 =

i=1 j=1 k =1 K i=1 b i N 3 2 3 2 21
I J K
I J
1 ij
1 a
Y
2


ij i

i=1 j=1 i=1


SCB(A) = (Y Y )2 = 2
Y i

i=1 j=1 k =1 K K bi

12 3
17Y 3 2
1
SCB(A) =
K Yij
i=1 j=1 K b
i=1
i

i
= 34552 + 33642 + 31662 + 31432 + 30602 + 24872 + 25152
3
2
9369 50022
1 2
6819
+ + = 3583, 5
3 2 3 2

SCE = SCT corregida SCA 6 SCE = 298766,95 291204,12 3583, 5 = 3979,33


SCB(A)
SCT corregida = SCA + SCB(A) + 6 298766,95 = 291204,12 + 3583, 5 + 3979,33
SCE
R2 0,987
ex p =lic ad a
2
Rno = 0,013
e xp lic a
da
SCA SCB(A) SCE 291204 ,12 3583, 5
1= + + 6 1= + + 3979, 33
SCT corregida SCT corregida SCT corregida 298766,95 298766,95 298766,95

Fuentes Variacin
Interseccin
Factor A
Factor B en A
Error
Total
Total corregida
SCB(A) 3583, 50
SCA 291204 ,12 MCB(A) = = = 895,875
MCA = = = 145602, (R I) 4
06
I1 2
SCT 298766, 95
MCT = = =
SCE 3979, 33 14938,347 (N 1) 20
MCE = = = 284,238
R (K 1) 14

Los estimadores por mnimos cuadrados de j(i) = + i + son nicos y son j(i) = Yij . Sin
j(i)
embargo, existen infinitas soluciones para estimar los parmetros , i y j(i) , siendo necesario
imponer restricciones.

Habitualmente se imponen las restricciones:


i
i
=0 y
j
j(i)
= 0 i

En el SPSS se plantea el mismo modelo pero los efectos se computan con las restricciones I = 0 y
= i , siendo I y J los ltimos cdigos de los niveles del Factor A y del factor B anidado
J(i)

0
respectivamente.
3 = 0
Los efectos en el SPSS se estiman con las restricciones:

= 2(1) 2(3)
=0
= 3(2)
= YI J = Y32 = (2515 / 3) = (Interseccin)
838,333
1 = Y
12 32
Y = (3364 / 3) (2515 / 3) = 283
i = Yi J 6 2 = Y23 Y32 = (3060 / 3) (2515 / 3) =
181,667
YIJ
3 = Y32 Y32 = (2515 / 3) (2515 / 3) = 0

1(1) = Y = (3455 / 3) (3364 / 3) = 30,333
11 Y12

2(1) = Y Y12 = (3364 / 3) (3364 / 3) = 0


12


2(1)
= Y21 Y23 = (3166 / 3) (3060 / 3) = 35,333
= Yij Yi J
2(2)
= Y22 Y23 = (3143 / 3) (3060 / 3) = 27,667

6
j(i)

2(3)
= Y23 Y23 = (3060 / 3) (3060 / 3) = 0



3(1) = Y31 Y32 = (2487 / 3) (2515 / 3) = 9,333
= (2515 / 3) (2515 / 3) = 0
3(2) = Y32 Y32

El modelo estadstico utilizando variables 'dummy':


J1 I1
J1

Y = + j(I) Z j +
j=1
i=1
i +
j=1
j(i) Z j X i +

siendo Xi la variable que toma el valor 1 en el i


simo nivel del factor A y 0 en otro caso, y Z j la
variable que toma el valor 1 en el jsimo nivel del
factor B y 0 en otro caso.

Y = 838,333 9,333 . Z1 + [283 + 30,333 . Z1 ] . X1 + [181,667 35,333 . Z1 + 27,667 . Z 2 ] . X2 +


+

MODELO DE EFECTOS FIJOS: Ciudades (Factor A) y Sucursales (Factor B) son de efectos fijos.
H0 (A) : i = 0 y H0 [B(A)] : j(i) = 0
F. Variacin
Factor A
Factor B en A
Error
MCA 145602, 06 FB( A) MCB(A) 895, 875
FA = = = 512,254 = = = 3,152
MCE 284,238 MCE 284,238

estadstico observado estadstico


fac to r A (c iu d t e r ic
a d es)
rechazando
o
Con un nivel de significacin = 0, 05 se tiene que
FA = 512,254 > 3,74 = F0 ,05 ; 2 ,
14

la hiptesis nula, la captacin de clientes es significativamente distinta en los tres tipos de ciudades,
consecuencia del hecho de su distinto carcter econmico.

estadstico observado estadstico


factor B ( A ) ( di re c to t e r ic o
res/ciudad)
Por otra parte, 3,11 = F0 ,05 ; 4 , 14 , rechazando la hiptesis nula, por
FB(A) = 3,152 >
tanto, la labor de los directores de sucursal tambin es significativamente distinta.

Entrada de datos en SPSS: Analizar > Modelo lineal general > Univariante
Analizar > Modelo lineal general > Univariante > Modelo

Se elige Modelo Personalizado, se traslada Fabricante a la lista Modelo y se selecciona Efectos


principales.

Analizar > Modelo lineal general > Univariante > Grficos


Analizar > Modelo lineal general > Univariante > Post hoc

Analizar > Modelo lineal general > Univariante > Opciones


Analizar > Modelo lineal general > Univariante > Pegar

Es necesario utilizar el editor de sintaxis para informar al SPSS que se trata de un diseo jerarquizado.

Para desarrollar el anlisis jerarquizado se pulsa Pegar en el cuadro de dilogo Univariante,


abrindose una ventana como la que se visualiza a continuacin:

La ltima fila /DESIGN = Ciudad. se cambia por /DESIGN = Ciudad Sucursales(Ciudad).


informando a SPSS del factor Sucursal en Ciudad.

Posteriormente, se pulsa Ejecutar en el men principal del editor de sintaxis.

Los resultados ms relevantes del Visor de Resultados de SPSS:

El contraste de Levene acepta la hiptesis nula de homocedasticidad [p valor = 0, 06 > 0, 05] , es


decir, se acepta la hiptesis de igualdad de varianzas.
En Pruebas de los efectos intersujetos est el cuadro ANOVA:

En Opciones:
2. IGUAL NMERO DE NIVELES DEL FACTOR ANIDADO EN TODOS LOS NIVELES DEL
FACTOR PRINCIPAL (DISEO BALANCEADO)

Ejemplo 7. Dos fabricantes comercializan tres filtros muy utilizados en respiradores comerciales para
la proteccin de partculas de materia. Para comparar los filtros se realizaron tres rplicas de prueba
independientes con cada filtro, evalundose el porcentaje de penetracin mediante una prueba
estndar de aerosol.

Rplicas \ Filtro
1
2
3

En el experimento hay dos factores tratamiento:

El Fabricante con dos niveles de efectos fijos: Fabricante 1 y Fabricante 2


El Tipo de Filtro con seis niveles fijos: Filtro 1, Filtro 2, . , Filtro 6.

Los niveles del factor 'Tipo de Filtro' estn anidados en los niveles del factor 'Fabricante': En
Fabricante 1 se ubican los niveles Filtro 1, Filtro 2 y Filtro 3. En Fabricante 2 se ubican los niveles Filtro
4, Filtro 5 y Filtro 6.
Se trata por tanto de un diseo jerarquizado o anidado en dos etapas.

Rplicas \ Filtro

2 3 3 2 3 3
Y2 14,32
2

ijk
i=1 j=1 k =1

SCT = Y = 17,
2
SCInter sec cin 2 = = = 11,392
Y N 18
3072 = i=1 j=1 k =1

2 3 3
ijk

SCT corregida = (Y Y )2 = SCT SCInter sec cin = 17,3072 11,3923 = 5,915


i=1 j=1 k =1

2 3 3 i 2 2 2 2 2
SCA = (Y Y ) = 1
2
Yi Y = 1 4,26 + 10, 06 11,392 = 1,869

i=1 j=1 k =1 K i=1
I N 3 3 3
2 3 2 2
1 ij 1 2
Y 1 2 1 10, 06
4,26


SCB(A) = 3,34 + 0, 53 + 0,39 + 2,69 + 2,1 + 5,27
2 2 2 2 2 2 2
Y + =
bi = 3
i
K i=1 j=1 K i=1 3 3 3
= 17, 0025 13,2612 = 3,7413
SCE = SCT corregida SCA SCB(A) SCE = 5,915 1,869 3,741 = 0,305
6

Fuentes Variacin
Interseccin
Factor A
Factor B en A
Error
Total
Total corregida

MODELO DE EFECTOS FIJOS: Ciudades (Factor A) y Sucursales (Factor B) son de efectos fijos.
H0 (A) : i = 0 H [B(A)] : = 0
0 j(i)
y
SCB(A) 3, 741
SCA 1, 869 MCB(A) = = =
MCA = = = 1,869 0,935 (R I) 4
I1 1

SCE 0, 305 SCT 5, 915


MCE = = = 0, 025 MCT = = =
R (K 1) 12 0,348 (N 1) 17

MCA 1, 869 FB( A MCB(A) 0, 935


F = = = = = = 36,84
) MCE 0, 0254
73,611
A
MCE 0, 0254

estadstico observado estadstico


fact or A ( fa b ri c t e r ic
antes)
rechazando
o
Con un nivel de significacin = 0, 05 se tiene
que FA = 73,611 4,74 = F0 ,05 ; 1,
> 12

la hiptesis nula, el porcentaje de penetracin es significativamente distinta en los dos tipos


de fabricantes.

estadstico observado estadstico


factor B ( A) ( fil tr o s/ t e r ic o
fabricantes)
Por otra parte, 3,26 = F0 ,05 ; 4 , 12 , rechazando la hiptesis nula, por
FB(A) = 36,84
>
tanto, la eficacia de los filtros de cada fabricante tambin es significativamente distinta.
Los estimadores por mnimos cuadrados de j(i) = + i + son nicos y son j(i) = Yij . Sin embargo,
j(i)
existen infinitas soluciones para estimar los parmetros , i j(i) , siendo necesario imponer
y restricciones.

Habitualmente se imponen las


restricciones:
i
=0 y j(i)
= i , resultando los estimadores:
0
i
j
= Y = (14,32 / 18) = 0,7956

1 = (4,26 / 9) (14,32 / 18) = 0,3223



Y i =iY 6

2 = (10, 06 / 9) (14,32 / 18) = 0,3223

= (3,34 / 3) (4,26 / 9) = = (2,69 / 3) (10, 06 / 9) =
1(1) 0,64 0,2211
1(2)

=Y 6 = (0, 53 / 3) (4,26 / 9) = = (2,1 / 3) (10, 06 / 9) = 0,
Y j(i) ij i 2(1) 0,2966 4178
2(2)

= (0,39 / 3) (4,26 / 9) = = (5,27 / 3) (10, 06 / 9) =
3(1) 0,3433 0,6389
3(2)

En el SPSS se plantea el mismo modelo pero los efectos se computan con las restricciones I = 0 y
= i , siendo I y J los ltimos cdigos de los niveles del Factor A y del factor B anidado
J(i)

0
respectivamente.
2 = 0
En el ejemplo, I = 2 y J = 3, de modo que las restricciones son:
3(1) = 3(2) = 0

Con este criterio, los efectos en el SPSS se estiman como sigue:


= YI J = Y23 = (5,27 / 3) = (Interseccin)
1,757

1 = Y13 Y23 = (0,39 / 3) (5,27 / 3) = 1,627



Y i = iYJ IJ 6

2 = 0
1(1) = Y = (3,34 / 3) (0,39 / 3) = 0,983
11 Y13
2(1)
= Y12 Y13 = (0, 53 / 3) (0,39 / 3) = 0, 047
3(1)

=Y Y = (0,39 / 3) (0,39 / 3) = 0
13 13

= Y Y 6
ij iJ
j(i)

1(2) = Y21 Y23 = (2,69 / 3) (5,27 / 3) = 0,86
2(2) = Y Y23 = (2,1 / 3) (5,27 / 3) = 1, 057
22
3(2) =
Y23 Y23 = (5,27 / 3) (5,27 / 3) = 0
ESTIMACIN DE LOS PARMETROS
Interseccin
[fabricante 1]
[fabricante 2]
[Filtro 1] ([Fabricante 1])
[Filtro 2] ([Fabricante 1]) El modelo estadstico utilizando variables 'dummy':
[Filtro 3] ([Fabricante 1])
J1 I1
J1


[Filtro 4] ([Fabricante 2]) Y = + j(I) Z j + i + j(i) Z j Xi +
[Filtro 5] ([Fabricante 2]) j=1 i=1
j=1
[Filtro 6] ([Fabricante 2])
Y = 1,757 + [ 1,627 + 0,983 . Z1 + 0, 047 . Z2 ] . X1 + [ 0,860 . Z1 1, 057 . Z2 ] . X2 +

Y = 1,757 + [ 1,627 + 0,983 . Z1 + 0, 047 . Z2 ] . X1 0,860 . Z1 1, 057 . Z2 +


Entrada de datos en SPSS: Analizar > Modelo lineal general > Univariante

Analizar > Modelo lineal general > Univariante > Modelo


Se elige Modelo Personalizado, se traslada Fabricante a la lista Modelo y se selecciona Efectos
principales.

Analizar > Modelo lineal general > Univariante > Grficos

Analizar > Modelo lineal general > Univariante > Post hoc
Analizar > Modelo lineal general > Univariante > Pegar

Es necesario utilizar el editor de sintaxis para informar al SPSS que se trata de un diseo jerarquizado.

Para desarrollar el anlisis jerarquizado se pulsa Pegar en el cuadro de dilogo Univariante,


abrindose una ventana como la que se visualiza a continuacin:

La ltima fila /DESIGN = Fabricante. se cambia por /DESIGN = Fabricante filtro(fabricante).


informando a SPSS del factor filtro en fabricante. Posteriormente, se pulsa Ejecutar en el men
principal del editor de sintaxis.

Los resultados ms relevantes del Visor de Resultados de SPSS:

El cuadro de Estadsticos descriptivos muestra una razonable homogeneidad en la dispersin de


cada uno de los seis grupos [fabricante * filtro(fabricante)] con excepcin del filtro 3 del fabricante
2 para el que se obtiene una desviacin tpica considerablemente ms importante.
La construccin de un grfico de dispersin
ilustra el hecho de que el filtro 3 del
fabricante 2 presenta una desviacin tpica
mayor.

Sealar que el tamao muestral (tres datos


por grupo) es excepcionalmente pequeo.
El grfico muestra como el filtro 1 del fabricante 1 proporciona resultados sustancialmente ms
elevados que los otros dos filtros de este fabricante y al nivel promedio de los filtros del fabricante 2.

En consonancia con los comentarios expuestos, el contraste de Levene rechaza la hiptesis nula de
homocedasticidad [p valor = 0, 01 < 0, 05] , es decir, se rechaza la hiptesis de igualdad de varianzas.

En Pruebas de los efectos intersujetos est el cuadro ANOVA:


El nico coeficiente que podra ser eliminado del modelo por no ser significativamente distinto de 0 es
el 2(1) por tener un p valor = 0,726 .
En otros trminos, los porcentajes de penetracin medios con los filtros 2 y 3 del primer fabricante no
difieren significativamente.
Modelo matemtico asociado: Yijk = + i + j(i) + (ij)k

Y = 1,757 0,860 . Z1 1, 057 . Z 2 + [ 1,627 + 0,983 . Z1 + 0, 047 . Z 2 ] . X1 +

siendo,

X1 Variable que toma el valor 1 cuando el porcentaje de penetracin se mide en un filtro del primer
fabricante y 0 en otro caso.
Zj Variable que toma el valor 1 si se trata del jsimo filtro y 0 en otro caso.
DISEO JERARQUICO FACTORIAL: MODELO JERRQUICO Y FACTORES CRUZADOS

Factor B
Nivel 1 Nivel 2
Factor C 1 2 3 Yi1 1 2 3 Yi2 Yi
Factor A

Y1121 Y1131 Y1211 Y1221 Y12 31


Y1111

Y113
Y1122 Y1132 Y1212 Y1222 Y1232
Y111

Y112

Y121

Y122

Y123
Y213
Y211

Y212

Y221

Y222

Y223
Y311

Y323
Y1112
1
#
Y111 l

Y2111
Y2112
2 #
Y211 l

Y3111
Y3112

Y322
Y312

Y313

Y321
3 #
Y311 l

Y j k
Y j

El modelo estadstico asociado: Yi j k l = + i + j + k ( j ) + ( )i j + ( )i k ( j ) + (i j k ) r

Media global

i Efecto del nivel isimo del Factor A (i = 1, 2, ", I)

j Efecto producido por el nivel jsimo del Factor B (j = 1, 2, ", J)

( )i j Efecto producido por la interaccin (A x B)

k ( j ) Efecto producido por el nivel ksimo del Factor C dentro del nivel jsimo del Factor B,
donde (k = 1, 2, ", K)

( )i k ( j ) Efecto producido por la interaccin del Factor (A x C) dentro del Factor B

r Nmero de rplicas, (r = 1, 2, ", R)


(i j k ) Error experimental, se supone que las variables aleatorias independientes siguen N(0, )
r
Si el Factor C est anidado en B 6 No existen interacciones (B x C) ni (A x B x C)

Si el A est cruzado con los factores B y C 6 Puede existir interaccin entre (A x B) y (A x C)

La ecuacin bsica del Anlisis de la Varianza:

SCT = SCA + SCB + SC (A x B) + SC [C (B)] + SC [A x C (B)] + SCR


I J K R 2
2
Y
Y
SCInter sec cin =
i=1 j=1 k =1 r =1 N
2
I J K R Y
SCT corregida = Y = SCT SCInter sec cin
2
ij k
N
r
i=1 j=1 k =1 r =1

I J

2 Y
i
Y
2 2
2
j
Y
SCA = Yi=1
j=1
SCB =
JKL N IKR N

I J

Y
2
ij 2
i=1 j=1 Y
SC(A x B) = SCA
SCB KR N
I J K

Y
2 2 2
ij k J K Y I J Y J Y2j
jk ij
SC [(A x C) (B)] =
i=1 j=1 k =1 +

R
j=1 k =1 IR KR IKR
i=1 j=1 j=1

SCR = SCT SCA SCB SC (A x B) SC [C (B)] SC [A x C (B)]

TABLA ANOVA: DISEO JERRQUICO FACTORIAL


Factor Variacin

Factor A

Factor B

C en B

AxB

(A x C) en B

Error

Total corregida
Ejemplo 8. Para mejorar la rapidez de ensamblaje en una lnea de produccin se estudia la
interseccin manual de componentes electrnicos en circuitos impresos.
Se disean tres aparatos para ensamblar y dos distribuciones del lugar de trabajo, seleccionando a
cuatro operadores en cada lnea de distribucin en dos localidades diferentes. Se obtienen dos
rplicas de cada combinacin de tratamientos de este diseo.
Los tiempos de ensamblaje se muestran en la siguiente tabla:

Aparato / Operadores

Solucin: [ I=3, J = 2, K = 4 , R = 2 , N = I. J.K.R ]

Factor A: Aparatos Factor B: Lnea Distribucin Factor C: Operadores R: rplicas

Factor B
Distribucin 1 Distribucin 2
Factor C 1 2 3 4 Yi1 1 2 3 4 Yi2 Yi
Factor A
22 23 28 25 Y11 26 27 28 24 Y12 Y1
1 24 24 29 23 198 28 25 25 23 206 404
30 29 Y21
2 30 27 29 30 24 28 Y22 Y2
27 28
32 25 228 28 27 23 30
25 24 219 447
3 27 26 Y31 27 26 24 28 Y32 Y3
21 22
25 23 193 25 24 27 27
208 401
Y j k 149 150 171 149 163 159 151 160 633 1252
619
Y j 619 633
2
3 2 4 2 Y 12522
SCT = Yi j 2k r = 32956 SCInter sec cin = = = 32656,33
i=1 j=1 k =1 r =1 N 48
2
3 2 4 2 Y
SCT corregida = Y2i j k = SCT SCInter sec cin = 32956 32656,33 = 299,67
N
r
i=1 j=1 k =1 r =1

3 2
Y
Yi
2
2
1 1252

404 + 447 +
2 2
SCA = i=1
= = 32739,13 32656,33 = 82,80
4012
JKR N 16 48
2

Y
2
2 2
j Y 1 1252

619 + 633
j=1 2 2
SCB = = = 32660, 41 32656,33 = 4, 08

IKR N 24 48
3 2

Y ij Y
22
1 1252
2


198 + 228 + 193 + 206 + 219 + 208
i=1 j=1 2 2 2 2 2 2
SC(A x B) = SCA SCB = =
KR N 8 48
= 32762,25 32656,33 82,80 4, 08 = 19, 04
3 2

Y 2
Y 2j 1
2
( 619 + 633 )
2

i=1 j=1
jk
= 149 + 150 + 171 + 149 + 163 + 159 + 151 +
2 2 2 2 2 2 2 =
SC C (B) = 2
160
IR IKR 6 24
= 32732,33 32660, 42 = 71,91

Factor B
Distribucin 1 Distribucin 2
Factor C 1 2 3 4 Yi1 1 2 3 4 Yi2 Yi
Factor A

46 47 57 48 Y11 54 52 53 47 Y12 Y1
1
111
112 113 114
198 121 122 123 124
206 404
57 57 62 52 Y21 57 57 47 58 Y22 Y2
2
211
212 213 214 221 222 223 224
228 219 447
46 46 52 49 Y31 52 50 51 55 Y32 Y3
3
311
312 313 314 321 322 323 324
193 208 401
Y j k 149 150 171 149 163 159 151 160 633 1252
619
Y j 619 633

3 2 4 2 4 3 2 j
Yi j k Y j k
2
Y2
i j Y
2
j
2

SC [ A x C (B)] =
i=1 j=1k =1 j=1k =1 i=1 j=1 =1
+ J =
R IR KR IKR
46 + 47 + 57 + " + 51 + 55
2 2 2 2 2

= 32732,33 32762, 5 + 32660, 42 = 65,84


2

SCR = SCT SCA SCB SC (A x B) SC [C (B)] SC [A x C (B)] =


= 299,67 82,80 4,08 19,04 71,91 65,84 = 56

De la igualdad anterior, resulta:

0 , 27 6 0 ,0 1 4 0 ,0 6 4 0 ,2 4 0 0 , 22 0 0 ,1 8 7
82,80 4,08 19,04 71,91 65,84 56
1= + + + + +
29 9,6 7 29 9, 67 2 9 9,6 7 29 9, 67 29 9,6 7
2 99 ,6 7
Coeficiente Determinacin 0,813 Variacin no
Explicada
TABLA ANOVA: DISEO JERRQUICO FACTORIAL
Factor Variacin
Factor A

Factor B

C en B
AxB

(A x C) en B
Error
Total corregida
SCA 82, 80 SCB 4 , 08 SC C (B) 71, 91
MCA = = = 41, 40 MCB = = = 4, 08 MC C (B) = = =
11,99
I1 2 (J I) 1 J (K 1) 6

SC [ A B] 19, 04 SC [ A C 65, 84
MC [ A B ] = = = 9, MC [ A C (B)] = = = 5, 49
(B)]
52
(I 1)(J 1) J(I 1)(K 1) 12
2
SCR 56
MCR = = = 2,33 SCT 299, 67
IJK (R I) MCT = (N 1)= 47 = 6,38
24
MCA 41, 40 MC B 4 ,08 = 0,34
F = = = 7, 54 F = =
MC [ A C (B)]
A B
5, 49 MC C (B) 11,99

MC [ A B] 9,52 MC [ A C 5, 49
(B)]
FAxB = = = 1,73 FAC (B) = MCR = = 2,36
MC[ A C(B)
] 5, 2,33
49
Entrada de datos en SPSS: Analizar > Modelo lineal general > Univariante

99
Pulsando Aceptar en el Visor de Resultados:

Para obtener la informacin deseada es necesario cambiar la ltima fila [/DESIGN =] por:

/DESIGN = Distribucin Operadores (Distribucin) Aparatos Aparatos Distribucin (Aparatos)


Distribucin Operadores* Aparatos (Distribucin).

En este lnea, se informa a SPSS:

El Factor C (Operarios) est anidado en B ejecutando, adems de crearse la fuente de variacin


originaria : Factor B (Distribucin).

/DESIGN = D is tri bu ci n Op e ra do re s ( Di str ibu ci n).


C(B)

100
100
El Factor C (Operarios) est anidado en B y se declara el Factor A (aparatos):

/DESIGN = D is tri bu ci n Op e ra do re s ( Di str ibu ci n) A pa ra t os.


C(B) A

El Factor C est anidado en B, se declara el Factor A (aparatos), y la interseccin de los Factores A


(Aparatos) y B (Distribucin):

/DESIGN = D is tri bu ci n Op e ra do re s ( Di str ibu ci n) A pa ra t os A p ara to s


D is t rib uc i n ( Ap ar at o s).
C(B) A AxB
101
El Factor C est anidado en B, se declara el Factor A (aparatos), la interseccin de los Factores A
(Aparatos) y B (Distribucin), y los Factores A (aparatos) y C (Operarios) estn anidados en el
Factor B (Distribucin):

/DESIGN = D is tri bu ci n Op e ra do re s ( Di str ibu ci n) A pa ra t os A p ara to s


D is t rib u ci n ( Ap ar at o s)
C(B) A A xB
D is tri bu ci n Op er ad or e s* Ap ar ato s
(D ist rib uc i n).
A x C(B)

Para obtener las estimaciones de los parmetros y, en consecuencia, el modelo estadstico


asociado:

Analizar > Modelo lineal general > Univariante > Opciones

102
102
103
103

Você também pode gostar