Você está na página 1de 38

Captulo 5

Diseos en bloques aleatorizados


5.1. Introduccin
En las situaciones que hemos estudiado en el Captulo 1 hemos supuesto que existe
bastante homogneidad entre las unidades experimentales, as, por ejemplo, en el caso de la
industria algodonera, hemos supuesto que las parcelas de terreno son de la misma calidad
e igual supercie. Pero, puede suceder que dichas parcelas sean distintas y contribuyan a
la variablidad observada en el rendimiento de la semilla de algodn. Si en esta situacin
se utiliza un diseo completamente aleatorizado, las diferencias entre los rendimientos de
dos unidades experimentales sometidas a distintos tratamientos no sabremos si se deben
a una diferencia real entre los efectos de los tratamientos o a la heterogeneidad de dichas
unidades. Como resultado el error experimental reejar esta variabilidad entre las parcelas
de terreno.
En todo diseo de experimento se desea que el error experimental sea lo ms pequeo
posible. Por lo tanto, en la situacin descrita se debe sustraer del error experimental la
variabilidad producida por las parcelas de terreno. Para ello, el experimentador puede:
Considerar parcelas de terreno muy homogneas.
O bien, formar bloques de terreno de manera que el terreno de cada bloque sea lo
ms homogneo posible y los bloques entre s sean heterogneos.
En esta ltima situacin, cada bloque se divide en I parcelas de terreno, tantas como
tratamientos y cada tratamiento se prueba en cada uno de los bloques. Los I tratamientos,
en este caso las I variedades del fertilizante, se asignan al azar a cada una de las I parcelas
del bloque; esto se hace con asignacin aleatoria independientemente en cada bloque. Este
1
2 Diseos en bloques aleatorizados
diseo se conoce como diseo en bloques
1
completos aleatorizados. La palabra completo
indica que todos los tratamientos se prueban en cada bloque.
Puede suceder, cuando se realizan diseos en bloques aleatorizados, que no puedan
realizarse los ensayos de todos los tratamientos dentro de cada bloque, debido, por ejemplo,
a la escasez de recursos del experimento o al tamao fsico de los bloques. Es decir, no
se puede aplicar cada fertilizante en cada bloque. En estos casos, es posible usar diseos
aleatorizados por bloques en los que no todos los tratamientos se encuentran representados
en cada bloque, y aquellos que s estn representados en uno en particular se ensayan en
l una sola vez. Estos diseos se conocen como diseos por bloques incompletos.
Recordemos que en el diseo completamente aleatorizado asignbamos los tratamien-
tos al azar a las parcelas sin restriccin alguna, mientras que en el diseo en bloques
aleatorizados primero agrupamos las parcelas en bloques y a continuacin asignamos los
tratamientos a las parcelas en cada bloque. Podemos decir, por tanto, que un diseo en
bloque aleatorizados es un diseo con aleatorizacin restringida en el cual las unidades
experimentales son primero clasicadas en grupos homogneos, llamados bloques, y los
tratamientos son entonces asignados aleatoriamente dentro de los bloques.
Esta estrategia de diseo mejora efectivamente la precisin en las comparaciones al
reducir la variabilidad residual. Dicho diseo es quizs el diseo experimental ms ampli-
amente utilizado. En la prctica, las situaciones en las que este diseo se aplica son muy
numerosas y pueden identicarse fcilmente.
Estudiaremos en primer lugar el diseo en bloques completos aleatorizados, y en la
seccin ?? el diseo en bloques incompletos.
5.2. Diseo en bloques completos aleatorizados
Para desarrollar esta seccin consideramos el siguiente ejemplo al que seguiremos
haciendo referencia en las sucesivas secciones.
Ejemplo 5.1
Una industria algodonera, interesada en maximizar el rendimiento de la semilla de al-
godn, quiere comprobar si dicho rendimiento depende del tipo de fertilizante utilizado para
tratar la planta. A su disposicin tiene 5 tipos de fertilizantes. Como puede haber diferencia
entre las parcelas, el experimentador decide efectuar un diseo en bloques aleatorizados.
Para ello, divide el terreno en 4 bloques
2
y cada bloque en 5 parcelas, fumigando dentro
1
El trmino bloques aleatorios procede de la experimentacin agrcola, en la que pueden usarse parcelas
de terreno como unidades experimentales. Un bloque consiste en varias parcelas adyacentes, y se supone
que las parcelas adyacentes son ms semejantes que las alejadas entre s.
2
El terreno, en cada bloque, debe ser lo ms homogneo posible.
5.2 Diseo en bloques completos aleatorizados 3
de cada bloque cada una de las parcelas con un fertilizante. Al recoger la cosecha se mide
el rendimiento de la semilla, obtenindose las siguientes observaciones.
Tabla 4-1. Rendimiento de la
semilla de algodn
Bloques
Fertilizantes A B C D
1 87 86 88 83
2 85 87 95 85
3 90 92 95 90
4 89 97 98 88
5 99 96 91 90
Especicamente, en este experimento, se han considerado 5 tipos de fertilizantes que
se han aplicado aleatoriamente a las parcelas dentro de cada bloque. La variable de inters
o variable respuesta es el rendimiento de la semilla en peso por unidad de supercie. En
este ejemplo hemos supuesto que el tipo de terreno inuye en el rendimiento de la semilla
de algodn y decidimos controlar estadsticamente sus efectos, mediante la formacin de
bloques. Es decir, nuestro propsito es eliminar en el estudio de los efectos del fertilizante la
variabilidad debida al terreno e intentar que de esta forma sean ms patentes las diferencias
entre los fertilizantes, si las hay.
5.2.1. Planteamiento del modelo
Todo el planteamiento anterior se puede formalizar de manera general. Supongamos
I tratamientos, (I fertilizantes), y supongamos tambin que hay otra variable que pueda
inuir en la variable respuesta, (por ejemplo el tipo de terreno) y cuyos efectos deseamos
controlar estadsticamente. Para ello, seleccionamos J niveles de esta variable, J bloques,
y aplicamos cada uno de los I niveles del tratamiento en cada bloque. La gura 4-1 muestra
este tipo de diseo.
Bloque 1
y
11
.
.
.
y
i1
.
.
.
y
I1

.
.
.
.
.
.

Bloque j
y
1j
.
.
.
y
ij
.
.
.
y
Ij

.
.
.
.
.
.

Bloque J
y
1J
.
.
.
y
iJ
.
.
.
y
IJ
Figura 4-1. Diseo en bloques completos aleatorizados.
4 Diseos en bloques aleatorizados
Supondremos que se realiza una observacin por tratamiento en cada bloque, por
tanto, hay un total de N = IJ observaciones y que la asignacin de los tratamientos a las
unidades experimentales en cada bloque se determina aleatoriamente. Tambin se supone
que tanto los tratamientos como los bloques son factores de efectos jos y que no hay
interaccin entre ellos. Se dice que no hay interaccin entre dos factores cuando el efecto
de un factor no depende del nivel del otro factor; en este caso se dice que los efectos de
los factores son aditivos.
Las observaciones se pueden disponer en forma de tabla de doble entrada como la
siguiente
Tabla 4-2. Diseo en bloques aleatorizado
Bloques
Tratamientos 1 2 j J
1 y
11
y
12
y
1j
y
1J
2 y
21
y
22
y
2j
y
2J
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
i y
i1
y
i2
y
ij
y
iJ
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
I y
I1
y
I2
y
Ij
y
IJ
Generalmente no vamos a utilizar el trmino completo cuando en el contexto est claro
que todos los tratamientos estn incluidos en cada bloque.
Utilizamos la siguiente notacin:
N = IJ es el nmero total de observaciones.
y
i.
es el total de las observaciones bajo el i-simo tratamiento, es decir
y
i.
=
J

j=1
y
ij
i = 1, 2, , I (5.1)
y
.j
es el total de las observaciones bajo el j-simo bloque, es decir
y
.j
=
I

i=1
y
ij
j = 1, 2, , J (5.2)
5.2 Diseo en bloques completos aleatorizados 5
y
..
es la suma de todas las observaciones, denominado el total general, es decir
y
..
=
I

i=1
J

j=1
y
ij
=
I

i=1
y
i.
=
J

j=1
y
.j
(5.3)
y
i.
es la media de las observaciones del tratamiento i-simo, es decir
y
i.
=
y
i.
J
y
.j
es la media de las observaciones del bloque j-simo, es decir
y
.j
=
y
.j
I
y
..
es la media general de las observaciones, es decir
y
..
=
y
..
N
=
1
N
I

i=1
J

j=1
y
ij
,
que tambin se puede expresar como media de las medias parciales, es decir
y
..
=
1
I
I

i=1
y
i.
=
1
J
J

j=1
y
.j
.
El modelo estadstico para este diseo es:
y
ij
= +
i
+
j
+u
ij
i = 1, 2, , I ; j = 1, 2, , J , (5.4)
donde
y
ij
es la variable aleatoria que representa la observacin (i)-sima del bloque (j)-
simo.
es un efecto constante que mide el nivel promedio de respuesta para todas las
unidades, denominado media global.

i
es el efecto producido por el nivel i-simo del factor principal. Se supone que

i
= 0.

j
es el efecto producido por el nivel j-simo del factor secundario o factor de bloque.
Se supone que

j

j
= 0.
6 Diseos en bloques aleatorizados
u
ij
son variables aleatorias independientes con distribucin N(0, ), que engloban el
efecto de todas las restantes fuentes de variabilidad; al igual que en el modelo com-
pletamente aleatorizado, reciben el nombre de perturbaciones o error experimental.
En este modelo intervienen dos factores, el factor tratamiento y el factor bloque. Al
primero es usual llamarlo factor principal mientras que al segundo factor secundario,
puesto que nuestro inters fundamentalmente est centrado en el primero y el factor bloque
se introduce en el modelo para eliminar su inuencia en la variable respuesta.
Nuestro objetivo es estimar los efectos de los tratamientos y de los bloques y contrastar
la hiptesis de que todos los niveles del factor principal producen el mismo efecto, frente
a la alternativa de que al menos dos dieren signicativamente. Tambin es de inters
contrastar la igualdad de los efectos de los bloques.
La expresin y condiciones de este modelo se resumen en:
1
o
) y
ij
= +
i
+
j
+u
ij
2
o
) u
ij
N(0, ) i, j
3
o
) u
ij
son independientes entre s
4
o
)
I

i=1

i
= 0 ,
J

j=1

j
= 0 .
(5.5)
Las hiptesis establecidas para la variable de perturbacin pueden ser formuladas tam-
bin en trminos de la variable respuesta. Es decir, las observaciones y
ij
son variables
aleatorias independientes con distribucin normal, con media
E[y
ij
] = +
i
+
j
, (5.6)
y varianza constante

2
[y
ij
] =
2
i, j . (5.7)
En este planteamiento, el contraste de hiptesis ms importante es
H
0
:
i
= 0 i
H
1
:
i
= 0 por lo menos para algn i .
(5.8)
A continuacin, vamos a estudiar la estimacin de los parmetros del modelo ,
i
,
j
y
2
.
5.2 Diseo en bloques completos aleatorizados 7
5.2.2. Estimacin de los parmetros del modelo
Estimacin por mxima verosimilitud
Al igual que en modelo completamente aleatorizado se construye la funcin de
verosimilitud asociada a la muestra y = (y
11
, , y
1J
, , y
I1
, , y
IJ
):
L(,
i
,
j
,
2
) = (2
2
)

N
2
exp
_
_

1
2
2
I

i=1
J

j=1
_
y
ij

i

j

2
_
_
, (5.9)
se determina el logaritmo de dicha funcin
ln(L(,
i
,
j
,
2
)) =
N
2
ln(2)
N
2
ln(
2
)
1
2
2
I

i=1
J

j=1
_
y
ij

i

j

2
, (5.10)
y se hallan las primeras derivadas parciales respecto de los parmetros del modelo
lnL

=
1

2
I

i=1
J

j=1
_
y
ij

i

j

lnL

i
=
1

2
J

j=1
_
y
ij

i

j

i = 1, , I
lnL

j
=
1

2
I

i=1
_
y
ij

i

j

j = 1, , J
lnL

2
=
N
2
2
+
1
2(
2
)
2
I

i=1
J

j=1
_
y
ij

i

j

2
.
(5.11)
Igualando a cero estas derivadas parciales, se obtiene un sistema de ecuaciones que
proporciona los estimadores mximo verosmiles. Dichos estimadores vienen dados por las
expresiones
=
I

i=1
J

j=1
y
ij
N
= y
..
, (5.12)
8 Diseos en bloques aleatorizados

i
=
1
J
J

j=1
y
ij
= y
i.
y
..
, (5.13)

j
=
1
I
I

i=1
y
ij
= y
.j
y
..
. (5.14)
Por tanto, la media general se estima utilizando el promedio de todas las observaciones
y cualquiera de los efectos de los factores se estiman usando la diferencia entre el promedio
correspondiente al nivel del factor y el promedio total.
Se puede comprobar fcilmente que

i
= 0
y

j

j
= 0
siendo, por tanto, I 1 y J 1 los grados de libertad asociados a los tratamientos y a los
bloques, respectivamente.
Finalmente, sustituyendo ,
i
y

j
en la ltima ecuacin de (5.11) igualada a cero,
obtenemos el estimador de mxima verosimilitud para la varianza

2
=
1
N
I

i=1
J

j=1
_
y
ij

i

j
_
2
. (5.15)
Residuos
Los residuos se denen como las diferencias entre los valores observados y
ij
y los
valores estimados por el modelo y
ij
y los denotamos por e
ij
,
e
ij
= y
ij
y
ij
= y
ij

i

j
= y
ij
y
i.
y
.j
+ y
..
. (5.16)
Por lo tanto, el estimador mximo-verosimil,
2
, se puede escribir como

2
=
I

i=1
J

j=1
e
2
ij
N
5.2 Diseo en bloques completos aleatorizados 9
Se verica que la suma de los residuos por las y por columnas es cero, en efecto

j
e
ij
=

j
(y
ij

i

j
) = J y
i.
J y
..
J
i

j
=
J y
i.
J y
..
J( y
i.
y
..
) = 0 i = 1, , I

i
e
ij
=

i
(y
ij

i

j
) = I y
.j
I y
..

i
I

j
=
I y
.j
I y
..
I( y
.j
y
..
) = 0 j = 1, , J
por lo tanto hay (I 1)(J 1) residuos independientes, ya que
IJ (I +J 1) = (I 1)(J 1) .
Propiedades de los estimadores mximo verosmiles
A continuacin vamos a ver algunas propiedades que verican los estimadores del
modelo. Concretamente, vamos a determinar su esperanza, su varianza y su distribucin
en el muestreo.
1) Propiedades de
a) es un estimador centrado de , puesto que
E[ ] = E[ y
..
] =
1
N
I

i=1
J

j=1
E[y
ij
] =
1
N
I

i=1
J

j=1
( +
i
+
j
) =
1
N
_
_
N +J
I

i=1

i
+I
J

j=1

j
_
_
=
1
N
N =
b) La varianza de es
2
/N, puesto que al ser independientes las observaciones
se verica:
Var[ ] = Var
_
_
I

i=1
J

j=1
y
ij
N
_
_
=
I

i=1
J

j=1
Var
_
y
ij
N
_
=

i,j
Var [y
ij
]
N
2
=

i,j

2
N
2
=
1
N
2
N
2
=

2
N
10 Diseos en bloques aleatorizados
c) se distribuye segn una Normal, puesto que dicho estimador es combinacin
lineal de variables aleatorias independientes con distribucin Normal.
2) Propiedades de
i
a)
i
es un estimador centrado de
i
, puesto que
E[
i
] = E[ y
i.
] E[ y
..
] = +
i
=
i
.
En efecto
E[ y
i.
] = E
_
_
1
J
J

j=1
y
ij
_
_
=
1
J
E
_
_
J

j=1
_
+
i
+
j
+u
ij
_
_
_
=
1
J
_
_
J +J
i
+
J

j=1

j
+
J

j=1
E[u
ij
]
_
_
= +
i
b) La varianza de
i
es (I 1)

2
N
, puesto que
Var[
i
] = Var [ y
i.
y
..
] = Var
_
_
1
J

j
y
ij

1
N

i,j
y
ij
_
_
=
1
J
2

j
Var(y
ij
) +
1
N
2

i,j
Var(y
ij
)
2
NJ
Cov
_
_

j
y
ij
,

i,j
y
ij
_
_
=
1
J
2

2
+
1
N
2

i,j

2
NJ
J
2
=
1
J

2
+
1
N

2
2
N
=

2
J


2
N
= (I 1)

2
N
(5.17)
c)
i
se distribuye segn una Normal, puesto que dicho estimador est expresado
como funcin lineal de variables aleatorias con distribucin Normal.
3) Propiedades de

j
5.2 Diseo en bloques completos aleatorizados 11
a)

j
es un estimador centrado de
j
, puesto que
E
[

j
] =
E
[ y
.j
]
E
[ y
..
] = +
j
=
j
.
En efecto
E[ y
.j
] = E
_
1
I

i
y
ij
_
=
1
I
E
_

i
_
+
i
+
j
+u
ij
_
_
=
1
I
_
I +

i
+I
j
+

i
E[u
ij
]
_
= +
j
b) La varianza de

j
es (J 1)

2
N
c)

j
se distribuye segn una Normal.
4) Propiedades de
2

2
no es un estimador insesgado de
2
puesto que se verica
N
2

2
=
1

2
I

i=1
J

j=1
(e
ij
)
2

2
(I1)(J1)
,
donde los grados de libertad de la distribucin
2
corresponden al nmero de residuos
independientes, por tanto
E
_
N
2

2
_
= (I 1)(J 1) E[
2
] =
(I 1)(J 1)
N

2
,
luego
2
no es un estimador insesgado de
2
. Ahora bien, a partir de este resultado
se construye fcilmente un estimador centrado simplemente considerando

2
=
N
(I 1)(J 1)

2
.
Dicho estimador recibe el nombre de varianza residual, se denota por

S
2
R
y se expresa,
por tanto, de la siguiente forma

2
=

S
2
R
=
I

i=1
J

j=1
[y
ij
y
ij
]
2
(I 1)(J 1)
=
I

i=1
J

j=1
e
2
ij
(I 1)(J 1)
. (5.18)
12 Diseos en bloques aleatorizados
Vamos a demostrar que efectivamente
1

2
I

i=1
J

j=1
(e
ij
)
2

2
(I1)(J1)
.
Para ello, denamos los siguientes vectores, formado cada uno de ellos por N com-
ponentes:
Y = (y
11
, , y
1J
, y
21
, , y
2J
, , y
I1
, , y
IJ
)

= (, . ., , , . ., , . ., , . ., )

= (
1
, . .,
1
,
2
, . .,
2
, . .,
I
, . .,
I
)

= (
1
, . .,
J
,
1
, . .,
J
, . .,
1
, . .,
J
)

U = (u
11
, , u
1J
, u
21
, , u
2J
, , u
I1
, , u
IJ
)

.
De esta forma, el modelo en bloques aleatorizados se puede expresar como:
Y = + + +U (5.19)
Denotemos por , ,

y e , los vectores obtenidos al sustituir los parmetros por
sus estimadores y las perturbaciones u
ij
por los residuos e
ij
, respectivamente. Veri-
cndose, por tanto, la siguiente identidad
Y = + +

+e (5.20)
De (5.19) y (5.20) se obtiene
U = ( ) + ( ) + (

) +e (5.21)
dividiendo (5.21) por y llamando Z =
1

U, se tiene la siguiente descomposicin


del vector Z, de variables normales (0, 1), en componentes ortogonales.
Z =
1

( ) +
1

( ) +
1

) +
1

e (5.22)
En efecto, los siguientes productos escalares son nulos
)
( )

e = ( y
..
)

j
e
ij
= 0 (5.23)
5.2 Diseo en bloques completos aleatorizados 13
)
( )

e =

j
(
i

i
)e
ij
=

i
(
i

i
)

j
e
ij
= 0 (5.24)
)
(

e =

j
(

j

j
)e
ij
=

j
(

j

j
)

i
e
ij
= 0 (5.25)
De forma similar se comprueba que los restantes productos escalares son nulos. Por
lo tanto, los vectores en que se descompone Z son ortogonales y se verican las
condiciones del teorema de Cochran cuyo enunciado presentamos en el Captulo 1.
Por consiguiente, los cuadrados de los mdulos de los vectores de la descomposicin
(5.22) seguirn distribuciones
2
independientes cuyos grados de libertad sern la
dimensin del subespacio al que pertenezca cada vector. De esta forma,
a) Como ( ) pertenece a un subespacio de dimensin 1, al tener todas sus
coordenadas iguales:
N( y
..
)
2

2

2
1
b) Como ( ) pertenece a un subespacio de dimensin I 1, al tener I coorde-
nadas distintas y una ecuacin de restriccin:
1

( )

( ) =
J

i
(
i

i
)
2

2
I1
c) Como (

) pertenece a un subespacio de dimensin J 1, al tener J coor-


denadas distintas y una ecuacin de restriccin:
1

) =
I

j
(

j

j
)
2

2
J1
d) El vector e tiene IJ coordenadas, en principio distintas, pero sujetas, como
hemos visto, a las ecuaciones de restriccin

j
e
ij
= 0 ;

i
e
ij
= 0
es decir, la suma de los residuos por las y por columnas es cero, lo que implica
I +J 1 ecuaciones de restriccin e IJ (I +J 1) = (I 1)(J 1) residuos
independientes. Por lo tanto,
14 Diseos en bloques aleatorizados

j
e
2
ij

2

2
(I1)(J1)
.
En resumen,
N(,
2
/N)

i
N
_

i
, (I 1)
2
/N
_

j
N
_

j
, (J 1)
2
/N
_
N
2
/
2

2
(I1)(J1)
5.2.3. Descomposicin de la variabilidad
Como dijimos en el Captulo 1, para comparar globalmente los efectos de los
distintos niveles de un factor se emplea la tcnica estadstica denominada anlisis de
la varianza, que est basada en la descomposicin de la variabilidad total de los datos
en distintas componentes. En los diseos en bloques aleatorizados tambin se emplea esta
tcnica y para ello consideramos la siguiente identidad:
y
ij
= y
..
+ ( y
i.
y
..
) + ( y
.j
y
..
) + (y
ij
y
i.
y
.j
+ y
..
) , (5.26)
que expresa cada variable y
ij
observada como la suma de cuatro trminos:
- La media total y
..
, es decir el estimador de
- El efecto producido por el tratamiento i-simo, (desviacin de la media del i-simo
nivel del factor principal respecto de la media total), y
i.
y
..
, es decir el estimador
de
i
- El efecto producido por el bloque j-simo, (desviacin de la media del j-simo nivel
del factor bloque respecto de la media total), y
.j
y
..
, es decir el estimador de
j
- La diferencia entre los valores observados y
ij
y los valores previstos por el modelo
y
ij
, es decir el estimador de u
ij
.
5.2 Diseo en bloques completos aleatorizados 15
Por tanto, la expresin (5.26) tambin se puede poner en la forma
y
ij
= +
i
+

j
+e
ij
(5.27)
Considerando esta expresin para todas las observaciones y expresndola en forma
vectorial resultan los siguientes vectores, todos ellos de dimensin N:
Y: Contiene los N trminos independientes y
ij
. Tiene, por tanto, N grados de lib-
ertad.
: Contiene N coordenadas iguales a y
..
. Tiene, por tanto, un grado de libertad.
: Contiene I valores distintos y
i.
y
..
, cada uno repetido J veces. Tiene I 1 grados
de libertad, ya que

i

i
= 0.

: Contiene J valores distintos y


.j
y
..
, cada uno repetido I veces. Tiene J 1 grados
de libertad, ya que

j

j
= 0.
e: Contiene los N residuos estimados, que deben sumar cero por las y por columnas.
Tiene, por tanto, N (I +J 1) grados de libertad.
Por lo que, la ecuacin (5.26) aplicada a los N datos tomar la siguiente forma (mostra-
da anteriormente):
Y = + +

+e (5.28)
Esta descomposicin est formada por componentes ortogonales dos a dos siendo los
grados de libetad de Y la suma de los grados de libertad de los componentes. En efecto,
se comprueba directamente que

= y
..
I

i=1
J

j=1

i
= 0

= y
..
I

i=1
J

j=1

j
= 0

e = y
..
I

i=1
J

j=1
e
ij
= 0

=
I

i=1

i
J

j=1

j
= 0
16 Diseos en bloques aleatorizados

e =
I

i=1

i
J

j=1
e
ij
= 0

e =
J

j=1

j
I

i=1
e
ij
= 0
y
N = 1 + (I 1) + (J 1) + (I 1)(J 1)
La ecuacin (5.26) tambin se puede expresar
y
ij
y
..
= ( y
i.
y
..
) + ( y
.j
y
..
) + (y
ij
y
i.
y
.j
+ y
..
) , (5.29)
elevando los dos miembros al cuadrado y sumando para todas las observaciones tenemos
I

i=1
J

j=1
(y
ij
y
..
)
2
=
I

i=1
J

j=1
[( y
i.
y
..
) + ( y
.j
y
..
) + (y
ij
y
i.
y
.j
+ y
..
)]
2
=
J
I

i=1
( y
i.
y
..
)
2
+I
J

j=1
( y
.j
y
..
)
2
+
I

i=1
J

j=1
(y
ij
y
i.
y
.j
+ y
..
)
2
+
2
I

i=1
J

j=1
( y
i.
y
..
)( y
.j
y
..
)+
2
I

i=1
J

j=1
( y
.j
y
..
)(y
ij
y
i.
y
.j
+ y
..
)+
2
I

i=1
J

j=1
( y
i.
y
..
)(y
ij
y
i.
y
.j
+ y
..
)
(5.30)
donde los dobles productos se anulan (ya que los trminos son ortogonales, como acabamos
de comprobar), por lo que dicha ecuacin queda en la forma
5.2 Diseo en bloques completos aleatorizados 17
I

i=1
J

j=1
(y
ij
y
..
)
2
= J
I

i=1
( y
i.
y
..
)
2
+I
J

j=1
( y
.j
y
..
)
2
+
I

i=1
J

j=1
(y
ij
y
i.
y
.j
+ y
..
)
2
(5.31)
que representa la ecuacin bsica del anlisis de la varianza, que simblicamente podemos
escribir
SCT = SCTr +SCBl +SCR ,
donde hemos desglosado la variabilidad total de los datos
SCT =
I

i=1
J

j=1
(y
ij
y
..
)
2
,
denominada suma total de cuadrados, en tres componentes:
1) SCTr = J

I
i=1
( y
i.
y
..
)
2
, la suma de cuadrados de las diferencias entre las medias
de los tratamientos y la media general, que expresa la variabilidad explicada por los
tratamientos, denominada suma de cuadrados entre tratamientos.
2) SCBl = I

J
j=1
( y
.j
y
..
)
2
, la suma de cuadrados de las diferencias entre las medias
de los bloques y la media general, que expresa la variabilidad explicada por los
bloques, denominada suma de cuadrados entre bloques.
3) SCR =

I
i=1

J
j=1
(y
ij
y
i.
y
.j
+ y
..
)
2
, la suma de cuadrados de los residuos, que
expresa la variabilidad no explicada por el modelo, denominada suma de cuadrados
del error.
A partir de la ecuacin bsica del ANOVA se pueden construir los cuadrados medios
denidos como:
Cuadrado medio total

S
2
T
=
I

i=1
J

j=1
(y
ij
y
..
)
2
N 1
(5.32)
18 Diseos en bloques aleatorizados
Cuadrado medio entre tratamientos

S
2
Tr
=
J
I

i=1
( y
i.
y
..
)
2
I 1
(5.33)
Cuadrado medio entre bloques

S
2
Bl
=
I
J

j=1
( y
.j
y
..
)
2
J 1
(5.34)
Cuadrado medio residual

S
2
R
=
I

i=1
J

j=1
(y
ij
y
i.
y
.j
+ y
..
)
2
(I 1)(J 1)
, (5.35)
donde los denominadores, corresponden a los grados de libertad de la distribucin en el
muestreo de los correspondientes numeradores.
Una notacin muy utilizada tambin en la prctica para los cuadrados medios anteri-
ores es, respectivamente, CMT, CMTr, CMBl y CMR o CME.
A continuacin vamos a calcular las esperanzas matemticas de estos cuadrados medios.
En primer lugar, recordemos la expresin del modelo (5.4)
y
ij
= +
i
+
j
+u
ij
.
Consideremos las expresiones de y
i.
, y
i.
, y
.j
, y
.j
, y
..
e y
..
, en funcin de los parmetros
del modelo, con objeto de poder hallar las esperanzas de las varianzas muestrales. Tambin
tengamos en cuenta que

i

i
= 0 y

j

j
= 0 . As tenemos:
5.2 Diseo en bloques completos aleatorizados 19
y
i.
= J +J
i
+
J

j=1

j
+u
i.
; y
i.
= +
i
+u
i.
y
.j
= I +
I

i=1

i
+I
j
+u
.j
; y
.j
= +
j
+u
.j
y
..
= N +J
I

i=1

i
+I
J

j=1

j
+u
..
; y
..
= +u
..
(5.36)
1
o
) El cuadrado medio entre grupos se puede expresar

S
2
Tr
=
J
I

i=1
( y
i.
y
..
)
2
I 1
=
J
I

i=1
[
i
+ (u
i.
u
..
)]
2
I 1
=
J
I

i=1

2
i
I 1
+
J
I

i=1
(u
i.
u
..
)
2
I 1
+
2J
J

j=1

i
(u
i.
u
..
)
I 1
y su esperanza matemtica ser la suma de las esperanzas matemticas de cada
sumando; es decir,
E
_

S
2
Tr
_
= E
_

_
J
I

i=1

2
i
I 1
_

_
+ E
_

_
J
I

i=1
(u
i.
u
..
)
2
I 1
_

_
+ E
_

_
2J
I

i=1

i
(u
i.
u
..
)
I 1
_

_
.
(5.37)
Ahora bien, puesto que:
a) El modelo es de efectos jos E[
i
] =
i
, entonces
20 Diseos en bloques aleatorizados
E
_

_
J
I

i=1

2
i
I 1
_

_
=
J
I 1

i
E
_

2
i

=
J
I 1

2
i
(5.38)
b) Como E [
i
E [
i
]]
2
es la Var (
i
), cuya expresin, determinada en la subsec-
cin 5.2.2, es (I 1)
2
/N, luego
E
_

_
J
I

i=1
(u
i.
u
..
)
2
I 1
_

_
=
J
I 1
I

i=1
E [u
i.
u
..
]
2
=
J
I 1
I

i=1
E [( y
i.
y
..
)
i
]
2
=
J
I 1
I

i=1
E [
i
E [
i
]]
2
=
J
I 1
I

i=1
Var (
i
) =
J
I 1
I

i=1
(I 1)

2
N
=
J
I 1
(I 1)I
2
N
=
2
(5.39)
c) Como E (u
i.
u
..
) = 0, entonces
E
_

_
2J
I

i=1

i
(u
i.
u
..
)
I 1
_

_
=
2
I 1
J
I

i=1

i
E [u
i.
u
..
] = 0 . (5.40)
Por lo tanto, sustituyendo las expresiones (5.38), (5.39) y (5.40) en (5.37) tenemos
que el valor esperado del cuadrado medio entre grupos es:
5.2 Diseo en bloques completos aleatorizados 21
E (

S
2
Tr
) =
J
I 1
I

i=1

2
i
+
2
(5.41)
2
o
) De la misma forma se comprueba que
E (

S
2
Bl
) =
I
J 1
J

j=1

2
j
+
2
(5.42)
3
o
) Ya hemos visto en la subseccin 5.2.2 que la varianza residual es un estimador ins-
esgado de la varianza poblacional, es decir
E (

S
2
R
) =
2
4
o
) Por ltimo, calculemos el valor esperado del cuadrado medio total. Para ello nos
basaremos en la ecuacin bsica del ANOVA que podemos poner en funcin de los
cuadrados medios de la siguiente forma:
(N 1)

S
2
T
= (I 1)

S
2
Tr
+ (J 1)

S
2
Bl
+ (I 1)(J 1)

S
2
R
,
tomando esperanzas matemticas en ambos miembros y aplicando la linealidad del
valor esperado, tenemos
(N 1)E
_

S
2
T
_
= (I 1)E
_

S
2
Tr
_
+ (J 1)E
_

S
2
Bl
_
+ (I 1)(J 1)E
_

S
2
R
_
,
de donde, sustituyendo los valores obtenidos anteriormente para E
_

S
2
Tr
_
, E
_

S
2
Bl
_
y
E
_

S
2
R
_
, obtenemos
E(

S
2
T
) =
J
I

i=1

2
i
N 1
+
I
J

j=1

2
j
N 1
+
2
. (5.43)
Observacin 5.1
Hemos visto que al aplicar el mtodo de mnimos cuadrados al modelo completamente
aleatorizado, se obtiene el sistema de ecuaciones normales (??). En el caso del modelo en
bloques completos aleatorizados, las ecuaciones normales para tratamientos no contienen
22 Diseos en bloques aleatorizados
informacin con respecto a los efectos de bloques, y recprocamente, las ecuaciones nor-
males para bloques no contienen informacin alguna sobre los efectos de los tratamientos,
(la informacin con respecto a los tratamientos no se encuentra mezclada con aquella
debida a los efectos de los bloques). Y as, un contraste entre efectos de tratamientos se
realiza comparando las medias de tratamientos e idnticamente, un contraste entre efectos
de bloques se realiza comparando las medias de los bloques. Cuando esto ocurre, se dice
que los efectos de bloques y tratamientos son ortogonales.
5.2.4. Anlisis estadstico
El contraste estadstico de ms inters en este modelo, como mencionamos anteri-
ormente, es el que tiene como hiptesis nula la igualdad de medias de los tratamientos:
H
0

1
=
2
= =
I
= 0 (5.44)
Tambin es interesante contrastar la igualdad de medias de los bloques:
H
0

1
=
2
= =
J
= 0 (5.45)
Como hemos comprobado anteriormente se verica que:
a)

S
2
R
= SCR/(I 1)(J I) es un estimador insesgado de la varianza
2
, independi-
entemente de que se veriquen las hiptesis nulas.
b) Si no hay diferencia entre las medias de los I tratamientos; es decir, si es cierta la
hiptesis de que todo
i
= 0, el primer sumando de E(

S
2
Tr
) es nulo, y entonces

S
2
Tr
es un estimador insesgado de
2
.
c) Si no hay diferencia entre las medias de los J bloques; es decir, si es cierta la hiptesis
de que todo
j
= 0, el primer sumando de E(

S
2
Bl
) es nulo, y entonces

S
2
Bl
es un
estimador insesgado de
2
.
Sin embargo, hay que notar que:
Si existe diferencia en las medias de los tratamientos, el valor esperado de

S
2
Tr
es
mayor que
2
.
Si existe diferencia en las medias de los bloques, el valor esperado de

S
2
Bl
es mayor
que
2
.
5.2 Diseo en bloques completos aleatorizados 23
De todo sto podemos deducir que:
1
o
) Un contraste para vericar la hiptesis nula de igualdad de medias de los tratamien-
tos puede efectuarse comparando

S
2
Tr
y

S
2
R
.
2
o
) Un contraste para vericar la hiptesis nula de igualdad de medias de los bloques
puede efectuarse comparando

S
2
Bl
y

S
2
R
.
Para ello, vamos a estudiar la distribucin de SCT, SCTr, SCBl y SCR en las hipte-
sis de que ni los tratamientos ni los bloques inuyen, es decir si las hiptesis (5.44) y (5.45)
son ciertas o equivalentemente, si las N observaciones provienen de la misma poblacin.
Tipicando las variables aleatorias y
ij
en la descomposicin (5.27) , se tiene
y
ij

+

i

+
e
ij

. (5.46)
Considerando esta descomposicin para totas las observaciones y expresndola en for-
ma vectorial, tenemos
Z = Z
1
+Z
2
+Z
3
+Z
4
(5.47)
siendo
Z =
1

(y
11
, . . . , y
1J
, y
21
, . . . , y
2J
, . . . , y
I1
, . . . , y
IJ
)

Z
1
=
1

( y
..
, . . . . ., y
..
, y
..
, . . . . ., y
..
, . . . . ., y
..
, . . . . ., y
..
)

Z
2
=
1

(
1
, . . . . .,
1
,
2,
. . . . .,
2
, . . . . .,
I
, . . . . .,
I
)

Z
3
=
1

1
, . . . . .,

J
,

1
, . . . . .,

J
, . . . . .,

1
, . . . . .,

J
)

Z
4
=
1

(e
11
, . . . , e
1J
, e
21
, . . . , e
2J
, . . . ., e
I1
, . . . , e
IJ
)

donde
Z: Contiene N trminos independientes
1

(y
ij
). Tiene, por tanto, N grados de
libertad.
Z
1
: Contiene N coordenadas iguales a
1

( y
..
). Tiene, por tanto, un grado de
libertad.
24 Diseos en bloques aleatorizados
Z
2
: Contiene I valores distintos
1

i
, cada uno repetido J veces y sujetos a una
ecuacin de restriccin,

i

i
= 0. Tiene, por tanto, I 1 grados de libertad.
Z
3
: Contiene J valores distintos
1

j
, cada uno repetido I veces y sujetos a una
ecuacin de restriccin,

j

j
= 0. Tiene, por tanto, J 1 grados de libertad.
Z
4
: Contiene N coordenadas
1

e
ij
, sujetas a I + J 1 ecuaciones de restriccin,

j
e
ij
= 0 para i = 1, . . . , I. y

i
e
ij
= 0 para j = 1, . . . , J. Tiene, por tanto,
(I 1)(J 1) grados de libertad.
Bajo las hiptesis nulas hemos realizado una descomposicin del vector Z, de variables
N(0, 1) independientes, en componentes ortogonales. Dicha descomposicin cumple las
condiciones del Teorema de Cochran, vericndose que:
i)
SCTr

2
=
J

i
(y
i.
y
..
)
2

2

2
I1
ii)
SCBl

2
=
I

j
(y
.j
y
..
)
2

2

2
J1
iii)
SCR

2
=

i,j
(y
ij
y
i.
y
.j
+ y
..
)
2

2

2
(I1)(J1)
y adems estas tres distribuciones son independientes entre s.
Hay que notar que:
Por una parte, se tiene que SCR/
2
se distribuye como una
2
con (I 1)(J 1)
grados de libertad, se verique o no la hiptesis nula, como ya vimos en la subseccin
5.2.2
Por otra parte, bajo las hiptesis (5.44) y (5.45), se tiene que SCTr/
2
y SCBl/
2
se distribuyen como una
2
con I 1 y J 1 grados de libertad, respectivamente.
5.2 Diseo en bloques completos aleatorizados 25
Por consiguiente, bajo las hiptesis de igualdad de efectos de los tratamientos y los
bloques, se verica
F

=
SCTr/
2
I 1
SCR/
2
(I 1)(J 1)
=

S
2
Tr

S
2
R
F
(I1),(I1)(J1)
(5.48)
y
F

=
SCBl/
2
J 1
SCR/
2
(I 1)(J 1)
=

S
2
Bl

S
2
R
F
(J1),(I1)(J1)
. (5.49)
Estos son los estadsticos de contraste para probar dichas hiptesis nulas. Por lo tanto:
Si la hiptesis de igualdad de efectos de los tratamientos es cierta, tanto el numerador
como el denominador del estadstico de contraste (5.48) son estimadores insesgados
de
2
, mientras que si dicha hiptesis no es cierta, la esperanza del numerador del
estadstico de contraste (5.48) es mayor que la esperanza del denominador, por lo
que rechazaremos H
0
cuando el valor experimental de dicho estadstico sea mayor
que el valor terico, F
(I1),(I1)(J1);
.
Siguiendo el mismo razonamiento anterior, se rechazar la hiptesis nula de igualdad
de efectos de los bloques cuando el valor del estadistico de contraste (5.49) sea mayor
que el valor terico, F
(J1),(I1)(J1);
.
Aunque hemos dicho que el contraste principal es el de la igualdad de medias de los
tratamientos, tambin es interesante la comparacin entre las medias de los bloques, ya
que la ecacia de este diseo depende de los efectos de los bloques. Un valor grande
del cociente (5.49), implica que el factor bloque tiene un efecto grande, es decir que los
bloques realmente inuyen mucho. En este caso, este diseo es ms ecaz que el diseo
completamente aleatorizado ya que si el cuadrado medio entre bloques,

S
2
Bl
, es grande, el
trmino residual ser mucho menor y el contraste principal (5.44) ser ms sensible a las
diferencias entre tratamientos.
Si los efectos de los bloques son muy pequeos, el anlisis por bloques quiz no sea
necesario y en caso extremo, cuando el cociente (5.49) es prximo a 1, puede llegar a
ser perjudicial, ya que el nmero de grados de libertad, (I 1)(J 1), del denominador
en la comparacin de tratamientos (5.48) es menor que el nmero de grados de libertad
correspondiente, IJ I = I(J 1), en el diseo completamente aleatorizado.
Para una mayor sencillez en el clculo se utilizan las expresiones abreviadas de SCT,
SCTr, SCBl y SCR, dadas a continuacin
26 Diseos en bloques aleatorizados
SCT =
I

i=1
J

j=1
y
2
ij

y
2
..
IJ
SCTr =
1
J
I

i=1
y
2
i.

y
2
..
IJ
SCBl =
1
I
J

j=1
y
2
.j

y
2
..
IJ
,
(5.50)
y la suma de cuadrados del error se obtiene por diferencia
SCR = SCT SCTr SCBl . (5.51)
El anlisis de la varianza utiliza la descomposicin (5.31), ecuacin bsica del anlisis
de la varianza, cuyos trminos se pueden disponer de la siguiente manera,
Tabla 4-3. Tabla ANOVA para el modelo de bloques aleatorizados
Fuentes de Suma de Grados de Cuadrados
variacin cuadrados libertad medios F
exp
Entre tratam. J
I

i=1
( y
i.
y
..
)
2
= SCTr I 1

S
2
Tr

S
2
Tr
/

S
2
R
Entre bloques I
J

j=1
( y
.j
y
..
)
2
= SCBl J 1

S
2
Bl

S
2
Bl
/

S
2
R
Residual SCT SCTr SCBl = (I 1)(J 1)

S
2
R
SCR
TOTAL
I

i=1
J

j=1
(y
ij
y
..
)
2
= SCT IJ 1

S
2
T
Alternativamente, utilizando las expresiones abreviadas de SCT, SCTr, SCBl y SCR,
dadas en (5.50), se construye la siguiente Tabla ANOVA.
5.2 Diseo en bloques completos aleatorizados 27
Tabla 4-4. Forma prctica de la tabla ANOVA para
el modelo de bloques aleatorizados
Fuentes de Suma de Grados de Cuadrados
variacin cuadrados libertad medios F
exp
Entre tratam.
1
J
I

i=1
y
2
i.

y
2
..
IJ
= SCTr I 1

S
2
Tr

S
2
Tr
/

S
2
R
Entre bloques
1
I
J

j=1
y
2
.j

y
2
..
IJ
= SCBl J 1

S
2
Bl

S
2
Bl
/

S
2
R
Residual SCT SCTr SCBl = (I 1)(J 1)

S
2
R
SCR
TOTAL
I

i=1
J

j=1
y
2
ij

y
2
..
IJ
IJ 1

S
2
T
Una de las ventajas del diseo en bloques aleatorizados es que se puede transformar
en un diseo unifactorial, simplemente suprimiendo el estudio por bloques y uniendo su
variabilidad a la residual.
Coecientes de determinacin
Al igual que en el modelo completamente aleatorizado, una medida apropiada
para comprobar la adecuacin del modelo a los datos es el coeciente de determinacin,
denotado por R
2
y denido como el cociente entre la suma de las variabilidades explicadas
por los tratamientos y los bloques, y la variabilidad total
R
2
=
SCTr +SCBl
SCT
.
Llamando
R
2

al cociente entre la variabilidad explicada por los tratamientos y la total, es decir


R
2

=
SCTr
SCT
,
28 Diseos en bloques aleatorizados
R
2

al cociente entre la variabilidad explicada por los bloques y la total, es decir


R
2

=
SCBl
SCT
,
el coeciente de determinacin tambin lo podemos expresar como
R
2
= R
2

+R
2

,
donde R
2

y R
2

reciben el nombre de coecientes de determinacin parciales asociados a los


tratamientos y a los bloques. Estas cantidades son adimensionales y se interpretan como
la proporcin de la variabilidad que es explicada por los tratamientos y por los bloques,
respectivamente.
A n de ilustrar el anlisis de la varianza de bloques aleatorizados vamos a considerar
el Ejemplo 4-1, en el que se desea comprobar si se aprecian diferencias signicativas, en
primer lugar, entre los fertilizantes y en segundo lugar, entre los bloques de terreno.
Para ello, construimos la Tabla 4-5, organizando los datos de la siguiente manera
Tabla 4-5. Datos del Ejemplo 4-1
bloques
Fertilizantes A B C D y
i.
y
2
i.
1 87 86 88 83 344 118336
2 85 87 95 85 352 123904
3 90 92 95 90 367 134689
4 89 97 98 88 372 138384
5 99 96 91 90 376 141376
y
.j
450 458 467 436 1811 656689
y
2
.j
202500 209764 218089 190096 820449

y
2
ij
40616 42054 43679 38058 164407
Las sumas de cuadrados necesarias para el anlisis de la varianza se calculan de la
5.2 Diseo en bloques completos aleatorizados 29
siguiente forma:
SCT =
5

i=1
4

j=1
y
2
ij

y
2
..
IJ
= 164407
(1811)
2
20
= 420,95
SCTr =
1
J
5

i=1
y
2
i.

y
2
..
IJ
=
656689
4

(1811)
2
20
= 186,20
SCBl =
1
I
4

j=1
y
2
.j

y
2
..
IJ
=
820449
5

(1811)
2
20
= 103,75
SCR = SCT SCTr SCBl = 131 .
El anlisis de la varianza resultante se presenta en la siguiente tabla.
Tabla 4-6. Anlisis de la varianza para los datos del Ejemplo 4-1
Fuentes de Suma de Grados de Cuadrados
variacin cuadrados libertad medios F
exp
Entre tratamientos 186.20 4 46.5500 4.264
Entre bloques 103.75 3 34.5833 3.168
Residual 131.00 12 10.9166
TOTAL 420.95 19
Realizando los contrastes al nivel de signicacin del 5 %, se tiene:
1
o
) Si comparamos el cociente F
(exp)
= 46,55/10,9166 = 4,264, con el valor de la F
terica (F
0,05,4,12
= 3,26), se concluye que se rechaza H
0
(igualdad de medias de
tratamientos); en otras palabras, concluimos que, a un nivel de signicacin del 5
%, el rendimiento de la semilla de algodn diere signicativamente dependiendo del
tipo de fertilizante utilizado.
2
o
) Si comparamos el cociente F
(exp)
= 34,5833/10,9166 = 3,168, con el valor de la F
terica (F
0,05,3,12
= 3,49), se concluye que no hay suciente evidencia para rechazar
H
0
(igualdad de medias de bloques); en otras palabras, concluimos que, a un nivel
de signicacin del 5 %, los bloques de terreno no son signicativamente distintos.
30 Diseos en bloques aleatorizados
Comprobamos, mediante los coecientes de determinacin parciales, cuyos valores son
R
2

=
SCTr
SCT
=
186,2
420,95
= 0,4423
R
2

=
SCTBl
SCT
=
103,75
420,95
= 0,2464 ,
que:
a) El factor tipo de fertilizante explica el 44.23 % de la variabilidad en el rendimiento
de la semilla de algodn.
b) El factor tipo de terreno explica el 24.64 % de la variabilidad en el rendimiento
de la semilla de algodn.
Es interesante ver los resultados que se hubiesen obtenido de no haberse realizado un
diseo en bloques aleatorizados. Para ello, supongamos que prescindimos del factor tipo
de terreno y realizamos un anlisis de la varianza de un factor, obtenindose la tabla
ANOVA siguiente
Tabla 4-7. Anlisis de la varianza para los datos del Ejemplo 4-1
Fuentes de Suma de Grados de Cuadrados
variacin cuadrados libertad medios F
exp
Entre tratamientos 186.20 4 46.55 2.974
Residual 234.75 15 15.65
TOTAL 420.95 19
Si efectuamos el contraste al 5 % y comparamos el valor de la F
exp
= 2,974, con el
valor de la F terica (F
0,05;4,15
= 3,05), se concluye que no se puede rechazar H
0
(igualdad
de medias de tratamientos); es decir, no hemos podido encontrar diferencias signicativas
entre los distintos tipos de fertilizantes aunque si se detectaron dichas diferencias al aplicar
el modelo en bloques aleatorizados.
Con este ejemplo se ilustra el hecho de que aunque los bloques no resulten signicativa-
mente diferentes, en algunas situaciones no es conveniente prescindir de ellos. Pero cmo
saber cuando se puede prescindir de los bloques? La respuesta la tenemos en el valor de
la F
(exp)
, experimentalmente se ha comprobado que si dicho valor es mayor que 3, no
conviene prescindir de los bloques para efectuar los contrastes.
5.3 Comparaciones mltiples 31
5.3. Comparaciones mltiples
Si el anlisis de la varianza conrma la existencia de diferencias signicativas entre
los tratamientos o entre los bloques, es conveniente investigar qu medias son distintas
realizando las comparaciones mltiples correspondientes a los tratamientos o a los bloques
o a ambos. Para ello se realizarn cualesquiera de los procedimientos de comparaciones
mltiples estudiados en el Captulo 2. Simplemente hay que recordar que, en el diseo
en bloques aleatorizados los grados de libertad del error son ((I 1)(J 1)) en lugar de
(N I) del diseo completamente aleatorizado y en el caso de comparaciones de medias
relativas a los tratamientos hay que reemplazar en las frmulas correspondientes el nmero
de repeticiones (n) del diseo completamente aleatorizado, por el nmero de bloques (J).
Como ilustracin vamos a realizar comparaciones entre las medias de los tratamientos
utilizando la prueba de rangos mltiples de Tukey con los datos del ejemplo de referencia.
En este ejemplo, los valores de los cinco promedios de los tratamientos son:
y
1.
= 86 ; y
2.
= 88 ; y
3.
= 91,75 ; y
4.
= 93 ; y
5.
= 94 .
As, por ejemplo, si realizamos la comparacin entre los tratamientos 1 y 2, el valor
crtico HSD correspondiente a un nivel de signicacin del 5 % se calcula como
HSD = q
,I,(I1)(J1)
_

S
2
R
J
= q
0,05,5,12
_
10,9166
4
= (4,51)(1,65) = 7,4415 .
Puesto que se verica:
| y
1.
y
2.
|= 2 < HSD ,
se concluye que las medias 1 y 2 no dieren signicativamente.
Adems de los procedimientos analticos de comparaciones mltiples tambin se puede
adaptar el mtodo grco visto en la subseccin ?? del Captulo 2 que nos muestra que
medias son signicativamente diferentes. Este procedimiento consiste en utilizar como
distribucin de referencia una distribucin t

ajustada por el factor de escala


_
S
2
R
/J,
para la comparacin de las medias de los tratamientos, donde es el nmero de grados de
libertad de la varianza residual.
En la Figura 4-2 se representan las 5 medias de los fertilizantes del Ejemplo 4-1 en
relacin con la distribucin de referencia t con 12 grados de libertad y con un factor de
escala
_
10,9166/4 = 1,65. Esta gura muestra que los procedimientos grcos a veces
no son sucientemente claros. Sin embargo, en dicha gura puede observarse que hay una
32 Diseos en bloques aleatorizados
gran diferencia entre los tratamientos 1 y 5, como se comprobar posteriormente en la
subseccin ?? mediante el procedimiento de Tukey realizado con S1.1on.iiic.
Figura 4-2
Tambin se puede comprobar qu bloques son signicativamente distintos mediante
un procedimiento grco como el anterior, pero con un factor de escala
_

S
2
R
/I, que en
nuestro ejemplo tiene el valor
_
10,9166/5 = 1,47761. Dicho procedimiento se muestra en
la Figura 4-3, donde comprobamos que se conrma el resultado del contraste F del anlisis
de la varianza, es decir, no hay diferencias signicativas entre los bloques.
Figura 4-3
5.4. Comprobacin de la idoneidad del modelo
La comprobacin de la idoneidad del modelo requiere contrastar las hiptesis dadas
en (5.5). Los contrastes de normalidad, homocedasticidad e independencia son anlogos a
los realizados en el modelo completamente aleatorizado, por lo que remitimos al lector al
Captulo 3, con la diferencia de que en el modelo en bloques aleatorizados tambin hay
5.4 Comprobacin de la idoneidad del modelo 33
que estudiar la variabilidad del error por bloques.
En este modelo hemos supuesto otra hiptesis adicional, la aditividad de los efectos de
tratamiento y bloque, es decir, hemos supuesto un modelo en el que el efecto de un factor
no depende del nivel del otro factor. A pesar de que este modelo aditivo es a menudo til,
existen situaciones en las que resulta inadecuado, por ejemplo, las diferencias entre dos
fertilizantes pueden ser mayores cuando se aplican en el bloque 1 que cuando se aplican en
el bloque 3. Cuando esto ocurre se dice que existe interaccin entre los tratamientos y los
bloques, y entonces el modelo de ecuacin (5.4) no es adecuado. Por lo tanto, la hiptesis
de aditividad tambin debe ser contrastada.
5.4.1. Test de Interaccin de Tukey
Cuando existe interaccin entre tratamiento y bloque, el modelo tendr en general
la siguiente ecuacin
y
ij
= +
i
+
j
+ ()
ij
+u
ij
i = 1, 2, , I j = 1, 2, , J , (5.52)
donde el trmino ()
ij
representa la interaccin. Se suponen las siguientes restricciones
para los parmetros

i
=

j
=

i
()
ij
=

j
()
ij
= 0 ,
por lo tanto el nmero de parmetros independientes de este modelo sera
1 + (I 1) + (J 1) + (I 1)(J 1) = IJ ,
que, puesto que hay una sola observacin por celdilla, coincide con el nmero de obser-
vaciones, no habiendo sucientes grados de libertad para estimar la varianza residual. Un
procedimiento para solventar este problema consiste en tomar ms de una observacin por
celdilla.
Tukey (1949) desarroll un mtodo para determinar si existe interaccin entre tratamien-
tos y bloques, cuando slo hay una observacin por celdilla, conocido como el test de in-
teraccin de un grado de libertad de Tukey. Este procedimiento supone que la forma de la
interaccin es particularmente simple, es decir
()
ij
=
i

j
,
en donde es una constante desconocida. De esta forma las interacciones aaden nica-
mente un parmetro, y el modelo resultante es:
34 Diseos en bloques aleatorizados
y
ij
= +
i
+
j
+
i

j
+u
ij
i = 1, 2, , I ; j = 1, 2, , J , (5.53)
siendo las restricciones para este modelo

i
=

j
=

j
=

j
= 0 .
En primer lugar abordaremos la estimacin de los parmetros del modelo. Para ello,
se construye la funcin de verosimilitud asociada a la muestra y =(y
11
, , y
1J
, ,
y
I1
, , y
IJ
):
L(,
i
,
j
, ,
2
) = (2
2
)

N
2
exp
_
_

1
2
2
I

i=1
J

j=1
_
y
ij

i

j

i

2
_
_
,
(5.54)
se determina el logaritmo de dicha funcin
ln(L(,
i
,
2
)) =
N
2
ln(2)
N
2
ln(
2
)
1
2
2
I

i=1
J

j=1
_
y
ij

i

j

i

2
,
(5.55)
y se hallan las primeras derivadas parciales respecto de los parmetros del modelo, obtenin-
dose las mismas expresiones que en (5.12)-(5.14) para los estimadores de los parmetros
,
i
y
j
.
El estimador mximo verosimil de se obtiene realizando la correspondiente derivada
parcial, es decir
lnL

=
1

2
I

i=1
J

j=1
_
y
ij

i

j

i

j
= 0 (5.56)
de donde
I

i=1
J

j=1
y
ij

j

I

i=1

i
J

j=1

j

I

i=1

2
i
J

j=1

j

J

j=1

2
j
I

i=1

i

I

i=1

2
i
J

j=1

2
j
= 0 .
5.4 Comprobacin de la idoneidad del modelo 35
Por lo tanto
=
I

i=1
J

j=1

j
y
ij
I

i=1

2
i
J

j=1

2
j
, (5.57)
y reemplazando
i
y

j
por sus respectivos estimadores muestrales, tenemos
=
I

i=1
J

j=1
( y
i.
y
..
)( y
.j
y
..
)y
ij
I

i=1
( y
i.
y
..
)
2
J

j=1
( y
.j
y
..
)
2
. (5.58)
Como hemos supuesto la existencia de interaccin entre los factores, hay que introducir
en este modelo una suma de cuadrados que represente dicha interaccin, esta suma de
cuadrados se denota por SCIT y viene dada por la expresin
SCIT =

j

2

2
i

2
j
, (5.59)
que recibe el nombre de suma de cuadrados debida a la interaccin o no-aditividad del
modelo, que tambin se puede expresar, sustituyendo los correspondientes estimadores
muestrales, de la siguiente forma
SCIT =
I

i=1
J

j=1

2
( y
i.
y
..
)
2
( y
.j
y
..
)
2
=
_
_
I

i=1
J

j=1
( y
i.
y
..
)( y
.j
y
..
)y
ij
_
_
2
I

i=1
( y
i.
y
..
)
2
J

j=1
( y
.j
y
..
)
2
.
(5.60)
Por lo tanto, la ecuacin bsica del anlisis de la varianza para el modelo con inter-
accin (5.53) debe tener un trmino ms que la citada ecuacin del modelo en bloques
aleatorizados. Dicha ecuacin se expresa simblicamente en la forma
SCT = SCTr +SCBl +SCIT +SCR , (5.61)
donde
36 Diseos en bloques aleatorizados
SCTr es la suma de cuadrados entre tratamientos
SCBl es la suma de cuadrados entre bloques
SCIT es la suma de cuadrados debida a la interaccin por Tukey
SCR es la suma de cuadrados residual que se obtiene como
SCR = SCT SCTr SCBl SCIT .
Se demuestra que si = 0, esto es, si no hay interaccin del tipo
i

j
, entonces
SCIT/
2
y SCR/
2
son variables aleatorias independientes distribuidas segn una
2
con 1 y IJ I J grados de libertad, respectivamente. Por tanto, si = 0, el estadstico
de contraste
F =
SCIT/1
SCR/(IJ I J)
, (5.62)
se distribuye segn una F de Snedecor con 1, IJ I J grados de libertad. As, para
contrastar
H
0
: = 0 (no hay interaccin)
H
1
: = 0 ( hay interaccin del tipo
i

j
) ,
(5.63)
puesto que, F se distribuye como una F
1,IJIJ
cuando H
0
es cierta y puesto que los
valores grandes de F
exp
conducen a la conclusin H
1
, la decisin apropiada para controlar
un riesgo de error de Tipo I igual a , es:
Si F
exp
F
,1,IJIJ
, se acepta H
0
Si F
exp
> F
,1,IJIJ
, se rechaza H
0
,
(5.64)
donde F
,1,IJIJ
es el punto crtico superior de la distribucin F con 1 y IJ I J
grados de libertad.
A n de ilustrar este procedimiento utilicemos el Ejemplo 4-1. Para ello, construimos
la Tabla 4-8, organizando los datos de la siguiente manera:
5.4 Comprobacin de la idoneidad del modelo 37
Tabla 4-8. Datos del Ejemplo 4-1
Bloques
Fert. A B C D y
i.

i

2
i
J

j=1

j
y
ij
1 87 86 88 83 86,00 4,55 20,702 69,16
2 85 87 95 85 88,00 2,55 6,502 78,03
3 90 92 95 90 91,75 1,20 1,440 19,62
4 89 97 98 88 93,00 2,45 6,002 91,63
5 99 96 91 90 94,00 3,45 11,902 14,49
y
.j
90 91,6 93,4 87,2 90,55 = y
..
46,55 21,45

j
0,55 1,05 2,85 3,35

2
j
0,302 1,102 8,122 11,222 20,75
En primer lugar calculamos el estimador de y la suma de cuadrados de la interaccin
SCIT
=

j
y
ij

2
i

2
j
=
21,45
(46,55)(20,75)
= 0,0222 ,
SCIT =

2
i

2
j
= (0,022)
2
(46,55)(20,75) = 0,4760 .
Continuamos con la suma de cuadrados debida al error SCR
SCR = SCT SCTr SCBl SCIT = 420,95 186,20 103,75 0,4760 = 130,524 .
Por lo tanto el valor del estadstico de contraste es
F
exp
=
SCIT/1
SCR

/(IJ I J)
=
0,4760
130,524/11
= 0,04011 .
Si realizamos el contraste al nivel de signicacin del 5 %, como el valor de la F terica
es F
0,05,1,11
= 4,84 y puesto que F
exp
= 0,04011 < 4,84 se concluye que no hay interaccin
entre los fertilizantes y los bloques de terreno.
38 Diseos en bloques aleatorizados
Bibliografa utilizada
Garca Leal, J. & Lara Porras, A.M. (1998). Diseo Estadstico de Experimentos.
Anlisis de la Varianza. Grupo Editorial Universitario.
Lara Porras, A.M. (2000). Diseo Estadstico de Experimentos, Anlisis de la Vari-
anza y Temas Relacionados: Tratamiento Informtico mediante SPSS Proyecto Sur
de Ediciones.

Você também pode gostar