Você está na página 1de 35

Captulo 3

Comparaciones mltiples
3.1.

Introduccin

En este captulo explicaremos algunas tcnicas para analizar con mayor detalle los
datos de un experimento, con posterioridad a la realizacin del Anlisis de la Varianza. Si
dicho anlisis conrma la existencia de diferencias signicativas entre los tratamientos, es
conveniente investigar qu medias son distintas. Para ello, emplearemos diversas tcnicas
cuyo objeto es identicar qu tratamientos son estadsticamente diferentes y en cunto
oscila el valor de esas diferencias. Consideraremos su aplicacin nicamente al modelo de
efectos jos.
El uso de estas tcnicas, en algunos casos, est supeditado al resultado del anlisis de
la varianza; en otros casos, las tcnicas pueden emplearse directamente sin haber realizado
previamente dicho anlisis. Este conjunto de tcnicas se engloba bajo la denominacin de
contrastes para comparaciones mltiples ya que su objetivo fundamental es comparar entre
s medias de tratamientos o grupos de ellas.
En primer lugar estudiamos un procedimiento intuitivo y cualitativo basado en la representacin grca de los datos del experimento1 . Depus del mtodo grco consideramos
la tcnica de comparacin por parejas introducida por Fisher en 1935. Dicha tcnica, denominada mtodo de la diferencia mnima signicativa o mtodo LSD (Least Signicant
Dierence), se basa en la construccin de tests de hiptesis para la diferencia de cualquier
par de medias.
Cuando el nmero posibles de comparaciones es elevado, la aplicacin reiterada de
este procedimiento, para un nivel de signicacin dado, puede conducir a un nmero
grande de rechazos de la hiptesis nula aunque no existan diferencias reales. El intento de
1

En cierto sentido, el mtodo grco ya fu comentado en el captulo anterior al dar la interpretacin


de algunas salidas grcas de S
.

Comparaciones mltiples

paliar el problema de los falsos rechazos justica la introduccin de otros procedimientos


para comparaciones mltiples. Entre estos mtodos se estudia primero el basado en la desigualdad de Bonferroni. A continuacin se aborda otra forma de solventar las deciencias
mencionadas anteriormente, basada en el rango estudentizado, que da lugar al mtodo de la
diferencia signicativa honesta propuesto por Tukey o mtodo HSD (Honestly Signicant
Dierence) y a los procedimientos de rangos mltiples de Newman-Keuls y Duncan.
Finalmente se estudia el procedimiento general de Sche, basado en la construccin
de intervalos de conanza simultneos para todas las posibles diferencias de medias y que
permite su extensin a comparaciones ms generales denominadas contrastes.
En la seccin 3.3 se justica qu procedimientos pueden ser adecuados para cada
situacin y cules son las condiciones experimentales que los hacen recomendables.
Otro problema de ndole diferente, tambin ligado a las comparaciones mltiples, consiste en las comparaciones de distintos tratamientos con un control que suele emplearse
en determinados campos de investigacin, por ejemplo en estudios epidemiolgicos. Dicho
problema se aborda mediante el contraste de Dunnett.

3.2.

Comparaciones mltiples de medias

Al estudiar el comportamiento de los tratamientos de un factor, mediante un anlisis de la varianza, el nico objetivo es saber si, globalmente, dichos tratamientos dieren
signicativamente entre s. Ahora estamos interesados, una vez aceptada la existencia de
diferencias entre los efectos del factor, en conocer qu tratamientos concretos producen
mayor efecto o cules son los tratamientos diferentes entre s. En estas misma condiciones,
puede ser til tambin realizar comparaciones adicionales entre grupos de medias de los
tratamientos.
Antes de seguir con el desarrollo de esta seccin, remitimos al lector al Captulo 1,
seccin ??, donde presentamos el modelo de efectos jos denido por la ecuacin
yij = i + uij .

(3.1)

Antes de estudiar analticamente las distintas formas de comparar efectos, es conveniente examinar de forma cualitativa su comportamiento. Esto se efecta de forma grca
y constituye el primer mtodo que pasamos a desarrollar.

3.2.1.

Comparaciones grcas de medias

Al igual que en el captulo anterior vamos a concretar toda la explicacin sobre un


determinado ejemplo. En este caso, vamos a considerar el Ejemplo 1-1.

3.2 Comparaciones mltiples de medias

Para ese ejemplo obtuvimos, vase Tabla 1-6, que el rendimiento de la semilla de algodn depende signicativamente del tipo de fertilizante utilizado. Pero esta conclusin no
nos informa nada sobre una serie de preguntas tales como: Producen algunos fertilizantes
el mismo rendimiento?, en el caso de que dos fertilizantes produzcan distinto rendimiento
entre qu valores oscila esa diferencia?, etc. Una primera respuesta a estas preguntas se
puede realizar de forma grca.
En primer lugar haremos unas consideraciones generales antes de estudiar el ejemplo
de referencia. Para ello, consideremos el modelo equilibrado con n observaciones por nivel
y sean y1. , y2. , , yI. las medias muestrales de los correspondientes tratamientos. Bajo
las hiptesis del modelo, cualquier promedio yi. de un tratamiento se distribuir alrededor

de su media i con una desviacin estndar / n. En consecuencia, si aceptamos que


las medias de los distintos niveles de un factor son todas idnticas, entonces las medias
muestrales yi. , i = 1, 2, I, se comportarn como un conjunto de I observaciones tomadas

al azar de una misma distribucin normal con media y desviacin estndar / n.


Supongamos que dibujamos la funcin de densidad de una distribucin normal deslizante
e imaginemos que situamos dicha distribucin sobre los puntos que representan las medias de los tratamientos. Procediendo de esta manera y teniendo en cuenta los distintos
comportamientos de los efectos, podemos distinguir dos casos relevantes:
a) Los efectos de los tratamientos son iguales entre s.
Entonces, al deslizar la distribucin a lo largo del eje OX, es probable que exista
alguna posicin para la cual todos los valores yi. sean compatibles con dicha distribucin; es decir, sean una muestra aleatoria de la misma distribucin.
b) Los efectos de los tratamientos no son iguales.
Entonces al deslizar la distribucin a lo largo del eje OX, es improbable que exista alguna posicin para la cual todos los valores yi. sean compatibles con dicha
distribucin. En este caso, es posible que existan situaciones que permitan detectar
niveles del factor que producen respuestas medias diferentes; concretamente, stos
se identican por medio de aquellos valores yi. que estn muy distanciados de los
otros.
Como generalmente 2 es desconocida estimamos su valor por medio de la varianza
2 y, en lugar de la distribucin normal, hay que emplear una distribucin t
residual SR
2 /n y con los grados de libertad correspondientes a dicha
deslizante con factor de escala SR
varianza residual. Para dibujar dicha distribucin t utilizamos la Tabla III del Apndice
C, que muestra el valor de la funcin de densidad, para determinadas abscisas, de una
distribucin t de Student con grados de libertad dados. Para obtener la distribucin con

Comparaciones mltiples

factor de escala hay que multipicar las correspondientes abscisas por dicho factor de escala
y representar sus valores frente a las correspondientes ordenadas.
Este mtodo se ilustra en la Figura 2-1 donde se distinguen varios casos:
a) Las cinco medias pueden considerarse como una muestra aleatoria de la misma distribucin.

Figura 2-1a
b) Al deslizar la distribucin de referencia a lo largo del eje horizontal, nos permite
detectar grupos homogneos. As, deducimos que las medias 2, 4 y 5 son probablemente mayores que 1 y 3 y que no hay distincin entre las medias de cada uno de
los grupos.

Figura 2-1b

3.2 Comparaciones mltiples de medias

c) Podemos deslizar la distribucin de referencia de forma que abarque a las cinco


medias, pero no parece razonable concluir que las cinco medias sean compatibles con
la misma poblacin.

Figura 2-1c

En estos casos parece razonable que el resultado que proporciona el anlisis de la


varianza sea aceptar la hiptesis H0 en el primer caso y rechazarla en los otros dos.
Este procedimiento grco se ha desarrollado para el caso en que todos los tamaos
muestrales sean iguales. Sin embargo, de forma aproximada, se puede aplicar tambin
cuando las diferencias entre los tamaos muestrales no sean muy grandes. En tal caso,
debe usarse
2
SR
,
n

como factor de escala, siendo n


el tamao medio de las muestras, n
=

1
I

i ni

La aplicacin de este mtodo a nuestro ejemplo de referencia se muestra en la Figura


2-2

Comparaciones mltiples

Figura 2-2: Comparacin grca de los tratamientos del Ejemplo 1-1.


En dicho ejemplo, como la varianza es desconocida y los tamaos muestrales son distintos, el factor de escala es igual a
2
SR
=
n

4,67
= 0,947 .
26/5

Para construir la distribucin deslizante, como el nmero de grados de libertad de la


varianza residual es 21, tomamos los valores de la correspondiente la de la Tabla III del
Apndice C, obteniendo:
Abcisa
Ordenada
Abcisa 0,947

0
0.394
0

0.5
0.346
0.473

1.0
0.236
0.947

1.5
0.129
1.420

2.0
0.058
1.894

Para dibujar la distribucin de referencia, se elige un origen arbitrario, que debe estar prximo a las medias, nosotros hemos considerado como origen . A continuacin se
representan las ordenadas de los puntos 0, 0,473, 0,947, 1,420, 1,894
que se unen en una lnea continua, con lo que esbozamos la distribucin de referencia. El
deslizamiento de la distribucin de referencia a lo largo del eje horizontal permite obtener
las siguientes conclusiones:
Las cinco medias no son iguales entre s. No es posible situar la distribucin de
referencia en ninguna posicin de forma que las abarque a todas.
Los fertilizantes (5 y 4), (4 y 3) y (3 y 1) tienen un rendimiento similar y el fertilizante
2 tiene un rendimiento distinto de los otros cuatro.

3.2 Comparaciones mltiples de medias

Este procedimiento de comparacin grca de las medias de los tratamientos mediante


una distribucin de referencia, es un mtodo aproximado pero ecaz en muchos problemas
de comparaciones mltiples. En las siguientes secciones se describen otros mtodos estadsticos ms rigurosos para realizar comparaciones mltiples. En primer lugar se abordan
mtodos creados especcamente para comparar por parejas los efectos de tratamientos,
de entre ellos, comenzaremos con los basados en la distribucin t.

3.2.2.

Comparaciones basadas en la distribucin t

Las pruebas estadsticas para comparaciones mltiples ms frecuentemente utilizadas se basan en la distribucin t de Student. Supongamos que interesa comparar por
parejas los efectos de I tratamientos. Es decir, nos interesa contrastar cualquier hiptesis
de la forma
H0 : i = j
(3.2)
H1 : i = j
La tcnica ms antigua y popular para efectuar estas comparaciones mltiples es el
procedimiento LSD, (Least Signicant Dierence), que pasamos a estudiar a continuacin.
Contraste de la Mnima Diferencia Signicativa
Este procedimiento fu sugerido por Fisher en 1935 y es el primer mtodo de
comparaciones mltiples que vamos a utilizar. Dicho procedimiento consiste en una prueba
de hiptesis por parejas basada en la distribucin t.
Este mtodo debe aplicarse cuando previamente se haya rechazado la hiptesis nula
del test F del anlisis de la varianza. Para ello, se determina el siguiente estadstico
t=

yi. yj.
2
SR

(3.3)

1
1
+
ni nj

que, por las hiptesis del modelo de ecuacin (??), sigue una distribucin t de Student
con N I grados de libertad.
Por lo tanto, se concluye que la pareja de medias i y j son estadsticamente diferentes

si
| yi. yj. |> LSD ,

(3.4)

donde la cantidad LSD, denominada mnima diferencia signicativa, viene dada por
LSD = t/2;NI

2
SR

1
1
+
ni nj

(3.5)

Comparaciones mltiples

siendo
ni y nj el nmero de observaciones correspondiente a cada media,
N I el nmero de grados de libertad de la varianza residual,
t/2;N I el valor crtico de la distribucin t con N I grados de libertad que deja
una probabilidad a su derecha igual a /2.
Si el diseo es balanceado, el valor de LSD se reduce a
LSD = t/2;NI

2
2SR
.
n

(3.6)

El procedimiento LSD es sencillo de utilizar; se puede aplicar tanto en modelos equilibrados como no-equilibrados. Adems proporciona tambin intervalos de conanza para
diferencias de medias. Dichos intervalos son de la forma
yi. yj. ) + LSD)
((
yi. yj. ) LSD , (

(3.7)

Comentarios 3.1
C1) Un problema que presenta la aplicacin de este procedimiento, para un nmero relativamente grande de tratamientos, es que el nmero de posibles falsos rechazos de la
hiptesis nula puede ser elevado aunque no existan diferencias reales. As, por ejemplo, si I es igual a 10, hay 10
2 = 45 posibles parejas de comparaciones. Si tomamos
= 0,05, entonces el nmero esperado de falsos rechazos ser
0,05 45 = 2,25 ,
supuesta independencia estadstica entre los distintos contrastes.
Otra forma de enfocar este problema es comprobando que la utilizacin reiterada de
este procedimiento conduce a que la probabilidad de que se rechace al menos una de
las posibles comparaciones sea bastante alta. En efecto, bajo la hiptesis nula
Pr[rechazar al menos una comparacin] = 1 Pr[aceptar todas] =
1 (1 0,05)45 0,90
El intento de paliar este problema justica la introduccin de otros procedimientos
para comparaciones mltiples.

3.2 Comparaciones mltiples de medias

C2) Puede suceder que el mtodo LSD falle al aceptar que todas las parejas son iguales,
a pesar de que el estadstico F del anlisis de la varianza resulte signicativo; sto es
debido a que la prueba F considera simultneamente todas las posibles comparaciones
entre las medias de los tratamientos y no slo las comparaciones por parejas.
A fn de ilustrar este procedimiento, consideramos el ejemplo de referencia. As, para
un nivel de signicacin del 5 %, el valor de LSD es
LSD = t0,025;21

2
SR

1
1
+
ni nj

= 2,080 4,67

1
1
+
= 4,49
ni nj

1
1
+
ni nj

Por tanto, dos medias dieren signicativamente entre s, si el valor absoluto de la


diferencia de sus promedios muestrales es mayor que el valor LSD. Recordemos que, en
este ejemplo de referencia, los valores de los cinco promedios de los tratamientos son:
y1. = 50, y2. = 57, y3. = 48, y4. = 47, y5. = 45 .
Para la aplicacin de este procedimiento es recomendable ordenar las medias de menor
a mayor. Una vez ordenadas se comparan la 1a y la 2a :
a) Si hay diferencia signicativa entre ellas, tambin la habr entre la 1a y todas las
dems.
b) Si no hay diferencia signicativa entre ellas, se compara la 1a con la 3a y siguientes
hasta encontrar la primera diferencia signicativa.
De forma similar se realiza la comparacin de la 2a media con todas las dems y as
sucesivamente se hara con las restantes medias.
Por lo tanto,
1o ) Ordenamos las medias de menor a mayor.
y5. = 45, y4. = 47 y3. = 48, y1. = 50, y2. = 57 .
2o ) Comparamos las medias 1a y 2a .
LSD = 4,49 1/6 + 1/4 = 2,898 ; | y5. y4. | =| 45 47 | = 2 .
Como no hay diferencia signicativa entre ellas, se compara la 1a con la 3a

10

Comparaciones mltiples

LSD = 4,49 1/6 + 1/5 = 2,718 ; | y5. y3. | =| 45 48 | = 3 .


Al haber diferencia signicativa entre ellas, tambin la hay entre la 1a y la 4a y entre
la 1a y la 5a .
3o ) Comparamos las medias 2a y 3a .
LSD = 4,49 1/4 + 1/5 = 3,011 ; | y4. y3. | =| 47 48 | = 1 .
Como no hay diferencia signicativa entre ellas comparamos la 2a y la 4a .
LSD = 4,49 1/4 + 1/6 = 2,898 ; | y4. y1. | =| 47 50 | = 3 .
Al haber diferencia signicativa entre ellas, tambin la hay entre la 2a y la 5a .
4o ) Comparamos las medias 3a y 4a .
LSD = 4,49 1/5 + 1/6 = 2,718 ; | y3. y1. | =| 48 50 | = 2 .
No hay diferencia signicativa, por lo tanto comparamos la 3a con la 5a
LSD = 4,49 1/5 + 1/5 = 2,839 ; | y3. y2. | =| 48 57 | = 9 .
Hay diferencia signicativa.
5o ) Comparamos las medias 4a y 5a .
LSD = 4,49 1/6 + 1/5 = 2,718 ; | y1. y2. | =| 50 57 | = 7 .
Hay diferencia signicativa.
Normalmente el resultado de las comparaciones por parejas se suele representar en
forma grca, como se muestra a continuacin

Figura 2-3

3.2 Comparaciones mltiples de medias

11

En dicha representacin los valores de las medias de los tratamientos aparecen en


orden creciente y se subrayan aquellos grupos de medias que resultan equivalentes. Esta
representacin grca es muy fcil de interpretar y es la utilizada por la mayora de los
paquetes estadsticos.
En la siguiente seccin se describe el mtodo de Bonferroni, que presenta una solucin
al problema de los falsos rechazos planteado en el mtodo LSD.
Mtodo de Bonferroni
En este procedimiento se ja un nivel de signicacin que se reparte entre cada
una de las comparaciones consideradas y se utiliza la desigualdad de Bonferroni
M

Pr

Am
m=1

Pr(Am ) .

(3.8)

m=1

Consideremos que queremos realizar estimacin por intervalos para las M = I2 comparaciones posibles, cada una al nivel de signicacin = /M; esto da origen a M
intervalos de conanza que contienen a cada una de las posibles diferencias i j con
probabilidad 1 . Llamando Cm al intervalo m-simo se tiene que
Pr [1m 2m Cm ] = 1

m = 1, 2, , M

siendo 1m y 2m la primera y segunda media de la correspondiente comparacin, donde


supondremos que 1 1m < 2m I.
Aplicando la desigualdad de Bonferroni, (expresin (3.8)), se tendr
M

Pr

Cm
m=1

= 1 Pr

Cm
m=1

m=1

Pr(Cm ) = 1

,
m=1

notamos por Cm al complementario del intervalo Cm .


Teniendo en cuenta este resultado y si queremos garantizar un nivel de signicacin
para el conjunto de las M comparaciones por parejas, o un nivel de conanza 1 para
el conjunto de intervalos, basta tomar
=

.
M

12

Comparaciones mltiples

Con ello, evidentemente, la probabilidad de que todos los intervalos, Cm , contengan


a la correspondiente diferencia de medias, ser al menos 1 . As pues, los intervalos
quedarn en la forma

y1m. y2m. t 2M

2
SR

1
1
+
n1m n2m

(3.9)

donde y1m. , y2m. y n1m , n2m , son las medias y los tamaos muestrales correspondientes a
la comparacin m-sima.
Denotamos por m = 1m 2m , m = 1, 2, , M, una de las M comparaciones lineales
por parejas de medias, para las cuales interesa contrastar H0 : m = 0 frente H1 : m = 0.
Entonces, se rechaza H0 si
| m |> Bm ,
y se acepta en caso contrario.
Donde

Bm = t 2M

2
SR

1
1
+
n1m n2m

(3.10)

En el caso del modelo equilibrado los valores de Bm coinciden, dichos valores se denotan
por BSD y tienen la siguiente expresin

BSD = t 2M

2
SR

1
1
+
n n

(3.11)

siendo n el nmero de observaciones de cada grupo y t/2M el valor crtico de la distribucin


t, con el mismo nmero de grados de libertad que la varianza residual, que deja una
probabilidad /2M a su derecha.
Para ilustrar este mtodo consideramos el ejemplo de referencia. Puesto que es un
modelo no-equilibrado, los valores de los estadsticos de contraste vendrn dados por la
siguiente expresin
Bm = t 0,025 ;21

(4,67)

10

As, por ejemplo, si comparamos

1
1
+
n1m n2m

m = 1, 2. , 10 .

3.2 Comparaciones mltiples de medias

13

5 vs2 4, el valor de Bm es
B1 = t 0,025 ;21

4,67

10

1 1
+
6 4

= (3,135)(1,394) = 4,370 .

Entonces, como
| y5. y4. |= 2 < B1 ,
las medias 5 y 4 no son signicativamente distintas
5 vs 3, el valor de Bm es
B2 = t 0,025 ;21
10

4,67

1 1
+
6 5

= (3,135)(1,308) = 4,100 .

Entonces, como
| y5. y3. |= 3 < B2 ,
las medias 5 y 3 no son signicativamente distintas.

El resultado de las comparaciones por parejas realizadas con este procedimiento se


muestra, en forma grca, a continuacin

Figura 2-4
Seguidamente presentamos los contrastes de rangos mltiples. Dichos contrastes se
basan en la distribucin del rango estudentizado y se distinguen tres mtodos debidos
respectivamente a Tukey, Duncan-Newman y Keuls.
2

Se utiliza i vs j, (i versus j), para denotar la comparacin de i frente a j .

14

Comparaciones mltiples

3.2.3.

Tests de rangos mltiples

Estos contrastes se basan en la distribucin del rango estudentizado, cuya denicin


se realiza en trminos del nmero de grupos que hay que comparar y de los grados de
libertad del estimador de la varianza.
Estos procedimientos, al igual que el procedimiento de Bonferroni, permiten superar
las dicultades que surgen al aumentar el nmero de grupos a comparar y no poderse
controlar los falsos rechazos de la hiptesis nula. Los mtodos resultantes, en trminos
generales, son conservadores; es decir, la probabilidad real de rechazar la hiptesis nula
cuando es cierta es menor que el nivel de signicacin jado.
Para denir el recorrido o rango estudentizado, supongamos que disponemos de k
observaciones independientes y1 , y2 , , yk de una distribucin Normal con media y
varianza 2 . Supongamos que disponemos, tambin, de un estimador S 2 de 2 que tiene
grados de libertad y es independiente de las yi . Sea R el rango de este conjunto de
observaciones,
(3.12)
R = max(yi ) mn(yi ) .
Bajo estas condiciones, se dene el rango estudentizado como el cociente
max(yi ) mn(yi )
R
=
,
S
S

(3.13)

que se denota por qk, . La distribucin de este estadstico, que depende de los parmetros
k y , ha sido tabulada y los valores crticos se presentan en el Apndice C en la Tabla
VI.
Mtodo de Tukey (Honestly-signicant-dierence)
Este procedimiento se va a desarrollar considerando en primer lugar el caso del
modelo unifactorial equilibrado. En este modelo vamos a construir intervalos de conanza
con coeciente de conanza conjunto 1 para todas las posibles comparaciones por
parejas asociadas a los I niveles, es decir las I2 comparaciones por parejas.
El nivel de conanza conjunto 1 indica que de cada 100 muestras en (1 ) 100
de ellas, cada uno de los intervalos contiene a su correspondiente diferencia de medias. Por
tanto el nivel de conanza de cada uno de los intervalos ser al menos 1 .
Para construir dichos intervalos consideramos las desviaciones
(
y1. 1 ), (
y2. 2 ), , (
yI. I ) .

(3.14)

3.2 Comparaciones mltiples de medias

15

Estas desviaciones son variables aleatorias independientes normalmente distribuidas


2 /n es un estimador de 2 /n que es independiente
con media 0 y varianza 2 /n. Adems SR
de dichas desviaciones. Entonces, de la denicin de rango estudentizado, se sigue que
max(
yi. i ) mn(
yi. i )
2
SR
n

1/2

qI,NI ,

(3.15)

donde
2
N I es el nmero de grados de libertad asociado a SR

max(
yi. i ) es la desviacin mayor
mn(
yi. i ) es la desviacin menor.
Entonces se verica que

max(
yi. i ) mn(
yi. i )

Pr

q
=1 .
;I,NI
1/2

2
SR

(3.16)

Consideramos, a continuacin, la siguiente desigualdad generada para todas las parejas


de medias de tratamientos i y j
| (
yi. i ) (
yj. j ) | max(
yi. i ) mn(
yj. j ) .

(3.17)

Puesto que la desigualdad (3.17) se verica para todas las parejas i y j , se sigue de
(3.16) que

(
y

)
i.
j.

i
j
Pr

q
;I,NI = 1 ,
1/2

2
SR

incluye todos los pares I(I 1)/2 de comparaciones entre los I niveles del factor.

(3.18)

16

Comparaciones mltiples

Reordenando la desigualdad (3.18) obtenemos los lmites de conanza, al nivel de


conanza conjunto 1 , para todas las I2 comparaciones por parejas de las I medias,
dados por
(
yi. yj. ) HSD i j (
yi. yj. ) + HSD ,
(3.19)
donde
HSD = q;I,NI

2
SR
.
n

Si el intervalo (3.19) no contiene el 0 se concluye que las medias i y j dieren


signicativamente entre s.
El coeciente de conanza 1 indica que de cada 100 muestras en (1 ) 100 de
ellas se determinar correctamente cuales de las I2 comparaciones por parejas de medias
son signicativas.
Por tanto, el mtodo de Tukey resuelve el contraste
H0 : i = j

vs

H1 : i = j ,

de la siguiente manera
Si | yi. yj. | HSD =

Aceptar

H0

Si | yi. yj. |> HSD =

Rechazar

H0

En el caso de que el modelo no sea equilibrado se emplea el ajuste de Tukey-Kramer, que


consiste en reemplazar n por la media armnica, nh , de los tamaos de los grupos, es decir
nh =

2
2
i=1

(3.20)

1
ni

Para ilustrar el uso de este procedimiento consideremos el ejemplo de referencia. En


este caso hay que usar q0,05;5,21 = 4,22 como base para determinar el valor crtico y,
en consecuencia, ningn par de medias se declara signicativamente diferente, salvo que
| yi. yj. | exceda a
HSD = (4,22)

2
SR
= (4,22)
nh

4,67
2

1
1
+
ni nj

Con esta prueba se obtienen los mismos resultados que con el procedimiento de Bonferroni.

3.2 Comparaciones mltiples de medias

17

El segundo procedimiento de comparaciones mltiples considerado en esta seccin es


el test de rango mltiple de Duncan. Es un procedimiento iterativo en el cual se intenta
comprobar la igualdad de medias basndose en las ms extremas. Es similar al procedimiento HSD de Tukey excepto que el nivel de signicacin vara de unas comparaciones
a otras.
Test de rango mltiple de Duncan
El contraste de Duncan utiliza, como el HSD de Tukey, la distribucin del recorrido
estudentizado. Se diferencia de ese test en que su aplicacin es secuencial, en el sentido de
no utilizar un nico valor crtico para todas las diferencias de medias, como el de Tukey,
sino un valor crtico que depende del nmero de medias comprendido entre las dos medias
que se comparan, habiendo ordenado previamente las medias en orden creciente.
Consideremos, en primer lugar, el modelo equilibrado y despus generalizaremos para
el caso no-equilibrado.
Se acepta que no hay diferencia signicativa entre la media mayor y la media menor
de p medias, yi. e yj. , si se verica
| yi. yj. | Rp ,

(3.21)

y sern consideradas iguales tambin todas las medias comprendidas entre ellas. En la
expresin (3.21), el valor de Rp es
Rp = qp ;p,NI

2
SR
n

p = 2, 3, , I

(3.22)

donde
qp ;p,NI es el punto crtico del rango estudentizado basado en la comparacin de la
media mayor y la menor de p medias. Los valores crticos qp ;p, , para p = 2, 3, , I,
se presentan en la Tabla VII del Apndice C para los niveles de signicacin de
comparaciones individuales = 0,01 y = 0,05.
2 es la varianza residual con N I grados de libertad.
SR

p es el nivel de signicacin conjunto relativo a p medias consecutivas; es decir, es


la probabilidad de rechazar errneamente al menos una de las p 1 comparaciones
independientes asociadas a las medias consideradas. Dicho nivel de signicacin est
relacionado con el nivel de signicacin , de una comparacin individual, a travs
de la ecuacin
p = 1 (1 )p1 .
(3.23)

18

Comparaciones mltiples

Para la aplicacin del test de rango mltiple de Duncan, una vez que las medias estn
en orden ascendente, se calculan las diferencias entre las medias, comenzando por el valor
ms pequeo frente al ms alto de las p = I medias de los tratamientos, comparando esta
diferencia con el valor RI en la ecuacin (3.22) con un nivel de signicacin I . Si esas
dos medias no se consideran signicativamente diferentes, entonces el contraste se termina
y se concluye que ninguna de las medias son signicativamente diferentes entre s al nivel
de signicacin I . Esto es equivalente a no rechazar H0 : 1 = 2 = = I . Si las dos
medias extremas son signicativamente diferentes, el contraste contina.
En el siguiente paso se calcula la diferencia entre el valor ms pequeo y el segundo valor
ms grande y esta diferencia se compara con RI1 . Si este contraste no es estadsticamente
signicativo, la prueba cesa en esta comparacin y slo las dos medias extremas se consideran signicativamente diferentes. Si este contraste es estadsticamente signicativo, la
prueba contina hasta encontrar la primera pareja de medias que no sea signicativamente
distinta. A continuacin, se calcula la diferencia entre la segunda media ms pequea y la
ms grande y se compara con RI1 . Este proceso contina hasta que se han considerado
las diferencias entre todas las I(I 1)/2 posibles parejas.
Para modelos no-equilibrados, la expresin de Rp es
Rp = qp ;p,NI

2
SR
nh

p = 2, 3, , I ,

(3.24)

donde nh es la media armnica dada por la expresin (3.20).


Comentario 3.1
La probabilidad de rechazar errneamente al menos una hiptesis nula es decir, la
probabilidad de detectar incorrectamente como signicativa la diferencia entre dos medias
de un grupo de tamao p, es el nivel de signicacin conjunto p relacionado con el nivel
de signicacin por medio de la expresin (3.23).
Por ejemplo, si = 0,05, entonces
Si comparamos parejas de medias adyacentes, el nivel de signicacin conjunto es
2 = 1 (1 0,05)21 = 0,05 ,
que lgicamente coincide con el nivel de signicacin .
Si comparamos parejas de medias separadas por una media, el nivel de signicacin
conjunto es
3 = 1 (1 0,05)31 = 0,10 .

3.2 Comparaciones mltiples de medias

19

Si comparamos parejas de medias separadas por dos medias, el nivel de signicacin


conjunto es

4 = 1 (1 0,05)41 = 0,142 .

Observamos que al aumentar p, aumenta el nivel de signicacin conjunto.

Para ilustrar la prueba de intervalos mltiples de Duncan consideramos el ejemplo de


2 = 4,67 con 21 grados de libertad. Ordenando las medias de
referencia. Recurdese que SR
los tratamientos en orden ascendente, se tiene

y5. = 45 y4. = 47 y3. = 48 y1. = 50 y2. = 57 .

Usando la Tabla de amplitudes signicativas de Duncan, Tabla VII del Apndice C,


para 21 grados de libertad y = 0,05, se obtienen los puntos crticos del rango estudentizado:

q2 = q(0,05; 2, 21) = 2,94 q3 = q(0,05; 3, 21) = 3,09


q4 = q(0,05; 4, 21) = 3,17 q5 = q(0,05; 5, 21) = 3,24 .

20

Comparaciones mltiples

Al hacer las comparaciones se obtiene:


5 vs 2

q5

2,33

1 1
+
6 5

= 2,994, | y5. y2. | = 12 > 2,994()

5 vs 1

q4

2,33

1 1
+
6 6

= 2,793, | y5. y1. | = 5

> 2,793()

5 vs 3

q3

2,33

1 1
+
6 5

= 2,856, | y5. y3. | = 3

> 2,856()

5 vs 4

q2

2,33

1 1
+
6 4

= 2,896, | y5. y4. | = 2

< 2,896

4 vs 2

q4

2,33

1 1
+
4 5

= 3,245, | y4. y2. | = 10 > 3,245()

4 vs 1

q3

2,33

1 1
+
4 6

= 3,044, | y4. y1. | = 3

< 3,044

4 vs 3

q2

2,33

1 1
+
4 5

= 3,010, | y4. y3. | = 1

< 3,010

3 vs 2

q3

2,33

1 1
+
5 5

= 2,983, | y3. y2. | = 9

> 2,983()

3 vs 1

q2

2,33

1 1
+
5 6

= 2,717, | y3. y1. | = 2

< 2,717

donde denota que la correspondiente diferencia de medias es signicativa.


Test de Newman-Keuls
Este contraste fu desarrollado por Newman en 1939 y ampliado por Keuls en 1952,
se suele denominar contraste de Newman-Keuls. Al igual que el contraste de Duncan, es un
procedimiento iterativo y, desde el punto de vista operacional, es similar a dicho mtodo.

3.2 Comparaciones mltiples de medias

21

En el procedimiento de Newman-Keuls, los valores con los que se comparan las sucesivas
diferencias de medias vienen dados por
Kp = q;p,NI

2
SR
nh

p = 2, 3, , I ,

(3.25)

donde
q;p,NI es el punto crtico del rango estudentizado, denido en (3.13). En la Tabla
VI del Apndice C se recogen los valores crticos de dicha distribucin.
2 es la varianza residual con N I grados de libertad.
SR

nh es la media armnica, dada en la ecuacin (3.20), que se utiliza cuando los tamaos
de las muestras son desiguales. En el caso del modelo equilibrado el valor de la media
armnica nh coincide con el tamao n de las muestras.
En este mtodo las medias ms extremas de un grupo de p medias, incluidas ambas, se
comparan con Kp exactamente de la misma forma que en la prueba de intervalos mltiples
de Duncan.
Comentarios 3.2
C1) El contraste de Newman-Keuls es ms conservador que el de Duncan en el sentido
de que el error de tipo I es menor.
C2) En el contraste de Newman-Keuls el nivel de signicacin es , en cambio en el
contraste de Duncan es p , cuyo valor cambia dependiendo del nmero de medias
comprendidas entre las que se comparan. Por lo tanto, la potencia de la prueba de
Newman-Keuls es menor que la del procedimiento de Duncan porque generalmente
es menor que p . Podemos comparar los valores de las Tablas VI y VII del Apndice
C para comprobar que el procedimiento de Newman-Keuls conduce a una prueba
menos ecaz que la de los intervalos mltiples de Duncan. Se observa que para p > 2,
siempre
q;p,NI > qp ;p,N I .
(3.26)
As, por ejemplo, considerando los grados de libertad correspondientes al ejemplo de
referencia y tomando 0.05 como nivel de signicacin , tenemos la siguiente tabla
p
qp ;p,
q;p,

2
2.94
2.94

3
3.09
3.57

4
3.17
3.94

5
3.24
4.22

22

Comparaciones mltiples

donde se comprueba que, efectivamente, para p > 2 se verica la desigualdad dada


en (3.26).
En otras palabras, es ms difcil declarar que dos medias son signicativamente
diferentes al utilizar la prueba de Newman-Keuls que cuando se usa el procedimiento
de Duncan.
Para ilustrar este procedimiento se utiliza el ejemplo de referencia y se comprueba que
los resultados coinciden con los obtenidos por los mtodos de Bonferroni y Tukey.
Hasta ahora hemos tratado nicamente comparaciones por parejas de niveles de un
factor; es decir, hemos considerado hiptesis del tipo
H0 : j = k
H1 : j = k .
De forma equivalente, estas hiptesis se pueden reescribir como
H0 : j k = 0
H1 : j k = 0 ,
que son casos particulares de hiptesis de la forma
I

H0 :

ai i = 0
i=1
I

H1 :

ai i = 0 ,
i=1

donde todos los ai son nulos excepto aj = 1 y ak = 1. Adems, se verica la propiedad


de que i ai = 0. Todo esto nos da pie a introducir el concepto de contraste.

3.2.4.

Contrastes

Se denomina contraste a toda combinacin lineal C, de los parmetros del modelo


de anlisis de la varianza, de la forma
I

C = a1 1 + a2 2 + + aI I =

ai i ,
i=1

(3.27)

3.2 Comparaciones mltiples de medias

23

tal que los coecientes veriquen


I

ai = 0 .

(3.28)

i=1

Ejemplo de contrastes distintos a las comparaciones por parejas son, entre otros,
1

2 + 3
2

(3.29)

1 + 4 (2 + 3 ) .

(3.30)

Si se acepta que el primer contraste es cero se arma que la media del nivel 1 del
factor es igual al promedio de las medias de los niveles 2 y 3.
Si se acepta que el segundo contraste es cero se arma que las medias de los niveles
1 y 4, consideradas en grupo, son iguales a las medias de los niveles 2 y 3, tambin
consideradas en grupo.
La combinacin lineal de la forma (3.27) tambin se puede expresar en funcin de los
efectos del factor
I

C=

ai i =
i=1

ya que

I
i=1 ai

ai ( + i ) =
i=1

ai +
i=1

ai i =
i=1

ai i ,

(3.31)

i=1

= 0.

Dado que un contraste es una funcin de los parmetros del modelo, que son desconocidos, su valor se podr estimar utilizando los estimadores de los parmetros que intervienen.
Concretamente, se puede demostrar que el estimador ptimo de un contraste viene dado
por la misma combinacin lineal de los estimadores de los parmetros que intervienen; es
decir
I

C=

ai i =
i=1

ai yi. ,
i=1

que tambin se puede escribir como la misma combinacin lineal de los estimadores de los
i ; es decir,
I

C=

ai i .
i=1

(3.32)

24

Comparaciones mltiples

En efecto
I

C=

ai i =
i=1

i=1

ai (i + ) =

i=1

ai (i ) +

ai =

ai i .

i=1

(3.33)

i=1

Si consideramos el contraste (3.29), la combinacin lneal y1. (


y2. + y3. )/2, es el
estimador de ese contraste. Para evitar coecientes fraccionarios es comn reescribir esa
combinacin como
2
y1. (
y2. + y3. ) .
(3.34)
De la misma forma, un estimador del contraste dado en (3.30) es
y2. + y3. ) .
(
y1. + y4. ) (

(3.35)

Como disponemos de un estimador para cada contraste y conocemos la distribucin en


el muestreo de los estimadores de los parmetros del modelo, podemos conocer tambin la
distribucin del estimador de un contraste y realizar inferencia estadstica sobre el mismo.
Para ello, vamos a mostrar algunas propiedades de dichos estimadores.
Propiedades de los estimadores de los contrastes
1a ) C es un estimador insesgado de C. En efecto
I

E{C} = E

ai i = E
i=1

ai yi. =
i=1

ai E[
yi. ] =
i=1

ai i ,

(3.36)

i=1

puesto que yi. son variables aleatorias con media i .


2a ) La varianza de C es 2

a2i
. En efecto
ni

I
2

{C} = Var

ai yi.

i=1

i=1

a2i Var{
yi. }

=
i=1

a2i

ni

2
i=1

a2i
ni

(3.37)

puesto que yi. son variables aleatorias independientes con varianza 2 /ni .
Por tanto, un estimador de la varianza de C es
I
2

S {C} =
2 , es la varianza residual.
donde SR

2
SR
i=1

a2i
,
ni

(3.38)

3.2 Comparaciones mltiples de medias

25

3a ) C se distribuye segn una Normal al ser una combinacin lineal de variables aleatorias Normales independientes. Adems, por las propiedades 1a y 2a , su media es C
y su desviacin tpica es {C}. En otras palabras,
C

N(C, {C})

2 , se verica que el
Por tanto, al considerar la estimacin de {C} en funcin de SR
cociente
C C
tNI .
(3.39)
S{C}

Consecuentemente, podemos efectuar la estimacin por intervalos de un contraste C


al nivel de conanza 1 , que vienen dados por la expresin
C t/2;NI S{C} .

(3.40)

En el ejemplo de referencia y considerando el contraste dado en (3.29),


C = 21 (2 + 3 ) ,

se tiene que:

1a ) La estimacin puntual de C es
C = 2
y1. (
y2. + y3. ) = 2(50) (57 + 48) = 5 .
2a ) La estimacin de la varianza muestral de C es
I
2
S 2 {C} = SR

i=1

a2i
= 4,67(1,067) = 4,982 ,
ni

donde a1 = 2, a2 = a3 = 1 y
I

i=1

a2i
4 1 1
16
= + + =
= 1,067 .
ni
6 5 5
15

Los lmites de conanza para C, al nivel conanza del 95 %, son


C t/2;NI

S 2 {C} = 5 2,08(2,23) = 5 4,63 ,

por lo tanto el intervalo de conanza correspondiente es (9,67 0,37) .

En los procedimientos de comparaciones mltiples de los efectos del factor interesa


manejar nicamente contrastes independientes. Dicha independencia se garantiza al considerar la ortogonalidad entre contrastes, que pasamos a denir a continuacin.

26

Comparaciones mltiples

Contrastes ortogonales
Decimos que dos contrastes3 C1 =
verican que

i.
i ai y

y C2 =

i.
i bi y

son ortogonales si

ai bi = 0 .

(3.41)

i=1

De la misma forma, se dice que tres o ms contrastes son mutuamente ortogonales si


todas las posibles parejas de contrastes son ortogonales.
Los coecientes de contrates ortogonales se pueden elegir de muchas formas para un
conjunto dado de tratamientos. Generalmente la naturaleza del experimento sugiere las
comparaciones que pueden ser ms interesantes.
Para ilustrar los contrastes ortogonales, consideremos el ejemplo de referencia y recordemos que los tamaos de muestras correspondientes a cada uno de los 5 tipos de fertilizantes
son: 6, 5, 5, 4, y 6. Supongamos que los contrastes ms apropiados son:
1) C1 = 1 3
2) C2 = 1 3 + 4 + 5
3) C3 = 4 5
4) C4 = 1 + 42 3 4 5 .
Los coecientes en estas comparaciones expresadas en forma tabular seran

Contraste
C1
C2
C3
C4

Tabla 2-1.
Respuesta media del nivel del factor
1
2
3
4
5
1
0
-1
0
0
-1
0
-1
1
1
0
0
0
1
-1
-1
4
-1
-1
-1

Obsrvese que la suma de los coecientes de cada la es cero indicando que cada Ci
es un contraste. Adems, es inmediato comprobar que los productos dos a dos de los
3

Aunque C = i ai yi. es un estimador del contraste C =


y lo denotaremos por C.

ai i , nos referiremos a l como contraste

3.2 Comparaciones mltiples de medias

27

coecientes de los contrastes suman cero indicando que los contrastes son mutuamente
ortogonales. En efecto, comprobemos, por ejemplo, que los contrastes C1 y C2 son ortogonales
(1)(1) + (0)(0) + (1)(1) + (0)(1) + (0)(1) = 0 .

Veamos a continuacin las expresiones para las sumas de cuadrados asociadas a un


contraste cualquiera, tanto en el caso equilibrado como en el caso no-equilibrado.
En el diseo no-equilibrado se puede demostrar que al contraste C =
puede asociar una suma de cuadrados dada por

i ai i

se le

ai yi.
1=1
I

SSC =

a2i
ni

i=1

(3.42)

y por lo tanto, la expresin de la suma de cuadrados en el modelo equilibrado es


2

ai yi.

n
1=1
I

SSC =

(3.43)

a2i
i=1

teniendo estas sumas de cuadrados un grado de libertad.


Por tanto, para comprobar las hiptesis del contraste
I

H0 :

ai i = 0
i=1

(3.44)
I

H1 :

ai i = 0 ,
i=1

basta comparar la suma de cuadrados asociada al contraste con el cuadrado medio del
2 es el estadstico de contraste que, bajo la hiptesis
error. Entonces, el cociente SSC/SR
nula, sigue una distribucin F1,NI .
A continuacin vamos a realizar las sumas de cuadrados asociadas a los contrastes para
el ejemplo de referencia. Supongamos que efectuamos los contrastes ortogonales expuestos

28

Comparaciones mltiples

en la Tabla 2-1. Dichos contrastes junto con sus estimaciones puntuales y su suma de
cuadrados asociada se muestran en la siguiente tabla
Tabla 2-2
Hiptesis
Estimaciones
H0 : 1 = 3
C1 = 2
H0 : 1 + 3 = 4 + 5
C2 = 6
H0 : 4 = 5
C3 = 2
H0 : 42 = 1 + 3 + 4 + 5 C4 = 38

S.Cuadrados
SSC1 = 10,89
SSC2 = 45,97
SSC3 = 9,61
SSC4 = 362,35

Donde
C1 = (1)(
y1. ) + (1)(
y3. ) = 50 48 = 2
C2 = (1)(
y1. + y3. ) + (1)(
y4. + y5. ) = (50 + 48) + (47 + 45) = 6
C3 = (1)(
y4. ) + (1)(
y5. ) = 47 45 = 2

y1. + y3. + y4. + y5. ) + 4(1)


y2. = 50 48 47 45 + 4(57) = 38
C4 = (1)(
SSC1 =

SSC2 =
(1)2

(6)2
1 1
+
+ (1)2
6 5

SSC3 =

SSC4 =
(1)2

(2)2
= 10,89
12 (1)2
+
6
5
1 1
+
4 6

= 45,97

(2)2
= 9,61
12 (1)2
+
4
6

(38)2
1 1 1 1
+ + +
6 5 4 6

(4)2
+
5

= 362,35

3.2 Comparaciones mltiples de medias

29

Teniendo en cuenta que el valor de la varianza residual es 4.67, con 21 grados de


libertad, obtenemos los siguientes valores para los estadsticos de contraste F (C1 ), F (C2 ),
F (C3 ) y F (C4 ),
SSC1
10,89
= 2,33
F (C1 )(exp) =
=
2
4,67
SR
F (C2 )(exp) =

F (C3 )(exp) =

F (C4 )(exp) =

SSC2
2
SR

SSC3
2
SR

SSC4
2
SR

45,97
= 9,84
4,67

9,61
= 2,05
4,67

362,35
= 77,59 .
4,67

Si realizamos el contraste al nivel de signicacin del 5 % y puesto que F0,05;1,21 = 4,32, se


concluye que 1 = 3 , 4 = 5 y en los otros dos contrastes se rechaza la hiptesis nula.
Generalmente las sumas de cuadrados de los contrastes y las pruebas correspondientes
se incorporan a la Tabla ANOVA, de la siguiente forma:
Tabla 2-3.
F. V.
S.C.
Entre grupos
439.88
C1 : 1 = 3
10.89
C2 : 1 + 3 = 4 + 5
45.97
C3 : 4 = 5
9.61
C4 : 42 = 1 + 3 + 4 + 5 362.35
Interna
98.00
TOTAL
537.88

G.L.
4
1
1
1
1
21
25

M. C.
109.97
10.89
45.97
9.61
362.35
4.67

Fexp
23.56
2.33
9.84
2.05
77.59

F
2.84
4.32
4.32
4.32
4.32

Comentarios sobre el nivel de signicacin


Cuando se realizan comparaciones mltiples una cuestin importante es la eleccin
del nivel de signicacin de los tests o el nivel de conanza para la estimacin por intervalos. Puesto que varios tests o varias estimaciones por intervalos se hacen sobre el mismo
conjunto de datos, es necesario distinguir entre dos probabilidades de error. Describimos
esas tasas de error de Tipo I para contrastes de hiptesis, pero igualmente se hara para
intervalos de conanza.
Tasa de error individual o para una pareja, , es la probabilidad de rechazar errneamente la hiptesis nula de una nica comparacin entre una pareja de efectos

30

Comparaciones mltiples

o medias. Esencialmente indica el nivel de signicacin asociado a un solo test estadstico de la forma,
H0 : i = j
(3.45)
H1 : i = j .
Tasa de error global o del experimento, , es la probabilidad de rechazar errneamente por lo menos una hiptesis nula al realizar las I 1 comparaciones independientes relativas a I medias sobre el mismo conjunto de datos. Esta tasa de error
puede ser mucho mayor que la tasa de error individual.
Ambas tasas de error estn relacionadas por las siguientes expresiones
= 1 (1 )I1 ,

(3.46)

= 1 (1 )1/(I1) .

(3.47)

Estas frmulas no son estrictamente vlidas cuando hay implicados contrastes noortogonales. En estas situaciones, sin embargo, pueden utilizarse dichas ecuaciones obtenindose resultados aproximados. En tales casos, la tasa global puede ser mayor que la indicada
por la ecuacin (3.46).
Para la ilustracin numrica, tomemos como nivel de signicacin individual 0.05 y
como valor de I, 5. Si las 5 medias poblacionales son iguales, la probabilidad de rechazar
incorrectamente una o ms de las 4 comparaciones ortogonales es = 1 (1 0,05)4 =
0,1854. Es decir, la tasa de error global es casi 4 veces mayor que la tasa individual.
Por otra parte, si tomamos igual a 0.05, entonces = 1 (1 0,05)0,25 = 0,01274.
Observamos que una tasa de error del experimento igual a 0.05 es mucho ms exigente
que una tasa de error individual de 0.05.
Aunque el experimentador se interesa en controlar todas las tasas de error y niveles
de conanza, es importante subrayar que el objetivo principal de los procedimientos de
comparaciones mltiples es informarse lo ms posible sobre las poblaciones, procesos o
fenmenos que intervienen en el experimento. Fijar unas tasas de error pequeas no es
el nico propsito de un experimento, es slamente una medida del grado de exigencia o
rigor de la metodologa estadstica empleada.
En muchos experimentos el investigador no sabe a priori los contrastes que le interesa
realizar, siendo despus de un anlisis preliminar de los datos cuando se descubren las
comparaciones de inters.

3.2.5.

Mtodo de Sche para comparaciones mltiples

Sche (1953) propuso un mtodo para realizar cualquier contraste entre medias
de tratamientos. Dicho procedimiento no requiere que el modelo sea equilibrado.

3.2 Comparaciones mltiples de medias

31

Sea una familia de contrastes de la forma


C=

ai i ,

(3.48)

el objetivo de este procedimiento es decidir, para cada uno de estos contrastes, entre las
hiptesis
H0 : C = 0
(3.49)
H1 : C = 0 .
El mtodo de Sche est basado en la construccin de intervalos de conanza para
todos los posibles contrastes de la forma (3.49). Estos intervalos tienen un nivel de conanza simultneo 1 , es decir, la probabilidad de que todos los intervalos sean correctos
simultneamente es igual a 1 . Sche demostr que dichos intervalos de conanza
tienen la siguiente expresin
C S{C} (I 1)F;I1,NI ,

(3.50)

donde las cantidades que intervienen son:


C es el estimador insesgado de C.
S{C} es el estimador de la desviacin tpica del contraste
I

S{C} =

2
SR
i=1

a2i
,
ni

(3.51)

2 la varianza residual con N I grados de libertad.


siendo SR

Por consiguiente, se rechaza la hiptesis H0 sobre un contraste C si el intervalo de


conanza para C
C S{C} (I 1)F;I1,NI , C + S{C} (I 1)F;I1,NI

(3.52)

no incluye al cero, es decir, si


| C |> S{C} (I 1)F;I1,NI .

(3.53)

32

Comparaciones mltiples

Para ilustrar el procedimiento, consideramos el ejemplo de referencia y suponemos que


los contrastes de inters son
C2 = 1 + 3 4 5
y
C3 = 4 5
Las estimaciones numricas de estos contrastes son
C2 = y1. + y3. y4. y5. = 50 + 48 47 45 = 6
C3 = y4. y5. = 47 45 = 2
y sus errores tpicos, determinados usando la ecuacin (3.51), son
5

S{C2 } =

2
SR
i=1

a2i
=
ni

4,67

1 1 1 1
+ + +
6 5 4 6

= 1,912

y
5

S{C3 } =

2
SR
i=1

a2i
=
ni

4,67

1 1
+
4 6

= 1,394 .

Por lo tanto, los intervalos de conanza son, respectivamente


I2 =

C2 S{C2 } (I 1)F0,05;I1,NI , C2 + S{C2 } (I 1)F0,05;I1,NI =


6 1,912 4F0,05;4,21 , 6 + 1,912 4F0,05;4,21 = (0,44 , 12,44) .

I3 =

C3 S{C3 } (I 1)F0,05;I1,NI , C3 + S{C3 } (I 1)F0,05;I1,NI =


2 1,394 4F0,05;4,21 , 2 + 1,394 4F0,05;4,21 = (2,69 , 6,69) .

Puesto que los intervalos I2 e I3 contienen al 0, se concluye que tanto C2 = 1 + 3


4 5 , como C3 = 4 5 no son signicativamente distintos de cero. En otras palabras,
existe evidencia para concluir, por una parte que las medias de los tratamientos uno y
tres, tomadas como grupo, no dieren signicativamente de las medias de los tratamientos
cuatro y cinco, tambin tomadas como grupo y por otra parte que no existe diferencia
signicativa entre los tratamientos cuatro y cinco.

3.3 Comparaciones entre los mtodos

3.3.

33

Comparaciones entre los mtodos

En diversos textos se encuentran comentarios sobre las comparaciones entre los


distintos mtodos; entre otras referencias, se recomienda consultar Neter at al. (1990) y
Mason at al. (1989). A continuacin, presentamos aqu un resumen de ambos estudios.
Cuando slo se hacen comparaciones por parejas, el mtodo de Tukey conduce a
lmites de conanza ms estrechos que el mtodo de Sche, por lo cual el mtodo
de Tukey encontrar ms diferencias signicativas, siendo en este caso el mtodo
preferido. En cambio cuando los contrastes son ms complicados que la diferencia
de medias, es el mtodo de Sche el que tiene lmites de conanza ms estrechos.
El mtodo de Bonferroni es preferido al de Sche cuando el nmero de contrastes
es igual o menor que el nmero de niveles del factor.
Cuando el nmero de comparaciones por parejas es muy grande no se debe utilizar
el mtodo de Bonferroni, ya que el nivel de signicacin de cada comparacin puede
llegar a ser demasiado pequeo para considerarse de utilidad. En estas situaciones
los tests de rangos mltiples como Tukey, Newman-Keuls y Duncan ofrecen una
solucin de compromiso entre la tasa de error global deseada y una tasa de error
individual demasiado pequea y por tanto inaceptable. Estos mtodos son preferidos
en el sentido de producir intervalos de conanza ms estrechos.
El mtodo LSD de Fisher es el que proporciona ms diferencias signicativas; a
continuacin, le siguen los mtodos de Duncan y Tukey. Eligiremos uno u otro dependiendo del riesgo que estemos dispuestos a correr al aceptar ms o menos diferencias signicativas. Es decir, a aceptar como signicativas diferencias que no lo sean
(situacin no conservadora), o a aceptar menos diferencias signicativas de las que
realmente existan (situacin conservadora). Cramer y Swanson (1973), realizaron
estudios de simulacin por el mtodo de Montecarlo de los que concluyeron que el
procedimiento LSD es una prueba muy eciente para detectar diferencias verdaderas
entre las medias si se aplica despus que la prueba F del anlisis de la varianza result signicativa al 5 %. Tambin concluyeron que el procedimiento de intervalos
mltiples de Duncan es un buen mtodo para detectar diferencias reales.
El procedimiento de Tukey tiene un error tipo I menor que los correspondientes
errores de los tests de Newman-Keuls y de Duncan; es decir, es un test ms conservador. En consecuencia, el procedimiento de Tukey tiene menos potencia que los
procedimientos de Newman-Keuls o de Duncan.
Si se desea controlar la tasa de error individual, los mtodos LSD de Fisher y de
Duncan resultan apropiados. Facilitan ms proteccin de los errores de Tipo I que

34

Comparaciones mltiples

los otros mtodos y son menos conservadores que los procedimientos basados en la
eleccin de la tasa de global.
Si se desea controlar la tasa de error global, los mtodos ms tiles incluyen el test
de Bonferroni y procedimiento de Tukey. Ambas tcnicas tienen fuertes defensores.
El test de Bonferroni tiene la ventaja de utilizar un estadstico t, siendo su principal
desventaja, cuando se realizan un gran nmero de comparaciones, que el nivel de
signicacin individual se hace demasiado pequeo.
Existen otros procedimientos para hacer comparaciones mltiples. Algunos de ellos
estn designados para casos especiales, tales como para comparar tratamientos experimentales con un tratamiento control.

3.4.

Comparaciones de tratamientos con un Control

Estamos ante el caso de un experimento en el que uno de los tratamientos es un


control y el experimentador puede estar interesado en comparar los restantes tratamientos
con este control. Por tanto, slo deben realizarse I 1 comparaciones. Un procedimiento
que realiza dichas comparaciones fu desarrollado por Dunnett (1964).
Supongamos que el control es el tratamiento I. Entonces se desean probar las hiptesis
H0 : i = I
H1 : i = I

(3.54)

i = 1, 2, , I 1 .

El procedimiento de Dunnett es una modicacin de la prueba t. Para cada hiptesis


se calculan las diferencias que se observan entre las medias muestrales
| yi. yI. |

i = 1, 2, , I 1 .

La pareja de medias i y I se consideran diferentes, a un nivel de signicacin conjunto


asociado a las I 1 comparaciones, si
| yi. yI. |> d;I1,NI

2
SR

1
1
+
ni nI

(3.55)

en donde la cantidad d;I1,NI se obtiene a partir de la Tabla VIII del Apndice C.


Para ilustrar la prueba de Dunnett, consideramos el ejemplo de referencia y aunque en
el desarrollo terico hemos dicho que el control es el ltimo tratamiento, la posicin que

3.4 Comparaciones de tratamientos con un Control

35

ocupe el control es arbitraria, por ello, en este ejemplo vamos a considerar que es la primera
posicin, el tratamiento 1. En dicho ejemplo, I=5, =21 y para un nivel de signicacin
del 5 % el valor de d0,05;4,21 es 2.64. Por tanto, las diferencias crticas y observadas son,
respectivamente,
2 vs 1 : d0,05;4,21

4,67

1 1
+
5 6

= 3,454

| y2. y1. |= 7

3 vs 1 : d0,05;4,21

4,67

1 1
+
5 6

= 3,454

| y3. y1. |= 2

4 vs 1 : d0,05;4,21

4,67

1 1
+
4 6

= 3,682

| y4. y1. |= 3

5 vs 1 : d0,05;4,16

4,67

1 1
+
6 6

= 3,293

| y5. y1. |= 5

Observamos que las parejas de medias 2 vs 1 y 5 vs 1 resultan signicativamente


diferentes.
Al comparar tratamientos con un control es conveniente tomar ms observaciones para
el tratamiento de control que para los otros tratamientos. Como norma general, se debe
vericar que la razn nI /ni sea aproximadamente igual a la raz cuadrada del nmero
total de tratamientos. Es decir,

nI
I .
ni

Bibliografa utilizada
Garca Leal, J. & Lara Porras, A.M. (1998). Diseo Estadstico de Experimentos.
Anlisis de la Varianza. Grupo Editorial Universitario.
Lara Porras, A.M. (2000). Diseo Estadstico de Experimentos, Anlisis de la Varianza y Temas Relacionados: Tratamiento Informtico mediante SPSS Proyecto Sur
de Ediciones.

Você também pode gostar