Análisis de Varianza20131

97
CAPÍTULO VIII ANÁLISIS DE VARIANZA
VIII.1. INTRODUCCION
Una forma simple de abordar el Análisis de la Varianza (ANOVA o ANDEVA) sería, como
un procedimiento para comprobar si dos o más medias muestrales pueden haberse obtenido
de poblaciones con una misma media paramétrica respecto de una variable dada.
Toda vez que se demuestra que dos o más medias son diferentes, debemos suponer que
proceden de poblaciones diferentes.
Para comprobar si existen diferencias significativas entre las medias para el caso de dos
muestras se utiliza para la comparación tradicionalmente la distribución t de Student o en el
caso de conocerse las varianzas de las poblaciones que se comparan, la distribución
normal,. Sin embargo la importancia del ANOVA, es que es un método más general que
permite comparar las medias de dos o más muestras.
El ANOVA se podría definir también como una técnica en la que la varianza total de un
conjunto de datos se divide en componentes asociados a una fuente específica de variación,
estimando la magnitud con la que contribuye cada una de esas fuentes a la variación total.
Dicho en otros términos, consiste esencialmente en descomponer la "varianza total" de un
conjunto de observaciones de una variable X, en "varianzas parciales" correspondientes a
fuentes de variación distintas y determinadas, las que luego se comparan entre sí por medio
de una prueba estadística llamada prueba F de Fisher.
En función de lo anterior diremos que el ANOVA se utiliza para dos propósitos: 1) estimar
y probar hipótesis respecto a varianzas poblacionales y 2) estimar y probar hipótesis
respecto a las medias poblacionales.
Para utilizar correctamente el ANOVA como una herramienta de la inferencia estadística es

necesario satisfacer un conjunto de suposiciones fundamentales. Aunque no se puede
esperar que los datos experimentales satisfagan todas las suposiciones a la perfección, es
importante al utilizar este procedimiento, poder discernir que grados de desviación son
aceptables y ser capaz de reconocer cuando estas suposiciones no son plenamente
satisfechas.
Para comprender la esencia del ANOVA es necesario realizar algunas precisiones respecto
de algunos términos y conceptos.
Sea el caso de una variable X (variable dependiente), que deseamos estudiar y sobre la que
presumiblemente influyen una serie de causas definidas o identificables y otras que son
imposibles de precisar o debidas al azar. La variable X, será nuestra variable respuesta o
variable dependiente, y denominaremos factor a cada una de las causas asignables que
pueden incidir sobre ella, constituyendo estas las variables independientes cuya influencia
se pretende evaluar. Consideremos también que cada una de las causas identificables o
98
factores que influyen sobre la variable X, no lo hacen de manera constante, sino que pueden
asumir distintas alternativas o categorías que constituyen los niveles del factor.
Si sobre la variable X incide un solo factor, al análisis de varianza que estudia la variación
de X, se llama ANOVA de un factor o unifactorial y a sus diferentes alternativas, niveles o
tratamientos; si inciden dos factores lo llamaremos ANOVA con dos factores y así
sucesivamente.
A modo de resumen diremos que dadas una variable dependiente cuantitativa y una variable
independiente o factor, el análisis de varianza de un factor, consiste en analizar el
comportamiento de la variable dependiente en las K subpoblaciones o grupos establecidos
en función de los valores de la variable independiente.
En esta primera parte consideraremos el caso particular del ANOVA de clasificación única,
de una vía o ANOVA de un factor.
VIII.2. DISTRIBUCIÓN F
Consideremos el caso de una variable X N( ,  2 ) .De esta población extraemos dos
muestras de tamaño n1 y n2 y calculamos las respectivas varianzas muestrales s21 y s22 y el
cociente
Fs = s21 / s22 (75)
Este cociente será cercano a 1, porque s21 y s22 son estimaciones de una misma varianza
paramétrica  2.
Si tomáramos repetidas muestras de tamaños n1 y n2 y calculáramos los cocientes Fs,

obtendríamos un estadístico o estadígrafo que sigue una distribución F. La forma de esta
distribución está determinada por los valores de n1 y n2 y más precisamente por los grados
de libertad asociados a las muestras 1 y 2 ,es decir 1y 2 iguales a (n1-1) y (n2-1)
respectivamente.
La distribución F, se utiliza para comprobar la siguiente hipótesis nula
Ho) ,  2 1 =  2 2
Es decir, si dos varianzas muestrales s21 y s22 han sido obtenidas de la misma población con
varianza paramétrica 2 .
La hipótesis alternativa podría ser:
Ha) 2 1  2 2 o Ha) 2 1  2 2 o 2 1  2 2
Que plantea un test de F a dos cola y a una cola respectivamente.
El valor de Fs calculado a partir de la expresión (75) se compara con un valor de Tabla

F(1,2) donde  es la probabilidad de error de tipo I y 1,2 son los grados de libertad de
99
las varianzas que se encuentran en el numerador y en el denominador respectivamente. El

valor de F(1,2) que se obtiene de una tabla de distribución F, determinan las áreas de
rechazo y aceptación de Ho.
Algunas veces, es necesario obtener valores de F para  0,5.dado que estos valores raras
veces están tabulados, deben ser obtenidas mediante la relación:
F(1,2) = 1/ F (1- )(2,1)
La aceptación de la hipótesis nula de igualdad de las varianzas es un requisito previo para

algunos tests donde se trata de decidir si las medias de 2 muestras proceden de una misma
población.
Esto es, muchas veces, estamos interesados en conocer de dos sistemas experimentales en
cual de ellos la lectura de una cierta magnitud es más variable, o cual de dos procesos o
métodos introduce mayor variabilidad en la magnitud medida.
VIII.3. ANÁLISIS DE VARIANZA DE UN FACTOR
Supongamos que se dispone de muestras de I subpoblaciones, establecidas por los I valores de una
variable independiente o factor Y, y que, sobre cada individuo o elemento de la muestra, se mide
una variable en escala de intervalo o de razón X, tal que su distribución en cada una de las
subpoblaciones es normal y con la misma varianza en todas ellas.
El análisis de la varianza con un factor, se utiliza para contrastar la hipótesis nula de que las medias
de las muestras que proceden de las I subpoblaciones para la variable respuesta X, es la misma:
Ho)  1 =  2 =  3 =.......... =  i (76)
El análisis de la varianza se basa en que la variabilidad total existente en los datos puede
descomponerse en una parte debida al efecto del factor investigado (variabilidad debida a
las diferencias entre las medias de los grupos) y otra parte residual que recoge el efecto de
todos los factores no controlados (variabilidad debida a las diferencias dentro de los
grupos).
La tabla de ANOVA se construye a partir de esta descomposición y proporciona el

estadístico Fs que permite contrastar la hipótesis nula de igualdad de medias en los grupos,
cuya aceptación implicaría la no influencia de factor analizado. Dicho estadístico compara
la variabilidad debida a las diferencias entre grupos con la debida a las diferencias dentro
de los grupos. En consecuencia, cuanto mayor sea el valor del estadístico Fs, mayor será la
influencia de factor en consideración y mayor la diferencia entre las medias de los grupos.
Si el p-valor asociado al estadístico Fs es menor que , se rechazará la hipótesis al nivel de
significación .
100
VIII.3.1.Partición de la Suma Total de Cuadrados y de los Grados de Libertad
Recordemos que la varianza es una medida de la dispersión de los valores de las

observaciones y que se obtiene dividiendo la “suma de cuadrados” por el “número de
grados de libertad”.
Atendiendo a que las varianzas no gozan de propiedades aditivas, es decir, no pueden

combinarse por suma ni descomponerse por sustracción, pero sí las “suma de cuadrados” y
los “grados de libertad” asociados, la técnica de Análisis de Varianza se basa esencialmente
en la descomposición de las sumas de cuadrados y de los grados de libertad asociado a la
varianza total , que se calcula para la totalidad de los datos sin considerar los distintos
grupos o muestras
Como se señalara en la introducción, el ANOVA proporciona una forma de dividir la

variación total de la variable medida en dos partes las cuales pueden ser expresadas como
sigue para una observación cualquiera Xi
( Xi-X) = (Xi-Xi ) + ( Xi - X) (77)
El término de la izquierda representa la diferencia entre una observación cualquiera y la

media general X, calculada considerando la totalidad de las observaciones. El primer
término de la derecha representa la diferencia entre el valor de la observación y la media
del grupo y el segundo término la diferencia entre la media del grupo y la media general.
Elevando al cuadrado cada uno de los términos, y generalizando la expresión a la totalidad

de las observaciones, la expresión anterior puede ser escrita como
 ( Xi-X)2 = (Xi-Xi )2 + ni ( Xi - X)2 ( 78)
donde ni el número de observaciones en el i-esimo grupo.
Es decir, la variación total queda expresada como la suma de dos fuentes de variación : 1)
la variación dentro de los grupos expresado como las diferencias de cada observación y
la media de su grupo y 2) la variación entre grupos, representada por la diferencia entre
cada una de las medias de los grupos y la media general .
Si las medias de los grupos son muy diferentes entre sí, habrá una variación considerable
entre estas y la media general comparada con la variación dentro de cada uno los grupos.
En cambio, si las medias de los grupos no difieren entre sí, la variación entre estas y la
media general no será mucho mayor que la variación de cada observación respecto a la
media de su grupo.
101
Como las varianzas no son aditivas, para descomponer la variación total, en cada una de
las fuentes de variación antes mencionadas, se procede a descomponer la "suma de
cuadrados" y "los grados de libertad" total en las "sumas de cuadrados" y los "grados de
libertad" entre los grupos y dentro de los grupos respectivamente.
Para comprender el cálculo y el significado de esta descomposición analicemos el siguiente

ejemplo:
Tanto las aguas superficiales como subterráneas en la Provincia de Misiones presentan

niveles muy aceptables de calidad, en todos los parámetros, con excepción de Fe, para el
cual las concentraciones obtenidas superan en un porcentaje importante de las muestras el
valor de 0.3 mg/l fijado por las normas para el agua de bebida.
Los resultados que se presentan a continuación corresponden a un relevamiento de la
calidad de las aguas de los pozos domiciliarios (freáticos) realizado por la COMIP
(Comisión Mixta Argentino-Paraguaya del Río Paraná) entre Abril y Mayo de 1986 y que
abarcó 8 localidades del centro-sur de la Provincia de Misiones.
La evaluación de este tipo de información es importante en virtud de que la cobertura de
agua potable en la provincia , según datos del año 1994 es solo del orden del 54 %.El resto
de la población urbana de barrios marginales y los asentamientos rurales que no cuentan
con el servicio, se abastecen mayoritariamente por medio de pozos excavados, cuyas
profundidades varían entre 6 y 15 m. Dichos pozos, en las áreas urbanas se encuentran
invariablemente sujetos a contaminación microbiológica, provocada por su proximidad a
pozos absorbentes, a los que debe agregarse según los resultados obtenidos en esta
evaluación, concentraciones de Fe total que superan los límites establecidos para el agua de
bebida.
En el Cuadro VIII.1 se presentan los datos obtenidos en el relevamiento, y la respuesta
que se quiere obtener es si existen diferencias entre los valores medios de las
concentraciones de Fe Total (mg/l) de las cuatro localidades seleccionadas.1
Cuadro VIII.1. Relevamiento de Calidad de Aguas de Pozos Excavados (Zona Centro-Sur)

Provincia de Misiones (Período Abril - Mayo de 1986)
Localidad
Candelaria Santa Ana San Ignacio Corpus
0.23 0.125 0.075 0.42
0.05 0.025 0.23 0.011
1.58 3.56 0.025 0.037
0.25 0.063 1.58 0.125
1.48 0.025 0.85 0.050
0.075 1.00 0.28 1.62
0.22 0.15 0.76 0.081
1.00 2.80 0.15
1
Piris da Motta M- Hierro y Manganeso en Aguas Superficiales y Subterránea en la Provincia de
Misiones- Taller Internacional sobre Hierro y Manganeso- Buenos Aires 6 y 7 de Noviembre de 1997
102
0.025 3.02 0.62

0.025 0.025 0.050
3.00 0.125 0.081
0.15
Candelaria Santa Ana San Ignacio Corpus

X 0.67 0.99 0.43 0.33
X 8.09 10.92 4.70 2.34
 X2 14.88 30.69 4.35 2.83
N 12 11 11 7
La comparación entre estas cuatro series de mediciones se hace ensayando la hipótesis nula,
de que las mismas fueron obtenidas de una población única.
Veamos como se efectúa la descomposición de la suma de cuadrados y los grados de

libertad .
Variabilidad Total:
Para el cálculo de esta "varianza" necesitamos la "suma de cuadrados" y el "número de

grados de libertad" correspondiente
La suma de cuadrados de las desviaciones de cada una de las observaciones respecto a la

media general, puede obtenerse mediante la siguiente expresión
SS total =  X2 - TC (79)
Siendo
1- X2 = Suma del cuadrado de los valores de las observaciones
Este valor se calcula sumando los resultados que se presentan en la tercera fila del Cuadro
Esto es  X2 =14,88 + 30.69 + 4.35 + 2.83 = 52.75
2-TC = suma de las observaciones o "Gran Total" al cuadrado dividido por el número total
de observaciones
TC = (8,09 + 10,92 + 4,70 + 2,34)2 / 41 = (26,05)2 / 41 = 16,55
Obteniéndose para la suma de cuadrado total el siguiente valor
SS total = 52,75 - 16,55 = 36,20
El número total de mediciones es 41 y por lo tanto el número de grados de libertad

correspondiente es N-1= 40
103
Variabilidad entre grupos o explicada:
Para aislar al estado puro la variación entre los grupos necesitamos suprimir la variación
dentro de los grupos, es decir entre los valores de las observaciones que constituyen un
mismo grupo. Podemos obtener este resultado simplemente, haciendo a todas las
observaciones de un mismo grupo iguales entre sí e iguales a la media del grupo. Mediante
esta operación, la variación entre los grupos no se modifica, puesto que los totales y las
medias de grupos permanecen invariables, mientras que la variación dentro del grupo queda
anulada.
La suma de cuadrados correspondiente se obtiene sumando los totales de grupo elevando al

cuadrado y dividiendo por el número de observaciones en cada uno de los grupos y
sustrayendo a esta cantidad el término de corrección.
SS entre grupos =  [( Tg)2 / ng ] - TC (80)
Esto es
SS entre grupos = [ (8.09)2 / 12] +[ (10.92)2 / 11] + [ (4.70)2 / 11] + [ (2.34)2 / 7] - TC
= (5.45+ 10.84+ 2.01+ 0.78) - TC = 18.72 - 16.55 = 2.17
El número de grados de libertad para el caso de a grupos será = a-1 , es decir igual a 3 para
el ejemplo que estamos considerando.
Variabilidad dentro de los grupos o no explicada:
La variación dentro de cada grupo se debe a las desviaciones que presentan los valores de
las observaciones respecto a la media del grupo. La suma de cuadrados dentro de cada
grupo es la suma del cuadrado de las desviaciones mencionadas anteriormente, y en número
de grados de libertad para cada grupo es igual al número de observaciones menos uno (ng-
1). La varianza dentro de cada grupo se calcula dividiendo la suma de cuadrados por el
número de grados de libertad correspondiente. Mediante este procedimiento se obtienen
tantas estimaciones de la varianza dentro de los grupos como grupos haya. Como
plateamos la hipótesis de que las muestras provienen de la misma población, las cuatro
estimaciones de la varianza que podríamos calcular para nuestro ejemplo, son en realidad
cuatro estimaciones de una misma varianza, y pueden combinarse para obtener una
estimación basada en el conjunto de las observaciones. Esta combinación se hace
basándose en las propiedades aditivas de las sumas de cuadrados y de los grados de
libertad.
104
La suma de cuadrados dentro de los grupos se calcula por diferencia entre la SS total y la
SS entre grupos. Esto es, como la diferencia entre la suma de los cuadrados de las
observaciones y los totales de grupos al cuadrado dividido por el número de observaciones
en el grupo.
SS dentro de grupos =  X2 -  [( Tg)2 / ng ] (81)
El valor correspondiente al ejemplo será
SS dentro = 52.75 - 18.72 = 34.03
Siendo 37 el número de grados de libertad dentro de los grupos.
Los resultados obtenidos se resumen en el siguiente Cuadro VIII.2
En el se presenta el cuadro de análisis de varianza bajo la forma generalmente adoptada.
La primera columna indica las fuentes de variación analizadas. La presentación de esta

columna varía según la estructura de la investigación. Por ejemplo, si los distintos grupos
corresponden a diferentes tratamientos, la primera línea podría titularse "Tratamientos", si
se trata de diferentes métodos, se podrá indicar "Métodos" y así sucesivamente.
La variación dentro de los grupos se denomina frecuentemente "Error", término que en

estadística no tiene el significado corriente, esto es, no quiere decir que se haya cometido
un error, significa "variaciones debidas a factores no controlados".
Cuadro VIII.2.
Fuente de variación Grados de libertad Suma de Cuadrados Cuadrados Medios Fs

G.L. SS MS
Entre Grupos(Entre 3 2.17 0.72 0.78 (ns)

Localidades)
Dentro de grupos 37 34.03 0.92

(error)
Total 40 36.20
En el análisis que hemos efectuado, las fuentes de variación que influyen en los valores de
las concentraciones de Fe las hemos separado en dos partes. Una de ella constituida por un
factor que fue controlado por el investigador y que se identifica con de denominación
"Localidades", la otra que constituye el resto, es decir, el conjunto de todos los factores no
controlados, y es lo que se ha denominado error.
105
La cuarta columna indica los cuadrados medios MS (o varianzas) 2, para las diferentes
fuentes de variación. Se calculan dividiendo las sumas de cuadrados (columna 3) por los
grados de libertad correspondientes (columna 2) .
VIII.3.2.Prueba de Significación
El mismo nos permite aceptar o rechazar la hipótesis nula, y de este modo comprobar si
existe efecto del factor analizado, esto es, si las cuatro media puede considerarse
muestreados aleatoriamente de la misma población o si los tratamientos a los que han sido
sometidos cada grupo han dado como resultado cambios en las medias, de modo tal que las
muestras no pueden considerarse proveniente de una misma población.
Si esto es así, habrá un componente añadido debido al efecto del factor o y podrá ser
detectado por la prueba de F en el test de significación del ANOVA.
Cuando el ANOVA, se ocupa de efectos de tratamientos como el del ejemplo que acabamos
de analizar, en el que las localidades fueron seleccionadas por el investigador, estamos en
presencia de un Modelo I de ANOVA o modelo de efecto fijo, para diferenciarlo del
Modelo II en el cual los efectos añadidos para cada grupo no son tratamientos fijos, sino
efectos aleatorios. Este sería el modelo en el caso en que las cuatro localidades hubieran
sido obtenidas aleatoriamente entre varias localidades posibles.
La principal diferencia entre ambos modelos, es que en el Modelo II, se consideran efectos
aleatorios en cada grupo, y que estos no están bajo el control de investigador, y por lo tanto
son irrepetibles. Dado que los efectos son aleatorios, no es preciso calcular la magnitud de
los mismos para cualquiera de los grupos o la diferencia entre un grupo y otro. En este caso
el propósito del análisis es calcular la componente añadida de la varianza entre grupos,
comprobar su presencia y calcular su magnitud, así como su % de contribución a la
variación de los valores de las observaciones y respecto a los otros niveles de réplicas.
Volviendo a la prueba de significación, si la hipótesis nula fuera verdadera, es decir que las
cuatro muestras provienen de la misma población, el cuadrado medio "entre grupos" y el
cuadrado medio "dentro de los grupos" serían dos estimaciones de la misma varianza
paramétrica, de modo que al calcular el cociente
Fs = MS "entre grupos"/ MS "dentro de grupos" = 0.72/0.92= 0.78
2
En realidad son "cuadrado medio" y no varianzas, los valores obtenidos, atendiendo al hecho que el
"cuadrado medio" de un rubro del ANOVA esta compuesto y contiene, además de la varianza correspondiente
a ese rubro, elementos de las varianzas de otros rubros.
106
Su valor sería próximo a la unidad y en la práctica suficientemente pequeño si se lo

comparada con el valor crítico obtenido como F (1,2), donde  es el nivel de significación
de la prueba, normalmente igual a 0.05 o 0.01 y 1 y 2 son los grados de libertad del
numerador y del denominador respectivamente.
Para nuestro ejemplo, el valor de Fs calculado es menor que la unidad y menor que el
valor critico F 0.05(3,37) = 2.8588, y por lo tanto no existen evidencias para rechazar la Ho y la
conclusión es que las cuatro localidades no presentan diferencias estadísticamente
significativas en los valores medios de las concentraciones de Fe total en las aguas de los
pozos excavados utilizados como fuente de suministro.
A continuación se muestra la estadística descriptiva y el Cuadro del Análisis de Varianza

correspondiente al ejemplo analizado, obtenido utilizando el paquete estadístico STATA .
Cuadro VIII.3.
Lugar | Mean Std. Dev. Freq.
+
Candelaria | .67375001 .92614579 12
Corpus | .33485714 .58339107 7
San Ignacio | .42736364 .4838362 11
Santa Ana | .99254544 1.409148 11
+
Total | .63531707 .95137159 41
Analysis of Variance
Source SS df MS F Prob > F

Between groups 2.52908239 3 .843027464 0.93 0.4377
Within groups 33.675234 37 .91014146

Total 36.2043164 40 .905107911
107
Bartlett's test for equal variances: chi2(3) =11.7684 Prob>chi2 = 0.008
El ultimo resultado corresponde al test de homocedasticidad cuyo p-valor indica que no

puede aceptarse la hipótesis nula de igualdad de varianza razón por el cual las conclusiones
obtenidas en la comparación de medias deben ser tomadas con reservas, ya que no se esta
cumpliendo una de las hipótesis en el que se sustenta el ANOVA.
La no homogeneidad de las varianzas puede ser debida en este caso a la diferencia en el

numero de observaciones que tiene cada grupo.
La eficiencia o potencia del test de significación de la F, puede aumentarse:
a) reduciendo el error experimental 2, estimado a través el MS error o dentro de grupo.
Esto puede conseguirse por medio de diseños mas elaborados, que permitan el control
de algunos de los múltiples factores que influyen en el término de error.
b) Aumentando el tamaño de los tratamientos o grupos.
Esto no siempre es posible, porque aumenta el costo del experimento y su tiempo de

realización. Por otro lado, al aumentar n, suele aumentarla heterogeneidad de la
población y por lo tanto 2, con lo que, en ciertos casos, este procedimiento puede ser
no conveniente.
VIII.4. HIPÓTESIS DEL ANOVA
En el apartado anterior consideramos el caso en que los grupos que son objeto de
comparación se establecen según un único criterio de clasificación –en este caso atendiendo
a la localización- y en el que la característica o variable respuesta continua observada o
medida en cada uno de los elementos (pozos) que conforman las muestras corresponden a
la concentración de Fe total en cada uno de los pozos.
Estamos interesados en determinar, si el valor medio de la concentración de Fe es
significativamente diferente entre una localidad y otra o si las medias de los distintos
grupos son idénticos , es decir el factor de clasificación –localización- no influye y se
verifica que
Ho) 1= 2 = 3=4
Si esta hipótesis es cierta, la pertenencia a una localidad u otra es irrelevante y podemos

considerar todas las observaciones como muestras provenientes de una misma población.
108
De un modo general, el modelo I (efecto fijo) para un anova de un factor establece que el
valor de la observación j-esima , perteneciente al i-esimo grupo puede ser expresado como:
Xij =  +  i +  ij =  i +  ij (82)
Es decir, es la suma de un término constante , un término  i diferente para cada grupo

en el caso en que el efecto del factor analizado se significativo y un término ij
denominado error experimental o residuo que representa el efecto de una serie de factores
distintos no controlados, es decir es el resultado de muchos factores distintos ninguno de
los cuales es predominante.
Estas perturbaciones  ij para que el modelo sea valido deben cumplir con las siguientes
hipótesis:
1- E ( ij) = 0  i ,j
2- Var ( ji) = 2 = cte
3- E ( ji  rk) = 0  jr y ik
4-  ij  ( 0,  2 )
Estas cuatro condiciones pueden ser resumidas expresando de que las  ji deben cumplir
con la hipótesis DIIN (( 0,  2 ), esto es que las perturbaciones se distribuyen idéntica e
independientemente como variables normales de media cero y varianza constante pero
desconocida  2 .
La primera condición exige que la totalidad de las  ij tengan media 0.Para que esto ocurra
las distintas mediciones de la variable X, tienen que haberse tomado en condiciones
homogéneas.
La condición 2, exige que la perturbaciones tengan la misma variabilidad en todos los
grupos o tratamientos,- y además que esta variabilidad sea estable- y no tienda a crecer o
disminuir durante el experimento.
La condición 3 impone que las perturbaciones  ij , se produzcan de manera independiente
de una observación a otra. Esto es, que las observaciones Xij sean independientes, es decir
que el valor de una observación no este condicionada por el valor anterior y no condicione
el valor siguiente.
Esta hipótesis es difícil de probar en la práctica y uno de los objetivos del diseño
experimental es garantizar esta independencia.
La hipótesis de normalidad se justifica en virtud del Téorema Central del Límite (TCL),
en virtud que las perturbaciones no pueden preverse o asignarse a causas concretas, sino
que resultan del efecto agregado de muchos factores distintos, ninguno de los cuales es
predominante.
109
La falta de normalidad en los errores o perturbaciones tiene poca influencia en la prueba de

significación y en las comparaciones entre medias, ya que estas tendrán siempre una
distribución próxima a la normal por el TCL. Por lo tanto, los resultados de estas
comparaciones son substancialmente válidos aunque los datos no sean normales, y, en este
sentido, podemos afirmar que el ANOVA es una técnica "robusta" frente a desviaciones de
la normalidad .
Sin embargo la falta de normalidad afecta mucho la estimación de la varianza y si los datos
son marcadamente no normales tenemos que desconfiar de los intervalos de confianza para
el error experimental, calculado como
(n-1) sR2 /  2(/2)  2  (n-1) sR2 /  2(1-/2) (83)
El efecto de las varianzas desiguales en los grupos depende de la heterogeneidad entre el

número de observaciones en cada grupo.
Si todos los grupos tienen igual nº de observaciones, la prueba de significación F es
igualmente exacto, aunque las varianzas sean enormemente distintas. Sin embargo si hay
muchas diferencias entre el nº de observaciones en los grupos (Ej. la relación ni máx./nj
mín. > 2), el efecto de grandes diferencias entre las varianzas puede ser muy importante.
En resumen, podemos despreocuparnos de las varianzas a efectos de la comparación de

medias, siempre que haya aproximadamente el mismo número de observaciones en los
grupos, pero si existe un gran desequilibrio en este sentido, diferencias importantes entre
las varianzas pueden ser grave.
La no normalidad, afecta mas el test de igualdad de varianzas, que el test de F.
Finalmente, el efecto de dependencia entre las observaciones puede ser muy grave, ya que
las formulas para las varianzas de las distribuciones muestrales de las medias de los grupos
son inválidas, por lo que todos los cálculos sobre la precisión de los estimadores son
erróneos. Como se señalara anteriormente, el procedimiento mas eficaz para asegurar la
independencia de las observaciones es la aleatorización.
Si las hipótesis DIIN ( 0,  2 ) fuera correcta toda la información respecto a  1 ,  2 , 
3 ......... , i y  vendría suministrada por las medias de los tratamientos X1, X2,..., Xi
2
y SR2 =MS error.
Si se pudiera confiar en la validez de estas hipótesis, podríamos asegurar que después de

haber calculado los estadísticos anteriores no queda mas información para extraer de los
datos originales, es decir, los residuos calculados son realmente residuos.
En la práctica seria imprudente efectuar esta afirmación sin mas comprobaciones, dado que
los datos pueden contener información valiosa no recogida por el modelo matemático de
un factor y requiera la consideración e inclusión de otro u otros factores .
110
La comprobación de estos supuestos se puede realizar analizado los residuos  ji que se

calculan como la diferencia entre cada observación y la media del grupo o tratamiento al
cual pertenece.
:
 ij = Xij - Xi (84)
VIII..4.1. Comprobación de las Hipótesis: Análisis de los residuos
Se pueden descubrir discrepancias de muchas clases estudiando los residuos por medio de
gráficos adecuados.
Si las hipótesis del modelo son ciertas, se debería comprobar que los residuos varían
aleatoriamente, es decir que no existe ningún patrón sistemático, debiéndose sospechar del
modelo propuesto en caso contrario.
La importancia práctica de las técnicas gráficas de análisis de los residuos para detectar
anomalías en los datos que pueden comprometer seriamente la validez del modelo, y que
constituye un requisito imprescindible previo a cualquier análisis estadístico se ejemplifica
sobre unos datos concretos.
Algunos de los gráficos utilizados para el análisis de los residuos son los que se indican a
continuación.
VIII.4.1.1. Gráfico de distribución de los residuos
Si la hipótesis de DIIN ( 0,  2 ) es cierta, un histograma de los residuos o simplemente un

gráfico de puntos de los mismos debe mostrar la apariencia de una distribución normal
centrada en 0.
Si el número de observaciones es muy pequeño aparecerán grandes fluctuaciones por lo que
apariencia de no normalidad no es necesariamente indicativa en ese caso de una causa
subyacente.
Este tipo de gráficos puede revelar la existencia de valores anómalos, es decir residuos
anormalmente altos o bajos, cuyas causas deben ser investigadas y que pueden
corresponder por ejemplo a errores de transcripción o aritméticos.
Cuando se presentan valores atípicos, debe buscarse la causa de tal discrepancia y no
desechar la observación hasta estar seguro que corresponde a un error de datos y no a
cambios imprevistos en las condiciones experimentales.
Si al inspeccionar los datos originales no se detecta este tipo de error, deben considerarse o
investigarse todas las circunstancias que rodean a la prueba que dio ese resultado
VIII.4.1.2. Gráficos de los residuos en función del tiempo
Este tipo de gráficos, permite identificar posibles cambios con el tiempo de las condiciones
experimentales.
111
EL análisis este tipo de gráficos puede revelar la existencia de tendencias. Su detección es

importante, dado que su presencia podría poner de manifiesto 1) la existencia de una fuente
de variación no considerada previamente y que podría controlarse en el futuro o 2) puede
conducir a que en un análisis mas preciso la tendencia temporal sea tenida en cuenta y que
no aparezca mezclada aleatoriamente en el término de error.
Cambios con el tiempo en los reactivos químicos utilizados (contaminación o deterioro) o

modificaciones en la destreza del investigador , que puede aumentar a medida que el
experimento progresa son ejemplo de tendencias que pueden descubrirse realizando un
gráfico cronológico de los residuos.
VIII.4.1.3. Gráfico de los residuos versus valor esperado
Este gráfico en el que se representa , Xij - Xi vs Xi, puede revelar si la variabilidad es
constante o no en todos los grupos.
Si el modelo matemático propuesto es adecuado, los residuos no deben estar relacionados
con el valor de la respuesta (valor medio de la variable medida), esto es, la variabilidad de
los mismos no deberá depender del nivel medio de la respuesta.
Puede suceder que la varianza de las observaciones crezca con el nivel de la respuesta, lo
cual nos estaría indicando que las muestras no son homocedásticas (no tienen igual
varianza) . En este caso los valores absolutos de los residuos tenderían a crecer a medida
que aumenta el nivel de las observaciones y el gráfico tendría forma de embudo.
VIII.4.1.4. Gráfico de residuos en función de variables de interés
Cuando se sospecha que un determinado factor (Ej. la temperatura) tiene influencia sobre la
variable respuesta y se dispone de los valores de la misma para cada una de las mediciones,
es posible representar los residuos en función de dicha variable y a partir de este gráfico
tomar la decisión si su influencia fuera importante, de ejercer un mejor control de dicha
variable en la fase siguiente del experimento o incluir dicha variable como un factor a
estudiar en un trabajo posterior.
Para comprender a cabalidad, la utilidad de los gráficos mencionados consideremos el

siguiente ejemplo.
El Cuadro VIII.4. muestra los tiempos de coagulación de la sangre extraída de 24 animales

alimentados con cuatro dietas distintas 1,2,3 y 4.
Las dietas fueron asignadas a los animales al azar y las muestras fueron extraídas en un
orden aleatorio. Estas dos condiciones facilitan el cumplimiento de la suposición de que los
datos pueden considerarse como muestras aleatorias de cuatro poblaciones normales que
poseen una misma varianza y que si difieren en algo es solo en sus medias.
La pregunta que se trata de responder es ¿hay evidencia suficiente que indique que existen
diferencias reales entre los valores medios de los tiempos de coagulación correspondientes
a las distintas dietas?
112
La hipótesis nula a contrastar es Ho)  1 =  2 =  3 = 4
Ha) algunas de las medias  i es diferente
Cuadro VIII.4
Dieta 1  ji Dieta 2  ji Dieta 3  ji Dieta 4  ji
62(20) 1 63(12) 68(16) 56(23)
60(2) -1 67(9) 66(7) 62(3)
63(11) 2 71(15) 71(1) 60(6)
59(10) -2 64(14) 67(17) 61(18)
65(4) 68(13) 63(22)
66(8) 68(21) 64(19)
63(5)
59(24)
Dieta 1 Dieta 2 Dieta 3 Dieta 4

X 61 66 68 61
X
 X2
N 4 6 6 8
1- Calcular el residuo para cada una de las observaciones

2- Obtener el Cuadro del ANOVA
3- Efectuar una análisis de los residuos utilizando los gráficos que se presentan a a
continuación y que han sido adecuados obtenidos utilizando el paquete
STATGRAPHICS Plus.
113
VIII.4.2. Ejemplo de análisis de los residuos
1- Distribución de los residuos
1.1. Histograma
Histogram for RESIDUALS

10
frequency
0
-6 -4 -2 0 2 4 6
RESIDUALS
1.2. Gráfico de puntos (univariante)
Scatterplot for RESIDUALS
-5 -3 -1 1 3 5
RESIDUALS
114
1.3. Gráfico en papel probabílistico normal
Normal Probability Plot for RESIDUALS

percentage
99.9
99
95
80
50
20
5
1
0.1
-5 -3 -1 1 3 5
RESIDUALS
2- Gráfico de residuos en función del tiempo
Residual Plot for TC

5
3
residual
-1
-3
-5
0 4 8 12 16 20 24
row number
115
3- Gráfico de residuos en función del valor esperado de la respuesta

5
3
residual
-1
-3
-5
61 63 65 67 69
predicted TC
4. Gráfico de residuos en función de los tratamientos

5
3
residual
-1
-3
-5
1 2 3 4
Dieta
VIII.5. Transformaciones para conseguir homocedasticidad
El modelo básico propuesto en la ecuación (82) establece que las observaciones en los
grupos siguen una distribución que solo difiere de un grupo a otro en el valor de la media.
En la práctica aparece con frecuencia la situación que los grupos difieren, no solamente en
la media, sino también en la varianza, es decir en la variabilidad de las observaciones.
Supongamos que el modelo correcto sea:
Xij = i x ij (86)

116
Donde las ij  N (0, ).
Este modelo producirá heterocedasticidad, ya que los grupos con í mas alta, tendrán
mayor variabilidad.
Sin embargo tomando logaritmos
Xij´ = ln Xij = ln i + ln ij = i´ + ij´
La nueva variable perturbación ij´, tendrá media 0 y varianza 2= cte. por lo que las
muestras con los valores transformados (ln Xij )serán homocedásticas.
Para detectar si es necesaria la transformación de la variable conviene:
a) estudiar la distribución de los residuos. Si es muy asimétrica convendrá transformar los

datos para convertirlos en normales
b) construir el gráfico de ij vs Xi (valor previsto)

Cuando se disponga de mas de 5 datos por grupo, convendrá calcular la desviación
típica si en cada grupo y representarlos en función de Xi .
Si existe relación entre ambas magnitudes (lineal o curvilínea), es decir que los valores
de si no tienen una distribución aleatoria convendrá transformar.
Para determinar el tipo de transformación requerida representamos el ln si vs Xi y

calculamos la pendiente  de la recta = 1- , siendo  el exponente al que hay que elevar la
variable para obtener la variable transformada. El valor de  =0, corresponderá a la
transformación logarítmica.
VIII.6. Modelo I y II
En el caso de ANOVA de un factor, se asume de manera formal que existen dos modelos
para los que se utiliza el análisis de varianza, el llamado modelo de efecto fijo de
tratamiento (modelo I) y el modelo de efecto aleatorio o modelo de componente de la
varianza (modelo II).
Si bien el sistema básico de datos, así como el cálculo y la prueba de significación, en la
mayor parte de los casos son los mismos para ambos modelos, los propósitos del análisis de
la varianza difieren para los dos modelos, así como varían algunos de los tests
suplementarios y los cálculos siguientes al test de significación inicial.
En el modelo I, se supone que las diferencias entre las medias de grupo, si existen, se
deben, se deben a efectos de tratamientos fijos determinados por el experimentador. Esto es,
siempre que los tratamiento sean fijos y repetibles, aun cuando el experimentador no
entienda y controle por completo el mismo, estaremos en presencia de un diseño que
corresponde a un modelo I.
Cualquier valor aislado puede descomponerse de la forma siguiente:
Xij =  +i +  ji (87)

117
Con i = 1,2,.....a = nº de tratamientos y siendo i el efecto fijo del tratamiento i-esimo .

El rechazo de la Ho y la aceptación de Ha, estaría indicando que algunos de los i son
diferentes en magnitud, quedando como tarea posterior determinar cuales de los i difieren
de los otros.
La estructura de variación en un modelo II de anova es completamente similar a un modelo
I, y cualquier observación puede se expresado como:
Xij =  +Ai +  ji (88)
Esta expresión difiere de la anterior, en que Ai , representa un efecto aleatorio y no fijo

como en el caso de un modelo I.
Dado que los efectos son aleatorios , no es preciso calcular la magnitud de estos efectos
aleatorios para cualquier grupo o las diferencias de un grupo a otro; centrándose la atención
en el calculo de la componente añadida de la varianza entre grupos. Comprobaremos su
presencia, calcularemos su magnitud, así como su porcentaje de contribución en un análisis
del modelo II de anova. Veremos en un ejemplo como se realiza el cálculo de cada uno de
los componentes de la varianza.
VIII.7. Comparaciones Múltiples
Siempre que se comprueba que un modelo I de Anova es significativo, lo que permite

concluir que las muestras correspondientes a los distintos tratamientos no proceden de la
misma población, es decir no tienen idéntica media paramétrica, el próximo paso es
determinar que medias o grupos de medias son significativamente diferentes unas de otras.
Estas comprobaciones se realizan mediante los tests de comparaciones múltiples.
Las comparaciones a realizar pueden ser clasificadas en dos grupos: 1) comparaciones "a
priori" y 2) comparaciones "a posteriori".
Las comparaciones "a priori" son aquellas que han sido planificadas antes que el
experimento se realice y por lo tanto son independientes de los resultados del experimento,
mientras que la comparaciones "a posteriori" son aquellas que resultan del análisis de los
resultados obtenidos, es decir después de realizado el experimento podríamos desear
comparar ciertas medias que notemos que sean marcadamente diferentes. Estos últimos
tests se realizan únicamente si el análisis de anova es significativo y cuando existen a
medias, pueden por lo tanto, hacerse a (a-1)/2 comparaciones entre pares de media.
La razón por la que se realiza esta distinción entre comparaciones "a priori" y "a
posteriori" es que los tests de significación apropiados para las dos comparaciones son
diferentes.
La comparación de cualquier par de medias puede realizarse utilizando la siguiente
expresión :
( x1  x 2 )  ( 1   2 )
ts   t / 2,  a ( n 1)
1 1 (88)
MS error (  )
n1 n2
118
Para una hipótesis alternativa bilateral , la pareja de medias  1 ,  2 se consideran diferentes

si t s >t /2 , = a(n-1)
La aplicación reiterada de esta prueba para diferentes pares de medias presenta un inconveniente.
Si el nº total de tratamientos que se comparan es 4, se podría aplicar el test anterior a 4C 2= 6 = c
pares de medias.
Si el nivel de significación o error de tipo I de cada prueba es = 0.05, para cualquier par de
medias (X1 -X2) se verifica que
P (X1 -X2)  t /2 , = a(n-1) [( Ms error (1 /n1+ 1 /n2 )] = 0.95
Luego, la probabilidad que, conjuntamente se verifiquen las 6 condiciones posibles, para todas las
comparaciones entre medias, es si fueran independientes (0.95) 6 = 0.73 y no 0.95 como podría
suponerse.
La conclusión que se desprende de lo anterior, es que al aplicar reiteradamente el test, es muy
probable que, aun cuando no existan diferencia entre los grupos, estas aparezcan como
consecuencia del azar.
Es por esta razón, que si se propone garantizar un error de tipo I total igual a  T para el conjunto
de c contrastes o comparaciones, se deba tomar para cada uno de ellos, un nivel  =  T / C .
Este es el método de Bonferroni que conduce a un procedimiento aproximado útil en la
práctica.
VIII.7.1. Comparaciones "a priori"
Las comparaciones planificadas se realizan utilizando una serie de pruebas entre las que se
incluyen las siguientes:
VIII.7.1.1. Descomposición de la suma de cuadrado entre grupos o entre tratamientos
Consiste en descomponer la suma de cuadrado entre grupos y los grados de libertad

correspondientes en suma de cuadrados separadas para cada una de las comparaciones
linealmente independientes con un grado de libertad asociado.
Si en el primer ejemplo de este capítulo referido a la concentración de Fe total en el agua de

consumo, estamos interesados en comparar las concentraciones de los pozos excavados
localizados en el sur de la provincia con los de la zona centro- sur , tendríamos que
calcular la suma de cuadrados para dicha comparación teniendo en cuenta que ahora existen
dos grupos nada mas, uno constituido por los pozos de las localidades Candelaria y Santa
Ana (grupo 1) y otro correspondiente a las localidades de San Ignacio y Corpus (grupo 2)
siendo los totales y el numero de observaciones en cada grupo los que se indican en el
siguiente cuadro
Cuadro VIII.6
Grupo 1 Grupo 2
Media 0.826 0.391
Total (TG) 19.01 7.04
N 23 18
119
La suma de cuadrado SS comparación se calcula utilizando la siguiente expresión:
SS comp = [(TG1)2 / n1 + (TG2)2 / n2] - TC (89)
El término de corrección definido anteriomente, vale también 16.55 porque en esta

comparación intervienen todos los tratamientos
SS comp = 15.71 + 2.573 - 16.55 = 1.915
El MS de la comparación es igual a SS calculado en virtud de que el número de grados de

libertad es igual a 1, razón por la cual la significación de la misma se realiza simplemente,
dividiendo su valor por el MS error igual a 0.92 resultando un Fs de
Fs = MS comp / MS error = 1.915/0.92= 2.08 (p-value=0.1576)
Valor que se compara con un F 0.05 (1, 37) = 4.1055, concluyéndose que no existen diferencias
estadísticamente significativa entre las concentraciones de Fe total de los dos grupos de
localidades.
VIII.7.1.2. Test de la Mínima Diferencia Significativa (LSD)
El valor de LSD, es decir la Mínima Diferencia Significativa se calcula a partir de la

siguiente expresión:
LSD = t [(,)] x ( 2 MS error/n)1/2 = t /2 , = a(n-1) [( Ms error (1 /n1+ 1 /n2 )] (89)
Donde t es el valor critico que se calcula utilizando la distribución de Student para un nivel
de significación  de 0.05 o 0,01, y un valor de  igual al número de grados de libertad de
error.
El LSD, es como se señalara la mínima diferencia significativa, esto es , cualquier pareja de
medias que difieran en una cantidad mayor a este valor serán significativamente diferente
una de otra.
Para comprender mejor la aplicación de los tests de comparaciones múltiples analicemos

los datos que se presentan en el siguiente cuadro.
Cuadro VIII.7 Concentraciones de DBO (mg/l) -Red de Monitoreo de Calidad de Agua de

120
los Arroyos Antonia, Ita y Divisa de la Ciudad de Posadas

Período Agosto de 1993-Junio de 19943
ARROYOS
Antonia Divisa Itá
92.50 81.30 190.00 72.00 39.50 27.30
60.50 48.48 42.50 54.56 36.00 34.85
129.50 17.80 112.50 55.00 52.00 17.80
80.00 80.00 140.00 38.00 36.00 23.50
67.30 92.70 57.60 181.00 32.50 35.35
52.00 44.50 26.00 51.30 32.50 34.50
59.00 60.00 26.00 41.50 15.40 28.50
52.30 52.00 28.00 28.00 49.50 62.50
44.00 79.00 23.50 53.00 13.90 52.50
63.00 68.00 175.00 70.00 47.50 54.50
42.50 25.50 28.50
Los observaciones corresponden a los valores de Demanda Bioquímica de Oxígeno (DBO)

en mg/l en muestras obtenidas en 3 Arroyos interiores de la Ciudad de Posadas, en
estaciones que forma parte de la Red Monitereo de Calidad de Agua operada en el Area del.
Embalse de Yacyreta, por la Entidad Binacional Yacyreta.
Los valores medios y los desvíos estándar calculados utilizando el paquete estadístico
Statgrafics plus para cada una de los arroyos se muestran a continuación, junto al test de
homogeneidad de varianzas
Arroyo Count Average
------------------------------------------------------------
1 21 65.0657
2 21 70.9981
3 21 35.9333
------------------------------------------------------------
Total 63 57.3324
Nota: (1) Aº Antonia (2) Aº Divisa (3) Aº Itá
Arroyo Variance Standard deviation

------------------------------------------------------------
1 553.123 23.5186
2 2991.31 54.6929
3 175.818 13.2596
------------------------------------------------------------
Total 1438.69 37.9301
Variance Check
Cochran's C test: 0.804061 P-Value = 3.27213E-8

Bartlett's test: 1.87155 P-Value = 1.02673E-8
Hartley's test: 17.0137
3
Informe Final- Piris da Motta, M.( Análisis Estadístico y redacción de Informe Final)- Convenio Entidad
Binacional Yacyreta (EBY)-Universidad Nacional de Misiones (UNaM)- Convenio Específico-Calidad de
Aguas
121
Histogram for DBO

40
30
frequency
20
10
0
0 40 80 120 160 200
DBO
Atendiendo a que la distribución de las observaciones se desvía en forma apreciable de la

normalidad como puede observarse en el histograma y que el test de Bartlett de igualdad
de varianzas no puede ser aceptado a un nivel de 0.01 se decidió efectuar una
transformación logarítmica de los valores de DBO.
La variable transformada tomando el logaritmo neperiano de cada una de las observaciones
(LNDBO) cumple los supuestos de normalidad y homocedasticidad como puede
comprobarse observando el histograma respectivo y el resultado del test de Bartlett.
Bartlett's test: 1.14371 P-Value = 0.0194315
Histogram for LNDBO

24
20
frequency
16
12
8
4
0
2.5 3 3.5 4 4.5 5 5.5
LNDBO
Comprobado los supuestos básicos, la aplicación del ANOVA que resultó muy significativo
(p-valor = 0.0007), indica que existen diferencias en el nivel de contaminación orgánica de
los tres cursos de aguas considerados , procediéndose a continuación a efectuar la
comparación de medias .
122
ANOVA Table for LNDBO by Arroyo
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Between groups 4.40112 2 2.20056 8.25 0.0007
Within groups 15.9996 60 0.266661
-----------------------------------------------------------------------------
Total (Corr.) 20.4008 62
Los resultados de los tests de comparaciones múltiples son equivalentes tanto si se trabajan
con los datos transformados o sin transformar.
En el siguiente cuadro se detallan los resultados de la comparación de medias utilizando el

test de la LSD.
Multiple Range Tests for LNDBO by Arroyo
--------------------------------------------------------------------------------
Method: 95.0 percent LSD
Arroyo Count Mean Homogeneous Groups
--------------------------------------------------------------------------------
3 21 3.50859 X
2 21 4.02177 X
1 21 4.10701 X
--------------------------------------------------------------------------------
Contrast Difference +/- Limits
--------------------------------------------------------------------------------
1 - 2 0.0852372 0.318772
1 - 3 *0.598421 0.318772
2 - 3 *0.513184 0.318772
--------------------------------------------------------------------------------
* denotes a statistically significant difference.
El valor de LSD es de 0.3187 y cualquier pareja de medias que difieran en más de esta
cantidad se consideraran significativamente diferentes al nivel de 0.05.
Los resultados obtenidos indican que no existen diferencias significativas entre los valores
medios de DBO de los Arroyos Antonica y Divisa , pero que estos difieren
significativamente del valor correspondiente al Aº Itá.
La conclusión correspondiente es que el Aº Ita presenta un nivel de contaminación orgánica
medida en términos de DBO, muy inferior a del los Arroyos Antonica y Divisa , los cuales
no difieren significativamente entre si.
VIII.7.2. Comparaciones "a posteriori"
Para las comparaciones de medias que se decidan efectuar una vez analizados los resultados
obtenidos se utilizan algunos de los tests que se presentan a continuación
123
VIII.7.2.1. Test Simultaneo de Suma de Cuadrados (SS-STP)
Se basa en el cálculo de una suma de cuadrados crítico para un test significativo, de modo
que cualquier numero de medias que se comparen y que tengan una suma de cuadrados
mayor que el crítico resultará significativo.
SS  (k-1) MS error F  [(k-1) , = a (n-1)] (90)
Este test se puede aplicar como un test "a priori" considerando en cada caso, en la
expresión anterior k como el nº de medias que se comparan.
Cuando se utiliza como un test "a posteriori" se toma para el cálculo k=a= al número total
de tratamientos , en la formula, independiente de número de medias que se comparan.
En el ejemplo de los niveles de contaminación orgánica de los Arroyos interiores de la

Ciudad de Posadas, vemos que el valor medio del Aº Ita resulta muy inferior a los valores
obtenidos para los Arroyos Divisa y Antonia, los cuales aparentemente no difieren entre si.
Para comprobar estas hipótesis calculemos el valor de la SS crítico, reemplazando en la
expresión anterior k=3 (nº de tratamientos) , MS error = 0.266661 y F 0.05 [(2,60]= 3.15.
El valor obtenido es de 1.6799, y cualquier SS calculado para una comparación dada que
resulte mayor a este valor crítico nos estará indicando que las medias de estos grupos
difieren significativamente.
La SS correspondiente a la comparación planteada se calcula mediante el procedimiento

delineado en el punto VIII.7.1.1 . utilizando los datos del siguiente Cuadro y la expresión
89
Grupo 1(Aº Itá) Grupo 2(Aº Antonia y Divisa)

Media(*) 3.5085 4.0643
Total (TG) 73.68 170.70
N 21 42
(*) Media de los valores transformados
Como el resultado obtenido para la SS igual a 4.32 supera el valor crítico de 1.679, se
concluye que el Aº Itá presenta un nivel de contaminación orgánica muy inferior a los de
los arroyos Antonica y Divisa.
VIII.7.2.2. Test Simultaneo de Rangos (Rangos-STP)
Este test desarrollado por Tukey, utiliza el rango , es decir la diferencia entre la media
máxima y mínima del grupo en consideración como estadístico y lo compara con una valor
critico calculado por medio de la expresión
124
LSR = Q  [ k,] x ( MS error/n)1/2 (91)
Donde Q  [ k,] es el rango studentizado, que se obtiene de una tabla en función de k=

al nº de medias comprendido en el rango y = nº de grados libertad del MS error, para un
valor conveniente de .
Cualquier conjunto de medias cuyo rango supere el valor LSR será significativo.
Cuando se quieran comparar dos medias que provengan de muestras que no tengan el
mismo tamaño se calcula
n = 2 n1x n2 / (n1+n2)
En algunos libros aparece una expresión alternativa para el caso de 2 media es el siguiente
LSR = Q  [ k,] x [( MS error/2) (1/n1+ 1/n2)]1/2 (92)
En los test "a posteriori", se emplea k=a para todos los test de cualquier nº de medias.
Utilizando este procedimiento vamos a comparar las medias de los arroyos Divisa y
Antonica, que aparentemente no difieren entre si.
Para el cálculo del LSR, utilizaremos un valor de Q 0.05 (3,60) = 3.399 en la expresión (91)
juntos con los valores MS error y n dados anteriormente.
El valor de LSR3 obtenido de 0.3830 resulta mayor al rango de las medias de los arroyos
Divisa y Antonia de 0.08524, razón por la cual se puede considerar que estos cursos de
agua no difieren significativamente en cuanto a la contaminación orgánica que presentan.
VIII.7.2.3. Test de Student Newman Keuls (SNK)
Este es un método paso a paso que también utiliza el rango lo estadístico para medir la
diferencia entre medias
Es paso a paso porque se verifica primero la significación de los grupos mas grandes de
medias. Si se tienen a medias, se las ordena de mayor a menor, se calcula la diferencia
entre la mas grande y la mas pequeña y se compara con un valor critico que se obtiene
utilizando la siguiente expresión
= Q  [ k,] x ( MS error/n)1/2 (93)

Donde Q  [ k,], es el rango studentizado, obtenido de una tabla para un valor de k igual
al nº de medias comprendidos en el rango en consideración.
Si el rango para el grupo de k=a medias resulta significativo, se verifica el grupo de k-1
utilizando un valor de conveniente de Q  [ a-1,] y así sucesivamente, hasta que algún
rango no resulte significativo.
VIII.7.2.4. Procedimiento de Dunnett para comparaciones múltiples con un

125
tratamiento control
Se utiliza a menudo en las investigaciones un tratamiento control o estándar como punto de

referencia con el cual comparar todos los tratamientos. El objetivo es demostrar si alguna
de los tratamientos puede considerarse diferente de la media del control. La expresión
utilizada es similar al del LSR, con la única diferencia que se sustituye el Q  [ k,] por la
d /2 (k,) de Dunnett, esto es
( yi  y o )  d / 2( k , ) MS error ( n1c  n1i ) (94)
donde nc es el nº de observaciones en el grupo control , n i en el tratamiento i-esimo, y k es

el nº de tratamientos excluido el control.
Para el caso especial de comparaciones con un tratamiento control es una buena costumbre
que éste posea un nº de observaciones nc mayor que cualquiera de los otros tratamientos.
Se sugiere que la relación nc/ni sea aproximadamente igual a ( a )1/2 siendo a el número de
tratamientos.
Cualquier media cuya diferencia con la media del grupo control sea ≥ al valor crítico
calculado mediante la expresión (94) estará indicando que el grupo al que pertenece la
media difiere significativamente del control
126
VIII.. 8. ANOVA DE 2 FACTORES
VIII.8.1. Modelo y cálculos preliminares
En este modelo se consideran 2 factores que influyen sobre la variable y cuyos efectos se
suponen a priori que tienen igual rango, es decir, la misma importancia .
Su formulación matemática para un modelo I es:
Xij =  +i+ i + ()i j+  ji (95)
Donde  y  se consideran efectos de tratamientos fijos , pudiendo uno de ellos ser un

efecto de tratamiento aleatorio en un modelo mixto, debiendo reemplazarse por los efectos
aleatorios Ai y Bi en el caso de un modelo II, donde  ji es la perturbación o error
experimental que distribuye normal con media 0 y varianza constante y ()i representa la
interacción cuyo significado se explicará mas adelante.
Para explicar los cálculos requeridos para la obtención del cuadro de Anova en un diseño
de dos factores, consideremos el siguiente experimento que corresponde a un estudio sobre
la inactivación de la vitamina A , cuyo resultados se muestran en el cuadro VIII.5.
Cuadro VIII.5.
c (grasas) c = 2 
F Sexos f= 2 Fresca Rancia
Machos 709 592
679 538
699 476
2087 1606 3693
Hembras 657 508
594 505
677 539
1928 1552 3480
 4015 3158 7173
Este ejemplo, en el que se evalúa el efecto de los factores (fijos): a)tipo de grasa (fresca o
rancia) y b) sexo (macho y hembra), tiene como propósito determinar si el sexo o la
frescura del tocino afectan significativamente la dieta de los ratones que conforman los
distintos subgrupos.
Para el cálculo de los componentes de la varianza, se descompone inicialmente la SS total y
los grados de libertad asociados en una SS entre subgrupos y dentro de subgrupos o error
respectivamente. La SS entre subgrupos , se descompone posteriormente en 1) SS de filas
(factor sexo) , 2) SS de columna (factor tipo de grasa) y 3) SS de la interacción, cada uno
con sus grados de libertad correspondientes.
127
Los cálculos requeridos para la obtención de las sumas cuadrados se detalla a

continuación:
Cálculos preliminares
1- Gran total = Suma de todas las observaciones=  X

=709+679+.............................+505+539=Suma = 7173
2- Suma del cuadrado de las observaciones =  X2
=709 2 +679 2 +....................................+ 505 2+ 539 2= 4365231
3- Suma del cuadrado de los totales de sugrupos dividido por el nº de observaciones en
cada subgrupos = (Tsg)2 / nsg con nsg= n
(2087) 2  (1606) 2  (1928) 2  (1552) 2
 =4353564,33
3
4- Término de corrección TC = (1)2 / f c n = (7173)2 / 2x2x3 =4287660,75
5- SS total = 2-4 = 4365231-4287660,75=77570,25 GL = f c n-1=2.2.3-1=11
6- Suma de cuadrado entre subgrupos
SS entre sg = 3-4=4353564,33-4287660,75= 65903,58 GL = f c -1= 4-1= 3
7- Suma de cuadrado dentro de subgrupos
SS dentro sg= 5-6 =77570,25 - 65903,58 GL = f c (n-1)=2x2x2=8
8- Suma del cuadrado de los totales de filas dividido por el nº de observaciones en cada
fila = (Tf)2 / nf
(3693) 2  (3480) 2
  4291441,5
6
9- Suma del cuadrado de los totales de columnas dividido por el nº de observaciones en
cada columna = = (Tc)2 / nc
( 4015) 2  (3158) 2 4348864,83
 
6
SS filas (sexo) = 8-4 =4348864,83 -4287660,75= 3780,75 GL = f-1=2-1=1
siendo f= nº de filas =2
10- SS columnas (grasa)= 9-4 = 4348864,83 -4287660,75= 61204,08 GL = c-1 =2-1=1

siendo c= nº de columnas =2
11- SS interacción = 6-10-11 = 65903,58-61204,08 -3780,7 = 918,75 GL = (f-1) (c-1)=1

128
Fuente de var. SS GL MS Fs
Entre subgrupos 65903,58 3
Entre filas (sexos) 3780,75 1 3780,75 3780,75/1458,33=4,11
Entre columnas 61204,08 1 61204,08 61204,08/1458,33=71,7

(grasas)
Interacción 918,17 1 918,75 918/1458,33=0,63
Dentro de subgrupos 11666,66 8 1458,33
(error)
Total 77570,25 11
F0,05(1,8) = 5,31
Cuadro VIII.6. Cuadro de ANOVA
Fuente de var. SS GL MS Fs MS esperado

Modelo I
Entre filas (sexos) 10 f-1 10/(f-1) 13/16 f 2
cn   j
(13) 2 j 1
 
f 1
Entre columnas 11 c-1 11/(c-1) 14/16 c 2
fn   i
(grasas) (14) 2 i 1
 
c 1
Interacción 12 (f-1)(c-1) 12/(f-1)(c-1) 15/16 i f 2
(15) n   ( ) ij
j 1
2 i 1
 
( f  1)( c  1)
Dentro de subgrupos 7 f c (n-1) 7/f c (n-1) 2
(error) (16)
Total 5 f c n-1
Cuadro VIII.7
Fuente de var. MS Fs MS esperado
Modelo II Modelo Mixto
Entre filas (fijo) 10/(f-1) 2 + n 2 +cn2  f 2
cn   j
2 2 i 1
  n 
 f 1
Entre columnas 11/(c-1) 2 + n 2 +fn2  2 + fn2 

(aleatorio)
Interacción 12/(f-1)(c-1) 2 + n 2  2 + n 2 
Dentro de subgrupos 7/f c (n-1) 2 2
(error)
129
Total
VIII.8.2.Significado de la interacción
Se dice que existe interacción cuando el efecto de un factor sobre la variable respuesta
depende del nivel del otro factor, esto es, cuando el efecto de dos factores aplicados juntos,
no puede predecirse a partir de las respuestas promedio de los factores separados.
Esto indica que los efectos de los dos factores no son simplemente aditivos, sino la
combinación de los niveles de los dos factores contribuye de manera positiva o negativa.
Cuando hay un gran incremento positivo de los efectos se habla de sinergia, mientras que
si hay un efecto antagónico se habla de interferencia.
VIII.8.3. Pruebas de Significación
Se pueden presentar los siguientes casos:
- Modelo I
Ambos factores, corresponden a efectos de tratamientos fijos. En este caso, el cuadrado
medio de cada nivel de variación, lleva solamente el efecto añadido asociado a aquel
nivel de tratamiento (Ver Cuadro VIII.6.)
El test de significación es simple y directo. Cualquier fuente de variación se comprueba
mediante el cociente del MS correspondiente sobre el MS error.
- Modelo II y Modelo mixto

En este caso los 2 efectos principales, contienen en los cuadrados medios esperados, la
componente de la varianza de la interacción, así como su propia componente de
varianza (Ver Cuadro VIII7.)
Por lo tanto, cuando se comprueba la significación en un modelo II, primero se
comprueba la interacción dividiendo el MS interac/ MS error.
Si la Interacción es significativa la significación de los factores se comprueba
dividiendo el MS correspondiente por el MS de la interacción.
Si la interacción no es significativa, nos encontramos con la decisión de promediar o no
SS interacción con la SS error utilizando determinadas reglas.
En el caso de un modelo mixto, en el que el factor B se supone efecto de tratamiento
fijo ( ) y el factor A es aleatorio, se comprobará la significación del efecto principal
aleatorio dividiendo su MS por el MS error, pero el efecto de tratamiento fijo se
realizará sobre el MS interacción si este es significativo o sobre un MS que se calcula
promediando la SS error e SS de interacción si la interacción no resulta significativo.
Algunos autores, aun cuando el contraste de interacción no resulte significativo,

recomiendan no unir la suma de cuadrado de la interacción con el residuo a no ser que el
MS interacción sea muy próximo al MS error (o el test de F para la interacción muy
próximo a 1). La razón es evitar aumentar erróneamente la estimación del error
experimental.
130
VIII.8.4. Anova de 2 factores sin repetición
En muchos experimentos se tiene una única observación para cada combinación de los
factores. En este caso, no se puede hablar de "subgrupos", dado que cada combinación de
los niveles de los factores contiene una única observación.
La existencia de una única observación se explica, atendiendo a que con frecuencia resulta
difícil o demasiado caro, obtener mas de una lectura o las medidas son tan semejantes que
no es necesario repetirlas.
Para presentar los calculos requeridos para el cuadro de Anova consideremos el siguiente
ejemplo real.
Cuadro VIII.8.
Profundidades Puntos de Muestreos
1 2 3 4 5 6 7 8 9
0.15 m (s) 4.0 3.4 4.1 4.0 3.6 3.9 4.1 4.0 4.0
1.00 m (m) 3.7 3.2 3.8 3.8 3.4 3.9 4.0 3.9 3.9
2.00. m (p) 3.7 3.2 3.8 3.7 3.3 3.8 3.8 3.8 3.8
Los valores que se detallan corresponden a las concentraciones de Oxígeno Disuelto en

mg/l, medidas en diferentes puntos y a distintas profundidades de una de las Lagunas
Aireadas que forman parte de la Planta de Tratamiento de Líquidos Cloacales de la Ciudad
de Posadas4.
El objetivo de estas mediciones fue comprobar si el contenido de la laguna podía
aproximarse al comportamiento de un reactor completamente mezclado o si se verificaba
algún tipo de heterogeneidad vertical o longitudinal.
Dado que n=1, la SS de subgrupos es la misma que la SS total y la suma de cuadrados

dentro de subgrupos ha desaparecido.
De esta forma, después de restar la suma de los cuadrados de columna (factor A) y filas
(factor B) del SS total, nos encontramos con una única suma de cuadrados, la cual es
equivalente a la anterior SS de la interacción, pero que ahora es la única fuente para un
término de error en el Anova. Esta SS es conocida como SS residuo.
Para algunos modelos y tests en un Anova de 2 factores sin repetición se debe suponer que
no existe efecto añadido debido a la interacción.
En el ejemplo considerado, podemos suponer que no existe interacción y por lo tanto los
cuadrados medios de filas y columnas se comprueban con el MS error como se muestra en
el siguiente Cuadro.
Cuadro VIII.9.
4
Piris da Motta M. ; Kruzolek y col. C. 2000. "Evaluación del funcionamiento de la Planta de Líquidos
Cloacales de la Ciudad de Posadas" Informe Final.
131
ANOVA Table for OD by Puntos
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Between groups 1.43333 8 0.179167 9.87 0.0000
Within groups 0.326667 18 0.0181481
-----------------------------------------------------------------------------
Total (Corr.) 1.76 26
Variance Check
Cochran's C test: 0.183673 P-Value = 1.0

Bartlett's test: 1.08917 P-Value = 0.992014
Hartley's test: 3.0
VIII.8.5. Diseño de Bloques Completos Aleatorizados
El método de bloques completos aleatorizados (BCA) es un tipo de Anova de 2 factores

(generalmente sin repetición), especialmente frecuente en investigaciones agrícolas, pero
también con numerosas aplicaciones en otros campos biológicos y experimentos de
laboratorio.
Cuando se aplica un fertilizante o un insecticida a una parcela de suelo, generalmente se
recoge como resultado una simple lectura que es el producto de la cosecha.
En el caso en que se quiera comparar 5 tratamientos (fertilizantes o insecticidas diferentes)
y se decida efectuar 4 repeticiones de cada uno de ellos, se necesitaran 20 parcelas , lo que
representa una superficie considerable cuya homogeneidad no se puede asegurar, tanto
desde el punto de vista de tipo de suelo como en otras condiciones microclimáticas.
En general, las parcelas adyacentes serán mas parecidas entre si, de modo que no tenemos
que poner el tratamiento A dentro del mismo área general; de otro modo, lo que podría
aparecer como significativamente diferente en el tratamiento A, puede deberse a una
característica del área general en la que están ubicadas las parcelas destinadas a este
tratamiento,
El método de BCA permite superar esta dificultad. En el ejemplo mencionado, se puede
seleccionar 4 bloques diferentes entre si, pero con condiciones ambientales tan homogéneas
como sea posible. Cada bloque se divide en 5 parcelas, las cuales se asignan aleatoriamente
a cada uno de los tratamientos. El ordenamiento aleatorio de los tratamientos entre las
parcelas es necesario, de manera que cualquier tratamiento dado no ocupe idéntica posición
relativa en el campo.
Los 4 bloques (filas) se consideran como efectos aleatorios y los 5 tratamientos (columnas),
como efectos fijos.
Una observación individual en un diseño BCA puede, por lo tanto, descomponerse en la
forma :
Xij =  +i+ Bj +  ji (96)
Donde i es el efecto de tratamiento y Bj es el efecto aleatorio de bloque.

132
En un diseño de bloques, simplemente se comprueba el Ms de tratamiento sobre el MS

error. EL MS de bloques rara vez se comprueba y se tendrá que suponer que no existe
interacción antes de hacerlo.
Si no es significativamente mayor que el MS error habría menos heterogeneidad entre los
bloques, que la esperada o los bloques se seleccionaron de tal manera que la mayor parte de
la heterogeneidad quedo dentro de los bloques en vez de entre los bloques.
La existencia de diferencias significativa entre los bloques, no debería extrañarnos, dado
que después de todo es lo esperado, lo llamativo sería, que las diferencias entre los bloques
sean pequeñas, lo que estaría indicando que en futuros experimentos convendría no utilizar
un diseño aleatorizado, sino uno de clasificación única o anova de un factor.
El diseño de BCA puede también aplicarse a otros tipos de experimentos distintos de los
agrícolas para los que se ideó.
Si un experimento es demasiado grande o insume mucho tiempo, se puede realizar en días
sucesivos utilizando los días como bloques o también en diferentes laboratorios,
constituyendo cada uno de ellos un bloque.
Esto es, siempre que las condiciones ambientales en la que se realiza un experimento o los
materiales de investigación sean heterogéneos, estos pueden subdividirse en bloques mas
homogéneos, y el experimento puede ser realizado y analizado mediante un diseño de
bloques completos aleatorizados.
VIII.9. ANOVA ENCAJADO
VIII.9.1. El modelo y los cálculos preliminares
El diseño de Anova de clasificación única muchas veces es insuficiente para representar la

complejidad de un determinado experimento.
Existen casos en que los grupos están divididos en subgrupos, elegidos aleatoriamente. Es
decir los subgrupos estan encajados o anidados dentro de los subgrupos.
A este diseño se lo denomina también Anova anidado o jerárquico, porque los subgrupos
están subordinados a los grupos.
El nivel mas bajo, es siempre elegido aleatoriamente (modelo II) y el nivel mas alto puede
ser de efecto fijo (modelo I) o aleatorio (modelo II).
Si el nivel mas alto es modelo I, hablamos de modelo mixto de anova encajado y si los dos
son modelo II, se denomina anova encajado puro.
Para explicar los pasos de cálculo requeridos para la obtención del cuadro de Anova en un
diseño de anova encajado a dos niveles o etapas, consideremos el siguiente experimento,
que corresponde a un estudio real sobre "Optimización de la red de monitoreo para
evaluar el desempeño de aireadores orbitales en lagunas aireadas de mezcla completa"
Los valores que se detallan en el Cuadro VIII.9.corresponden a las concentraciones de
Oxígeno Disuelto en mg/l, medidas en diferentes puntos de tres transectas de una de las
133
Lagunas Aireadas que forman parte de la Planta de Tratamiento de Líquidos Cloacales de

la Ciudad de Posadas5.
El objetivo de estas mediciones fue conocer la magnitud de la varianza atribuible a los
diversos niveles de variación del estudio. esto es, entre líneas (transectas), entre puntos de
una línea y entre mediciones de un mismo punto.
.
Cuadro VIII.10.
Líneas
A B C
Puntos de muestreos 1 2 3 4 5 6 7 8 9
4.0 3.4 4.1 4.0 3.6 3.9 4.1 4.0 4.0
3.7 3.2 3.8 3.8 3.4 3.9 4.0 3.9 3.9
3.7 3.2 3.8 3.7 3.3 3.8 3.8 3.8 3.8
Totales subgrupos 11,4 9,8 11,7 11,5 10,3 11,6 11,9 11,7 11,7
Totales grupos 32,9 33,4 35,3
Cálculos Preliminares
1- Gran total =  X=101,6

2- Suma del cuadrado de las observaciones =  X2 = 384,06
3- Suma del cuadrado de los totales de subgrupos dividido por el nº de observaciones en
2
 (9,8) 2 ......... (11,7 ) 2
cada subgrupos = (Tsg)2 / nsg = (11,4) 3
 383,726
2
4- Término de corrección TC = (1)2 / a b n= (101 ,6 )
3.3.3
 382,317
5- SS total = 2-4 =1,7429 GL = a bn-1=3x3x3-1=26
6- Suma de cuadrado de los totales de grupos dividido por el nº de observaciones en cada
(32,9)2  (33, 4) 2  (35,3) 2
grupo = (Tg)2 / ng  9
 382,67
7- SS sg dentro de grupos = 3-6 =383,726-382,67=1,0533 GL = a(b -1)=3x2=6
8- Suma de cuadrado entre grupos = SS entre g= 6-4 =382,67-382,317=0,3562
GL = a-1=3-1=2
9- Suma del cuadrado error = 5-7= 0,333 GL = a b (n-1)= 3x3x(2)=18
a= número de grupos= 3 b= número de subgrupos= 3 n= número de observaciones =3
Cuadro VIII.11. Cuadro de ANOVA

5
Piris da Motta M. 2003. " Optimización de red de monitoreo diseñada para evaluar el desempeño
de aireadores orbitales en lagunas aireadas de mezcla completa"
134
Fuente de var. SS GL MS Fs MS esp

Entre grupos 0,3562 2 0,3562/2 Mseg/MSsgdg 2 + n 2 BA +nb 2 A
=0,1781 =1,01
Entre subgrupos 1,053 6 1,053/6 MSsgdg/MSerror 2 + n 2 BA
dentro de grupos =0,1755 =9,48
Dentro de subgrupos 0,333 18 0,333/18
(error) =0,0185 2
Total 1,7429 26
Como puede observarse en los cálculos para un Anova encajado de 2 niveles (grupos y
subgrupos dentro de grupos) las sumas de cuadrados que intervienen son: 1) SS entre
grupos, 2) SS de subgrupos dentro de grupos y 3) SS dentro de subgrupos o SS error, cada
uno con sus grados de libertad correspondientes.
El Cuadro de ANOVA para las concentraciones de OD se presentan a continuación :
Analysis of Variance for OD
--------------------------------------------------------------------------------
Source Sum of Squares Df Mean Square Var. Comp. Percent
--------------------------------------------------------------------------------
TOTAL (CORRECTED) 1.76 26
--------------------------------------------------------------------------------
Lineas 0.346667 2 0.173333 0.0 0.00
Puntos 1.08667 6 0.181111 0.054321 74.96
ERROR 0.326667 18 0.0181481 0.0181481 25.04
--------------------------------------------------------------------------------
Como puede verse el 74 % de la variabilidad en los valores de oxígeno disuelto se debe a la

componente entre puntos y no existe variabilidad entre las líneas, razón por la cual en la
nueva red de monitoreo se incluirán mas puntos, reduciendo el nº de líneas y el nº de
observaciones en cada punto .
Para el cálculo manual de estas componentes se deberán tener en cuenta las siguientes
relaciones:
Fuente de var. MS MS esp

Entre grupos 0,1781=  + n 2 BA +nb 2 A
2
Entre subgrupos 0,1755= 2 + n 2 BA

dentro de grupos
Dentro de subgrupos 0,0185 = 2
(error)
MS dentro de subgrupos (dentro de puntos)= 2= 0,0185
MS entre subgrupos dentro de grupos(entre puntos dentro de líneas) = 0,1755=2 + n 2 BA

de esta ultima expresión se obtiene 2 BA = (0,1755-0,0185)/3 = 0,05233
El valor de 2 A se calcula a partir de la igualdad
135
MS entre grupos (entre líneas) =0,1781 = 2 + n 2 BA +nb 2 A

2 A= (0,1781-0,1755)/3*3 =0,000289
Los % se obtienen como:
% entre líneas = (2 A /2 + 2 BA + 2 A )* 100=0,000289/0,0711= 0,40 %
% entre puntos = (2 BA /2 + 2 BA + 2 A )* 100=0,05233/0,0711= 73,5 %
% dentro de puntos (error)= (2 /2 + 2 BA + 2 A )* 100=0,0185/0,0711=26 %

Existen dos clases de aplicaciones generales del Anova Encajado :
El primero sirve para controlar la magnitud del error en los diversos estadios (etapas) de un
experimento o de un proceso industrial y un segundo uso mas importante aparece en los
casos en que se trata de un modelo II puro y que provienen frecuentemente del campo de la
genética cuantitativa, donde se desea conocer la magnitud de la varianza atribuible a los
diversos niveles de variación del estudio.
El anova encajado no está limitado a 2 niveles, a los que se hizo referencia anteriormente,
dado que podríamos dividir los grupos en subgrupos, y estos vueltos a dividir y así
sucesivamente como puede verse en el siguiente ejemplo.
Se diseña un experimento para comprobar los efectos de 5 drogas sobre la cantidad de
pigmentación en la piel de un animal. Las 5 drogas y un control (6 grupos) son el nivel
superior, y claramente son efectos de tratamientos fijos (modelo I).Para cada droga se
seleccionan 5 ratas aleatoriamente; dichas ratas proporcionarían una varianza de "ratas
dentro de drogas". De cada rata se podrían tomar 3 muestras de piel aleatoriamente. Esto
daría lugar a un nuevo nivel de variación subordinado (muestras de piel dentro de ratas).
Cada muestra de piel se divide en dos lotes, que se hidrolizan por separado. Este nuevo
nivel está formado por partes hidrolizadas dentro de muestras de piel. Finalmente la
cantidad de pigmentación podría ser leída como una densidad óptica, pudiendo efectuarse
dos lecturas repetidas de cada parte hidrolizada.
El error básico de la varianza seria la varianza de las lecturas repetidas para cada parte
hidrolizada, pero también tendríamos valores de varianza entre las partes hidrolizadas
dentro de una muestra de piel, entre muestras de piel dentro de una rata y entre ratas dentro
de una droga.
Estos valores de la varianza son importantes en el diseño de experimentos análogos porque
nos indican a que nivel del experimento deberíamos concentrar la mayor parte de nuestros
esfuerzos. El aspecto mas variable de nuestro experimento necesita mayor repetición o un
mejor control experimental. De esta manera si encontramos que las dos partes hidrolizadas
poseen la mayor proporción de varianza, nuestro método de hidrólisis claramente no está
muy perfeccionado y debería por lo tanto ser mejorado; si esto no es posible, debería
dividirse cada muestra de piel en mas lotes para disponer de mas partes hidrolizadas.
VIII.9.2. Pruebas de significación

136
Con el fin de determinar las estadísticas apropiadas para efectuar las pruebas de
significación se deberían considerar los valores esperados de los cuadrados medios, que en
cada nivel por encima del error de la varianza contiene dentro de él, la variación de todos
los niveles que están por debajo, además de la correspondiente a su propio nivel.
De esta forma la varianza esperada de los subgrupos (puntos) dentro de grupos (líneas) en
el ejemplo anterior, es  2 + n  2 BA, donde  2 BA indica que se trata de la varianza de B
dentro del nivel A.
El cuadrado medio esperado entre grupos contiene los términos por debajo de él, mas nb
2 A .
A partir de estos cuadrados medios esperados, los tests de significación son inmediatos
como se muestra en el Cuadro VIII.11, comprobándose los niveles mas bajos antes que los
superiores. Así para nuestro ejemplo, se comprueba en primer lugar MSsgdg/MSerror
para la significación de  2 BA y después Mseg/MSsgdg para  2 A .
Este modelo II encajado de ANOVA, con efectos aleatorios entre grupos (líneas) y entre
subgrupos dentro de grupos se completa con el cálculo de las componentes de la varianza,
como se indica en el Cuadro VIII.12. En el caso de un modelo mixto en el que el nivel mas
alto de clasificación es un modelo I (efecto fijo), no se calcula ninguna componente de la
varianza, sino que simplemente se comprueba la significación de los efectos de tratamiento
añadidos completándose el análisis con comparaciones múltiples.

Análisis de Varianza20131

Enviado por

Dados do documento

Descrição original:

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Análisis de Varianza20131

Enviado por

Direitos autorais:

Formatos disponíveis

97

CAPÍTULO VIII ANÁLISIS DE VARIANZA

Para utilizar correctamente el ANOVA como una herramienta de la inferencia estadística es

Fs = s21 / s22 (75)

Si tomáramos repetidas muestras de tamaños n1 y n2 y calculáramos los cocientes Fs,

La distribución F, se utiliza para comprobar la siguiente hipótesis nula

La hipótesis alternativa podría ser:

Que plantea un test de F a dos cola y a una cola respectivamente.

El valor de Fs calculado a partir de la expresión (75) se compara con un valor de Tabla

las varianzas que se encuentran en el numerador y en el denominador respectivamente. El

F(1,2) = 1/ F (1- )(2,1)

La aceptación de la hipótesis nula de igualdad de las varianzas es un requisito previo para

VIII.3. ANÁLISIS DE VARIANZA DE UN FACTOR

Ho)  1 =  2 =  3 =.......... =  i (76)

La tabla de ANOVA se construye a partir de esta descomposición y proporciona el

VIII.3.1.Partición de la Suma Total de Cuadrados y de los Grados de Libertad

Recordemos que la varianza es una medida de la dispersión de los valores de las

Atendiendo a que las varianzas no gozan de propiedades aditivas, es decir, no pueden

Como se señalara en la introducción, el ANOVA proporciona una forma de dividir la

( Xi-X) = (Xi-Xi ) + ( Xi - X) (77)

El término de la izquierda representa la diferencia entre una observación cualquiera y la

Elevando al cuadrado cada uno de los términos, y generalizando la expresión a la totalidad

 ( Xi-X)2 = (Xi-Xi )2 + ni ( Xi - X)2 ( 78)

donde ni el número de observaciones en el i-esimo grupo.

Para comprender el cálculo y el significado de esta descomposición analicemos el siguiente

Tanto las aguas superficiales como subterráneas en la Provincia de Misiones presentan

Cuadro VIII.1. Relevamiento de Calidad de Aguas de Pozos Excavados (Zona Centro-Sur)

0.025 3.02 0.62

Candelaria Santa Ana San Ignacio Corpus

Veamos como se efectúa la descomposición de la suma de cuadrados y los grados de

Para el cálculo de esta "varianza" necesitamos la "suma de cuadrados" y el "número de

La suma de cuadrados de las desviaciones de cada una de las observaciones respecto a la

1- X2 = Suma del cuadrado de los valores de las observaciones

Esto es  X2 =14,88 + 30.69 + 4.35 + 2.83 = 52.75

TC = (8,09 + 10,92 + 4,70 + 2,34)2 / 41 = (26,05)2 / 41 = 16,55

Obteniéndose para la suma de cuadrado total el siguiente valor

SS total = 52,75 - 16,55 = 36,20

El número total de mediciones es 41 y por lo tanto el número de grados de libertad

Variabilidad entre grupos o explicada:

La suma de cuadrados correspondiente se obtiene sumando los totales de grupo elevando al

SS entre grupos =  [( Tg)2 / ng ] - TC (80)

SS entre grupos = [ (8.09)2 / 12] +[ (10.92)2 / 11] + [ (4.70)2 / 11] + [ (2.34)2 / 7] - TC

= (5.45+ 10.84+ 2.01+ 0.78) - TC = 18.72 - 16.55 = 2.17

Variabilidad dentro de los grupos o no explicada:

SS dentro de grupos =  X2 -  [( Tg)2 / ng ] (81)

El valor correspondiente al ejemplo será

SS dentro = 52.75 - 18.72 = 34.03

Siendo 37 el número de grados de libertad dentro de los grupos.

Los resultados obtenidos se resumen en el siguiente Cuadro VIII.2

En el se presenta el cuadro de análisis de varianza bajo la forma generalmente adoptada.

La primera columna indica las fuentes de variación analizadas. La presentación de esta

La variación dentro de los grupos se denomina frecuentemente "Error", término que en

Fuente de variación Grados de libertad Suma de Cuadrados Cuadrados Medios Fs

Entre Grupos(Entre 3 2.17 0.72 0.78 (ns)

Dentro de grupos 37 34.03 0.92

Fs = MS "entre grupos"/ MS "dentro de grupos" = 0.72/0.92= 0.78

Su valor sería próximo a la unidad y en la práctica suficientemente pequeño si se lo

A continuación se muestra la estadística descriptiva y el Cuadro del Análisis de Varianza

El ultimo resultado corresponde al test de homocedasticidad cuyo p-valor indica que no

La no homogeneidad de las varianzas puede ser debida en este caso a la diferencia en el

La eficiencia o potencia del test de significación de la F, puede aumentarse:

a) reduciendo el error experimental 2, estimado a través el MS error o dentro de grupo.

b) Aumentando el tamaño de los tratamientos o grupos.