Você está na página 1de 16

INTRODUCCIN AL ANLISIS DE LA VARIANZA

Jos Luis Vicente Villardn Departamento de Estadstica

ANALISIS DE LA VARIANZA
DISEO DE UNA VIA

Disponemos de r poblaciones, generalmente correspondientes a r tratamientos experimentales. Cada uno de los tratamientos Ti, (i=1, , r) se supone que tiene distribucin normal con media i y varianza 2, comn a todos ellos, es decir se trata de poblaciones normales y homoscedsticas. De cada una de las poblaciones (o tratamientos), tomamos una muestra de tamao ni. Las observaciones obtenidas se pueden recoger en una tabla de la forma

es decir xij es la observacin j del grupo experimental i. Llamaos a las medias muestrales de los grupos y de todas las observaciones. a la media

Cuando se trata de un experimento diseado, es decir, cuando se trata de la aplicacin de r tratamientos a un conjunto de unidades experimentales, estas deben seleccionarse para que sean homogneas, de forma que no se introduzcan factores de variacin distintos del que se desea controlar. La asignacin de los tratamientos a cada una de las unidades debe hacerse al azar. Es lo que se conoce como diseo completamente al azar. El modelo matemtico subyacente a este tipo de diseo es

donde

es la cantidad que depende del tratamiento usado

(descompuesta en una media global y un efecto del tratamiento) y es la cantidad que depende solamente de la unidad experimental y que se identifica con el error experimental. La hiptesis de que los distintos tratamientos no producen ningn efecto (o la de que las medias de todas las poblaciones son iguales) se contrasta mediante el anlisis de la varianza de una va, comparando la variabilidad entre grupos con la variabilidad dentro de los grupos.

El anlisis de la varianza se basa en la descomposicin de la variabilidad total en dos partes, una parte debida a la variabilidad entre las distintas poblaciones o tratamientos (variabilidad entre grupos o variabilidad explicada por el diseo) y otra parte que puede considerarse como la variabilidad intrnseca de las observaciones (variabilidad dentro de los grupos o residual).

La variabilidad entre grupos

mide la discrepancia entre los grupos y la media global, de forma que si no hay diferencias entre ellos (la hiptesis nula es cierta) obtendremos variabilidades pequeas. Si, por el contrario, la hiptesis nula es falsa, cabe esperar que la variabilidad entre grupos sea grande. La variabilidad dentro de los grupos

mide la variabilidad intrnseca de las observaciones, es decir, si el experimento est bien diseado y no se incluyen factores de variacin distintos al estudiado, debe ser error puramente aleatorio producido como resultado de la variabilidad biolgica del material experimental. El contraste del Anlisis de la varianza se basa en la comparacin de la variabilidad entre y la variabilidad dentro, rechazaremos la hiptesis nula siempre que la variabilidad entre sea grande, pero utilizando como patrn de comparacin la variabilidad dentro. Es decir, aceptaremos un efecto de los tratamientos siempre que estos produzcan mayores diferencias en las unidades experimentales que las que habra sin la aplicacin de los mismos. Antes de proceder a la comparacin hemos de dividir las sumas de cuadrados por sus correspondientes grados de libertad, relacionados con el nmero de observaciones con las que se realiza el clculo. De esta forma obtenemos los cuadrados medios o estimadores de las variabilidades. La informacin completa se resume en la tabla siguiente. Es la que se conoce como tabla de ANOVA y resume toda la informacin necesaria para realizar el correspondiente contraste. Fuente Entre Residual Total Suma de cuadrados g.l. Estimador Fexp r-1 n-r n-1

El cociente entre la variabilidad entre y la variabilidad dentro, una vez que se han hecho comparables, sigue una distribucin F de Snedecor con r-1 y n-r grados de libertad. La distribucin nos sirve para buscar el valor a partir del cual el cociente es lo suficientemente

grande como para declarar estadsticamente significativas.

las

diferencias

entre

grupos

Los estimadores de los efectos de los tratamientos se estiman a partir de

y la parte propia de cada observacin (o residual)

Los residuales pueden servirnos para la validacin de las hiptesis bsicas. Recurdese que, en realidad, un anlisis de la varianza de una va es equivalente a un modelo de regresin en el que solo aparece una regresora cualitativa con r categoras (mediante las correspondientes variables ficticias). La validacin de las hiptesis bsicas puede hacerse entonces de la misma manera que en un modelo re regresin, utilizando grficos de residuales.

ANALISIS DE DOS VIAS

En muchas situaciones prcticas la unidades experimentales no son homogneas por lo que conviene agruparlas en distintos conjuntos de observaciones homogneas. A tales conjuntos se les denomina bloques. Los tratamientos se aplican dentro de cada bloque siguiendo las mismas tcnicas de aleatorizacin expuestas previamente. Se procurar que los tratamientos estn representados de la misma manera en todos los bloques. Diseo en bloques al azar Supongamos que se dispone de r tratamientos a comparar y que se dividen las observaciones en s bloques con r unidades experimentales cada uno. Dentro de cada bloque se aplica una vez cada tratamiento utilizando un procedimiento de aleatorizacin. Los datos resultantes seran los siguientes

El modelo matemtico es ahora

Donde i es el efecto debido al bloque, j es el efecto debido al tratamiento y ij es el error experimental.

Obsrvese que solamente hemos sustrado del residual la parte correspondiente a los bloques. -Anlisis estadstico: Anlisis de la varianza de dos vas. Las hiptesis de que los distintos tratamientos y los bloques no producen ningn efecto se contrasta mediante el anlisis de la varianza de dos vas, comparando la variabilidad entre bloques y la variabilidad entre tratamientos con la variabilidad dentro de los grupos. Los resultados fundamentales se resumen en la tabla siguiente. Fuente
Entre Bloques

Suma de cuadrados g.l. s-1

Estimador

Fexp

Entre Tratam.

r-1

Residual

(r-1)(s1)

Total

n-1

Los estimadores de los efectos de los bloques y tratamientos se estiman a partir de

y la parte propia de cada observacin (o residual)

Los residuales pueden servirnos para la validacin de las hiptesis bsicas de la misma manera que en el diseo de una va.

IDEAS BASICAS SOBRE EXPERIMENTOS FACTORIALES


-Definiciones generales y discusin
A cada uno de los tratamientos bsicos le denominaremos factor y a cada una de sus posibles formas (o valores) la denominaremos nivel del factor. Una combinacin de un nivel de cada uno de los factores estudiados determina un tratamiento. El experimento en el que todas las combinaciones de niveles de los factores son interesantes se denomina experimento factorial.

-Tipos de factores
-Factores cualitativos especficos. Factores susceptibles de aplicacin Factores de clasificacin -Factores cuantitativos -Factores cualitativos ordenados. -Factores cualitativos muestreados.

Efectos principales e interaccin en un experimento de dos factores. Supongamos que tenemos un experimento de dos factores A y B con cuatro niveles cada uno, y supongamos, para simplificar que no existe variacin no controlada. Factor B Factor nivel 1 nivel 2 nivel 3 nivel 4 media A nivel 1 9 11 14 15 12.25 nivel 2 12 14 17 18 15.25 nivel 3 10 12 15 16 13.25 nivel 4 13 15 18 19 16.25 media 11 13 16 17 Tenemos varias formas de cacterizar esta tabla: a)La diferencia entre las observaciones de dos niveles cualesquiera de A es la misma para todos los niveles de B. b)La diferencia entre las observaciones de dos niveles cualesquiera de B es la misma para todos los niveles de A. c) Los efectos de los dos factores son aditivos. d) Los residuales al restar los efectos fila y columna son cero. En este caso se dice que los factores no interactuan o que sus efectos son aditivos. Si estas condiciones no una interaccin entre A y B. se verifican decimos que hay

Se dice que hay interaccin cuando las diferencias entre dos niveles cualesquiera de uno de los factores dependen de los niveles del otro factor.

Factor B Factor nivel 1 nivel 2 nivel 3 nivel 4 media A nivel 1 9 11 14 15 12.25 nivel 2 12 14 17 18 15.25 nivel 3 11 11 14 17 13.25 nivel 4 12 16 19 18 16.25 media 11 13 16 17 Efectos principales: Efectos de cada uno de los niveles de los factores por separado (promediando sobre el otro factor). Interaccin: Efectos producidos por la aplicacin conjunta de los niveles de los dos factores. Grficos de interaccin

Efectos aditivos

Efectos no aditivos

Experimento factorial con dos factores de variacin y el mismo nmero de observaciones por casilla. Se dispone de un conjunto de observaciones homogneas y se asigna los tratamientos (combinacin de niveles de los dos factores) aleatoriamente a las unidades. Los datos resultantes seran los siguientes

El modelo matemtico es ahora

Donde i es el efecto debido al bloque, j es el efecto debido al tratamiento, (ij es el efecto conjunto (interaccin) y ij es el error. -Anlisis estadstico: Anlisis de la varianza de dos vas. Las hiptesis de que los distintos factores no producen ningn efecto y de que no existe interaccin se contrastan mediante el anlisis de la varianza de dos vas con interaccin, comparando la variabilidad entre los niveles del factor A, la variabilidad entre los niveles del factor B, y la variabilidad debida a la interaccin con la variabilidad dentro de los grupos o residual. Fuente Suma de cuadrados g.l. Estimador Fexp

Filas

s-1

Columnas

r-1

Interacc.

(r-1)(s1)

Resid.

rs(t-1)

Total

rst-1

Los estimadores de los efectos de los bloques y tratamientos se estiman a partir de

y la parte propia de cada observacin (o residual)

Los residuales pueden servirnos para la validacin de las hiptesis bsicas de la misma manera que en el diseo de una va.

EJEMPLO

Se est investigando cual es el efecto de tres tipos de abono sobre dos tipos de suelo. Se espera que el efecto de los distintos abonos se manifieste de forma diferente dependiendo del tipo de suelo. Para el presente estudio tomaremos dos tipos de suelo, cido y alcalino y tres tipos de abono que denotaremos con A, B y C. Tenemos as dos factores (suelo y abono) con 2 y 3 niveles respectivamente, que resultan en 6 combinaciones. Tomaremos un diseo factorial con dos factores y tres rplicas en cada una de las combinaciones de los niveles de los dos factores. La respuesta es un ndice de abundancia de una determinada especie tras la aplicacin de los distintos abonos. Los resultados se muestran en la tabla siguiente.

A 8 cido 4 0 14 Alcalino 10 6

B 10 8 6 4 2 0

C 8 6 4 15 12 9

Você também pode gostar