Você está na página 1de 28

Anlisis de Varianza Unidimensional ANOVA

El anlisis de varianza, conocido por las siglas ANOVA, es una extensin del test t y nos permite comparar ms de dos promedios en forma simultnea, para determinar si es que hay diferencias entre dos o ms de esos promedios, mayores significativamente que lo que podra esperarse por el efecto del azar.

Anlisis de Varianza Unidimensional ANOVA

En la ANOVA "one way" estamos interesados en los valores promedios de una variable dependiente medida a nivel de intervalo, dentro de las diferentes categoras, "within" generalmente tres o ms, de la variable independiente.

Anlisis de Varianza Unidimensional ANOVA

ANOVA est basada en la comparacin de dos fuentes de varianza en los grupos muestrales: entre y dentro, "between-" y "within-group".

La varianza entre grupos

La varianza Between-group est a menudo designada como la varianza explicada, porque proviene de la variable agrupada o categorizada.

La varianza dentro de los grupos

La varianza Within-group est a menudo designada como la varianza no explicada, porque es la proporcin de la varianza dejada sin explicar por los grupos.

Donde est la significacin

La lgica de ANOVA es que si la varianza entre grupos es significativamente mayor que la varianza dentro de los grupos, las poblaciones desde las cuales provienen los grupos, pueden ser consideradas ser diferentes en relacin a la variable dependiente.

Diferencia entre promedios, diferencia entre varianzas


En el t test hacamos la siguiente comparacin:

diferencias de promedios t error estndar de diferencia


En el anlisis de varianza:

between- group variance F= within - group variance

Distribucin F
Las varianzas en ANOVA son controlados en su significacin con el concurso de la Distribucin F. La distribucin F siendo en muchoas aspectos similar a la t de Student, se diferencia en que vara en la forma de acuerdo al nmero de grados de libertad usados en el clculo. La distribucin F se empieza a aproximar a la distribucin normal en la medida que los DF aumentan. Siempre es psitivamente curvada, vale decir no podemos tener un valor F negativo. En cambio podemos tener u t negativo.

Ejemplo

Supongamos que un investigador quiere estudiar los efectos de pertenencia tnica en niveles de conocimiento general. Elige al azar 6 blancos, 6 hispnicos y 6 negros y les administra un test de conocimiento general. La Ho es de que el promedio de los tres grupos no diferir significativamente.

Los datos
Blancos 73 75 77 75 78 75 -------------------456 Hispanos 72 78 74 80 83 80 --------------------467 Negros 83 86 89 85 90 95 -------------------528

Promedios grupales 75.5 77.83 88.0 Promedio Total o Gran promedio=456+467+528=1448/18=80.444

Primer paso: Clculo de Sstotal (Sumatoria de Cuadrados)

SS ( X X )
de donde

SStotal ( X Xt )

donde Xt = total mean


SStotal= (73-80.444)2 + (75-80.444)2 + ....+ (9580.444)2 SStotal=722.5

Primer paso: Clculo de Sstotal (Sumatoria de Cuadrados)


SStotal es la sumatoria total de los cuadrados, representando la suma de la variacin en toda la muestra, vale decir es el 100% de la varianza en el conjunto de los datos.
La SStotal se puede disgregar en los siguientes elementos:

SStotal SSwithin SSbetween

Paso segundo: Clculo de SSbetween.


Su frmula es:

SSbe twe e n N ( Xg Xt ) 2 donde N total grupos Xg = promedio grupal Xt = promedio total

SS between = 6(75.5-80.444)2 + 6(77.83 - 80.444)2 + 6(88.0-88.444)2 SS between= 146.66+342.56+342.56 SS between=530.2

Tercer paso: determinar SS within

SSwithin ( X Xg)

Esta frmula nos instruye a sustraer cada puntaje de cada grupo de su respectivo promedio grupal, poner al cuadrado la diferencia y sumar. Despus que ha sido hecho para cada grupo, se suma las sumas. SS within para los Blancos: (73-75.5)2 + (75-75.5)2 + ....+ (75-75.5)2 = 15.5

Tercer paso: determinar SS within

SS within para los Hispnicos: (72-77.83)2 + (78-77.83)2 +.....+(80-77.83)2 =84.8 SSSS within para Negros: (83-88)2 + (86-88)2+...+(95-88)2=92.0 total SS within=15.5+84.8+92.0=192.3

Determinacin de la significacin estadstica: promedios al cuadrado y radio F

Primeramente debemos dividir cada uno de los SS por sus respectivos grados de libertad para arribar a un valor llamado MEAN SQUARE, promedio al cuadrado (MS) el cual es una estimacin de la varianza de la poblacin. Como hemos definido que los grados de libertad son: Para SSbetween: k - 1 3 -1 =2 Para SSwithin: N - k 18 - 3=15

Determinacin de la significacin estadstica: promedios al cuadrado y radio F

SSbetween 530. 2 mean square between = 265.1 df 2 SSwithin 192. 3 mean square within= 12.82 df 15

Determinacin de la significacin estadstica: promedios al cuadrado y radio F

Estamos ahora en condiciones de poder hacer el test de la significacin con la distribucin F. El radio F es determinado por el radio de promedio al cuadrado within en relacin a promedio cuadrado between. Si no hay diferencias entre los grupos las varianzas between-group y within-group sern aproximadamente iguales y el valor de F tender a 1. Mientras ms exceda la varianza between-group la varianza withingroup, ms grande es la probabilidad de que los grupos representen poblaciones diferentes.

Determinacin de la significacin estadstica: promedios al cuadrado y radio F


En este caso:

MSbetween 265.1 F 20. 66 MSwithin 12.83


Este valor de F de 20.66 significa que la varianza between-group es 20.66 veces ms grande que la varianza within-group. Nuestra decisin se hace comparando nuestro F computado con el F crtico en las tablas F. El valor crtico de F depende del nivel alfa seleccionado y los grados de libertad

Determinacin de la significacin estadstica: promedios al cuadrado y radio F

Sources of Variance

SS

df

Mean Square

Sig.

Between

530.2

265.1

20.66

<.001

Within

192.3

15

12.82

Total

722.5

17

Operacin del anlisis de varianza con Spss

Operacin del anlisis de varianza con Spss

A una muestra de alumnos chilenos se les pregunta acerca de la biblioteca del establecimiento. Frente a la pregunta podras darnos tu opinin acerca de la biblioteca del liceo? Las alternativas de respuestas eran 1) no voy a la biblioteca del liceo, 2) rara vez me sirve para mis estudios, 3) slo algunos libros me sirven para mis estudios, 4) es una biblioteca con muchos libros tiles para mis estudios. Esta opinin la confrontamos con el resultado pronosticado en castellano. La hiptesis es de que a medida que aumenta la utilizacin y opinin favorable de la biblioteca se produce un mejor pronstico del resultado escolar en castellano.

Operacin del anlisis de varianza con Spss

Debemos utilizar un anlisis de varianza pues tenemos como variable independiente la opinin de la biblioteca categorizada en una escala de 4 categoras. La variable dependiente es el resultado pronosticado en castellano.

Operacin del anlisis de varianza con Spss

Tenemos por tanto en la ventana de la variable dependiente nuestra variable resultado pronosticado en castellano (v99) y como Factor la variable opinin sobre la biblioteca (v24x).

Operacin del anlisis de varianza con Spss


Para interpretar los resultados que obtengamos, es til obtener una descripcin de la variable dependiente a travs de los grupos. Ello lo obtenemos a travs de elegir OPCIONES

Operacin del anlisis de varianza con Spss


Antes de proceder con el anlisis, volvemos al men principal de ANOVA y elegimos POST-HOC, men donde podremos seleccionar una tcnica para comparar grupo con grupo y auscultar sus diferencias significativas. En otras palabras, el programa ANOVA calcula primeramente si en general existen o no diferencias significativas al interior del conjunto de grupos que componen la variable independiente, pero no sabremos acerca de las diferencias especficas grupo con grupo. Esto lo obtenemos a travs del anlisis POST-HOC.

Operacin del anlisis de varianza con Spss


N Media Desviacin tpica Error tpico Intervalo de confianza para la media al 95% Mnimo Mximo

Lmite inferior

Lmite superior

No voy a la biblioteca rara vez me sirve para mis estudios

510

5.3824

.7038

3.116E-02

5.3211

5.4436

3.00

7.00

1070

5.4575

.6968

2.130E-02

5.4157

5.4993

1.00

7.00

algunos libros me sirven

3652

5.5374

.6873

1.137E-02

5.5151

5.5597

1.00

7.00

con muchos libros tiles para mis estudios Total

3527

5.5639

.6796

1.144E-02

5.5414

5.5863

2.00

7.00

8759

5.5293

.6880

7.351E-03

5.5149

5.5437

1.00

7.00

Operacin del anlisis de varianza con Spss


Suma de cuadrados gl Media cuadrtica F Sig.

Inter-grupos

20.989

6.996

14.851

.000

Intra-grupos

4124.585

8755

.471

Total

4145.574

8758

El anlisis ANOVA arroja un coeficiente F de Fisher de 14.851, con un nivel de significacin de 0.000, vale decir, la probabilidad de aceptar la hiptesis de nulidad de que no hay diferencias significativas entre los grupos relativos a la opinin sobre la biblioteca en relacin al resultado pronosticado en castellano, es prcticamente nula. Se debe por tanto aceptar con un amplio margen de seguridad estadstica que para la poblacin en estudio, la opinin acerca de la biblioteca se asocia positivamente con el resultado pronosticado en castellano.

Você também pode gostar