Escolar Documentos
Profissional Documentos
Cultura Documentos
El anlisis de varianza, conocido por las siglas ANOVA, es una extensin del test t y nos permite comparar ms de dos promedios en forma simultnea, para determinar si es que hay diferencias entre dos o ms de esos promedios, mayores significativamente que lo que podra esperarse por el efecto del azar.
En la ANOVA "one way" estamos interesados en los valores promedios de una variable dependiente medida a nivel de intervalo, dentro de las diferentes categoras, "within" generalmente tres o ms, de la variable independiente.
ANOVA est basada en la comparacin de dos fuentes de varianza en los grupos muestrales: entre y dentro, "between-" y "within-group".
La varianza Between-group est a menudo designada como la varianza explicada, porque proviene de la variable agrupada o categorizada.
La varianza Within-group est a menudo designada como la varianza no explicada, porque es la proporcin de la varianza dejada sin explicar por los grupos.
La lgica de ANOVA es que si la varianza entre grupos es significativamente mayor que la varianza dentro de los grupos, las poblaciones desde las cuales provienen los grupos, pueden ser consideradas ser diferentes en relacin a la variable dependiente.
Distribucin F
Las varianzas en ANOVA son controlados en su significacin con el concurso de la Distribucin F. La distribucin F siendo en muchoas aspectos similar a la t de Student, se diferencia en que vara en la forma de acuerdo al nmero de grados de libertad usados en el clculo. La distribucin F se empieza a aproximar a la distribucin normal en la medida que los DF aumentan. Siempre es psitivamente curvada, vale decir no podemos tener un valor F negativo. En cambio podemos tener u t negativo.
Ejemplo
Supongamos que un investigador quiere estudiar los efectos de pertenencia tnica en niveles de conocimiento general. Elige al azar 6 blancos, 6 hispnicos y 6 negros y les administra un test de conocimiento general. La Ho es de que el promedio de los tres grupos no diferir significativamente.
Los datos
Blancos 73 75 77 75 78 75 -------------------456 Hispanos 72 78 74 80 83 80 --------------------467 Negros 83 86 89 85 90 95 -------------------528
SS ( X X )
de donde
SStotal ( X Xt )
SSwithin ( X Xg)
Esta frmula nos instruye a sustraer cada puntaje de cada grupo de su respectivo promedio grupal, poner al cuadrado la diferencia y sumar. Despus que ha sido hecho para cada grupo, se suma las sumas. SS within para los Blancos: (73-75.5)2 + (75-75.5)2 + ....+ (75-75.5)2 = 15.5
SS within para los Hispnicos: (72-77.83)2 + (78-77.83)2 +.....+(80-77.83)2 =84.8 SSSS within para Negros: (83-88)2 + (86-88)2+...+(95-88)2=92.0 total SS within=15.5+84.8+92.0=192.3
Primeramente debemos dividir cada uno de los SS por sus respectivos grados de libertad para arribar a un valor llamado MEAN SQUARE, promedio al cuadrado (MS) el cual es una estimacin de la varianza de la poblacin. Como hemos definido que los grados de libertad son: Para SSbetween: k - 1 3 -1 =2 Para SSwithin: N - k 18 - 3=15
SSbetween 530. 2 mean square between = 265.1 df 2 SSwithin 192. 3 mean square within= 12.82 df 15
Estamos ahora en condiciones de poder hacer el test de la significacin con la distribucin F. El radio F es determinado por el radio de promedio al cuadrado within en relacin a promedio cuadrado between. Si no hay diferencias entre los grupos las varianzas between-group y within-group sern aproximadamente iguales y el valor de F tender a 1. Mientras ms exceda la varianza between-group la varianza withingroup, ms grande es la probabilidad de que los grupos representen poblaciones diferentes.
Sources of Variance
SS
df
Mean Square
Sig.
Between
530.2
265.1
20.66
<.001
Within
192.3
15
12.82
Total
722.5
17
A una muestra de alumnos chilenos se les pregunta acerca de la biblioteca del establecimiento. Frente a la pregunta podras darnos tu opinin acerca de la biblioteca del liceo? Las alternativas de respuestas eran 1) no voy a la biblioteca del liceo, 2) rara vez me sirve para mis estudios, 3) slo algunos libros me sirven para mis estudios, 4) es una biblioteca con muchos libros tiles para mis estudios. Esta opinin la confrontamos con el resultado pronosticado en castellano. La hiptesis es de que a medida que aumenta la utilizacin y opinin favorable de la biblioteca se produce un mejor pronstico del resultado escolar en castellano.
Debemos utilizar un anlisis de varianza pues tenemos como variable independiente la opinin de la biblioteca categorizada en una escala de 4 categoras. La variable dependiente es el resultado pronosticado en castellano.
Tenemos por tanto en la ventana de la variable dependiente nuestra variable resultado pronosticado en castellano (v99) y como Factor la variable opinin sobre la biblioteca (v24x).
Lmite inferior
Lmite superior
510
5.3824
.7038
3.116E-02
5.3211
5.4436
3.00
7.00
1070
5.4575
.6968
2.130E-02
5.4157
5.4993
1.00
7.00
3652
5.5374
.6873
1.137E-02
5.5151
5.5597
1.00
7.00
3527
5.5639
.6796
1.144E-02
5.5414
5.5863
2.00
7.00
8759
5.5293
.6880
7.351E-03
5.5149
5.5437
1.00
7.00
Inter-grupos
20.989
6.996
14.851
.000
Intra-grupos
4124.585
8755
.471
Total
4145.574
8758
El anlisis ANOVA arroja un coeficiente F de Fisher de 14.851, con un nivel de significacin de 0.000, vale decir, la probabilidad de aceptar la hiptesis de nulidad de que no hay diferencias significativas entre los grupos relativos a la opinin sobre la biblioteca en relacin al resultado pronosticado en castellano, es prcticamente nula. Se debe por tanto aceptar con un amplio margen de seguridad estadstica que para la poblacin en estudio, la opinin acerca de la biblioteca se asocia positivamente con el resultado pronosticado en castellano.