Você está na página 1de 7

Anlisis de la Varianza con un slo factor.

Esta es una prueba generalizada del contraste de medias para muestras con datos independiente. Se comparan tres o ms muestras independientes cuya clasificacin viene dada por la variable llamada Factor. La base de este procedimiento consiste en estudiar si el Factor influye sobre la Variable Respuesta, y la forma de hacerlo es analizando como varan los datos dentro de cada uno de los grupos en que clasifica el Factor a la observaciones de la Variable Respuesta.

Ejemplo 1. Supongamos que estamos interesados en conocer si existen diferencias significativas entre el tiempo diario de dedicacin a la investigacin de los profesores, en funcin de la categora que tienen. Para ello, elegiremos las siguientes opciones desde el men principal:

y con esto se abre un cuadro de dilogo con los siguientes campos: Dependientes: en este campo se introduce la variable respuesta a analizar. En el Ejemplo 5.1 sera Tinvest (tiempo diario para la investigacin). Factor: aqu se introduce la variable de clasificacin, que ha de ser categrica. Para el ejemplo, se considera la Categora de los profesores. Adems de los campos anteriores existen tres botones cuya utilidad es la siguiente: CONTRASTES. Con este botn se trata de averiguar si los valores promedios de la variable dependiente para cada nivel del factor, siguen o no alguna tendencia determinada, lineal, cuadrtica, cbica, de grado 4 5. Adems de poder realizar cualquier tipo de comparacin a priori, entre las medias de la variable respuesta para los niveles del factor que se elijan. Permite realizar hasta 10 contrastes diferentes, con 50 coeficientes en cada uno de ellos. Para excluir algn grupo se le asigna el coeficiente 0. POST HOC. Este tiene como finalidad averiguar cul o cules de los diferentes grupos o niveles del factor son los que difieren entre s, a travs de una serie de pruebas diferentes (Contrastes a posteriori). OPCIONES. Este botn permite mostrar una serie de estadsticos descriptivos para cada grupo de la muestra o nivel del factor, el test de Levene para comprobar la

homogeneidad de varianzas entre los distintos grupos, un grfico de las medias de cada grupo y la forma de tratar los valores perdidos. Ejecutamos el procedimiento con las variables indicadas anteriormente y elegimos dentro de OPCIONES la prueba de homogeneidad de varianzas, obtenindose los siguientes resultados.

Tabla 1: Anlisis de la Varianza con 1 Factor

ANOVA de un factor

Prueba de homogeneidad de varianzas Tiempo diario para la investigacin Estadstico de Levene gl1 gl2 Sig. 1,713 5 74 0,142 ANOVA Tiempo diario para la investigacin Suma de cuadrados Media gl cuadrtica F Sig.

Inter-grupos 190239,152 5 38047,830 47,177 ,000 Intra-grupos 59680,480 74 Total 249919,632 79 806,493

En la Tabla 1 aparecen los resultados sobre la homogeneidad de varianzas y el Anova. Como se puede apreciar en la homogeneidad de varianzas, el p-valor es de 0.142 que es mayor que 0.05, luego podemos aceptar la igualdad de varianzas entre los grupos. Mientras que en el Anova, podemos ver que el estadstico es bastante grande 47.177 y el p-valor vale 0, lo que nos conduce a rechazar el que los tiempos medios dedicados a la investigacin sean iguales segn la categora que tiene el profesor.

Ejemplo 2. Puesto que el anlisis ha dado significativo, veamos cules de los niveles del factor difieren entre s. Para ello, volvemos a entrar en el procedimiento Anova de un

factor, y con las mismas variables seleccionadas pulsamos en el botn POST HOC. Se muestra a continuacin otro cuadro donde aparece una serie de posibles constrastes a posteriori. Supuestas las varianzas iguales, estn el de Bonferroni, Scheffe, Tuckey, Duncan, etc., y entre los que se asume varianzas distintas el T2 de Tamnhane, el T3 de Dunnett, etc. Elegimos el test de Tuckey y pulsamos CONTINUAR y ACEPTAR. Los resultados obtenidos indican que los tiempos medios dedicados a la investigacin para los catedrticos de escuela, los titulares de universidad y los titulares de escuela se pueden considerar iguales, y por otro lado, tambin ocurre lo mismo con los de los profesores asociados y los de los ayudantes.

ANLISIS DE LA VARIANZA CON UN FACTOR (ANOVA) El anlisis de la varianza permite contrastar la hiptesis nula de que las medias de K poblaciones (K >2) son iguales, frente a la hiptesis alternativa de que por lo menos una de las poblaciones difiere de las dems en cuanto a su valor esperado. Este contraste es fundamental en el anlisis de resultados experimentales, en los que interesa comparar los resultados de K 'tratamientos' o 'factores' con respecto a la variable dependiente o de inters.

El Anova requiere el cumplimiento los siguientes supuestos:


Las poblaciones (distribuciones de probabilidad de la variable dependiente correspondiente a cada factor) son normales. Las K muestras sobre las que se aplican los tratamientos son independientes. Las poblaciones tienen todas igual varianza (homoscedasticidad).

El ANOVA se basa en la descomposicin de la variacin total de los datos con respecto a la media global (SCT), que bajo el supuesto de que H0 es cierta es una estimacin de obtenida a partir de toda la informacin muestral, en dos partes:

Variacin dentro de las muestras (SCD) o Intra-grupos, cuantifica la dispersin de los valores de cada muestra con respecto a sus correspondientes medias. Variacin entre muestras (SCE) o Inter-grupos, cuantifica la dispersin de las medias de las muestras con respecto a la media global.

Las expresiones para el clculo de los elementos que intervienen en el Anova son las siguientes:

Media

Global:

Variacin Total: Variacin Intra-grupos: Variacin Inter-grupos: Siendo xij el i-simo valor de la muestra j-sima; nj el tamao de dicha muestra y su media.

Cuando la hiptesis nula es cierta SCE/K-1 y SCD/n-K son dos estimadores insesgados de la varianza poblacional y el cociente entre ambos se distribuye segn una F de Snedecor con K-1 grados de libertad en el numerador y N-K grados de libertad en el denominador. Por lo tanto, si H0 es cierta es de esperar que el cociente entre ambas estimaciones ser aproximadamente igual a 1, de forma que se rechazar H0 si dicho cociente difiere significativamente de 1. La secuencia para realizar un ANOVA es: Analizar Comparar medias ANOVA de un factor Se abre el siguiente cuadro de dilogo:

Se selecciona la variable que se considera Dependiente y la variable Factor y con el botn Opciones se activan EstadsticosDescriptivos y Homogeneidad de varianzas.

Al aceptar en el visor de resultados aparecen los siguientes cuadros:

Descriptivos. Recoge la media, la desviacin tpica, el intervalo de confianza del 95% (por defecto) para la media correspondientes a la variable dependiente para cada uno de los grupos definidos por el factor. Prueba de homogeneidad de varianzas. Contiene el valor del estadstico de Levene del contraste de la hiptesis de homoscedasticidad con el nivel de significacin crtico. ANOVA. Contiene las sumas de cuadrados inter-grupos, intra-grupos y total, sus correspondientes grados de libertad y el valor del estadstico de prueba F junto con el nivel de significacin crtico.

Como complemento grfico de este anlisis, para obtener una primera aproximacin acerca de si es razonable o no la hiptesis nula, se selecciona Grficos > Barras de error y se activa la opcin Simple. Con el botn Definir se abre el siguiente cuadro de dilogo:

Se selecciona en Variable la variable dependiente del ANOVA y en el Eje de categoras la variable factor. El intervalo de confianza para la media se calcula por defecto al 95% de confianza. Al aceptar aparece en el visor de resultados los puntos que respresentan a la media de cada grupo junto con los lmites del correspondiente intervalo de confianza para la media poblacional. Si los puntos que representan las medias estn desigualmente distribuidos en el grfico se tiene un indicio de que a nivel poblacional no puede sostenerse la hiptesis de igualdad de medias; es decir, por lo menos uno de los niveles del factor influye significativamente sobre la variable dependiente. EJEMPLOS 3

Con los datos de la encuesta sobre transporte, Enctrans.sav, razonar si puede aceptarse que el tipo de transporte utilizado, Trans, influye sobre la variable tiempo. Con la opcin de men Grficos > Barras de error > Simple y con el botn Definir se selecciona como Variable Tiempo y enEje de categoras la variable Trans; al aceptar se obtiene la siguiente representacin grfica:

Como puede observarse, los puntos que representan a las medias de cada grupo aparecen dispersos a diferentes niveles; sobre todo la media del grupo definido por el factor Tren. El intervalo de confianza para la media correspondiente al grupo definido por el factor Metro est contenido dentro del intervalo correspondiente al grupo definido por el factor Bus, as como, el intervalo correspondiente al factor Coche est contenido dentro de los intervalos correspondientes definidos por los factores Metro y Otros. El grfico, por tanto, parece sugerir no una nica poblacin sino tres poblaciones con distintas medias. Para realizar el anlisis de la varianza propiamente dicho la secuencia es Analizar > Comparar medias > ANOVA de un factor. En el cuadro de dilogo se selecciona Tiempo como variable Dependiente y Trans como Factor. Para contrastar la hiptesis de igualdad de varianzas se abre con el botn correspondiente el cuadro de dilogo ANOVA de un factor: Opcionesy se activa Homogeneidad de varianzas. Si se desea un anlisis descriptivo del comportamiento de la variable dependiente dentro de cada grupo se activa tambin la opcin Descriptivos. Al aceptar se obtienen los siguientes cuadros de resultados:

Este cuadro contiene un anlisis descriptivo de la variable dependiente por grupos, as como, los lmites superior e inferior para la media de cada grupo al 95% de confianza.

El estadstico de Levene toma un valor lo suficientemente pequeo para no rechazar la hiptesis de homocesdaticidad a los niveles de significacin habituales.

En el cuadro de resultados del ANOVA, el valor del estadstico de prueba, F=6,450, es significativamente distinto de 1 para cualquier nivel de significacin y, por lo tanto, se rechaza la hiptesis nula de igualdad de medias y queda confirmada la primera impresin proporcionada por el grfico de barras de error.

Você também pode gostar