Você está na página 1de 6

Una forma de análisis de varianza (ANOVA) Ejemplo Problema

Introducción
Análisis de Varianza (ANOVA) es una técnica de prueba de hipótesis utilizado para probar la igualdad de dos o más de la
población (o tratamiento) significa mediante el examen de las varianzas de las muestras que se toman. ANOVA permite
determinar si las diferencias entre las muestras son simplemente debido al error aleatorio (errores de muestreo) o si hay
sistemáticas efectos del tratamiento que causa la media en un grupo a diferir de la media en otro.

La mayoría de las veces ANOVA se utiliza para comparar la igualdad de tres o más medios, sin embargo, cuando los medios de dos

muestras se compararon mediante ANOVA es equivalente a usar una prueba t para comparar las medias de muestras independientes.

ANOVA se basa en la comparación de la varianza (o variación) Entre las muestras de datos a la variación

dentro cada muestra particular. Si el entre variación es mucho mayor que la variación dentro de, los medios de diferentes

muestras no será igual. Si el entre y dentro de las variaciones son aproximadamente del mismo tamaño, entonces no habrá

ninguna diferencia significativa entre medias de la muestra. Supuestos de ANOVA:

(I) Todas las poblaciones involucradas siguen una distribución normal. (Ii) Todas las poblaciones tienen la misma varianza (o

desviación estándar). (Iii) Las muestras se seleccionaron al azar e independientes uno de otro. Desde ANOVA asume las poblaciones

implicadas siguen una distribución normal, ANOVA cae en una categoría de pruebas de hipótesis conocidas como pruebas

paramétricas. Si las poblaciones involucradas no siguen una distribución normal, una prueba de ANOVA no podía ser utilizado para

examinar la igualdad de las medias de la muestra. En su lugar, habría que utilizar una prueba no paramétrica (prueba o de distribución

libre), que es una forma más general de la prueba de hipótesis que no se basa en la hipótesis de distribución.

Ejemplo
Considere este ejemplo:
Supongamos que la Junta Nacional de Seguridad del Transporte (NTSB) quiere examinar la seguridad de los coches compactos, coches de
tamaño medio, y los coches de tamaño completo. Se recoge una muestra de tres para cada uno de los tratamientos (tipos de coches).
Utilizando los datos hipotéticos se proporcionan a continuación, comprobar si la presión media aplicada a la cabeza del conductor durante
una prueba de choque es igual para cada uno de los tipos de coche. Utilizar α =
5%.

Tabla ANOVA.1
Compactos vehículos automóviles de tamaño mediano coches de tamaño completo

643 469 484


655 427 456
702 525 402

x 666,67 473,67 447,33


S 31.18 49.17 41.68
(1.) las hipótesis nula y alternativa
La hipótesis nula para un ANOVA asume siempre las medias de población son iguales. Por lo tanto, podemos escribir la hipótesis

nula como: H 0:
μ=μ2 1 = μ 3 - La presión media cabeza es estadísticamente igual entre los tres tipos de coches.

Dado que la hipótesis nula supone que todos los medios son iguales, podemos rechazar la hipótesis nula si sólo se quiere decir no es
igual. Por lo tanto, la hipótesis alternativa es: H un: Al menos una presión media no es estadísticamente iguales.

(2.) Se calcula la estadística de prueba apropiado La estadística de prueba en ANOVA es la relación de la Entre y dentro variación en los
datos. De ello se sigue una distribución F.

Suma total de cuadrados - la variación total en los datos. Es la suma de la variación entre y dentro.

r do

Suma total de cuadrados (SST) = ΣΣ


2
( ij
- XX) , donde r es el número de filas en la tabla, c es
yo= 1= j 1

el número de columnas, x es la media general, y x es


ij
el yo ésima observación en el j ésima columna.

Utilizando los datos de la Tabla ANOVA.1 podemos encontrar la gran media:

= Σij + + + + 484 525


456 + 427 469
+ 702 655
+ 643 ( + 402 )
= = 529 . 22
NXX 9

= SST
2 2 2 2
643-( 529 . 22) + 655-( 529 . 22) + 702-( 529 . 22) + 469-( 529 . 22) + ... + 402 ( 529 .- 22) = 96303 . 55
2

Entre suma de cuadrados (o Tratamiento Suma de Cuadrados) - variación de los datos entre las diferentes muestras (o
tratamientos).

Tratamiento suma de cuadrados (SSTR) = Σ r es el número de filas de la


2
( r jj
- XX) , dónde j

j ésimo tratamiento y
x esj la media de la j ésimo tratamiento.

Utilizando los datos en la Tabla ANOVA.1, SSTR =


2 2
(3 [ 666* - 529 . 22) + (3 [] 473* . - 529 . 22)
2
. 67 67 + (3 [] 447 . 33- 529
* . 22) = 86049] . 55
Dentro de variación (o suma de cuadrados) - variación en los datos de cada tratamiento individual.

Suma de cuadrados (SSE) = ΣΣ - ( ij


XXj )
2

De la Tabla ANOVA.1, SSE =


2 2 2
643 -[( 666 . 67 ) + 655-( 666 . 67 ) + 702-( 666 . 67 ) ]+
2 2
469 -[( 473 . 67 ) + 427-( 473 . 67 ) + 525-( 473 . 67 ) ] +]
2

2 2
484 -[( 447 . 33) + 456-( 447 . 33) + 402-( 447 . 33)
2

= 10.254.

Tenga en cuenta que SST = SSTR + SSE (96.303,55 86.049,55 + = 10254).

Por lo tanto, sólo es necesario para calcular cualquier dos de las tres fuentes de variación para llevar a cabo un ANOVA. Especialmente durante
los primeros problemas que usted se resuelve, debe calcular los tres para la práctica.

El siguiente paso en un ANOVA es calcular las fuentes “promedio” de variación en los datos utilizando SST, SSTR, y SSE.

SST
Total de cuadrados medios (MST) “Variación total promedio en los datos” (N es el total
- =1
norte
número de observaciones)

96303 =
. 55
12037 . 94
MST = - 9 ()
1

La media de Tratamiento Square (MSTR) = “Promedio entre la variación” (c es el número de


- 1
c SSTR
columnas en la tabla de datos)

86049 =
. 55
43024 . 78
MSTR = -1 3 ()

SSE
Error cuadrático medio (MSE) = N “Promedio dentro de variación”
- c

10254 =
1709
MSE = -3 9 ()

Nota: MST ≠ MSTR + MSE


La estadística de prueba puede ahora ser calculado. Para un ANOVA de una vía de la estadística de prueba es igual a la relación de MSTR
y MSE. Esta es la relación entre el “promedio entre la variación” para el “promedio dentro de la variación”. Además, esta relación se conoce
a seguir una distribución F. Por lo tanto,

MSTR 43024 =
. 78
= 25 . 17
F= MSE 1709 . La intuición aquí es relativamente sencillo. Si el promedio
entre la variación aumenta en relación a la media dentro de la variación, el estadístico F aumentará y también lo hará nuestra oportunidad de
rechazar la hipótesis nula.

(3.) Obtener el valor crítico


Para encontrar el valor crítico de una distribución F se debe conocer el numerador (MSTR) y grados denominador (MSE) de

la libertad, junto con el nivel de significación. F CV tiene DF1 y DF2 grados de libertad, donde DF1 son los grados de libertad

del numerador igual a c-1 y DF2 es los grados de libertad del denominador igual a Nc.

En nuestro ejemplo, DF1 = 3 - 1 = 2 y gl2 = 9 - 3 = 6. Por lo tanto, tenemos que encontrar CV F 6 , 2 correspondiente a
CV
α = 5%. Utilizando las tablas de F en el texto se determina que F 6 , 2 = 5.14.

(4.) regla de decisión


Rechaza la hipótesis nula si: F (valor observado)> F CV ( valor crítico). En nuestro ejemplo 25.17
> 5.14, por lo que se rechaza la hipótesis nula.

(5.) Interpretación
Ya que rechaza la hipótesis nula, tenemos un 95% de confianza (1- α) que la presión media de la cabeza no es estadísticamente igual para
compacto, de tamaño mediano, y los coches de tamaño completo. Sin embargo, ya que sólo una media debe ser diferente a rechazar la
hipótesis nula, que todavía no sabemos lo que significa (s) es / son diferentes. En resumen, una prueba de ANOVA nos prueba que al menos un
medio es diferente, pero una prueba adicional debe llevarse a cabo para determinar qué medio (s) es / son diferente.

La determinación de qué medio (s) es / son diferentes


Si usted no puede rechazar la hipótesis nula en un ANOVA entonces se hacen. Ya sabes, con un cierto nivel de confianza, que los medios

de tratamiento son estadísticamente iguales. Sin embargo, si usted rechaza la hipótesis nula, entonces debe llevar a cabo una prueba

independiente para determinar qué medio (s) es / son diferentes. Existen varias técnicas para probar las diferencias entre medias, pero la

prueba más común es el menos significativo Prueba de la diferencia.


2 MSE
* *F 1, N -c
Mínima diferencia significativa (LSD) para una equilibrado muestra: , Donde MSE es
r
el error medio cuadrático y R es el número de filas en cada tratamiento.

(2) ( ) 5. 99 )
(1709
En el ejemplo anterior, LSD = = 82.61
3
Por lo tanto, si el valor absoluto de la diferencia entre dos medios de tratamiento es mayor que
82.61, podemos concluir que no son estadísticamente iguales. coches compactos frente a

coches de tamaño medio:

666 -. 67 473 . 67 = 193. Desde 193> 82.61 la presión media de la cabeza es estadísticamente diferente

entre los coches compactos y de tamaño medio.

coches de tamaño medio en comparación con los coches de tamaño completo:

473 -. 67 447 . 33 = 26,34. Desde 26,34 <82,61 la presión media de la cabeza es estadísticamente igual

entre medianas y coches de tamaño completo.

Compacta frente a tamaño completo: Trabajar por su

cuenta.

ANOVA de una vía en Excel


Es posible llevar a cabo un ANOVA de una vía con Excel.

(Paso preliminar) En primer lugar, asegúrese de que el “Herramientas para análisis” está instalado.
En “Herramientas” es la opción actual “Análisis de datos”? Si es así - Herramientas
para está instalado. Si no - seleccione “Complementos”.

Marque las casillas titulada “Herramientas para análisis” y “Herramientas para análisis - VBA” y haga clic en “OK”. Esto
instalará el “Herramientas para análisis de datos.”

(1) En la sección “Herramientas”, seleccione “Análisis de Datos”


En la ventana que aparece, seleccione: “OK”. “Un factor ANOVA” y haga clic (2) Utilizando el
ratón resaltar las celdas que contienen los datos.
(3.) Seleccionar “Columnas” si cada tratamiento es su propia columna o “fila” si cada tratamiento es su propia fila.

(4) Ajuste el nivel de significación. (El valor predeterminado es 5% o 0.05.) (5.) Haga clic en “OK” y la
salida ANOVA aparecerá en una nueva hoja de cálculo.

Resultados ANOVA de Excel:


RESUMEN
grupos Contar Suma Promedio Diferencia
columna 1 3 2000 666.6667 972.3333
columna 2 3 1421 473.6667 2417.333
columna 3 3 1342 447.3333 1737.333

ANOVA
Fuente de Variación SS df SRA F P-valor F crit
Entre grupos 86049,55556 2 43.024,78 25,17541 0,001207 5,143249
dentro de los grupos 10254 6 1709

Total 96303,55556 8

Los resultados bajo el título “Resumen” simplemente le proporciona estadísticos de resumen para cada una de sus muestras.
Los resultados de la prueba de ANOVA se proporcionan bajo el título “ANOVA”. Al comparar estas cifras con el ejemplo
anterior, que debe ser simple para determinar el significado de la salida de Excel.

Você também pode gostar