Você está na página 1de 8

1 PRUEBA DE NORMALIDAD

Prueba de Shapiro-Wilk

Cuando la muestra es como mximo de tamao 50 se puede contrastar la


normalidad con la prueba de shapiro Shapiro-Wilk. Para efectuarla se calcula la
media y la varianza muestral, S2, y se ordenan las observaciones de menor a
mayor. A continuacin se calculan las diferencias entre: el primero y el ltimo; el
segundo y el penltimo; el tercero y el antepenltimo, etc. y se corrigen con unos
coeficientes tabulados por Shapiro y Wilk. El estadstico de prueba es:

Donde D es la suma de las diferencias corregidas.

Se rechazar la hiptesis nula de normalidad si el estadstico W es menor que el


valor crtico proporcionado por la tabla elaborada por los autores para el tamao
muestral y el nivel de significacin dado.

La secuencia para realizar los contrastes de normalidad es:

Analiza

Estadsticos, Descriptivos y Explorar

En el cuadro de dilogo que aparece al activar el botn Grficos se activa la


opcin Grficos con pruebas de normalidad.

EJEMPLO

Ejemplo 1.

Con los datos correspondientes a la variable Trans de la encuesta Enctrans.sav y


con referencia a los encuestados que viven en Barcelona, se quiere comprobar si
su distribucin en cuanto al tipo de transporte utilizado se adapta a los resultados
de un estudio realizado por el Ayuntamiento de Barcelona, que son los siguientes:
el 40% de los desplazamientos al trabajo se realizan en metro; el 30% en autobs;
el 20% en transporte privado y 10% otros medios.
La distribucin de frecuencias de la variable Trans es:

En este caso para realizar el contraste Chi-cuadrado es necesario definir las


cuatro categoras contempladas en la hiptesis nula. Para ello, se crea una nueva
variable, Trans2, a partir de Trans con las siguientes categoras: Metro, Bus,
Privado (que resultar de agregar Coche y Moto) y Otros (que agrupar Tren y
Otros).Una vez creada la nueva variable, con la secuencia Analizar > Pruebas no
paramtricas > Chi-cuadrado se llega al cuadro de dilogo en donde se selecciona
la variable Trans2 y se introduce en Valores esperados las frecuencias relativas de
cada categora segn la hiptesis nula correctamente ordenadas: 0,4 para la
categora 1; 0,3 para la 2; 0,2 para la 3 y 0,10 para la 4. Al aceptar se obtienen los
siguientes resultados:
Como todas las categoras presentan frecuencia esperada mayor que 5 se puede
aplicar el contraste Chi-cuadrado sin modificar el nmero de categoras. El valor
del estadstico Chi-cuadrado permite rechazar la hiptesis nula para niveles de
significacin superiores al 2,7%. As pues, al 5% de significacin se llega a la
Conclusin de que la distribucin del tipo de transporte que utilizan los alumnos
no se adapta a la publicada por el ayuntamiento.

Prueba de K-cuadrado de D'Agostino

En las estadsticas, de D'Agostino K 2 prueba, llamada as por Ralph D'Agostino ,


es una bondad de ajuste medida de la desviacin de la normalidad , es decir, la
prueba tiene como objetivo establecer si la muestra dada proviene de una
poblacin distribuida normalmente. La prueba est basada en las
transformaciones de la muestra curtosis y la asimetra, y tiene el poder slo contra
las alternativas que la distribucin est sesgada y / o Kurtic.

Ejemplo de utilizacin de prueba de DAgostino

La prueba es utilizada para corroborar si es razonable asumir que un conjunto de


datos tiene distribucin normal. Aplicacin de la prueba a los siguientes datos:

8.27 - 3.34 - 10.50 - 11.15 - 5.41 - 14.76 - 14.76 - 9.85 - 11.31 - 10.70 - 9.25 -
12.90

Planteo de hiptesis de la prueba

H0: Los datos tienen distribucin normal

H1: No es H0Clculo del estadstico del test:

Dnde:
- Xi: indica el dato que apareci en el lugar i en la muestra. Por ejemplo, para la
muestra dada

X2 = 3.34, X5 = 5.41

- Xi: son los datos ordenados en la muestra. Por ejemplo, para la muestra dada

X3 = 8.27,

X5 = 9.85

- n: indica la cantidad de datos de la muestra, para este ejemplo n = 12

- n se calcula de la siguiente manera:

Para el clculo del estadstico realizamos la siguiente tabla, la cual nos facilita los
clculos.

Comentarios sobre la creacin de la tabla:


- Columna 1: colocamos los ndices, en nuestro caso como hay 12 datos va de 1
a 12.

- Columna 2: tiene los datos en el orden que fueron dados en la letra del problema.

- Columna 3: tiene los datos en forma ordenada de menor a mayor.

- Columna 4: realizamos la operacin en cada fila, a i (elementos de la columna 1)


le quitamos n+1/2

- Columna 5: en cada fila realizamos multiplicamos el elemento de la columna 3


(de esa fila) con el elemento de la columna 4 de esa fila.

Por ejemplo:

-18.36 se obtiene del producto: (3.34)(-5.5).

-24.36 se obtiene del producto: (-4.5) (5.41) y as con el resto de los elementos.

Finalmente calculamos el estadstico:

Para eso, primero hallamos el numerador sumando todos los elementos de la


columna 5 de la tabla:

Para el clculo del denominador hallamos n, utilizando su definicin: n =


3.3859.

Entonces el denominador: n

2n = 487.5721

Finalmente, el estadstico es el cociente: DA = 128.29/487.5721 = 0.26312


Decisin del test:

Para decidir entre H0 o H1 nos fijamos en la tabla de DAgostino para n = 12.

Como el estadstico DA (0.2653, 0.2841), podemos concluir que el p-valor es


mayor a 0.2.

Entonces: p-valor0.1, por lo que acepto H0.

2 PRUEBA HOMOGNEA

PRUEBA F-MAX DE HARTLEY

Fue propuesta por Hartley (19401950). Asume que las poblaciones son normales
e independientes y los tamaos de las muestras son iguales.

El estadstico de prueba es:

Fmax = mx(si2) / mn(si2)

Donde i = 1, . . . , k, con k igual al nmero de muestras.

Si la hiptesis nula es cierta y los tamaos de las muestras son iguales n = n1 =


n2 = = nk, la distribucin muestral del estadstico Fmax (asumiendo
independencia de las muestras aleatorias tomadas de las poblaciones normales)
es FMAX con k grados de libertad en el numerador y v = n1 grados de libertad en
el denominador.

Si el diseo es desbalanceado, es decir, si los tamaos de muestras no son


iguales, entonces hay dos versiones sobre el clculo de v:

1. Se puede obtener una prueba liberal (la probabilidad de error tipo I es mayor
que ) haciendo v = mx(ni)1 (Milliken & Johnson 1984, pg. 18).

2. Si los tamaos no son tan diferentes, una prueba conservativa puede hacerse
usando v = mn(ni) 1 (Lentner & Bishop 1986, pg. 64).
PRUEBA DE LEVENE

El estadstico de prueba de Levene se define como:

Dnde: Zij puede tener una de las siguientes tres definiciones:

1. Zij = | Xij. Xi.| donde Xi. es la media del i-simo subgrupo

2. Zij = | Xij Xi.| donde Xi. Es la mediana del i-simo subgrupo.

3. Zij = | Xij Xi. | donde X i. la media recortada al 10 % del i-simo subgrupo.

Z.. es la media global de Zij y Zi. Es la media del i-simo subgrupo de los Zij.

La prueba de Levene rechaza la hiptesis de que las varianzas son iguales con un
nivel de significancia si W > F,k1,Nk donde F,k1,Nk es el valor critico
superior de la distribucin F con k 1 grados de libertad en el numerador y N k
grados de libertad en el denominador a un nivel de significancia .

La prueba de Levene ofrece una alternativa ms robusta que el procedimiento de


Bartlett, ya que es poco sensible a la desviacin de la normalidad. Eso significa
que ser menos probable que rechace una verdadera hiptesis de igualdad de
varianzas slo porque las distribuciones de las poblaciones muestreadas no son
normales.

Você também pode gostar