Você está na página 1de 12

PRUEBA DE HIPTESIS KRUSKALL WALLIS

PRUEBAS K PARA MUESTRAS INDEPENDIENTES


La prueba de Kruskal-Wallis (de WILLIAM KRUSKALL y W ALLEN
WALLIS), tambin conocida como Prueba H de Kruskall Wallis es un
Mtodo no paramtrico, se utiliza para comprar la localizacin de ms
de dos muestras independientes.
Caractersticas de Prueba Kruskall Wallis
1. Probar si un grupo de datos proviene de la misma poblacin.
2. Se emplea cuando se quieren comparar tres o ms poblaciones
3. Es el equivalente a un anlisis de varianza de una sola va
4. No requiere supuesto de normalidad
5. No requiere supuesto de varianzas iguales (homogeneidad de
varianzas)
6. Compara esencialmente los rangos promedios observados para
las k muestras, con los esperados bajo
PASOS PARA EL CLCULO DE LA PRUEBA DE KRUSKALL WALLIS

1. Planteamiento de hiptesis

2. Se ordenan las n observaciones de menor a mayor, y se les


asignan rangos desde 1 hasta n.

3. Se obtiene la suma de los rangos correspondientes a los


elementos de cada muestra, rj y se halla el rango promedio

4. Calcular estadstico de prueba

5. Buscar H en la Tabla

6. Conclusiones

EJERCICIOS
PRIMER EJERCICIO
Un psicopedagogo investigador pretende establecer si existen
diferencias en las expectativas de logro que manifiestan los padres
acerca de los avances de sus hijos en la atencin especializada que
reciben, segn la dependencia del colegio de procedencia de los
nios. Para ese fin, aplica una escala de expectativas, la cual indica
que a mayor puntuacin, mayor expectativa sobre los avances de su
hijo(a).
Paso 1: Se obtienen los siguientes datos

Paso 2: Planteamiento de hiptesis


H0: Existe diferencias en las expectativas de colegio de
procedencia de los nios.
Ha: No existe diferencias en las expectativas de colegio de
procedencia de los nios.
Paso 3: Se ordenan todos los datos, de menor a mayor, de las k
muestras y en un solo conjunto, cuidando de identificar a cada uno
con su muestra respectiva.
Paso 4: Luego se suman los rangos de cada grupo.

Paso 5: A continuacin se calcula el valor H de Kruskal-Wallis.

k = nmero de grupos
N = Nmero total de sujetos
nj = nmero de sujetos en cada grupo
Rj = Suma de los rangos en cada grupo
= Indica que se deben sumar los k grupos

En nuestro ejemplo de las expectativas de los padres segn la


dependencia del colegio de sus hijos, tenemos los siguientes valores:

Paso 6 : Se procede a establecer la probabilidad de error tipo I o alfa


asociada a nuestros valor H.

Existen dos procedimientos, asociados a la cantidad de grupos y sus


tamaos.
-

Primer procedimiento: Si el nmero de muestras es k=3 y el


nmero de observaciones en cada una de ellas no pasa de 5, se
rechaza H0 si el valor de Hobs supera el valor terico de H que
encontramos en la tabla de Kruskal-Wallis. (La tabla aportada en
el curso opera hasta k=5 para n=3).
Segundo procedimiento: En cualquier otro caso, se compara el
valor de Hobs con el de la tabla de Chi cuadrado con k-1 grados
de libertad. Se rechaza H0 si el valor del estadstico supera el
valor terico.
REGLAS DE DECISIN

Si desarrollamos los pasos 6 y 7, siguiendo el segundo procedimiento


de contraste, tenemos los siguientes valores:

En la tabla correspondiente, ubicamos los valores de los tamaos de


los grupos 6,5,4 y comparamos nuestros valor Hobs con H
correspondiente.

Los valores crticos de H son:

Al realizar la comparacin de Hobs con H, se observa que

Paso 7: Se concluye sobre la Hiptesis nula


Por lo tanto, podemos rechazar la hiptesis nula, al 1%, y debemos
aceptar que existe evidencia emprica suficiente para afirmar que
existen diferencias significativas entre las medias de rangos entre, al
menos, dos de los grupos de padres.
Si desarrollamos los pasos 5 y 6, siguiendo el segundo procedimiento
de contraste, tenemos los siguientes valores:

En la tabla correspondiente, ubicamos en la columna DF nuestro k-1 y


2
comparamos nuestro valor Hobs con el X correspondiente

Los valores crticos de H son:

Al realizar la comparacin de Hobs con H, se observa que

Parte 7: Se concluye sobre la hiptesis nula.


Por lo tanto, podemos rechazar la hiptesis nula, al 2%, y debemos
aceptar que existe evidencia emprica suficiente para afirmar que
existen diferencias significativas entre las medias de rangos entre, al
menos, dos de los grupos de padres.

SEGUNDO EJERCICIO
La manufactura A recluta y contrata personal para su equipo
gerencial en tres escuelas diferentes. Se dispone de calificaciones de
desempeo en muestras independientes de cada una de las escuelas.
Se dispone de calificaciones de 7 empleados de la escuela A, 6 de la B
y 7 de la C. La calificacin de cada gerente est en escala de 0 a 100.
El lmite superior es la mxima nota.

Determinar si las tres escuelas son idnticas en cuanto a las


evaluaciones de desempeo.
Procedimiento:
-

Planteamiento de hiptesis.
H0: Las poblaciones son idnticas en trminos de las
evaluaciones de desempeo.
Ha: Las poblaciones no son idnticas en trminos de las
evaluaciones de desempeo.

Clculo de estadstica de prueba

Regla de decisin
2
X 2tab se rechaza H0
Si X c
2

X tab
-

con k-1 grados de libertad (3-1=2)

Valor tabla = 5.99147


Conclusin: El desempeo de los gerentes vara segn la
escuela a la que asistan. Considerando que la escuela B
presenta menores calificaciones deber tenerse precaucin con
seleccionar personas de este lugar.

TERCER EJERCICIO
Un nuevo gerente de Avon debe comparar el tiempo que les toma a
tres clientes pagar los envos del nuevo producto New-Face Cream,
ofrecido por la empresa. Se seleccionan aleatoriamente varias
compras de cada cliente, junto con el nmero de das que cada uno
se tom en liquidar su cuenta. Los resultados aparecen en la tabla
Cliente
Compra
1
2
3
4
5
6
7

1
28
19
13
28
29
22
21

Estadstico Kruskal- Wallis:

2
26
20
11
14
22
21

3
37
28
26
35
31

12 Ri2
K
3( n 1 )
n( n 1 )
ni
Tabla. Rangos en la prueba de Kruskall-Wallis.

Das

Rango

13

19

21
22

6.5
8.5

28
28
29

13
13
15

Das
11

Rango
1

14

20
21
22
26

5
6.5
8.5
10.5

R1=62

Das

Rango

26

10.5

28

13

31
35
37

16
17
18
R3=74.5

R2=34.5

Calculando el estadstico K se tiene:

62 2 34.5 2 74.5 2
12

3 18 1 8.18
18( 18 1 ) 7
6
5

Enseguida comparamos K con un valor crtico. La distribucin de K es


aproximada por una distribucin chi-cuadrada con k 1 grados de
libertad. Si K excede el valor crtico de chi-cuadrada, se rechaza la
hiptesis nula. En caso de seleccionar un valor de de 5% en la
prueba de Avon, el valor crtico de chi-cuadrado dados 3-1 = 2 grados
de libertad es

02.05 ,2 5.99

Regla de decisin: No rechazar si k 5.99. rechazar si k >


5.99
Como k = 18.8 > 5.99, se rechaza la hiptesis nula de que no hay
diferencia en el tiempo que toma a tres clientes pagar sus cuentas
con Avon.

CUARTO EJERCICIO
Se quiere estudiar si el pH de cuatro charcas situadas sobre sustratos
diferentes es distinto. Para ello se obtuvieron 8 muestras de agua
procedentes de cada una de las charcas, midindose el pH en cada
una de ellas.
Los datos de pH se ordenaron de forma ascendente para cada charca.
(Una muestra de agua de la charca n 3 se perdi, de forma que
n3=7; pero el test no requiere igualdad en el nmero de datos de
cada grupo). Los rangos se muestran entre parntesis.
Variable dependiente: pH (cuantitativa)
Variable independiente: tipo de sustrato sobre el que cada charca
(cualitativa)
H0 = el pH es el mismo en las cuatro charcas
Hecol= el pH no es el mismo en las cuatro charcas

*Rangos ligados

QUINTO EJERCICIO
Supongamos que un psiclogo est interesado en estudiar la
efectividad de dos medicamentos analgsicos y de un placebo. El
tiempo (en horas) transcurrido desde la administracin de la pldora
hasta que el paciente vuelve a quejarse de dolor se presenta en la
Tabla :

El investigador desea poner a prueba la hiptesis de que el tipo de


medicamento es irrelevante con respecto a la disminucin del dolor
que provoca. Como hicimos en el caso de dos muestras
independientes, reemplazamos cada observacin directa por sus
rangos u rdenes. As, reemplazamos la ms pequea de las 15
observaciones por 1, la siguiente ms pequea por 2, y as
sucesivamente. Si existiesen empates (como es el caso en el ejemplo)
utilizaremos el clculo de rangos promediados. Los rdenes as como
sus sumas para cada tratamiento son (el matiz de gris de la fila
Tiempo y Rango ajustado representa el grupo, siendo el blanco el
grupo Placebo, el gris claro el medicamento B y el gris oscuro el
medicamento A).

El sumatorio de rangos para cada grupo es:

La suma de todos los rangos en un conjunto de 15 datos es 1+2+3+


+15 = 15 (15+1)/2=120. Si asumimos que los rangos individuales
se han distribuido aleatoriamente entre las tres condiciones, en

promedio deberan valer 120/3= 40 si H0 es cierta. Excepto las


variaciones aleatorias producidas por el muestreo, esperamos que en
cada grupo exista una suma de rangos igual a 40. Una medida de la
magnitud de las diferencias entre el valor esperado de la suma de
rangos y los valores realmente encontrados viene dado por el
sumatorio de las diferencias al cuadrado:

Aunque esta medida es una buena indicacin del grado de


alejamiento de datos con respecto a H0, el criterio utilizado es otro: el
estadstico H de Kruskall- Wallis:

Siendo N el total de sujetos, ni el nmero de sujetos en cada uno de


los k grupos y Ri el sumatorio de los rangos para cada grupo. Aplicado
a nuestro ejemplo, produce:

Observemos que H es, forzosamente, igual o superior a 0. La


estadstica demuestra que H se distribuye segn la distribucin X2 con
k-1 grados de libertad. Buscamos en la tabla de X2con 3-1 = 2 grados
de libertad la probabilidad de obtener un valor de H igual o mayor a
1.235. Aunque no podemos obtener un valor preciso, vemos que el
valor de X2 ms aproximado es 1.35, el cual deja por encima de s el
0.5. De aqu deducimos que el estadstico H = 1.235 deja por encima
de s un valor un poco inferior a 0.5. Este valor es demasiado elevado
si trabajamos a un de 0.05 o de 0.01 (los niveles de ms
utilizados en Psicologa). En consecuencia los datos nos conducen a
no poder rechazar H0. Los niveles crticos que nos indica la Tabla X2
de son de 5.99 para un del
0.05 y de 9.21 para un del 0.01. Como nuestro valor de H es inferior
a ambos, no podemos rechazar H0.

SEXTO EJERCICIO
Tres vecinos discuten acerca que cual de sus perros corre ms rpido
y deciden hacer un pequeo experimento. Cada perro corre una
pequea distancia 3 veces. Se registran los tiempos que demoran los
perros en correr en segundos:
a) Establezca las hiptesis de inters
Se tienen 3 grupos independientes.

Ho: la distribucin de los tiempos de los tres perros es igual.


H1: la distribucin de los tiempos de al menos uno de los perros
es distinta.
o
Ho: las medianas de los tiempos de los tres perros es igual.
H1: la mediana de los tiempos de al menos uno de los perros es
distinta.
Solucin:
En este caso el test apropiado para docimar la hiptesis de inters es
el test de Kruskal-Wallis.
Para llevar a cabo el test, tenemos que ordenar todos los datos y
calcular los rangos.

Con estos datos podemos calcular el estadstico H:

En la salida H=6,771, esta diferencia se produce por la correccin por


empates.
Para resolver la hiptesis planteada en (a) usamos el Test no
paramtrico de Kruskal-Wallis que se basa en el estadstico H=6,771
con 2 grados de libertad.
Este estadstico tiene un valor-p aproximado de 0,034.
Como el valor p es menor que el nivel de significancia de 0,05,
rechazamos la hiptesis nula y concluimos, con un nivel del 5%, que
existen diferencias significativas en las medianas del tiempo que
demoran los perros.

Você também pode gostar