Você está na página 1de 69

Slide 1

Esther Flores Ugarte ESTADISTICA II

CAPTULO 13
Slide 2

Estadstica no Paramtrica
13-5
Prueba de Kruskal-Wallis
13-6
Correlacin de rangos
13-7
Prueba de rachas para detectar
aleatoriedad

Esther Flores Ugarte ESTADISTICA II

Slide 3

ELEMENTARY STATISTICS by Mario Triola - 2004


Presentaciones originales de Pearson Addison
Wesley.
Interpretadas, traducidas y adaptadas por Esther Flores
Ugarte para fines acadmicos de la asignatura de
Estadstica II
Universidad Continental de Ciencias e Ingenieria
Huancayo- Per

Esther Flores Ugarte

ESTADISTICA II

Slide 4

SEMANA 12

Esther Flores Ugarte

ESTADSTICA II

Slide 5

Seccin 13-5
Prueba de Kruskal-Wallis

Created by Erin Hodgess, Houston, Texas

Esther Flores Ugarte ESTADISTICA II

Prueba Kruskal-Wallis

Slide 6

(llamada tambin prueba H)

Definicin
La prueba Kruskal-Wallis es una prueba no
paramtrica que usa rangos de datos
muestrales de tres o ms poblaciones
independientes.

Es usada para probar la hiptesis nula de que


las muestras independientes provienen de
poblaciones con la misma distribucin.
Esther Flores Ugarte ESTADISTICA II

Prueba Kruskal-Wallis

Slide 7

(llamada tambin prueba H)

Hiptesis
H0: las muestras provienen de
poblaciones con medianas iguales.
H1: las muestras provienen de
poblaciones con medianas que no todas
son iguales.

Esther Flores Ugarte ESTADISTICA II

Prueba Kruskal-Wallis

Slide 8

(llamada tambin prueba H)


Calculamos el estadstico de prueba H, el cual
tiene una distribucin que puede aproximarse a la
distribucin chi cuadrada (2 ), siempre y cuando
cada
muestra
tenga
al
menos
cinco
observaciones.

Esther Flores Ugarte ESTADISTICA II

Procedimiento para encontrar el valor


Slide 9
del estadstico de prueba
1. Combine todas las muestras en una sola lista
y asigne un rango para cada valor. (Ordene de
menor a mayor y en caso de empates asigne la
media de los rangos involucrados.
2. Para cada muestra, calcule la suma de los
rangos y determine el tamao de la muestra.
3. Calcule H con los resultados del paso dos.

Esther Flores Ugarte ESTADISTICA II

Aseveraciones

Slide 10

1.
Tenemos por lo menos tres muestras
independientes, cada una de las cuales ha sido
seleccionada aleatoriamente.
. 2.
Cada muestra tiene por lo menos cinco
observaciones.
3. No existe requerimiento sobre las poblaciones
en el aspecto que deben estar normalmente
distribuidas o tener cualquier otra forma particular
de distribucin.

Esther Flores Ugarte ESTADISTICA II

Notacin para la prueba


Kruskal-Wallis

Slide 11

N = nmero total de observaciones


combinadas
k

= nmero de muestras

R1 = suma de rangos de la muestra 1

n1 = nmero de observaciones en la
muestra 1
Para la muestra 2, la suma de rangos es R2 y el nmero de
observaciones es n2 , y una notacin similar es usada para las
otras muestras.
Esther Flores Ugarte ESTADISTICA II

Estadstico de prueba de KruskalSlide 12


Wallis

H=

12
N(N + 1)

2
1

R
R2
+
+...+
n1
n2

Grados de libertad = k 1

Esther Flores Ugarte ESTADISTICA II

Rk
nk

3 (N +1)

Estadstico de prueba para KruskalSlide 13


Wallis

Valores crticos
1. La prueba es a cola derecha.

2. Use la Tabla A-4 (debido a que el


estadstico de prueba H se aproxima
a travs de la distribucin 2 ).
3. Grados de libertad = k 1
Esther Flores Ugarte ESTADISTICA II

Ejemplo:

Slide 14

Efectos de los tratamientos en los pesos


de lamos.
La tabla siguiente, lista los pesos en Kg.
de lamos que recibieron tratamientos
diferentes. Usemos la prueba Kruskal
Wallis para probar la hiptesis nula de que
las cuatro muestras provienen de
poblaciones con medianas iguales.
Esther Flores Ugarte ESTADISTICA II

Slide 15

NINGUNO FERTILIZANTE
0.15
1.34
0.02
0.14
0.16
0.02
0.37
0.08
0.22
0.08

RIEGO
0.23
0.04
0.34
0.16
0.05

Esther Flores Ugarte ESTADISTICA II

FERTIL
IZANTE
Y
RIEGO
2.03
0.27
0.92
1.07
2.38

Ejemplo

Slide 16

Ejercicio y estrs.
Se realiz un estudio para investigar los efectos del
ejercicio sobre el estrs. La siguiente tabla lista lecturas
de presin sangunea sistlica (en mmHg) de sujetos,
antes de iniciar 25 minutos de ejercicio aerbico en
bicicleta y antes de generarles estrs por medio de una
prueba de aritmtica y otra de expresin verbal.
Utilice el nivel de significancia de 0.05 para probar la
aseveracin de que los diferentes grupos de sujetos
tienen la misma mediana de presin sangunea. Con
base en los resultados, se puede considerar que los
grupos son muestras de la misma poblacin?.
Esther Flores Ugarte ESTADISTICA II

Slide 17

MUJERES/ VARONES/ MUJERES/ VARONES/


AFROAM. AFROAM. CAUCSICA CAUCSICO
117.00
115.67
119.67
124.33
130.67
120.67
106.00
111.00
102.67
133.00
108.33
99.67
93.67
120.33
107.33
128.33
96.33
124.67
117.00
102.00
92.00
118.33
113.33
127.33
Pruebas no paramtricas 2.xls
Esther Flores Ugarte ESTADISTICA II

Ejemplo: Clancy,
Rowling y Tolstoy
Use la data de la
tabla 12-5, pruebe la
severacin que las
puntuaciones de
lectura por pgina de
las tres muestras
tienen la misma
distribucin, use la
prueba KruskalWallis.

Esther Flores Ugarte ESTADISTICA II

Slide 18

Ejemplo: Clancy,
Rowling y Tolstoy

Slide 19

H0: Las poblaciones de los rcords de lectura de las


pginas de los tres libros tienen medianas iguales
H1: Las tres medianas poblacionales no todas son
iguales.

Esther Flores Ugarte ESTADISTICA II

Ejemplo: Clancy,
Rowling y Tolstoy

n1 = 12
n2 = 12
n3 = 12
N = 36
R1 = 201.5
R2 = 337
R3 = 127.5

Esther Flores Ugarte ESTADISTICA II

Slide 20

Ejemplo: Clancy,
Rowling y Tolstoy

H=
H=

12
N(N + 1)

R1
R22
+
+...+
n1
n2

12
36(36+ 1)

201.5

12

337

12

Slide 21

Rk
nk

3 (N +1)

127.5

12

H = 16.949

Esther Flores Ugarte ESTADISTICA II

3 (36 +1)

Slide 22

Seccin 13-6
Correlacin de rangos

Created by Erin Hodgess, Houston, Texas

Esther Flores Ugarte ESTADISTICA II

Correlacin de Rangos

Slide 23

Definicin
La prueba de Correlacin de Rangos usa
rangos de datos apareados.
La prueba de Correlacin de Rangos es usada
para probar una asociacin entre dos variables
por lo que las hiptesis se plantean de la forma
siguiente:
Ho: s = 0 (No hay correlacin entre dos
variables)
H1: s 0 (Hay correlacin entre dos variables)
Esther Flores Ugarte ESTADISTICA II

Ventajas

Slide 24

1. Los mtodos no paramtricos de correlacin de


rangos pueden usarse con una variedad mas amplia
de circunstancias que el mtodo paramtrico de
correlacin lineal. A diferencia de los mtodos
paramtricos, el mtodo de correlacin de rangos
no requiere una distribucin normal de cualquier
poblacin.

2. La correlacin de rangos puede usarse para


detectar algunas relaciones (no todas) que no son
lineales.

Esther Flores Ugarte ESTADISTICA II

Desventajas

Slide 25

Una desventaja de la prueba de correlacin de


rangos es su tasa de eficiencia de 0.91. Esta
tasa de eficiencia indica que con todas las
dems circunstancias iguales, el mtodo no
paramtrico requiere de 100 pares de datos
muestrales para tener los mismos resultados
que solo 91 pares de observaciones muestrales
analizadas a travs del mtodo paramtrico
suponiendo que los requisitos ms estrictos
del mtodo paramtrico se satisfacen.

Esther Flores Ugarte ESTADISTICA II

Requisitos

Slide 26

1.

Los datos muestrales deben ser


seleccionados aleatoriamente.

2.

A diferencia de los mtodos


paramtricos, no existe el requisito de
que los datos muestrales apareados
tengan una distribucin normal
bivariada. No existe el requisito de
una distribucin normal

Esther Flores Ugarte ESTADISTICA II

Notacin

Slide 27

rs =

Coeficiente de correlacin de rangos para datos


muestrales apareados (rs es un estadstico muestral)

s =

Coeficiente de correlacin de rangos para todos los


datos poblacionales (s es un parmetro poblacional)

n =

nmero de pares de datos muestrales.

d =

diferencia entre los rangos de los dos valores


dentro de un par.

rs

con frecuencia se denomina coeficiente de correlacin


de rangos de Spearman.
Esther Flores Ugarte ESTADISTICA II

Estadstico de prueba

Slide 28

Sin empates: despus de convertir los datos de cada muestra a


rangos, si no existen empates entre los rangos para la primera
variable y no existen empates entre los rangos para la segunda
variable, el valor exacto del estadstico de prueba puede
calcularse usando la frmula siguiente:

rs = 1

2
6

d
2
n(n 1)

Esther Flores Ugarte ESTADISTICA II

Estadstico de prueba

Slide 29

Empates: despus de convertir los datos de cada muestra a


rangos, si cualquier variable tiene empates entre sus rangos, el
valor exacto del estadstico de prueba rs puede calcularse
utilizando la frmula siguiente con los rangos.
nxy (x)(y)

r=

n(x2) (x)2

n(y2) (y)2

Esther Flores Ugarte ESTADISTICA II

Valores Crticos:

Slide 30

Si n 30, los valores crticos se


encuentran en la tabla A-9
Si n > 30, los valores crticos se
calculan utilizando la siguiente frmula
z

rs =

n1

Donde el valor de z corresponde al nivel de


significancia ( por ejemplo, si =0.05, z ser
1.96)
Esther Flores Ugarte ESTADISTICA II

Figure 12-4

Rank Correlation for Testing H0: s = 0


Start

Slide 31

Are
the n pairs of data
in the form of ranks
?

No

Yes
Calculate the difference d for
each pair of ranks by subtracting
the lower rank from the higher
rank.

Square each difference d and


then find the sum of those
squares to get
Let n equal the
total number
(d2)
of signs.

Complete the computation of


2
rs = 1 62d

n(n 1)

to get the sample statistic.


Esther Flores Ugarte ESTADISTICA II

Convert the data of the first


sample to ranks from 1 to n
and then do the same for the
second sample.

Figure 13-4

Rank Correlation for Testing H0: s = 0


Slide 32
Complete the computation of
2
rs = 1 62d

n(n 1)

to get the sample statistic.


Calculate the critical values
Is
n 30
?

No

Yes

rs =

z
n 1

where z corresponds to the


significance level

Find the critical values of rs


in Table A-9

If the sample statistic rs is positive and exceeds the positive critical


value, there is a correlation. If the sample statistic rs is negative and is
less than the negative critical value, there is a correlation. If the
sample statistic rs is between the positive and negative critical values,
there is no correlation.
Esther Flores Ugarte ESTADISTICA II

Ejemplo:

Slide 33

Clasificacin de universidades por estudiantes y el


U.S. News and World Report. El problema del
captulo incluye las clasificaciones de universidades
por parte de los estudiantes y de la revista U.S. News
and World Report. La clasificacin aparece en la
tabla siguiente. Calcule el valor del coeficiente de
correlacin de rangos y utilcelo para determinar si
existe una correlacin entre la clasificacin de los
estudiantes y la clasificacin de la revista. Use un
nivel de significancia de 0.05.

Esther Flores Ugarte ESTADISTICA II

Hiptesis

Slide 34

Ho: s = 0 (No hay correlacin entre las


dos variables)
H1: s 0 (Hay correlacin entre las
dos variables)

Esther Flores Ugarte ESTADISTICA II

Data del ejercicio


CLASIFICACIN
CLASIFICACIN
SEGN
SEGN LA REVISTA
PREFERENCIA DE
U.S. NEWS AND
LOS ESTUDIANTES WORLD REPORT

UNIVERSIDAD
HARDVARD
YALE
CAL. INST. OF TECH.
MIT
BROWN
COLUMBIA
U. DE PENN.
NOTRE DAME

1
2
3
4
5
6
7
8

1
2
5
4
7
6
3
8

Esther Flores Ugarte ESTADISTICA II

Slide 35

Ejemplo:
Percepcin de belleza

Slide 36

Use los datos de la Tabla 12-6 para determinar si hay una


correlacin entre las puntuaciones que otorgan varones y
mujeres a un grupo de candidatas elegidas finalistas de un
concurso de belleza. Use un nivel de significancia de =
0.05.

Esther Flores Ugarte ESTADISTICA II

Ejemplo:
Percepcin de belleza
H0: s = 0
H 1: s 0
n = 10

rs = 1
rs = 1

2
6

d
2
n(n 1)

6(74)

2
10(10 1)

rs = 0.552
Esther Flores Ugarte ESTADISTICA II

Slide 37

Ejemplo:
Percepcin de belleza

Slide 38

Usamos la Tabla A-9 para determinar que los valores


crticos son 0.648. Debido a que rs = 0.552 no excede el
valor crtico 0.648, no rechazamos Ho. No hay suficiente
evidencia para sustentar la aseveracin de que hay
correlacin entre los rankings de calificacin de hombres
y mujeres.

Esther Flores Ugarte ESTADISTICA II

Ejemplo: Percepcin de belleza con


Slide 39
muestras grandes.
Considere que en el ejemplo anterior la muestra
incluye un total de 40 mujeres y que el
estadstico de prueba rs es 0.291, si el nivel de
significancia es de = 0.05, qu concluye acerca
de la correlacin?

Esther Flores Ugarte ESTADISTICA II

Ejemplo: Percepcin de belleza con


Slide 40
muestras grandes.

rs =

z
n1

rs =

1.96 = 0.314
40 1

Estos son los valores crticos

Esther Flores Ugarte ESTADISTICA II

Ejemplo: Percepcin de belleza con


Slide 41
muestras grandes.
El estadstico de prueba rs = 0.291 no excede al
valor crtico de 0.314, por tanto, no se rechaza Ho.
No hay suficiente evidencia para aseverar que
existe correlacin en la apreciacin de hombres y
mujeres.

Esther Flores Ugarte ESTADISTICA II

Ejemplo: deteccin de
un patrn no lineal

Slide 42

Se utiliza una mquina de Pinboll para medir el aprendizaje


que resulta de repetir funciones manuales. Los sujetos se
seleccionaron para que fueran similares en caractersticas
importantes de edad, gnero,inteligencia, educacin etc. La
tabla siguiente lista los nmeros de juegos que se
realizaron y las ltimas puntuaciones ( en millones) de
sujetos seleccionados al azar del grupo de caractersticas
similares. Esperamos que haya una asociacin entre el
nmero de juegos realizados y las puntuaciones del Pinball.
Existe suficiente evidencia para sustentar la aseveracin de
que existe una asociacin como sta?, use alfa de 0.05.
Esther Flores Ugarte ESTADISTICA II

Ejemplo: deteccin de
un patrn no lineal

Esther Flores Ugarte ESTADISTICA II

Slide 43

H0: s = 0
H1: s 0
n=9

Ejemplo: deteccin de
un patrn no lineal

rs = 1

2
6

d
2
n(n 1)

rs = 1

6(6)
2
9(9 1)

rs = 0.950
Esther Flores Ugarte ESTADISTICA II

Slide 44

Ejemplo: deteccin de
un patrn no lineal

Slide 45

Usamos la tabla A-9 para obtener los valores crticos 0.700


( teniendo en cuenta alfa de 0.05 y 9 como tamao muestral).
El estadstico de 0.950 excede el valor crtico de 0.700, por
lo que concluimos que hay correlacin significativa. Los
nmeros ms altos de juegos parecen estar asociados con
puntuaciones ms altas. Parece que los sujetos aprenden
mejor el juego al jugar ms.

Esther Flores Ugarte ESTADISTICA II

Slide 46

Seccin 13-7
Rachas para detectar
aleatoriedad
Created by Erin Hodgess, Houston, Texas

Esther Flores Ugarte ESTADISTICA II

Slide 47

Rachas para detectar aleatoriedad

Definiciones
Rachas
Una racha es una secuencia de datos que tiene
la misma caracterstica, la secuencia es
precedida y seguida por datos con una
caracterstica diferente o por ningn dato en
absoluto.

Prueba de rachas
La prueba de rachas utiliza el nmero de
rachas en una secuencia de datos muestrales
para probar la aleatoriedad del orden de los
datos.
Esther Flores Ugarte ESTADISTICA II

Principio fundamental de la
prueba de rachas

Slide 48

Rechace la aleatoriedad si el
nmero de rachas es muy bajo o
muy alto

Esther Flores Ugarte ESTADISTICA II

Ejemplo

Slide 49

MMMMMHHHHH
2 RACHAS ( ES MUY BAJO); no es
aleatorio

MMMMM

HHHHH

1ra. Racha

2ra. Racha

Esther Flores Ugarte ESTADISTICA II

Ejemplo

MHMHMHMHMH
10 RACHAS ( ES MUY ALTO); no es
aleatorio.

Esther Flores Ugarte ESTADISTICA II

Slide 50

Ejemplo

Slide 51

DDDDRRDDDR
4 RACHAS

DDDD
1ra. racha

RR
2da. racha

DDD
3ra. racha

Esther Flores Ugarte ESTADISTICA II

R
4ta. racha

Ejemplos

Slide 52

DDDDDRRRRR
solo 2 rachas

Si el nmero de rachas es muy bajo, no existe aleatoriedad.

DRDRDRDRDR
10 rachas
Si el nmero de rachas es muy alto, no existe aleatoriedad.
Esther Flores Ugarte ESTADISTICA II

Requisitos

Slide 53

1. Los datos muestrales estn acomodados de


acuerdo con algn esquema de orden, por
ejemplo en el orden en el que se obtuvieron los
valores muestrales.

2. Cada valor de los datos se puede categorizar


en una de dos categoras separadas ( como
hombre / mujer, por ejemplo)

Esther Flores Ugarte ESTADISTICA II

Notacin

Slide 54

n1 = Nmero de elementos en la secuencia que


tienen una caracterstica particular.(La
caracterstica elegida para n1 es arbitraria).

n2 = Nmero de elementos en la secuencia que


tienen la otra caracterstica.

G = Nmero de rachas o corridas.

Esther Flores Ugarte ESTADISTICA II

Estadstico de prueba para la


prueba de rachas

Slide 55

Si = 0.05 y n1 20 y n2 20, el estadstico de prueba


es el nmero de rachas G.

Si 0.05 n1 > 20 n2 > 20, el estadstico de prueba es:

z=

Valores crtico:
Si el estadstico de prueba es G, los valores crticos se encuentran en la Tabla A-10

Si el estadstico de prueba es z, los valores crticos se encuentran en la Tabla A-2


usando el procedimiento ya conocido.

Esther Flores Ugarte ESTADISTICA II

Clculos para el estadstico de prueba: caso


Slide 56
de muestras grandes
2n1n2
G = n + n + 1
1
2

Donde

(2n1n2) (2n1n2 n1 n2)


G

(n1 + n2) (n1 + n2 1)

= media de las corridas

= desviacin estndar de las corridas G


La distribucin del nmero de corridas G se
aproxima a la distribucin normal.
G

Esther Flores Ugarte ESTADISTICA II

Figure 13-5

Runs Test for Randomness


Slide 57

Esther Flores Ugarte ESTADISTICA II

Figure 13-5

Runs Test for Randomness


Slide 58

Esther Flores Ugarte ESTADISTICA II

Figure 13-5

Runs Test for Randomness


Slide 59

Esther Flores Ugarte ESTADISTICA II

Ejemplo:

Slide 60

CASO DE MUESTRA PEQUEA


Gnero de osos: Se lista el gnero de 10
osos.Utilice el nivel de significancia de
0.05 para probar la aleatoriedad de la
secuencia de gneros.
MMMMHHMMHH
Requisitos:
Los datos estan acomodados de acuerdo al muesteo, y se
encuentran mostrando dos categoras. Cumplidos los
requisitos haremos la prueba de aleatoriedad.
Esther Flores Ugarte ESTADISTICA II

Ejemplo:
MMMM
1ra racha

HH
2da racha

MM
3ra racha

Slide 61

HH
4ta racha

Hay 6 machos y 4 hembras y el nmero e


rachas es 4, por tanto:
n1 = 6
n2 = 4
G=4
Puesto que las muestras son menores a 20 y =0.05 y G=4, en la tabla 10 los
valores crticos son de 2 y 9
Esther Flores Ugarte ESTADISTICA II

Conclusin

Slide 62

G = 4 se encuentra entre los dos valores


extremos 2 y 9, por lo que no rechazamos
la aleatoriedad .
No existe evidencia suficiente para
rechazar la aleatoriedad en la secuencia
de gnero, parece que la secuencia de
gnero es aleatoria.

Esther Flores Ugarte ESTADISTICA II

Ejemplo: Lluvia en Boston


los lunes

Slide 63

S, representa sin lluvia ( indica valores de 0.00), L


representa los lunes con algo de lluvia ( indica valores
mayores a 0.00).La muestra es de 52 lunes consecutivos
SSSSLSLSSLSSLSSSLSSLLLSSSSLSLSLLLSLSSSLSSSLS
LSSLSSSL
Use el 5% de nivel de significancia par probar la hiptesis
de que la secuencia es aleatoria.

Esther Flores Ugarte ESTADISTICA II

Ejemplo: Lluvia en Boston


los lunes
H0: La secuencia es aleatoria
H1: la secuencia no es aleatoria
n1 = 33 (seco S)
n2 = 19 (lluvioso L)
G = 30
Es n1>20?, s por lo tanto necesitamos evaluar el
estadstico de prueba z.

Esther Flores Ugarte ESTADISTICA II

Slide 64

Ejemplo: Lluvia en Boston


los lunes
G =

2n1n2
+1
n1+n2

G =

2(33)(19)
+1
33+19

= 25.115

Esther Flores Ugarte ESTADISTICA II

Slide 65

Ejemplo: Lluvia en Boston


los lunes

(2n1n2) (2n1n2 n1 n2)


G

(n1 + n2) (n1 + n2 1)


2(33)(19)[2(19)(33) 33 19]

(33 + 19) (33 + 19 1)

G = 3.306
Esther Flores Ugarte ESTADISTICA II

Slide 66

Ejemplo: Lluvia en Boston


los lunes
G G

z=

z=

30 25.115
3.306

= 1.48

Esther Flores Ugarte ESTADISTICA II

Slide 67

Ejemplo: Lluvia en Boston


los lunes

Slide 68

El valor crtico 1.96, debido a que = 0.05, tenemos


una prueba a dos colas. El estadstico de prueba 1.48
no cae dentro de la regin crtica, por lo que no
rechazamos la hiptesis nula de aleatoriedad.

Esther Flores Ugarte ESTADISTICA II

Ejercicio

Slide 69

Se entrevist a una muestra de 36 personas en


una encuesta de investigacin de mercados,
con 22 mujeres y 14 hombres. Las personas
que integraron la muestra fueron consultadas en
el siguiente orden:

HMMMMHHHMHMMMHHMMMMHMMMHH
MMMHMHHMMMH
Haga la prueba de aleatoriedad al 5% de
nivel de significancia.
Esther Flores Ugarte ESTADISTICA II

Você também pode gostar