Você está na página 1de 10

PRUEBAS NO PARAMTRICAS

Distribucin chi-cuadrada ( 2) La distribucin chi cuadrada es toda una familia de distribuciones. Existe una distribucin chi-cuadrada para cada grado de libertad. La Figura 1 muestra que a medida que se incrementan los grados de libertad la distribucin se vuelve menos sesgada. Las aplicaciones ms comunes de la distribucin chi-cuadrada son (1) pruebas de bondad de ajuste y (2) pruebas de independencia. A. Pruebas de bondad de ajuste Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma de distribucin particular planteada como hiptesis. Si el ajuste es razonablemente cercano, puede concluirse que si existe la forma de distribucin planteada como hiptesis. Prueba chi-cuadrada

(O =
k i =1

Ei ) Ei

(1.1)

donde k: Nmero de categoras o clases k-m-1: grados de libertad donde m es el nmero de parmetros a estimar. 1.Prueba para un ajuste uniforme. Juan Prez, director de Mercadeo de Alden de Jurez, tiene la responsabilidad de controlar el nivel de existencias para cuatro tipos de automvil vendidos por la firma. En el pasado, ha ordenado nuevos automviles bajo la premisa de que los cuatro tipos son igualmente populares y la demanda de cada tipo es la misma. Sin embargo, recientemente las existencias se han vuelto ms difciles de controlar, y Juan considera que debera probar su hiptesis respecto a una demanda uniforme. Sus hiptesis son: H0: La demanda es uniforme para los cuatro tipos de autos. H1: La demanda no es uniforme para los cuatro tipos de autos. La Tabla 1.1 muestra la expectativa uniforme para una muestra de 48 autos vendidos durante el ltimo mes Tabla 1.1 Registro de Ventas de Alden de Jurez Tipo de auto Ventas observadas Ka 15 Fiesta 11 Focus 10 Clio 12 Ventas esperadas 12 12 12 12

= 1.17 12 12 12 12 Debido a que no hay parmetros que estimarse el nmero de grados de libertad es k-1 = 3 grados de libertad. Si Juan deseara probar al nivel del 5%, se encontrara, como lo 2 muestra la Figura 1.2, que 0.05 , 3 = 7.815
2

( 15 12 ) =

( 11 12 ) +

( 10 12 ) +

( 12 12 ) +

Regla
" No rechazar si

de
7.815. Rechazar si

decisin:
> 7.815 "

Como 1.17 < 7.815, la hiptesis de que la demanda no es uniforme no se rechaza. B.Tablas de contingencia. Una prueba de independencia La distribucin chi-cuadrada tambin permite la comparacin de dos atributos para determinar si existe una relacin entre ellas. Ejemplo. Paty Alvarado es la directora de investigacin de Plaguicidas de Jurez. En su proyecto actual Paty debe determinar si existe alguna relacin entre la clasificacin de efectividad que los consumidores asignan a un nuevo insecticida y el sitio (urbano o rural) en el cual se utiliza. De los 100 consumidores a quienes se le aplic la encuesta, 75 vivan en zonas urbanas y 25 en zonas rurales. La Tabla 1.2 resume las clasificaciones hechas por los consumidores. Tabla 1.2 Tabla de contingencia de Plaguicidas de Jurez Clasificacin Urbano Rural Arriba del promedio 20 11 23.3 7.75 Promedio 40 8 36 12 Debajo del promedio 15 6 15.8 5.25 Total 75 25 H0: La clasificacin y la ubicacin son independientes. H1: La clasificacin y la ubicacin no son independientes.

2 =

Total 31 48 21 100

( 20 23.3 ) 2
23.3

( 11 7.75 ) 2 ( 40 36 ) 2
7.75 + 36

( 8 12 ) 2
12

( 15 15.8 ) 2
15.8

( 6 5.25 ) 2
5.25

= 3.76

La prueba tiene (r 1)(c 1) = (3 -1)(2 1) = 2 grados de libertad. Si Paty fija = 10%, 02.10 , 2 = 4.605 , la hiptesis nula no se rechaza. Prueba del signo Una prueba no paramtrica utilizada comnmente para tomar decisiones en relacin a diferencias entre poblaciones como contraparte de la distribucin t, la cual requiere el

supuesto de normalidad de ambas poblaciones. La prueba de signos es til cuando no se cumple este supuesto. Se supone que se tienen datos antes y despus para una muestra y se desean comparar estos conjuntos de datos correspondientes. Se hace restando las observaciones por pares, y se anota el signo algebraico resultante. No es importante la magnitud de la diferencia, sino solo si resulta un signo ms o un signo menos. La hiptesis nula establece que no existe diferencia en los conjuntos de datos. Si esto es cierto, entonces un signo ms y un signo menos son igualmente probables. La probabilidad de que ocurra cualquiera es de 0.50. Una prueba de dos extremos es: H0: m = p H1: m p en donde m y p son los nmeros de signos menos y de signos ms, respectivamente. Una prueba de un solo extremo es: H0: m = p H1: m > p o H0: m = p H1: m < p Ejemplo. Un analista de mercado desea medir la efectividad de una campaa promocional del producto de su empresa. Antes de la campaa, selecciona 12 tiendas minoristas y registra las ventas del mes. Durante el segundo mes se termina la campaa promocional y se registran de nuevo las ventas. La Tabla 1.3 muestra los niveles de ventas, junto con el signo algebraico que resulta cuando las ventas del segundo mes se restan de las del primer mes. Tabla 1.3 Ventas para doce tiendas minoristas Tienda Antes Despus Signo 1 $4200 $4000 + 2 $5700 $6000 3 $3800 $3800 0 4 $4900 $4700 + 5 $6300 $6500 6 $3600 $3900 7 $4800 $4900 8 $5800 $5000 9 $4700 $4700 0 10 $5100 $5200 11 $8300 $7200 + 12 $2700 $3300 Se desea probar la hiptesis de que la promocin increment las ventas con un nivel de significancia del 5%. Esta es una prueba de extremo derecho, como se muestra enseguida:

H0: m p H1: m > p Pregunta: Qu hara que se rechazara la hiptesis nula? 1) un nmero significativamente grande de signos menos 2) un nmero significativamente pequeo de signos ms Nmero de signos menos = 6 Nmero de signos ms = 4 Los valores que resultan en una diferencia de cero se eliminan. La Tabla de Distribucin Binomial establece que la probabilidad de seis o ms signos menos es:
p( m 6 | n = 10 , = 0.5 ) = 1 P ( X 5 ) = 1 0.6230 = 0.3770

Este valor de 0.3770 es la probabilidad de obtener seis o ms signos menos ( o cuatro o menos signos ms) si la probabilidad de ocurrencia de cualquier signo es de = 0.5. Se nota que si el nmero de signos menos fuera inusitadamente grande, se rechazara la hiptesis nula. Sin embargo, 6 no es un nmero grande. La probabilidad de su ocurrencia es mayor que un de 0.5%, el evento de 6 signos menos no se considera grande, y la hiptesis nula de que H0: m p no se rechaza, por lo tanto no se puede considerar que la promocin haya sido exitosa. Valor de Z para prueba del signo con muestras grandes (n 30)
Z= k 0.5 0.5 n 0.5 n

La prueba de rachas Cuando no existe aleatoriedad, muchas de las herramientas estadsticas en las cuales se confa son de poco uso o de ningn uso. Para comprobar la aleatoriedad se utiliza una prueba de rachas. Prueba de rachas. Prueba no paramtrica de aleatoriedad en el proceso de muestreo. Racha. Una serie continua de uno o ms smbolos. Ejemplo. Suponga que se seleccionan los empleados para un programa de entrenamiento. Si la seleccin no depende de si el empleado es de sexo masculino ( m) o femenino (f), se esperara que el gnero fuera un evento aleatorio. Sin embargo, si se detecta algn patrn en el gnero, se puede asumir que la aleatoriedad est ausente y que la seleccin se hizo, por lo menos en parte, con base en el gnero de un trabajador. Si existe un nmero inusualmente grande o inusualmente pequeo de rachas, se sugiere un patrn. As, por ejemplo _____________________________________________ mmm ffffff mmm

_____________________________________________ 1 2 3 _____________________________________________ Tres rachas existen en esta muestra. Tres hombres , seguidos de seis mujeres y luego tres hombres. Aparentemente existe ausencia de aleatoriedad. Consideremos ahora que el orden de seleccin es _______________________________________ m f m f m f m f m f m f m f m f _______________________________________ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 _______________________________________ De nuevo, parece existir un patrn que produce un nmero inusualmente grande de 16 rachas independientes. Deteccin de un patrn. Si se presentan muy pocas o demasiadas rachas, puede estar ausente la aleatoriedad. Un conjunto de hiptesis para probar es: H0: Existe aleatoriedad en la muestra. H1: No existe aleatoriedad en la muestra. Para probar la hiptesis se debe determinar si el nmero de rachas r es demasiado grande o demasiado pequeo. Las Tablas de valores crticos de r en la prueba de rachas muestran el nmero de rachas si es 5%. Supongamos ahora que las selecciones fueron: __________________________________________ m fff mmm ff mmm 1 2 3 4 5 __________________________________________ Las selecciones parecen ms aleatorias porque no existe patrn evidente. Se nota que n1 = 7 es el nmero de hombres y n2 = 5 es el nmero de mujeres. La tabla M1 muestra el nmero crtico mnimo de rachas para un valor de de 5%.. Si el nmero de rachas es igual o menor que el valor mostrado en la tabla M1, se sugiere que al nivel del 5% hay muy pocas rachas como para confirmar la hiptesis nula de aleatoriedad. Debido a que n1 = 7 y n2 = 5, se halla el valor crticamente bajo que es 3. Debido a que el nmero de rachas excede este mnimo, entonces no hay un nmero significativamente bajo de rachas como para garantizar el rechazo de la hiptesis nula. La tabla M2 proporciona valores crticamente altos para r. si el nmero de rachas en una muestra es igual o mayor que estos valores, se puede concluir que existe un nmero extremadamente grande de rachas, lo que sugiere la ausencia de aleatoriedad. Para n1 = 7 y n2 = 5, la tabla M2 revela que el nmero mximo de rachas es 11. Si el nmero de rachas es superior a 11, existen demasiadas como para sustentar la hiptesis de aleatoriedad. Debido a que el nmero de rachas es menor que 11, no es significativamente alto y no se rechaza la hiptesis nula al nivel del 5%. Uso de la mediana como medida para bifurcar los datos

Ejemplo. Se asumen niveles de produccin diarios en una mina de carbn seleccionada para un estudio estadstico, y stos son, 31, 57, 52, 22, 24, 59, 25, 29, 27, 44, 43, 32, 40, 37, y 60 toneladas. La mediana de 37 puede utilizarse como valor de referencia. Las observaciones caen o por arriba (A) o por abajo (B) de 37, produciendo 8 rachas de: ___________________________________________________ 31 57 52 22 24 59 25 29 27 44 43 32 40 60 ___________________________________________________ B A A B B A B B B A A B A A 1 2 3 4 5 6 7 8 ___________________________________________________ Con n1=7 para B y n2 = 7 para A, la tabla M revela valores crticos de 3 y 13 rachas. Debido a que hay 8 rachas, se asume que hay aleatoriedad y no se rechaza la hiptesis nula. Prueba U de Mann-Whitney Es la contraparte no paramtrica de la prueba t para muestras independientes. No requiere del supuesto de que las diferencias entre las dos muestras estn distribuidas normalmente. Ejemplo. Suponga que una fbrica de cermicas desea comparar el tiempo que toma a las piezas de barro enfriarse despus de haber ardido en el horno mediante dos mtodos diferentes. Los alfareros queman 12 piezas utilizando el mtodo 1, y 10 utilizando el mtodo 2. El nmero de minutos necesarios para que cada pieza se enfre es el siguiente: Mtodo1 27 31 28 29 39 40 35 33 32 36 37 43 Mtodo 2 34 24 38 28 30 34 37 42 41 44 Tabla 1.4 Rangos de tiempos de enfriamiento Mtodo 1 Rango 27 28 29 31 32 33 35 36 37 39 40 2 3.5 5 7 8 9 34 34 12 13 14.5 17 18 37 38 10.5 10.5 14.5 16 Mtodo 2 24 28 30 Rango 1 3.5 6

41 42 43 21 44 R1=130

19 20 22 R2=123

Se calcula el estadstico de Mann-Whitney para cada muestra de la ecuacin, as:


n1 ( n1 + 1 ) R1 2 n (n + 1 U 2 = n1n2 + 1 1 R2 2 12( 12 + 1 ) U 1 = ( 12 )( 10 ) + 130 = 68 2 10( 10 + 1 ) U 2 = ( 12 )( 10 ) + 123 = 52 2 Se nota que U1+ U2 = n1n2 proporciona un chequeo rpido de su aritmtica. Media y Desviacin estndar de la distribucin muestral para la Prueba U de MannWhitney n n ( 12 )( 10 ) u = 1 2 = = 60 2 2 U 1 = n1n2 +

n1n2 ( n1 + n2 + 1 ) ( 12 )( 10 )( 12 + 10 + 1 ) = = 15.17 12 12 Valor de Z para normalizar la prueba U de Mann-Whitney U u Z= 1 u Prueba de dos extremos: Probar la hiptesis de que los tiempos promedio de enfriamiento de enfriamiento del mtodo 1 y del mtodo 2 son los mismos

u =

H 0 : 1 = 2 H 1 : 1 2

Utilizando arbitrariamente U2, se tiene que


Z=

52 60 = 0.053 15.17

Si = 10%, la regla de decisin es No rechazar si -1.65 Z 1.65. Rechazar si Z < -1.65 o Z > 1.65. Como Z = -0.53 se puede concluir al nivel de significancia del 10% que los tiempos promedio de enfriamiento son los mismos para ambos mtodos de coccin. Prueba de Kruskall-Wallis Es una prueba que compara tres o ms poblaciones para determinar si existe una diferencia en la distribucin de las poblaciones. Es anloga a la prueba F utilizada en las pruebas ANOVA. No importa la restriccin de que las poblaciones tienen que estar distribuidas normalmente.

Las hiptesis son: H0: Todas las k poblaciones tienen la misma distribucin. H1: No todas las k poblaciones tienen la misma distribucin. Ejemplo. Un nuevo gerente de Avon debe comparar el tiempo que les toma a tres clientes pagar los envos del nuevo producto New-Face Cream, ofrecido por la empresa. Se seleccionan aleatoriamente varias compras de cada cliente, junto con el nmero de das que cada uno se tom en liquidar su cuenta. Los resultados aparecen en la Tabla 1.5. Tabla 1.5 Nmero de das para pagar a Avon la entrega recibida. Compra 1 2 3 4 5 6 7 Estadstico Kruskal- Wallis: 1 28 19 13 28 29 22 21 Cliente 2 26 20 11 14 22 21 3 37 28 26 35 31

12 Ri2 3( n + 1 ) n( n + 1 ) ni donde ni es el nmero de observaciones en la i-sima muestra n es el nmero total de observaciones en todas las muestras. Ri es la suma de los rangos de la i-sima muestra. Tabla 1.6 Rangos en la prueba de Kruskall-Wallis. Das Rango Das Rango Das 11 1 13 2 14 3 19 4 20 5 21 6.5 21 6.5 22 8.5 22 8.5 26 10.5 26 28 13 28 13 28 29 15 31 35 37 K=

Rango

10.5 13 16 17 18

R1=62 Calculando el estadstico K se tiene:


K=

R2=34.5

R3=74.5

( 62 ) 2 ( 34.5 ) 2 (74.5 ) 2 12 + + 3( 18 + 1) = 8.18 18( 18 + 1 ) 7 6 5

Enseguida comparamos K con un valor crtico. La distribucin de K es aproximada por una distribucin chi-cuadrada con k 1 grados de libertad. Si K excede el valor crtico de chi-cuadrada, se rechaza la hiptesis nula. En caso de seleccionar un valor de de 5% en la prueba de Avon, el valor crtico de chi-cuadrado dados 3-1 = 2 grados de libertad es 2 0 .05 , 2 = 5.99 . Regla de decisin: No rechazar si k 5.99. rechazar si k > 5.99 Como k = 18.8 > 5.99, se rechaza la hiptesis nula de que no hay diferencia en el tiempo que toma a tres clientes pagar sus cuentas con Avon. En el caso de que se rechace la hiptesis nula, el siguiente paso lgico es determinar cules diferencias son estadsticamente significativas y cuales se deben a un error de muestreo. Esto involucra una comparacin de todos los pares posibles. Los pasos para la comparacin son los siguientes: 1. Calcular el rango promedio para cada muestra.
62 = 8.86 7 34.5 R2 = = 5.75 6 74.5 R3 = = 14.9 5 R1 =

2. Calcular diferencias absolutas


| R1 R2 |=| 8.86 5.75 |= 3.11 | R1 R3 |=| 8.86 14.9 |= 6.04 | R2 R3 |=| 5.75 14.9 |= 9.15

3. Comparacin con el valor crtico Ck:

Ck =

2 ,k 1

1 n( n 1 ) 1 + 12 ni n j

( 18 )( 19 ) 1 1 = 5.99 + = 7.27 Comparacion del cliente 1 con el 2 12 7 6 ( 18 )( 19 ) 1 1 C k = 5.99 + = 7.65 Comparacion del cliente 1 con el 3 12 7 5 ( 18 )( 19 ) 1 1 C k = 5.99 + = 7.91 Comparacion del cliente 2 con el 3 12 6 5

4. Comparacin de las diferencias contra los valores crticos


| R1 R2 |=| 8.86 5.75 |= 3.11 < 7.27 Por tanto 1 y 2 no difieren | R1 R3 |=| 8.86 14.9 |= 6.04 < 7.65 Por tanto 1 y 3 no difieren | R2 R3 |=| 5.75 14.9 |= 9.15 > 7.91 y entre 2 y 3 si existe diferencia

Correlacin de rangos de Spearman

Você também pode gostar