Você está na página 1de 25

INSTITUTO TECNOLGICO SUPERIOR DE

LA SIERRA NEGRA DE AJALPAN




CARRERA: ING. ADMN DE EMPRESAS.


MATERIA: ESTADISTICA II


TRABAJO: RESUMEN DE LA UNIDAD V

TEMA: ESTADSTICA NO PARAMTRICA.


MAESTRO: ING.JOS GUADALUPE
RODRIGUEZ RAMOS.


ELABORADO POR: FELIX CASTRO GARCA

FECHA DE ENTREGA: MAYO DE 2012




INDICE

UNIDAD 4
ESTADSTICA NO PARAMTRICA.






















5.1 Escala de medicin
5.2 Mtodos estadsticos contra no
Paramtricos
5.3 Prueba de corridas para
aleatoriedad
5.4 Una muestra: prueba de signos
5.5 Una muestra: prueba de Wilcoxon
5.6 Dos muestras: prueba de Mann-
Whitney
5.7 Observaciones pareadas: prueba
de signos
5.8Observaciones pareadas prueba
de Wilcoxon
5.9Varias muestras independientes:
prueba de Krauskal-Wallis











INTRODUCCIN
La estadstica no paramtrica es una rama de la estadstica que estudia las pruebas
y modelos estadsticos cuya distribucin subyacente no se ajusta a los llamados
criterios paramtricos. Su distribucin no puede ser definida a priori (se utilizan para
distinguir entre dos tipos de conocimiento: el conocimiento a priori es aquel que, en
algn sentido importante, es independiente de la experiencia; mientras que el
conocimiento a posteriori es aquel que, en algn sentido importante, depende de la
experiencia.), pues son los datos observados los que la determinan. La utilizacin de
estos mtodos se hace recomendable cuando no se puede asumir que los datos se
ajusten a una distribucin conocida, cuando el nivel de medida empleado no sea,
como mnimo, de intervalo.

5.1 ESCALA DE MEDICIN
Existen diversas definiciones del trmino "medicin", pero estas dependen de los
diferentes puntos de vista que se puedan tener al abordar el problema de la
cuantificacin y el proceso mismo de la construccin de una escala o instrumento de
medicin. En general, se entiende por medicin la asignacin de nmeros a
elementos u objetos para representar o cuantificar una propiedad. El problema
bsico est dado por la asignacin un numeral que represente la magnitud de la
caracterstica que queremos medir y que dicho nmeros pueden analizarse por
manipulaciones de acuerdo a ciertas reglas. Por medio de la medicin, los atributos
de nuestras percepciones se transforman en entidades conocidas y manejables
llamadas "nmeros". Es evidente que el mundo resultara catico si no pudiramos
medir nada. En este caso cabra preguntarse de que le servira la fsico saber que el
hierro tiene una alta temperatura de fusin.




Niveles o Escalas de mediciones

Escala Nominal:
La escala de medida nominal, puede considerarse la escala de nivel ms bajo, y
consiste en la asignacin, puramente arbitraria de nmeros o smbolos a cada una
de las diferentes categoras en las cuales podemos dividir el carcter que
observamos, sin que puedan establecerse relaciones entre dichas categoras, a no
ser el de que cada elemento pueda pertenecer a una y solo una de estas categoras.
Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la
misma sean equivalentes respecto del atributo o propiedad en estudio, despus de lo
cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar de
denominaciones, se le atribuyan nmeros, puede ser una de las razones por las
cuales se le conoce como "medidas nominales".
Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR
Ncleo San Carlos de acuerdos a la carrera que cursan.

Carrera Nmero asignada a la categora
Educacin 1
Administracin 2
Se ha de tener presente que los nmeros asignados a cada categora sirven nica y
exclusivamente para identificar la categora y no poseen propiedades cuantitativas.

Escala Ordinal:
En caso de que puedan detectarse diversos grados de un atributo o propiedad de un
objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a la
propiedad de "orden" de los nmeros asignndolo a los objetos en estudio de modo
que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A
posee un mayor grado de atributo que B.
La asignacin de nmeros a las distintas categoras no puede ser completamente
arbitraria, debe hacerse atendiendo al orden existente entre stas.
Los caracteres que posee una escala de medida ordinal permiten, por el hecho
mismo de poder ordenar todas sus categoras, el clculo de las medidas estadsticas
de posicin, como por ejemplo la mediana.

Ejemplo:
Al asignar un nmero a los pacientes de una consulta mdica, segn el orden de
llegada, estamos llevando una escala ordinal, es decir que al primero en llegar
ordinal, es decir que al primeo en llegar le asignamos el n 1, al siguiente el n 2 y as
sucesivamente, de esta forma, cada nmero representar una categora en general,
con un solo elemento y se puede establecer relaciones entre ellas, ya que los
nmeros asignados guardan la misma relacin que el orden de llegada a la consulta.

Escalas de intervalos iguales:
La escala de intervalos iguales, est caracterizada por una unidad de medida comn
y constante que asigna un nmero igual al nmero de unidades equivalentes a la de
la magnitud que posea el elemento observado. Es importante destacar que el punto
cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningn
momento ausencia de la magnitud que estamos midiendo. Esta escala, adems de
poseer las caractersticas de la escala ordinal, encontramos que la asignacin de los
nmeros a los elemento es tan precisa que podemos determinar la magnitud de los
intervalos (distancia) entre todos los elementos de la escala. Sin lugar a dudas,
podemos decir que la escala de intervalos es la primera escala verdaderamente
cuantitativa y a los caracteres que posean esta escala de medida pueden
calculrsele todas las medidas estadsticas a excepcin del coeficiente de variacin.

Ejemplo:
El lapso transcurrido entre 1998-1999 es igual al que transcurri entre 2000-2001.

Escala de coeficientes o Razones:
El nivel de medida ms elevado es el de cocientes o razones, y se diferencia de las
escalas de intervalos iguales nicamente por poseer un punto cero propio como
origen; es decir que el valor cero de esta escala significa ausencia de la magnitud
que estamos midiendo. Si se observa una carencia total de propiedad, se dispone de
una unidad de medida para el efecto. A iguales diferencias entre los nmeros
asignados corresponden iguales diferencias en el grado de atributo presente en el
objeto de estudio. Adems, siendo que cero ya no es arbitrario, sino un valor
absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de la
propiedad presente en B.

Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observ que hay familias
que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que
aquellas que tienen 3 hijos.

5.2 MTODOS ESTADSTICOS CONTRA NO PARAMTRICOS
Es una rama de la estadstica que estudia las pruebas y modelos estadsticos cuya
distribucin subyacente no se ajusta a los llamados criterios paramtricos. Su
distribucin no puede ser definida a priori, pues son los datos observados los que la
determinan. La utilizacin de estos mtodos se hace recomendable cuando no se
puede asumir que los datos se ajusten a una distribucin conocida, cuando el nivel
de medida empleado no sea, como mnimo, de intervalo.
Las principales pruebas no paramtricas son las siguientes:
Prueba de Pearson
Prueba binomial
Prueba de Anderson-Darling
Prueba de Cochran
Prueba de Cohen kappa
Prueba de Fisher
Prueba de Friedman
Prueba de Kendall
Prueba de Kolmogrov-Smirnov
Prueba de Kruskal-Wallis
Prueba de Kuiper
Prueba de Mann-Whitney o prueba de Wilcoxon
Prueba de McNemar
Prueba de la mediana
Prueba de Siegel-Tukey
Coeficiente de correlacin de Spearman
Tablas de contingencia
Prueba de Wald-Wolfowitz
Prueba de los signos de Wilcoxon
La mayora de estos test estadsticos estn programados en los paquetes
estadsticos ms frecuentes, quedando para el investigador, simplemente, la tarea de
decidir por cul de todos ellos guiarse o que hacer en caso de que dos test nos den
resultados opuestos. Hay que decir que, para poder aplicar cada uno existen
diversas hiptesis nulas que deben cumplir nuestros datos para que los resultados
de aplicar el test sean fiables. Esto es, no se puede aplicar todos los test y quedarse
con el que mejor convenga para la investigacin sin verificar si se cumplen las
hiptesis necesarias. La violacin de las hiptesis necesarias para un test invalida
cualquier resultado posterior y son una de las causas ms frecuentes de que un
estudio sea estadsticamente incorrecto. Esto ocurre sobre todo cuando el
investigador desconoce la naturaleza interna de los test y se limita a aplicarlos
sistemticamente.

5.3 PRUEBA DE CORRIDAS PARA ALEATORIEDAD
Una corrida es una serie de observaciones similares. La prueba de corridas se usa para
probar la aleatoriedad de una serie de observaciones cuando cada observacin puede
ser asignada a una de dos categoras.
Ejemplo. En relacin con una muestra aleatoria de n = 10 individuos, supongamos que
cuando se les clasifica por sexo la secuencia de observaciones es: M, M, M, M, F, F, F,
F, M, M. Estos datos contienen tres corridas, o series de elementos semejantes.
Respecto de datos numricos, un medio para obtener el esquema requerido de dos
categoras es clasificar cada observacin segn si es superior o inferior a la mediana del
grupo. En general, mucho menos corridas o mucho ms corridas que las que seran de
esperar al azar resultaran en el rechazo de la hiptesis nula de que la secuencia de
observaciones es una secuencia aleatoria.
El nmero de corridas de elementos semejantes se determina de acuerdo con los datos
mustrales, con el uso del smbolo R para designar el nmero de corridas observadas. Si
n1 equivale al nmero de elementos muestreados de un tipo y n2 al nmero de
elementos muestreados del segundo tipo, la media y el error estndar asociados con la
distribucin de muestreo de la estadstica de prueba R cuando la secuencia es aleatoria
son
Sin, n1 > 20 o n2 > 20, la distribucin de muestreo de r aproxima la distribucin normal.
Por lo tanto, en estas circunstancias la estadstica R puede convertirse a la estadstica
de prueba z.


5.4 UNA MUESTRA: PRUEBA DE SIGNOS
La prueba de los signos puede utilizarse para probar una hiptesis nula referente al
valor de la medida de la poblacin. En consecuencia, es el equivalente no
paramtrico a la prueba de una hiptesis referente al valor de la medida de la
poblacin. Es necesario que los valores de la muestra aleatoria se encuentren al
menos en la escala ordinal, aunque no se requiere de supuestos acerca de la forma
de la distribucin de la poblacin.
Las hiptesis nula y alternativa pueden aludir ya sea a una prueba bilateral o
unilateral. Si Med denota la mediana de la poblacin y Med0 designa al valor
hipottico, las hiptesis nulas y alternativa para una prueba de dos extremos son:
H0: Med=Med0

H1: MedMed0
Se aplica un signo de ms a cada valor muestra observada mayor que el valor
hipottico de la mediana y un signo de menos a cada valor menor que el valor
hipottico de la mediana. Si un valor maestral es exactamente igual a la mediana
hipottica, no se le aplica ningn signo, con lo que el tamao de muestra efectivo se
reduce. Si la hiptesis nula sobre el valor de la mediana es cierta, el nmero de
signos de ms debera ser aproximadamente igual al nmero de signos de menos.
O, para decirlo de otra manera, la proporcin de signos de mas debe ser de
alrededor de 0.50. Por consiguiente, la hiptesis nula que se prueba en una prueba
bilaterales H0: =0.50, donde es la proporcin de la poblacin de los signos de
mas o de menos. As, una hiptesis referente al valor de la mediana se prueba en
realidad como una hiptesis sobre . Si la muestra es grande, se puede hacer uso
de la distribucin normal.



5.5 UNA MUESTRA: PRUEBA DE WILCOXON
La prueba de Wilcoxon puede usarse para probar una hiptesis nula referente al
valor de la medida de la poblacin. Pero dado que la prueba Wilcoxon considera la
magnitud de la diferencia entre cada valor muestral y el valor hipottico de la
mediana, es una prueba ms sensible que la prueba de los signos.
Sea X una variable aleatoria continua. Podemos plantear cierta hiptesis sobre la
mediana de dicha variable en la poblacin, por ejemplo, M=M0. Extraigamos una
muestra de tamao m y averigemos las diferencias Di = X - M0. Consideremos
nicamente la n diferencias no nulas (n m). Atribuyamos un rango u orden (0i) a
cada diferencia segn su magnitud sin tener en cuenta el signo. Sumemos por un
lado los 0+i, rangos correspondientes a diferencias positivas y por otro lado los 0-i,
rangos correspondientes a diferencias negativas. La suma de los rdenes de
diferencias positivas sera igual a la suma de los rdenes de diferencias negativas,
caso que la mediana fuera el valor propuesto M0. En las muestras, siendo M0 el
valor de la verdadera mediana, aparecern por azar ciertas discrepancias, pero si la
suma de los rangos de un ciclo es considerablemente mayor que la suma de los
rangos de otro signo, nos har concebir serias dudas sobre la veracidad de M0. La
prueba de Wilcoxon va a permitir contrastar la hiptesis de que una muestra aleatoria
procede de una poblacin con mediana M0. Adems, bajo el supuesto de simetra
este contraste se puede referir a la media, E(X). Esta prueba es mucho ms sensible
y poderosa que la prueba de los signos; como se puede apreciar utiliza ms
informacin, pues no solo tiene en cuenta si las diferencias son positivas o negativas,
sino tambin su magnitud. El contraste de Wilcoxon puede ser utilizado para
comparar datos por parejas. Supongamos que la distribucin de las diferencias es
simtrica, y nuestro propsito es contrastar la hiptesis nula de que dicha distribucin
est centrada en 0. Eliminando aquellos pares para los cuales la diferencia es 0 se
calculan los rangos en orden creciente de magnitud de los valores absolutos de las
restantes diferencias. Se calculan las sumas de los rangos positivos y negativos, y la
menor de estas sumas es el estadstico de Wilcoxon. La hiptesis nula ser
rechazada si T es menor o igual que el valor correspondiente. Cuando n25 y la
hiptesis nula es cierta, la estadstica t tiene una distribucin aproximadamente
normal. La media y el error estndar asociados con esta distribucin de muestreo
son, respectivamente: _T=(N(N+1))/4 _T= ((N(N+1) (2N+1))/24) En el caso de
una muestra relativamente grande la prueba puede realizarse usando la distribucin
normal de probabilidad y calculando la estadstica de prueba z, de la siguiente
manera: Z= (T-_R)/_T


5.6 DOS MUESTRAS: PRUEBA DE MANN-WHITNEY
La prueba de Mann-Whitney se emplea en aquellos casos en los que deseamos
contrastar si existen diferencias entre las poblaciones de donde se extraen dos
muestras, que han de ser aleatorias e independientes. La utilidad de esta prueba es
la misma que la de la prueba t, pero no parte de supuestos y puede ser aplicada a
datos medidos en escala ordinal.
El procedimiento es el siguiente:
1. Hiptesis:
Hiptesis nula: No existen diferencias entre los dos grupos.
Hiptesis alternativa: Hay diferencias entre los dos grupos.
2. Estadstico de contraste:
En este caso, el estadstico a emplear se denomina U de Mann-Whitney, que se
calcula siguiendo estos pasos:
a) Se procede a ordenar las puntuaciones de las dos muestras como si fueran una
sola.
b) A cada una de ellas se le asigna un rango.
c) Se calcula el estadstico T, a partir de la suma de los rangos de la muestra de
menor tamao.
d) Teniendo T, se calcula U:
Donde U = n1n2 + n1 (n1 + 1)/2 - T
Donde n
1
es el nmero de sujetos de la muestra de menor tamao, y n
2
el de la
muestra mayor.
3. Como en el caso anterior, el valor observado es comparado con valores tabulados.
En dicha tabla encontramos la probabilidad asociada a cada valor del estadstico
para una prueba unilateral. Si nuestro contraste es bilateral, slo tendremos que
multiplicar por dos el valor tabular correspondiente a una cola.



5.7 OBSERVACIONES PAREADAS: PRUEBA DE SIGNOS
Tambin se puede utilizar la prueba de signo para probar la hiptesis nula
para observaciones pareadas. Aqu se reemplaza cada diferencia,
d
i
, con un signo ms o menos dependiendo si la diferencia ajustada, d
i
-d
0
, es positiva
o negativa. A lo largo de esta seccin suponemos que las poblaciones son
simtricas. Sin embargo, aun si las poblaciones son asimtricas se puede llevar a
cabo el mismo procedimiento de prueba, pero las hiptesis se refieren a las
medianas poblacionales en lugar de las medias.
Ejemplo:
1. Una compaa de taxis trata de decidir si el uso de llantas radiales en lugar de
llantas regulares con cinturn mejora la economa de combustible. Se equipan
16 automviles con llantas radiales y se manejan por un recorrido de prueba
establecido. Sin cambiar de conductores, se equipan los mismos autos con
llantas regulares con cinturn y se manejan una vez ms por el recorrido de
prueba. Se registra el consumo de gasolina, en kilmetros por litro, de la
siguiente manera:
Automvil Llantas radiales
Llantas con
cinturn
1 4.2 4.1
2 4.7 4.9
3 6.6 6.2
4 7.0 6.9
5 6.7 6.8
6 4.5 4.4
7 5.7 5.7
8 6.0 5.8
9 7.4 6.9
10 4.9 4.9
11 6.1 6.0
12 5.2 4.9
13 5.7 5.3
14 6.9 6.5
15 6.8 7.1
16 4.9 4.8
Se puede concluir en el nivel de significancia de 0.05 que los autos
equipados con llantas radiales obtienen mejores economas de
combustible que los equipados con llantas regulares con cinturn?
Solucin:



Regla de decisin:
Si z
R
1.645 no se rechaza H
o
.
Si z
R
> 1.645 se rechaza H
o
.
Se procede ha realizar las diferencias entre de los kilmetros por litro entre llantas
radiales y con cinturn:
Automvil Llantas radiales
Llantas con
cinturn
d
1 4.2 4.1 +
2 4.7 4.9 -
3 6.6 6.2 +
4 7.0 6.9 +
5 6.7 6.8 -
6 4.5 4.4 +
7 5.7 5.7 0
8 6.0 5.8 +
9 7.4 6.9 +
10 4.9 4.9 0
11 6.1 6.0 +
12 5.2 4.9 +
13 5.7 5.3 +
14 6.9 6.5 +
15 6.8 7.1 -
16 4.9 4.8 +
Al observar las diferencias se ve que slo existe una n=14, ya que se descartan los
valores de cero. Se tiene r
+
= 11

Decisin y conclusin:
Como 2.14 es mayor a 1.645 se rechaza H
0
y se concluye con un = 0.05 que las
llantas radiales mejoran la economa de combustible.


5.8 OBSERVACIONES PAREADAS PRUEBA DE WILCOXON
PRUEBA DE RANGO CON SIGNO DE WILCOXON
Se puede notar que la prueba de signo utiliza slo los signos ms y menos de las
diferencias entre las observaciones y
0
en el caso de una muestra, o los signos
ms y menos de las diferencias entre los pares de observaciones en el caso de la
muestra pareada, pero no toma en consideracin la magnitud de estas diferencias.
Una prueba que utiliza direccin y magnitud, propuesta en 1945 por Frank Wilcoxon,
se llama ahora comnmente prueba de rango con signo de Wilcoxon.
Esta prueba se aplica en el caso de una distribucin continua simtrica. Bajo esta
condicin se puede probar la hiptesis nula =
0
. Primero se resta
0
de cada
valor muestral y se descarta todas las diferencias iguales a cero. Se asigna un rango
de 1 a la diferencia absoluta ms pequea, un rango de 2 a la siguiente ms
pequea, y as sucesivamente. Cuando el valor absoluto de dos o ms diferencias es
el mismo, se asigna a cada uno el promedio de los rangos que se asignaran si las
diferencias se distinguieran. Por ejemplo, si la quinta y sexta diferencia son iguales
en valor absoluto, a cada una se le asignara un rango de 5.5. Si la hiptesis =
0

es verdadera, el total de los rangos que corresponden a las diferencias positivas
debe ser casi igual al total de los rangos que corresponden a las diferencias
negativas. Se representan esos totales como w
+
y w
-
, respectivamente. Se designa el
menor de w
+
y w
-
con w.
Al seleccionar muestras repetidas esperaramos que variaran w
+
y w
-
, y por tanto w.
De esta manera se puede considerar a w
+
y w
-
, y w como valores de las
correspondientes variables aleatorias W
+
, W
-
, y W. La hiptesis nula =
0
se
puede rechazar a favor de la alternativa <
0
slo si w
+
es pequea y w
-
es
grande. Del mismo modo, la alternativa >
0
se puede aceptar slo si w
+
es
grande y w
-
es pequea. Para una alternativa bilateral se puede rechazar H
0
a favor
de H
1
si w
+
o w
-
y por tanto w son suficientemente pequeas. No importa cul
hiptesis alternativa puede ser, rechazar la hiptesis nula cuando el valor de la
estadstica apropiada W
+
, W
-
, o W es suficientemente pequeo.
Dos Muestras con Observaciones Pareadas
Para probar la hiptesis nula de que se muestrean dos poblaciones simtricas
continuas con
1
=
2
para el caso de una muestra pareada, se clasifican las
diferencias de las observaciones paradas sin importar el signo y se procede como en
el caso de una muestra. Los diversos procedimientos de prueba para los casos de
una sola muestra y de una muestra pareada se resumen en la siguiente tabla:


No es difcil mostrar que siempre que n<5 y el nivel de significancia no exceda 0.05
para una prueba de una cola 0.10 para una prueba de dos colas, todos los valores
posibles de w
+
, w
-,
o w conducirn a la aceptacin de la hiptesis nula. Sin embargo,
cuando 5 n 30, la tabla A.16 muestra valores crticos aproximados de W
+
y W
-

para niveles de significancia iguales a 0.01, 0.025 y 0.05 para una prueba de una
cola, y valores crticos de W para niveles de significancia iguales a 0.02, 0.05 y 0.10
para una prueba de dos colas. La hiptesis nula se rechaza si el valor calculado w
+
,
w
-,
o w es menor o igual que el valor de tabla apropiado. Por ejemplo, cuando n=12
la tabla A.16 muestra que se requiere un valor de w
+
17 para que la alternativa
unilateral <
0
sea significativa en el nivel 0.05.










Ejemplos:
1. Los siguientes datos representan el nmero de horas que un compensador
opera antes de requerir una recarga: 1.5, 2.2, 0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0,
1.2 y 1.7. Utilice la prueba de rango con signo para probar la hiptesis en el
nivel de significancia de 0.05 que este compensador particular opera con una
media de 1.8 horas antes de requerir una recarga.
Solucin:
H
0
; = 1.8
H
1
; 1.8
Se proceder a efectuar las diferencias y a poner rango con signo a los datos.
1.
Dato d
i
= dato - 1.8 Rangos
1.5 -0.3 5.5
2.2 0.4 7
0.9 -0.9 10
1.3 -0.5 8
2.0 0.2 3
1.6 -0.2 3
1.8 0 Se anula
1.5 -0.3 5.5
2.0 0.2 3
1.2 -0.6 9
1.7 -0.1 1

Regla de decisin:
Para una n = 10, despus de descartar la medicin que es igual a 1.8, la tabla
A.16 muestra que la regin crtica es w 8.
Clculos:
W
+
= 7 + 3 + 3 = 13
w
-
= 5.5 + 10 + 8 + 3 + 5.5 + 9 + 1 = 42
Por lo que w = 13 (menor entre w
+
y w
-
).
Decisin y Conclusin:
Como 13 no es menor que 8, no se rechaza H
0
y se concluye con un =
0.05 que el tiempo promedio de operacin no es significativamente diferente
de 1.8 horas.

1. Se afirma que un estudiante universitario de ltimo ao puede aumentar su
calificacin en el rea del campo de especialidad del examen de registro de
graduados en al menos 50 puntos si de antemano se le proporcionan problemas
de muestra. Para probar esta afirmacin, se dividen 20 estudiantes del ltimo ao
en 10 pares de modo que cada par tenga casi el mismo promedio de puntos de
calidad general en sus primeros aos en la universidad. Los problemas y
respuestas de muestra se proporcionan al azar a un miembro de cada par una
semana antes del examen. Se registran las siguientes calificaciones del examen:
Par
Con problemas de
muestra
Sin problemas de
muestra
1 531 509
2 621 540
3 663 688
4 579 502
5 451 424
6 660 683
7 591 568
8 719 748
9 543 530
10 575 524

Pruebe la hiptesis nula en el nivel de significancia de 0.05 de que los problemas
aumentan las calificaciones en 50 puntos contra la hiptesis Alternativa de que el
aumento es menor a 50 puntos.
Solucin: ajustadas sin importar el signo y se aplica el mismo procedimiento.
En este caso d
0
= 50, por lo que se procede a calcular las diferencias entre las
muestras y luego restarles el valor de 50. Se representara con
1
y
2
la
calificacin media de todos los estudiantes que resuelven el examen en cuestin con
y sin problemas de muestra, respectivamente.
H
0
;
1

2
= 50
H
1
;
1

2
< 50
Regla de decisin:
Para n=10 la tabla muestra que la regin crtica es w
+
11.
Clculos:

La prueba de rango con signo tambin se puede utilizar para probar la hiptesis nula
1

2
= d
0
. En este caso las poblaciones no necesitan ser simtricas. Como con la
prueba de signo, se resta d
0
de cada diferencia, se clasifican las diferencias
Par
Con
problemas
de
muestra
Sin
problemas
de
muestra
d
i

d
i


d
0

Rangos
























W
+
= 6 + 3.5 + 1 = 10.5
Decisin y Conclusin:
Como 10.5 es menor que 11 se rechaza H
0
y se concluye con un = 0.05 que los
problemas de muestra, en promedio, no aumentan las calificaciones de registro de
graduados en 50 puntos.


1 531 509 22
-
28
5
2 621 540 81 31 6
3 663 688
-
25
-
75
9
4 579 502 77 27 3.5
5 451 424 27
-
23
2
6 660 683
-
23
-
73
8
7 591 568 23
-
27
3.5
8 719 748
-
29
-
79
10
9 543 530 13
-
37
7
10 575 524 51 1 1
5.9 VARIAS MUESTRAS INDEPENDIENTES: PRUEBA DE
KRAUSKAL-WALLIS
Esta prueba estadstica de anlisis de varianza de entrada simple de Kruskal-Wallis
es una extensin de la prueba de U Mann-Whitney, en razn de que se usan rangos
para su aplicacin; por otra parte, este procedimiento se emplea cuando el modelo
experimental contiene ms de dos muestras independientes.

Dicha prueba se define matemticamente de la forma siguiente:


Donde:
H = valor estadstico de la prueba de
Kruskal-Wallis.
N = tamao total de la muestra.
Rc
2
= sumatoria de los rangos elevados al
cuadrado.
ni = tamao de la muestra de cada grupo.
L = ajuste dado por el ajuste de ligas o
empates de los rangos.


El ajuste L se calcula de la manera siguiente:


Donde:
Li = valor de nmero de empates de un rango.
N = tamao total de la muestra.
Se utiliza cuando:
- Cuando son diferentes tratamientos o condiciones.
- Muestras pequeas.
- Se utiliza escala ordinal.
- Si las muestras se seleccionaron de las diferentes poblaciones.
- Contrastar hiptesis (direccional o no direccional).
- Pasos:
1. Ordenar las observaciones en rangos de todos los grupos, del ms pequeo al
mayor.
2. Asignar el rango para cada observacin en funcin de cada grupo de
contraste, elabora la sumatoria de rangos, elevar al cuadrado este valor y
dividirlo entre el nmero de elementos que contiene (ni).
3. Detectar las ligas o empates entre los rangos de cada grupo y aplicar la
ecuacin (L) para obtener el ajuste.
4. Aplicar la ecuacin de Kruskal-Wallis y obtener el estadstico H.
5. Calcular los rangos de libertad (gl): gl = K grupos - 1.
6. Comparar el estadstico H, de acuerdo con los grados de libertad, en la tabla
de distribucin de ji cuadrada en razn de distribuirse de forma similar.
7. Decidir si se acepta o rechaza la hiptesis.
Ejemplo:
Un investigador estudia el efecto benfico de cuatro sustancias anticonvulsionantes
(fenobarbital, difenilhidantoinato -DFH-, diacepam y clonacepam), para proteger
contra la muerte producida por un convulsionante, la tiosemicarbazida, la cual se
manifiesta despus de crisis clnica y tnica, respectivamente. El investigador elige
al azar a 24 ratones de la misma edad y peso y les inyecta anticonvulsionante
previamente a la tiosemicarbazida. A partir de este momento, inicia la cuenta en
tiempo, hasta que mueren los ratones; adems mide las observaciones en horas de
tiempo transcurrido.

Eleccin de la prueba estadstica.
Las mediciones se realizan en horas, por lo que la variable puede ser continua y, en
consecuencia, una escala de intervalo; sin embargo, algunos ratones no murieron y
el tiempo est calificado nominalmente como infinito. Este obstculo impide
concederle la calificacin de escala de intervalo, por lo cual se elige una escala de
tipo ordinal.
Planteamiento de la hiptesis.

Hiptesis alterna (Ha).
La proteccin de la muerte por drogas anticonvulsionante contra el frmaco
convulsionante tiosemicarbazida, se muestra diferente entre los cuatro grupos, y hay
mejor proteccin por el diacepam.

Hiptesis nula (Ho).
Las diferencias observadas en los cuatro grupos de frmacos anticonvulsionantes,
para evitar la muerte producida por la tiosemicarbazida, se deben al azar.

Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha
Tiempo en horas que tarda el frmaco en causar la muerte en ratones.


Aplicacin de la prueba estadstica.
De acuerdo con los pasos, se inicia con el ordenamiento de todas las observaciones
a partir del valor ms pequeo hasta el mayor y la deteccin de las ligas o empates.
Arreglo de los datos para asignar rangos y detectar las ligas o empates.



Una vez efectuado el ordenamiento en rangos de las observaciones, se hacen las
sumatorias de los rangos. Para facilitar esta tarea, elabrese una tabla en la que
sustituyan los datos.
Sustitucin por rangos. Observaciones de la primera tabla.

Se calcula el valor de ajuste por ligas con la siguiente frmula:

Con el ajuste de L, se procede a calcular el valor estadstico de la prueba de Kruskal-
Wallis.

Calculamos los grados de libertad.
gl = K grupos - 1 = 4 - 1 = 3
El estadstico H calculado de 15.4, se compara con los valores crticos de ji
cuadrada. En seguida se busca en esa hilera la cifra de grados de libertad (3) hasta
el nivel de significancia de 0.05 y se observa el valor 7.82, hasta los crticos 11.34 y
16.27, donde se encuentra el calculado. Esto quiere decir que la probabilidad de que
exista una diferencia se halla a una probabilidad de error entre 0.01 y 0.001.

Decisin.
Como el valor estadstico H tiene una probabilidad menor que 0.01 y ste es menor
que el nivel de significancia, se acepta Ha y se rechaza Ho.

Interpretacin.
Entre las drogas anticonvulsionantes, existe diferencia significativa en cuanto a la
proteccin de muerte a los ratones cuando se les inyecta el frmaco
tiosemicarbazida. El diacepam se manifest principalmente con los rangos ms altos
y se muestra distinto de los dems anticonvulsionantes (vase la siguiente figura).
Sumatoria de rangos de las observaciones.











BIBLIOGRAFA
1. Sprent P. Applied nonparametric statistical methods. 2nd Ed., Chapman-
Hall, London, 1993:1-3.
2. Glantz SA. Primer of Biostatistics, 3th ed., McGraw Hill, New Yor, 1992
3.- Bloquear todos los resultados de es.wikipedia.org

Você também pode gostar