Você está na página 1de 11

Universidad Los ngeles de Chimbote

FACULTAD DE CIENCIAS DE LA SALUD

CURSO BIOESTADSTICA

LECTURA 08: INTRODUCCIN A LA ESTADSTICA NO PARAMETRICA (PARTE I). PRUEBA DE SIGNO. PRUEBA DE INDEPENDENCIA CHI CUADRADO INTRODUCCIN:

Las pruebas no paramtricas, en realidad son poco utilizadas a pesar de la potencia y certeza de sus resultados. Normalmente se utilizan cuando no se dispone de informacin suficiente de la poblacin de la cual se extrajeron los datos; careciendo entonces de un soporte para la realizacin de una inferencia con base a una muestra observada.
ANALISIS NO PARAMTRICOS:

Para realizar este tipo de anlisis, se debe partir de las siguientes consideraciones: La mayora de estos anlisis no requieren de presupuestos acerca de la forma de la distribucin poblacional y acepta distribuciones no normales. Las variables no necesariamente tienen que estar medidas en un nivel por intervalos o de razn. En este seccin trataremos la prueba de signo en una sola muestra, prueba de independencia Chi Cuadrado y prueba de correlacin de Spearman.
TEMA 18: PRUEBA DE SIGNO 1. INTRODUCCIN:

La prueba t estudiada en los capitulos anteriores, no es estrictamente valida para probar: 1) La hipotesis nula de que la medida de una poblacin es igual a algn valor en particular, o bien, 2) La hiptesis nula de que la media de una poblacin de diferencia entre pares es igual a cero, a menos que las poblaciones en cuestin signa una distribucin normal. El caso 2 se reconocer como una situacin que se analiza mediante la prueba de comparacin de parejas. Cuando no es posible hacer suposiciones de normalidad o cuando los datos disponibles son categoras en lugar de medidas sobre una escala de intervalos o de razones, debe buscarse un procedimiento opcional. An cuando se sabe que la prueba t es casi insensible a las violaciones de la suposicin de
___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2 1

Universidad Los ngeles de Chimbote


FACULTAD DE CIENCIAS DE LA SALUD

CURSO BIOESTADSTICA

normalidad, hay casos en que resulta preferible una prueba alternativa. Una prueba no paramtrica que se utiliza con frecuencia y que no depende de los supuestos de la prueba t es la prueba del signo. Esta prueba se centra en la mediana ms que en la media como una medida de tendencia central o de ubicacin. La mediana y en la media sern iguales en distribuciones simtricas. La nica suposicin que fundamente la prueba es que la distribucin de la variable de inters es continua. Est suposicin excluye el uso de datos nominales. La prueba del signo toma su nombre del hecho de que los signos ms y menos, y no son valores nmericos proporcionan datos utilizados en los clculos. Se ilustraar el uso de esta prueba primero para una sola muestray, a continuacin, para pareja de datos.
2. PASOS PARA LLEVAR ACABO LA PRUEBA DE SIGNO EN UNA SOLA MUESTRA:

1.

Formulacin de hiptesis Ho: La mediana de la poblacin es igual a cierto valor. H1: La mediana de la poblacin es mayor(menor odiferente) que cierto valor. Nivel de significancia: Estadstica de prueba: Prueba de cola derecha: K=N de signos menos Prueba de cola izquierda: K=N de signos ms

2. 3.

B(n, 0.5)

B(n, 0.5)

Prueba bilateral: K=N de singos que ocurre con menor frecuencia

B(n, 0.5)

NOTA: La distribucin muestral de K es la distribucin binomial con parametros n y p=0.5, donde n es el nmero de diferencias no nulas (x i Me) > 0

___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2

Universidad Los ngeles de Chimbote


FACULTAD DE CIENCIAS DE LA SALUD

CURSO BIOESTADSTICA

4.

Establecimientos de los criterios de decisin: Para H1: P(+)>P(-) se rechaza Ho , cuando Ho es verdadera, si la probabilidad de obtener k o menos signos menos es menor o igual a . Para H1: P(+)<P(-) se rechaza Ho , cuando Ho es verdadera, si la probabilidad de obtener k o menos signos ms es menor o igual a . Para H1: P(+)P(-) se rechaza Ho , cuando Ho es verdadera, si la probabilidad de obtener un valor de k tan extremo o ms que el valor calculado es igual o menor que /2.

5.

Clculos

Prueba de cola derecha: P1 =

( ) (0.5)
i= 0 n i

Prueba de cola izquierda: P2 =

( ) (0.5)
i= 0 n i

Prueba bilateral Se calcula la probabilidad del signo que ocurre con menor frecuencia.

6.

Decisin: Se acepta o se rechaza Ho.

___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2

Universidad Los ngeles de Chimbote


FACULTAD DE CIENCIAS DE LA SALUD

CURSO BIOESTADSTICA

Ejemplo 1: Los investigadores desean saber si al instruir en cuidados y aseo personal a una muestra de nias con retraso mental mejorara su apariencia. Se eligi aleatoriamente a 10 nias de una escuela para nios con retraso mental, para que recibieran educacin especial sobre cuidado y aseo personal. Dos semanas despus de concluir el curso de instruccin, las nias fueron entrevistadas por una enfermera y una trabajadora social, quienes asignaron a cada ia una calificacin basada en sus apariencia general. Los investigadores crean que, como mximo, las calificaciones alcanzaran el nivel de una escala ordinal. Crean que aunque una calificacin de, digamos 8, representaba una apariencia mejor que una de 6, no podian decir que la diferencia entre las calificaciones de 6 y 8 representaba el doble de mejora que la diferencia entre las calificaciones 5 y 6. las calificaciones se muestran en la tabla que se da a continuacin. Se desea saber si es posible concluir que la calificacin mediana de la poblacin de la que se supone se extrajo la muestra es diferente de 5, a un nivel de significancia del 5%. Tabla N 1 Nia 1 2 3 4 5 Calificacin 4 5 8 8 9 Nia 6 7 8 9 10 Calificacin 6 10 7 6 6

Solucin: 1. Formulacin de hiptesis Ho: La mediana de la poblacin es igual 5 H1: La mediana de la poblacin es diferente de 5. 2. 3. Nivel de significancia: =0.05 Estadstica de prueba: K=N de signos que ocurre con menor frecuencia

B(n,0.5)
4

___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2

Universidad Los ngeles de Chimbote


FACULTAD DE CIENCIAS DE LA SALUD

CURSO BIOESTADSTICA

4.

Establecimiento de los criterios de decisin: Para H1: P(+)P(-) se rechaza Ho , cuando Ho es verdadera, si la probabilidad de obtener un valor de k tan extremo o ms que el valor calculado es igual o menor que /2=0.025. Clculos: A continuacin se hallarn las calificaciones por arriba (+) y por abajo(-) de la mediana hipottica en los datos de la Tabla N 1 Nia 1 2 0 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 +

5.

Calificacin relativa a la mediana hipottica

Donde n= 9, teniendo en cuenta que no se toman las diferencias nulas Entonces en este caso de acuerdo a lo expuesto para una prueba bilateral hallaremos la probabilidad del nmero de signos que ocurre con menor frecuencia; es decir la probabilidad de obtener uno o menos signos menos.

P1 =

( ) (0.5)
k= 0 n k

P1 =

( ) (0.5)
k= 0 9 k

9 P1 = (9 )(0.5)9 + (1 )(0.5) 9 0

P1 = 0.0020 + 0.0176 P1 = 0.0196

___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2

Universidad Los ngeles de Chimbote


FACULTAD DE CIENCIAS DE LA SALUD

CURSO BIOESTADSTICA

6.

Decisin: P1 = 0.0196 < 0.025. Se rechaza Ho. Lo cual quiere decir que la mediana de la poblacin es diferente de 5.

TEMA 19: PRUEBA DE INDEPENDENCIA CHI CUADRADO

Es un procedimiento de contrastacin que se utiliza para determinar la dependencia (relacin o asociacin) o independencia entre dos variables categricas. Los datos pueden disponerse en una tabla de doble entrada llamada Tabla de Contingencia de r filas y k columnas. Pasos a seguir: 1. Formulacin de Hiptesis: H0 : No existe relacin entre las caractersticas. H1 : Existe relacin entre las caractersticas. 2. Nivel de signficancia: 3. Estadstica de prueba:

X =
2

(f ij e ij ) 2 e ij

i = 1 j= 1

X2 v

Donde: v = (r 1)(k 1) grados de libertad

eij =

f i . f. j n

f ij : Frecuencias observadas. e ij : Frecuencias esperadas.

4.

Establecimiento de los criterios de decisin:

___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2

Universidad Los ngeles de Chimbote


FACULTAD DE CIENCIAS DE LA SALUD

CURSO BIOESTADSTICA

0
2 X 1 , v

R.A.

R.R

2 Si Xo X12 ,v , se acepta Ho . 2 Si Xo > X12 ,v , se rechaza H o .

5. Clculos. 6. Decisin. Se acepta o rechaza Ho.


OBSERVACIONES:

Cuando los grados de libertad es v = 1 y especialmente cuando la muestra es muy pequea (n < 50), es aconsejable introducir un factor de correccin de continuidad de al calcular el valor chi-cuadrado. Es decir cuando v = 1 modificamos la ecuacin

X =
2 0


i= 1

(/ f ij e ij / 0.5) 2 e ij

j= 1

f ij e ij 0.5

Si cada celda tiene 5 o ms observaciones y las X 2 tiene dos o ms grados de libertad la aproximacin es buena. Si las frecuencias observadas en alguna celda, son menores que cinco, se combinan adecuadamente las celdas correspondientes hasta salvar la dificultad.

___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2

Universidad Los ngeles de Chimbote


FACULTAD DE CIENCIAS DE LA SALUD

CURSO BIOESTADSTICA

Para emplear correctamente el estadgrafo X 2, es necesario que por lo menos el 80% de las frecuencias esperadas de las distintas modalidades sean mayores o iguales que 5 y ninguna menor que 1. Si no es posible que se cumpla esta regla, los datos sern analizados por un medio de un procedimiento, llamado Test Exacto de Fisher. El coeficiente de contingencia C de Pearson: Es un indicador que sirve para medir el grado de relacin entre dos variables categricas y vara entre 0 y 1. C no tiene a 1 como lmite superior, su lmite superior se relaciona con el nmero de categoras. Para una tabla superior construida con igual nmero de filas y columnas el lmite superior es LS =
(k 1) / k . De este modo para una tabla 2 / 3 = 0.82 ; para una tabla

3 x 3 (T33 ) , k=3, entonces el lmite superior es LS = 4x4 (T44 ) , k=4. entonces LS =

3 / 4 = 0.87 , etc. Cuando el nmero de columnas

y filas difiere (Tabla Rectangular), por ejemplo, 3 x 4 (T34 ) el lmite superior de C se deduce con un valor k igual nmero ms pequeo.

El coeficiente de contingencia se define por:


C= X2 n+ X2

Si C > 0.30 se considera que es adecuado

Ejemplo 2: La siguiente tabla corresponde 360 alumnos del 5to y 6to grado de un colegio X por nivel de autoestima segn diagnostico nutricional: Diagnstico Nivel de Autoestima Alta Media Baja Nutricional Total Adecuado 100 50 10 160 Inadecuado 20 30 150 200 Total 120 80 160 360 a) Probar que el diagnstico nutricional y el nivel de autoestima se relacionan, a un nivel de significancia del 5%. b) Calcular e interpretar el coeficiente de contingencia Chi cuadrado.
___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2 8

Universidad Los ngeles de Chimbote


FACULTAD DE CIENCIAS DE LA SALUD

CURSO BIOESTADSTICA

Solucin: a) 1. Formulacin de hiptesis: Ho: El estado nutricional y el nivel de autoestima de los alumnos no se relacionan. H1: El estado nutricional y el nivel de autoestima de los alumnos se relacionan. 2. 3. Nivel de significancia: = 0.05 Estadstica de prueba:

X =
2


i= 1

(f

ij

e ij ) e ij

j= 1

X2 2

Donde: r = 2, k = 3 v = (r 1) x (k 1) v = 2 4. Establecimiento de los criterios de decisin:

1 = 0.95 =0.05 5.99

R.A.
2 Si X 0 5.99 ; se acepta Ho.
2 Si X 0 > 5.99 ; se rechaza Ho.

R.R.

___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2

Universidad Los ngeles de Chimbote


FACULTAD DE CIENCIAS DE LA SALUD

CURSO BIOESTADSTICA

NOTA:

X 2 = X 2 0.95, 2 = 5.99 ; se debe hallar en la Tabla de distribucin chi-cuadrado. t


5. Clculos:

e ij =

f i. f . j n
f 1. f .1 160 120 = = 53.3 53 n 360 f 1. f .2 160 80 = = 35.5 36 n 360 f 1. f .3 160 160 = = 71.1 71 n 360 f 2. f .1 200 120 = = 66.7 67 n 360 f 2. f .2 200 80 = = 44.4 44 n 360 f 2. f .3 200 160 = = 88.9 89 n 360

e11 = e12 = e13 =

e 21 =

e 22 =

e 23 =

Estado Nutricional Adecuado 100 Inadecuado f.j 20 120

Alto 53 67

Nivel de Autoestima Medio Bajo 36 71 50 10 44 89 30 150 80 160

fi. 160 200 360

___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2

10

Universidad Los ngeles de Chimbote


FACULTAD DE CIENCIAS DE LA SALUD
2 Hallando X 0 2 X0 =

CURSO BIOESTADSTICA

(100 53) 2 (50 36) 2 (10 71) 2 (20 67) 2 (30 44) 2 (150 89) 2 + + + + + 53 36 71 67 44 89 5 + 52 + 33 + 4 + 42

2 X 0 = 42 +

2 X 0 = 178

6.

Decisin: Como
2 X 0 = 178 > 5.99 ,

rechazamos Ho, lo que quiere decir el diagnostico

nutricional y el nivel de autoestima de los alumnos se relacionan. a) Calculando el coeficiente de contingencia:


2 X0 2 X0 + n

C =

C=

178 = 0.58 178 + 360

Haciendo el anlisis respectivo el grado de relacin entre el estado nutricional y el nivel de autoestima de los alumnos vemos que es adecuado.

___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2

11

Você também pode gostar