Você está na página 1de 41

Bioestadística Aplicada I

NMRCD – Progr ama GEIS


UPCH – FASPA
ABE Perú
Sexta clase:

Métodos paramétricos y no
paramétricos

Medias, varianza y correlación

Pruebas para variables continuas

Bioestadística
Porqué usamos pruebas no
paramétricas?:
Porque no siempre se cumplen todos los
supuestos requeridos por las pruebas de
hipótesis tradicionales (paramétricas):
Distribución normal
Tamaño de muestra “grande”
Varianzas iguales (?)
Si la distribucion de la poblacion es sesgada
(Por lo que la media no es buen indicador de
tendencia central)
Bioestadística
Cómo se aplican estas pruebas:
Aplicar una transformación a los datos originales,
convertiéndolos en rangos, valores positivo o
negativo, etc.

Con los datos transformados, calcular un


estadístico en base a los datos (a veces también
se calcula su promedio y error estándar)

Con el estadístico y los parámetros calculados,


realizar una prueba de hipótesis de acuerdo a
una cierta distribución paramétrica (Normal, Ji-
cuadrado, Binomial, etc.)

Bioestadística
Transformaciones de datos

Si los datos tienen una distribución


sesgada, en ocasiones pueden
transformarse para eliminar los sesgos

En algunos casos se puede emplear un


test paramétrico después de la
transformación

Bioestadística
Ejemplo:
Si trabajamos con parasitemia, con
frecuencia tendremos que aplicar una
transformación

Log

Bioestadística
Comando ‘gladder’:

Bioestadística
Análisis con variables numéricas:
Análisis Paramétrico No paramétrico
Describir un grupo µ, σ2 Mediana, rango
intercuartil
Comparar un grupo T Student de una Prueba Wilcoxon
a un valor muestra
Comparar medias T Student de dos Mann-Whitney
en 2 grupos muestras
Comparar medias T Student Prueba Wilcoxon
en 2 grupos apareada
apareados
Comparar medias ANOVA Kruskal-Wallis
en 3 o mas grupos
Correlación entre Pearson (lineal) Spearman
dos variables (monotónica)
Bioestadística
Comparación de una muestra
contra una constante
Se piensa que la edad de inicio del consumo
de cigarrillos es la adolescencia

Puntualmente se plantea que el consumo se


inicia a los 15 años

Si la distribución es sesgada o la muestra es


pequeña, una prueba paramétrica sobre la
media puede ser poco relevante
Bioestadística
histogram p59, fraction
.2
.15
Fraction
.1
.05
0

0 20 40 60
¿qué edad tenía ud. cuando fumó cigarrillos por primera vez?

Bioestadística
Prueba T Student de una muestra

Bioestadística
Aunque no es necesario,
hagamos la prueba no
paramétrica:

Bioestadística
Prueba signrank (Wilcoxon):

Ho: Mediana de la diferencia = 0


p59 – 15 = 0 ó p59 = 0

Asume una distribución uniforme


alrededor de cero

Compara puntajes esperados con


observados

Bioestadística
Comparación entre dos muestras
independientes
Se piensa que la edad de inicio del consumo
de cigarrillos varía entre varones y mujeres

Si la distribución es sesgada, una prueba


paramétrica sobre la media puede ser poco
relevante

Si los tamaños de muestra son pequeños (n


< 30), el TLC no se cumplirá y la prueba T
podría llevar a conclusiones erróneas
Bioestadística
Prueba T Student (paramétrica):
Ho: µvarones = µ mujeres Ha: µvarones ≠ µ mujeres

Bioestadística
Igualdad de varianzas:

La prueba T de Student de grupos


independientes difiere si las varianzas
difieren entre los grupos, debiendo
agregarse la opción “unequal”

Para evaluar si las varianzas son


comparables o no se utiliza el comando
sdtest

Bioestadística
Prueba de Varianzas (sdtest)
Ho: σ2varones = σ2mujeres Ha: σ2varones ≠ σ2mujeres

Bioestadística
T Student con varianzas
diferentes:

Bioestadística
Prueba de Mann-Whitney:
Equivalente no paramétrico a una prueba de
hipótesis de promedios para dos muestras

Determina si una variable tiene valores mas


altos en una población que en otra. NO
COMPARA LOS PROMEDIOS!!!

Util si el tamaño de muestra es pequeño o la


distribución es demasiado sesgada

Bioestadística
Qué son los puntajes correlativos?
¿qué edad tenía ud. cuando fumó cigarrillos por primera vez?
0 20 40 60

.5 1 1.5 2 2.5
Varones inf_sexo
Mujeres
Bioestadística
Prueba de Mann-Whitney:
Ho: Fumarvarones = Fumarmujeres Ha: Fumarvarones ≠ Fumarmujeres

Bioestadística
Interpretación

Se están comparando “valores” o la


“distribución”, no los promedios

Si en un grupo los puntajes observados


son mayores a los esperados, ese
grupo tiene mayores “valores”

Bioestadística
Comparación de dos grupos
apareados
Es una sola muestra, en verdad, en la que se
han medido dos valores

Se puede calcular la diferencia entre los


valores y sería una prueba de una sola
muestra

Qué comienza primero, alcohol o tabaco?

Prueba no paramétrica útil si es muestra


pequeña o distribución muy sesgada
Bioestadística
Prueba T Student apareada:
Ho: μfumar = μtomar Ha: μfumar ≠ μtomar

Bioestadística
Prueba signrank (Wilcoxon):

Bioestadística
Análisis de Varianza:
Prueba paramétrica para determinar si hay
diferencias en el promedio de una variable
cuantitativa (inicio fumar) entre tres o más
poblaciones (estratos sociales). Supuestos:
Distribución normal en todas las poblaciones (no
es necesario si el tamaño de muestra es
“grande”)

Varianzas comparables entre poblaciones

Observaciones (muestras) independientes


Bioestadística
Comparación de Varianzas:
Se usa en el ANOVA para determinar si hay
diferencias entre promedios de varias
muestras

También se usa ANOVA en el análisis de


regresión, siendo un caso particular del
ANOVA

Utiliza la prueba estadística F

Bioestadística
Las hipótesis:

Hipótesis nula, Ho:


X-inicioAlto = X-inicioMedio = X-inicioBajo

Hipótesis alternativa, Ha:


Existen diferencias en la edad de inicio
de fumar promedios de al menos dos
estratos sociales

Bioestadística
Bioestadística
Prueba de Kruskal-Wallis:

Extensión de la prueba de Mann-Whitney a


mas de dos poblaciones

Equivalente no paramétrico del análisis de


varianza

TAMPOCO COMPARA PROMEDIOS:


determina si una población tiene valores
diferentes (mas altos o mas bajos) que las
otras poblaciones

Bioestadística
¿qué edad tenía ud. cuando fumó cigarrillos por primera vez?
Los puntajes correlativos:
0 20 40 60

.5 1 1.5 2 2.5 3 3.5


estrato social

Bioestadística
En Stata:

Bioestadística
Determinando pares diferentes:

Bioestadística
Correlación r de Pearson
Mide el grado de asociación lineal entre dos
variables numéricas

-1 <= r <= 1, r = 0 indica independencia

Se calcula en stata con el comando “pwcorr”

Requiere muestras “grandes”, distribuciones


cruzadas no sesgadas

Bioestadística
Las hipótesis:

Hipótesis nula (Ho):


rfumar - tomar = 0

Hipótesis alternativa (Ha):


rfumar - tomar ≠ 0

Bioestadística
scatter p59 p89
60
40
p59b
20
0

0 10 20 30 40 50
p89b

Bioestadística
Resultados:

Bioestadística
Correlación de puntajes
(Spearman):
Equivalente no paramétrico a la prueba de
correlación lineal de Pearson. Se aplica cuando
la correlación no es lineal, la muestra es
pequeña o existen valores muy extremos

Determina si dos variables cuantitativa u


cualitativa-ordinal están correlacionadas positiva
(una crece y la otra también) o negativamente
(una crece y la otra disminuye)

Al igual que las pruebas de Mann-Whitney y


Kruskal-Wallis, también utiliza datos por rangos
Bioestadística
Las hipótesis:

Hipótesis nula, Ho:


ρ-puntajesfumar - tomar = 0

Hipótesis alternativa, Ha:


ρ- puntajesfumar - tomar ≠ 0

Bioestadística
Resultados:

Bioestadística
Que debemos llevar a casa hoy:
Alternativas disponibles cuando no se
cumplen las condiciones para usar
pruebas parámetricas

Como aplicar e interpretar las pruebas de


Wilcoxon, Mann-Whitney, Kruskal-Wallis y
Spearman

Limitaciones de las pruebas no


paramétricas

Bioestadística

Você também pode gostar