Você está na página 1de 29

Eleccin de la prueba

estadstica
Lic. Andre Choc
Clnica de Enfermedades Infecciosas
Hospital Roosevelt
El modelo estadstico
La potencia de la prueba
Medicin
Evaluacin de la normalidad de los datos
Homocedasticidad
Carcter apareado/independiente de los datos
Mtodos paramtricos
Mtodos no paramtricos
Resumen de mtodos
Sumario
El modelo estadstico
Para aplicar una prueba estadstica se debe conocer el
modelo estadstico y el requisito de medida.
El modelo estadstico de una investigacin se refiere a la
afirmacin de la naturaleza de la poblacin y el mtodo de
muestreo.
Si no se pueden verificar si las condiciones de un modelo
estadstico particular han sido satisfechas, se realizan
suposiciones. A medida que las suposiciones que definen
un modelo particular, son ms escasas, o ms vagas,
necesitaremos de menos limitaciones para llegar a una
decisin lograda por la prueba estadstica asociada al
modelo.
El modelo estadstico
Las observaciones son independientes entre s? Es
decir, la seleccin de un caso cualquiera de la
poblacin no afecta las posibilidades de incluir a
cualquier otro?
Las varianzas de los grupos a comparar es similar?
La distribucin de los datos es normal?
Se utiliza un diseo experimental para evaluar ms de
una variable independiente con combinaciones
lineales debidos a columnas y renglones o ambos?


Potencia-eficiencia
La potencia de una prueba es la probabilidad de
rechazar una hiptesis nula cuando es realmente
falsa. Y se relaciona con el error tipo II. El erro tipo II
o error beta se comete cuando se acepta una
hiptesis nula falsa.
Por otro lado el error tipo I (o significancia) se comete
cuando se rechaza una hiptesis nula verdadera.
Potencia-eficiencia
A medida que son menores o ms dbiles las suposiciones
de un modelo particular, son ms generales las
conclusiones derivadas al aplicar la prueba estadstica
asociada con l, pero menos poderosa es la prueba de Ho.
El concepto de potencia-eficiencia nos seala que al
aumentar apropiadamente el tamao de la muestra
podemos usar una prueba no paramtrica en lugar de una
paramtrica sin perder potencia para rechazar Ho.
Potencia-eficiencia de la prueba B = (100)*(n
a
/n
b
)%

Potencia-eficiencia
La potencia de una prueba es la probabilidad de
rechazar una hiptesis nula cuando es realmente
falsa. Y se relaciona con el error tipo II. El erro tipo II
o error beta se comete cuando se acepta una
hiptesis nula falsa.
Por otro lado el error tipo I (o significancia) se comete
cuando se rechaza una hiptesis nula verdadera.
Potencia-eficiencia
A medida que son menores o ms dbiles las suposiciones
de un modelo particular, son ms generales las
conclusiones derivadas al aplicar la prueba estadstica
asociada con l, pero menos poderosa es la prueba de Ho.
El concepto de potencia-eficiencia nos seala que al
aumentar apropiadamente el tamao de la muestra
podemos usar una prueba no paramtrica en lugar de una
paramtrica sin perder potencia para rechazar Ho.
Potencia-eficiencia de la prueba B = (100)*(n
a
/n
b
)%

Escalas dbiles: nominal (Estado civil) y ordinal (nivel
socioeconmico)
Nominal: dicotmica (sexo) y politmica (orientacin
sexual)
Escalas fuertes: discreta (nmero de hijos) y continua
(peso). De escala (no cero absoluto), De razn (cero
absoluto
Jerarqua: Nominal < Ordinal < Discreta < Continua o
nominal<ordinal<de escala<de razn
Medicin
Criterios para evaluar la normalidad
de los datos
Mtodos descriptivos
Regla emprica: en muestras
Clculo de coeficiente de asimetra y curtosis
Cuando la desviacin estndar es de tamao similar o mayor a
la media y la variable slo puede tener valores positivos,
entonces la distribucin se encuentra inclinada.
Mtodos inferenciales
Pruebas de bondad de ajuste
Shapiro-Wilks
Kolmogorov-Smirnoff
Ji cuadrada

Criterios para evaluar la normalidad
de los datos
Mtodos inferenciales: pruebas dirigidas a la poblacin de la que
se extrajo los datos.
De bondad de ajuste: en qu se parece un conjunto de datos a
una distribucin de probabilidad.
Shaphiro-Wilks
Mide la fuerza del ajuste con una recta. Cuanto mayor sea este
estadstico mayor desacuerdo habr con la recta de normalidad, por
lo que podremos rechazar la hiptesis nula.
La prueba de Shapiro-Wilks est considerada como la
prueba ms potente para muestra inferiores a 30 casos.

Criterios para evaluar la normalidad
de los datos
Kolmogorov-Smirnof
Es la ms utilizada y se considera uno de los test ms
potentes para muestra mayores de 30 casos. En este test la
Hiptesis nula Ho: es que el conjunto de datos siguen una
distribucin normal. Y la Hiptesis alternativa H1: es que no
sigue una distribucin normal.
Xi Cuadrado
Para comparar si un grupo de frecuencias observadas con
unas frecuencias esperadas y decidir si existen diferencias.
Grados de libertad : K -1.

Criterios para evaluar la normalidad
de los datos
Estadstic
o gl Sig.
Estadstic
o gl Sig.
Normal .219 50 .000 .764 50 .000
Sobrepeso .163 76 .000 .801 76 .000
Obesidad
grado I
.312 37 .000 .530 37 .000
Obesidad
grado II
.200 15 .110 .838 15 .012
Kolmogorov-Smirnov
a
Shapiro-Wilk
IMC
HOMA/IR
count 178
empirical rule
mean - 1s -1.2372
mean + 1s 7.1601
percent in interval (68.26%) 93.3%
mean - 2s -5.4359
mean + 2s 11.3587
percent in interval (95.44%) 97.8%
mean - 3s -9.6346
mean + 3s 15.5574
percent in interval (99.73%) 98.3%
Se refiere a la igualdad de varianzas, o a la evaluacin
de la similitud de la dispersin entre los grupos de
comparacin
Mtodo descriptivo: grficas de Tuckey, comparacin de
desviaciones estndar, grficas de error
Mtodos inferenciales: prueba de Bartlet, Estadstica de
Levene
Homocedasticidad
Homocedasticidad
Homocedasticidad
Estadstico gl Sig.
Primaria .165 13
.200
*
Bsicos .135 28
.200
*
Diversificado .082 81
.200
*
Universitario .093 38
.200
*
Pruebas de normalidad
Kolmogorov-Smirnov
a
Estadstico de Levene gl1 gl2 Sig.
2.646 3 156 .051
Prueba de homogeneidad de varianzas
ndice de consumo de frutas verduras
Medidas repetidas o apareadas cuando han sido
realizadas en los mismos sujetos.
Al ser los mismos sujetos existe menor variabilidad en la
mediciones, por tanto se pueden usar pruebas ms
potentes.
Apareamiento por similitud de caractersticas fsicas,
sociodemogrficas, antropomtricas, clnicas, etc.
No hay relacin entre los sujetos: datos
independientes.
Carcter apareado/independiente de
los datos
Mtodos paramtricos
Los test estadsticos como el test de z, t y F son llamados,
en conjunto, test paramtricos. Los test paramtricos son
test estadsticos para comprobar hiptesis para las
poblaciones de las que se extrajeron las muestras en
estudio.
Para aplicar estos mtodos se deben de tomar diversos
criterios relacionados al modelo estadstico, la potencia y
eficiencia deseadas, la escala de medicin de las variables,
as como la distribucin de probabilidad de las variables.
Mtodos paramtricos
El elemento fundamental de estos procedimientos es el
conocimiento de la forma funcional de la distribucin de la
poblacin de la cual se extrajeron las muestras que
proporcionaron la base para la inferencia.
Si las poblaciones de las que proceden las observaciones
no tienen una distribucin normal, los mtodos
paramtricos pierden precisin puesto que la media y la
desviacin estndar, que constituyen los elementos clave
de las estadsticas paramtricas, ya no describen por
completo a la poblacin .

Mtodos paramtricos
Suma de
cuadrados gl
Media
cuadrtic F Sig.
Inter-grupos 11638.650 3 3879.550 15.020 .000
Intra-grupos 40292.744 156 258.287
Total 51931.394 159
ANOVA de un factor
ndice de consumo de frutas verduras
Estadstico
a
gl1 gl2 Sig.
Welch 14.182 3 41.218 .000
Brown-Forsythe 12.647 3 71.153 .000
Pruebas robustas de igualdad de las medias
ndice de consumo de frutas verduras
Mtodos paramtricos
Lmite inferior Lmite superior
Bsicos -5.73640 5.39377 .712 -19.7437 8.2709
Diversificad
o
-9.00761 4.80176 .243 -21.4775 3.4623
Universitari
o
-26.46093
*
5.16384 .000 -39.8711 -13.0508
Primaria 5.73640 5.39377 .712 -8.2709 19.7437
Diversificad
o
-3.27121 3.52325 .790 -12.4209 5.8784
Universitari
o
-20.72453
*
4.00269 .000 -31.1193 -10.3298
Primaria 9.00761 4.80176 .243 -3.4623 21.4775
Bsicos 3.27121 3.52325 .790 -5.8784 12.4209
Universitari
o
-17.45332
*
3.16002 .000 -25.6597 -9.2469
Primaria
26.46093
*
5.16384 .000 13.0508 39.8711
Bsicos
20.72453
*
4.00269 .000 10.3298 31.1193
Diversificad
o
17.45332
*
3.16002 .000 9.2469 25.6597
HSD de Tukey
Primaria
Bsicos
Diversificado
Universitario
Diferencia
de medias
(I-J) Error tpico Sig.
Intervalo de confianza al 95%
Mtodos paramtricos
1 2
Primaria 13 31.6404
Bsicos 28 37.3768
Diversificad
o
81 40.6480
Universitari
o
38 58.1013
Sig. .179 1.000
HSD de Tukey
a,b
ndice de consumo de frutas verduras
Escolaridad N
Subconjunto para alfa =
Los mtodos no paramtricos
Cuando las poblaciones no se encuentran
normalmente distribuidas o no se aproximan a esta
distribucin se deben utilizar los mtodos no
paramtricos. Estas tcnicas establecen menos
suposiciones sobre la naturaleza de las distribuciones
fundamentales, por ello son llamados mtodos de
distribucin libre.
Los mtodos no paramtricos
Cuando las observaciones provienen de una
poblacin de distribucin normal, los mtodos no
paramtricos tienen una potencia aproximada e 95%
respecto de la de los mtodos paramtricos anlogos.
Cuando las observaciones se obtienen a partir de
poblaciones que carecen de una distribucin normal,
los mtodos no paramtricos no slo son ms
confiables sino tambin ms potentes que los
mtodos paramtricos.
Los mtodos no paramtricos
Hay situaciones particulares donde estos mtodos resultan
ms adecuados:
La variable que se est midiendo tiene una alta carga de
subjetividad o la escala de medicin de esta es dbil.
Se tienen muy pocas muestras para el anlisis.
No se conoce la distribucin de probabilidad de la variable
respuesta.
Se tiene la certeza que la variable respuesta no tiene una
distribucin normal.
No se necesita aportar resultados muy concluyentes pues el
estudio que se realiza es exploratorio.
Resumen de mtodos
Tipo de variables Escala de medicin Tablas Grficas Estadsticos de resumen Estadsticos de dispersin
Nominal dicotmica De frecuencias absolutas y relativas Pie y barras % No aplica
Nominal politmica De frecuencias absolutas y relativas
De preferencia
columnas, barras
cuando hay muchas
categoras
% No aplica
Ordinales De frecuencias absolutas y relativas
De preferencia
columnas ordenando
de acuerdo a la
variable y no a la
frecuencia
% No aplica
Discretas
De frecuencias agrupadas absolutas
y relativas
De preferencia
boxplot pero
tambin histograma
De preferencia
mediana, tambin
puede usarse media
De preferencia Cuartil 3 y
1 o rango intercuartil,
tambin puede usarse
desviacin estndar junto
a la media
Continuas
De frecuencias agrupadas absolutas
y relativas
De preferencia
histograma, pueden
usarse tambin
Pareto y Boxplot
Media Desviacin estndar
Cualitativas
Cuantitativas
Resumen de mtodos
Variable
independiente
Variable
dependiente
Escala de medicin
variable respuesta
Observaciones Mtodo estadstico
Cualitativa Cualitativa Nominal Grupos independientes
Ji cuadrado, reg. Log. Bivariada
binomial
Cualitativa Cualitativa Nominal Pocos casos Prueba exacta de Fisher
Cualitativa Cualitativa Nominal Grupos relacionados Estadstica de Mc Nemar
Cualitativa Cualitativa Ordinal Grupos independientes Ji cuadrado
Cualitativa Cualitativa Ordinal Grupos relacionados
Prueba de signos, Estadstica
de Stuart-Maxwell, Friedman
Cualitativa Cualitativa Nominal u ordinal
Estratificacin por una
variable cualitativa
adicional
Prueba de Mantel-Haenzel
Cuantitativa Cualitativa Nominal Grupos independientes reg. Log. Bivariada binomial
Cualitativa dos
grupos
Cuantitativa Discreta
No normal, grupos
relacionados
Prueba de signos, prueba de
rangos con signos de Wilcoxon
Cualitativa dos
grupos
Cuantitativa Discreta
No normal, grupos
independientes
Prueba de rangos con sumas
de Wilcoxon, Mann Withney
Cualitativa ms
de dos grupos
Cuantitativa Discreta
No normal, grupos
relacionados
Prueba de Cochran, Friedman
Cualitativa ms
de dos grupos
Cuantitativa Discreta
No normal, grupos
independientes
Kruskall Wallis
Resumen de mtodos
Variable
independiente
Variable
dependiente
Escala de medicin
variable respuesta
Observaciones Mtodo estadstico
Cualitativa dos
grupos
Cuantitativa Discreta o continua
Normal, grupos
relacionados
Prueba de T de muestras
emparejadas
Cualitativa dos
grupos
Cuantitativa Discreta o continua
Normal, grupos
independientes n < 30
Prueba de T de muestras
independientes
Cualitativa dos
grupos
Cuantitativa Discreta o continua
Normal, grupos
independientes n = 30
o ms
Prueba de z de muestras
independientes
Cualitativa dos o
ms grupos
Cuantitativa Discreta o continua
Normal, grupos
relacionados
Anlisis de varianza de 1 va
Cualitativa dos o
ms grupos
Cuantitativa Discreta o continua
Normal, grupos
independientes
Anlisis de varianza de dos vas
con bloqueo por variable A
2 o ms
Cualitativas
Cuantitativa Discreta o continua Normal
Anlisis de varianza de 2 vas
factorial
2 o ms
Cualitativas
Cuantitativa Discreta o continua
Normal, estratificacin
de variable A
Anlisis de varianza de dos vas
con bloqueo por variable A
Cualitativa dos o
ms grupos
2 o ms
cuantitativas
Discreta o continua
Normal, grupos
independientes
Multianova
Cuantitativa Cuantitativa Discreta o continua No normal
Coeficiente de correlacin de
Spearman
Cuantitativa Cuantitativa Discreta o continua Normal
Coeficiente de correlacin de
Pearson
Gracias!!!

Você também pode gostar