Você está na página 1de 3

Estadstica no parametrica

Claudio Bustos
10 de octubre de 2014

Indice
1. Metodos no parametricos 2
Referencias 3
Siegel (1956) se nala que el desarrollo inicial de las pruebas de hipotesis es-
tadsticas se realizo haciendo suposiciones bastante fuertes sobre las poblaciones
y los estadsticos que se obtenan de los datos.
Si hacemos el supuesto que todos los grupos tienen distribuciones iguales ,
lo mas sencillo es realizar pruebas sobre sus parametros, es decir, sobre aquellos
valores que permiten representar completamente a la distribucion. De aqu el
nombre de estadstica parametrica que adopta este tipo de analisis.
Las pruebas parametricas se basan en la manipulacion aritmetica de las
variables, por lo que solo admite el uso de variables numericas.
Por ejemplo, una de los operaciones mas comunes es determinar si dos grupos
dieren entre s en su valor central. Si asumimos que la distribucion de cada
grupo es normal, en lo que pueden diferir solamente es en su esperanza o su
varianza poblacional. Como generalmente este ultimo valor no es relevante, la
prueba se realizara sobre la diferencia de esperanzas entre ambos grupos (H
0
:

1
=
2
) y la la prueba de eleccion sera la t de Student para muestras no
relacionadas. Si la cantidad de grupos es mayor, asumiendo que la distribucion
de cada grupo nuevamente es normal y con varianzas iguales, se puede utilizar
la prueba ANOVA de una va, que tiene por hipotesis nula la igualdad de medias
de los grupos (H
0
:
1
=
2
= ... =
k
)
En aquellos casos donde no se supone normalidad en la distribucion original
de los datos, por medio del Teorema del Lmite Central se puede asumir en
muestras grandes que la distribucion de sus medias sera normal. Esto justica,
entre otras cosas, el uso de ANOVA sobre grupos con datos no normales, pero
con muestras grandes.
Ahora, si nuestras hipotesis se relacionan con caractersticas distintas a la es-
peranza poblacional, contamos con muestras peque nos o tenemos distribuciones
desconocidas o muy distintas a la normal (lo que suele ocurrir con datos a nivel
ordinal o nominal), no podremos utilizar la estadstica basada en parametros.
Para estos casos, se pueden utilizar los metodos no parametricos.
1
Wasserman (2006) se nala que lo fundamental de los metodos no parametricos
es usar datos para inferir algo sobre la poblacion usando la menor cantidad de
supuestos posibles.Siegel (1956) agrega que los metodos no parametricos pueden
ser usados para datos no numericos, a nivel ordinal particularmente, de lo cual
surgen las pruebas basadas en el orden de los datos(ranking tests, en ingles).
Entre los problemas que trata la estadstica no parametrica, se cuenta (Wasserman,
2006):
Estimar la distribucion de origen de los datos. Esto es, a partir de los
datos, denir cual es la funcion de probabilidad acumulada de la poblacion.
Tambien se puede estimar la funcion de densidad, pero es mas complejo.
Estimar el valor esperado para una variable X, dada una variable Y , lo
que es conocido como regresion no parametrica
Entre las pruebas no parametricas de hipotesis mas conocidas se encuentran
la prueba Chi-cuadrado y prueba exacta de Fisher, para datos a nivel nominal,
y la correlacion de rangos de Spearman, para datos a nivel ordinal.
Siegel (1956) se nala que para optar entre metodos parametricos y no pa-
rametricos, se deben considerar las siguientes dimensiones
1. Poder: En general, si la distribucion de origen de los datos es cercana a una
conocida (la normal, por ejemplo), es mejor usar pruebas parametricas,
ya que presentan mayor poder, es decir, capacidad de rechazar H
0
cuando
esta es falsa.
2. Tipo de medicion: si los datos se encuentran a nivel nominal u ordinal, los
datos no son numericas y no aplica la realizacion de operaciones aritmeti-
cas sobre ellos. Por tanto, si la distribucion no es conocida (por ejemplo,
binomial), solo se pueden utilizar metodos no parametricos.
1. Metodos no parametricos
A continuacion, se presenta una tabla resumen de los metodos a utilizar,
a partir de Sheskin (2003):
Cuadro 1: Tabla resumen de metodos no parametricos
Nivel de medida Dependencia N
o
grupos Nombre Mecanismo Referencia
Intervalar (continuo) Independiente 2 T. de U de Mann-Whitney Ranks (Mediana)
Intervalar (continuo) Independiente 3+ T. de Kruskall-Wallis Ranks (Mediana)
Ordinal Independiente 2 T. de Kolmogorov-Smirnov CDF
Nominal Independiente 2+ T.
2
de Independencia Multinomial
Nominal Independiente 2 T. Exacto de Fisher Hipergeometrica
Intervalar (continuo) Dependiente 2 T. de Wilcoxon Ranks (Mediana)
Intervalar (continuo) Dependiente 3+ T. de Friedman Ranks?
Ordinal Dependiente 2 T. de los signos para m.d Binomial
Nominal (dicot omica) Dependiente 2 T. de McNemar Binomial
Nominal (dicot omica) Dependiente 3+ T. Q de Cochran
2
En las pruebas donde se utilizan los rangos, se asume que hay una distribu-
cion continua en la cual los datos pueden ser ordenados, generandose as una
variable ordinal sin repeticiones de categoras. Por tanto, si bien las pruebas
estrictamente solo exigen que la medicion sea ordinal, el analisis se vuelve mas
complejo si se repiten los valores, lo que se producira si se tiene una variable
ordinal con pocas categoras.
Para analizar variables ordinales con pocas categoras, se aceptan como pro-
cedimientos validos el test de Wilcoxon-Mann-Whitney con uniones(ties) o prue-
bas de permutacion(Heeren y DAgostino, 1987). Es necesario, al usar software
estadstico, estar seguro que se calcula el estadstico correcto. En todo caso, si
las categoras son pocas, es recomendable utilizar las pruebas para niveles no-
minales, como X
2
de Independencia o exacta de Fisher, que aparte tienen la
ventaja de descubrir diferencias en la distribucion que vayan mas alla del punto
central, como la mediana.
Referencias
Heeren, T., y DAgostino, R. (1987). Robustness of the Two Independent
Samples t-Test when applied to ordinal scaled data. Statistics in medicine,
6, 7990.
Sheskin, D. (2003). Handbook of Parametric and Nonparametric Statistical Pro-
cedures. Bora Raton, Florida, EEUU: Chapman and Hall/CRC. Descarga-
do de http://www.crcnetbase.com/doi/book/10.1201/9781420036268
doi: 10.1201/9781420036268
Siegel, S. (1956). Nonparametric statistics. The American Statistician, 11,
13-19.
Wasserman, L. (2006). All of nonparametric statistics. Springer.
3