Você está na página 1de 7

Rehabil.

integral 2011; 6 (2): 93-99


Artículo de Bioestadística

Aplicación de la estadística no paramétrica


en el área de rehabilitación

PAMELA SAN MARTÍN P1.

1
Dirección de
ABSTRACT Investigación y Desarrollo.
Teletón-Chile.
The use of non-parametric statistics in rehabilitation
Recibido: 24 de enero de
In this article, we focus on the importance of obtaining statistics that stray from 2011
the usual probabilistic distribution, such as normal distribution. These statistics, Aceptado: 23 de noviembre
known as non-parametric, are especially adequate when analyzing small samples de 2011
(less than 30 individuals) within biomedical research. We elaborate and show
Correspondencia a:
examples of their use in rehabilitation. Pamela San Martín P.
Key words: Statistic nonparametric, statistics & numerical data, rehabilitation. psanmartin@teleton.cl

RESUMEN

En este artículo, se enfatiza la importancia de la obtención de estadísticas que


no se ajustan a alguna distribución de probabilidad conocida, como la distribución
normal por ejemplo, que se denominan no paramétricas, adecuadas para analizar
un conjunto de datos provenientes de muestras de tamaño relativamente peque-
ño, inferiores a 30 unidades de observación en una investigación biomédica. Se
desarrollan y ejemplifican los escenarios más comúnmente encontrados en el área
de la rehabilitación.
Palabras clave: Estadística no paramétrica, estadística y datos numéricos,
rehabilitación.

Introducción de los trabajos en el área de rehabilitación. En


estas situaciones disponemos de dos posibles
Cuando se analizan datos medidos para mecanismos: los datos se pueden transformar
una variable cuantitativa continua, las pruebas mediante funciones matemáticas de tal manera
estadísticas de estimación y contraste frecuen- que sigan una distribución normal, o bien se
temente empleadas se basan en suponer que puede acudir a pruebas estadísticas que no se
se ha obtenido una muestra aleatoria de una basen en ninguna suposición en cuanto a la
distribución de probabilidad de tipo normal o distribución de probabilidad a partir de la que
de Gauss. Pero en muchas ocasiones esta supo- fueron obtenidos los datos, y por ello se deno-
sición no resulta válida, y la sospecha de que no minan pruebas de libre disposición o no para-
sea adecuada no resulta fácil de comprobar, por métricas, mientras que las pruebas que suponen
tratarse de muestras pequeñas como es el caso una distribución de probabilidad determinada

93
P. SAN MARTÍN P.

para los datos se denominan pruebas paramé- decir, deja igual número de observaciones a
tricas. Un parámetro es un valor constante que un lado y a otro.
se obtiene considerando todas las unidades de Las pruebas no paramétricas se trabajan con
observación de una población determinada; muestras pequeñas de datos categóricos u or-
como esta situación es poco probable, se re- dinales, independientemente de la distribución
curre a las estadísticas que caracterizan a las de las muestras que se desea contrastar. Las
muestras. características que son comunes a las pruebas
Existe una amplia diversidad de pruebas no de hipótesis no paramétricas son 3-6:
paramétricas, las cuales pueden ser utilizadas 1. Independencia de las observaciones aleato-
dependiendo de los objetivos y de la hipótesis rias a excepción de datos emparejados (por
planteada en un estudio específico, para estable- ejemplo, evaluaciones al inicio y al final de
cer conclusiones sobre el comportamiento de un tratamiento).
variables bajo estudio. Estas pruebas ofrecen al- 2. Pocos supuestos con respecto a la distribu-
gunas ventajas con respecto a las paramétricas, ción de la variable en la población.
destacándose la rapidez del análisis y facilidad 3. La variable dependiente es medida en escala
de interpretación de los mismos1. categórica.
En la mayor parte de ellas los resultados 4. El punto primario de cálculo es el ordena-
estadísticos se derivan únicamente a partir de miento por rangos o por frecuencias.
procedimientos de ordenación y recuento, por 5. Las hipótesis se formulan sobre rangos,
lo que su base lógica es de fácil comprensión. medianas o frecuencias de los datos.
Cuando se trabaja con muestras pequeñas (n 6. El tamaño de la muestra requerido es menor
< 30) en las que se desconoce si es válido su- (< 30).
poner la normalidad de los datos y éstos son
categóricos u ordinales, conviene usar pruebas La Tabla 1 presenta como resumen las prue-
no paramétricas, al menos para corroborar los bas no paramétricas posibles de ser analizadas
resultados obtenidos a partir de la utilización a través del programa estadístico SPSS versión
de la teoría basada en la distribución normal2. 17.07.
En estos casos se emplea como parámetro Para las pruebas no paramétricas más uti-
de centralización la mediana, que correspon- lizadas en medicina física y rehabilitación,
de al elemento que divide la serie de datos publicadas hasta la fecha en este Boletín, se
ordenados en forma creciente en dos partes realiza una descripción cada una de ellas, dando
iguales, superiores e inferiores a él, quiere énfasis a su interpretación.

Tabla 1. Resumen de pruebas no paramétricas según número de muestras

Una sola muestra * Prueba c2


* Prueba Binomial
* Prueba de Rachas
* Prueba de Kolmogorov-Smirnov
Dos muestras Datos independientes * U de Mann-Whitney
* Z de Kolmogorov -Smirnov
* Reacciones Extremas de Moses
* Test de Rachas de Wald-Wolfowitz
Datos dependientes o emparejados * T de Wilcoxon
* Prueba de Signos
* c2 de MacNemar
K muestras Datos independientes * H de Kruskal -Wallis
(> a dos muestras) * Test de la Mediana
Datos emparejados * c2 de Friedman
* W de Kendall

94 Rehabil. integral 2011; 6 (2): 93-99


APLICACIÓN DE LA ESTADÍSTICA NO PARAMÉTRICA EN EL ÁREA DE REHABILITACIÓN

Prueba de asociación basada en la menor a 5%. Sin embargo, uno de los supuestos
distribución Chi-cuadrado (χ2) para aplicar la prueba de asociación basado en
χ2 es que las frecuencias (número de casos)
Una de las pruebas no paramétricas más esperadas de al menos el 80% de las celdas en
conocidas es la prueba de asociación basada en una tabla de contingencia sean mayores de 5.
la distribución χ2, la cual tabula una variable en Así, en una tabla 2 x 2 será necesario que todas
categorías y calcula un estadístico basándose las celdas verifiquen esta condición, si bien en
en las diferencias entre las frecuencias obser- la práctica suele permitirse que una de ellas
vadas derivadas de un estudio en particular y muestre frecuencias esperadas ligeramente por
las frecuencias que se esperan de acuerdo a debajo de este valor. En estos casos, en que no se
una distribución de probabilidades específica. verifique este requisito, existe un test propuesto
Una aplicación importante del uso de χ2 son las por R.A. Fisher, que permite analizar si dos
llamadas “tablas de contingencia” o tablas de variables dicotómicas están asociadas cuando
dos filas por dos columnas, las cuales buscan la muestra a estudiar es demasiado pequeña y
probar la hipótesis nula de ausencia de asocia- no se cumplen las condiciones necesarias para
ción, cuando se tienen dos variables y cada una la aplicación del test χ2 9. Este procedimiento
de ellas presenta dos categorías. consiste en evaluar la probabilidad asociada a
Un ejemplo de este uso aplicado a la in- todas las tablas 2 x 2 que se puedan formar con
vestigación en el campo de la rehabilitación los mismos totales marginales que los datos
se presenta en la Tabla 2. En dicho estudio la observados, bajo el supuesto de independencia.
hipótesis de nulidad (H0) establece que no exis- Los cálculos, aunque elementales, resultan algo
ten relaciones significativas entre el diagnóstico engorrosos, por lo que no se incluirán en este
nutricional y edad de los niños portadores de trabajo, siendo múltiples las referencias que se
enfermedades raquimedulares congénitas. Con- pueden consultar al respecto10-15.
siderando equivocarnos en 5 de cien muestras
(falsos positivos) para un total de 255, es decir, Prueba U de Mann Whitney
establecer que no hay relación entre diagnóstico
nutricional y edad cuando efectivamente existe Se utiliza cuando se desea efectuar la com-
esa relación (error α = 0,05), se obtuvieron los paración de dos grupos en quienes se ha medido
siguientes resultados: Se pesquisó mayor nú- una variable cuantitativa continua o de tipo
mero de niños obesos en el grupo de 2-7 años, cuantitativa discreta o cuando las mediciones
con asociación significativa entre diagnóstico se pueden ordenar en escala ordinal (es decir,
nutricional y edad (valor χ2 = 16,17; p = 0,013)8. cuando los valores tienden a una variable con-
En el caso descrito anteriormente, es posible tinua, pero no tienen una distribución normal)
afirmar que se presenta una asociación signifi- y resulta aplicable cuando las muestras son
cativa, porque el hallazgo de falsos positivos es independientes y con un tamaño de muestra

Tabla 2. Relación entre diagnóstico nutricional y edad

Diagnóstico nutricional Grupo de edad (años)


2-7 8 - 13 14 - 18 Total
n % n % n % n %
Bajo peso 3 7,9 6 4,8 6 6,5 15 5,9
Eutrófico 9 23,7 35 28 42 45,7 86 33,7
Sobrepeso 8 21,1 35 28 26 28,3 69 27,1
Obeso 18 47,4 49 39,2 18 19,6 85 33,3
Total 38 100 125 100 92 100 255 100
Significativo p = 0,013.

Rehabil. integral 2011; 6 (2): 93-99 95


P. SAN MARTÍN P.

menor a 30 observaciones. Cuando es mayor el variables se ordenan del valor menor al mayor y
tamaño de muestra, se aproxima bastante bien para finalizar, a cada rango se le otorga un signo
a la distribución normal. positivo o negativo, dependiendo del signo de
Esta prueba contrasta si dos poblaciones la diferencia original. Los signos positivos y
muestreadas son equivalentes en relación a su negativos se suman separadamente y se obtienen
centro de equilibrio (mediana). Las observacio- los promedios. Los pares que no tienen cambio
nes de ambos grupos se combinan y clasifican, se retiran del análisis.
asignándose el rango promedio en caso de pro- Según los siguientes datos, se quiere analizar
ducirse empates. El número de empates debe si existen diferencias estadísticamente signifi-
ser pequeño en relación con el número total de cativas en distintos ciclos de evaluación con
observaciones. Si el centro de equilibrio de las GMFM-6619 y GMFM-8820 en su totalidad y en
poblaciones es idéntica, los rangos deberían sus dimensiones tras terapia de neurodesarrollo
mezclarse aleatoriamente entre las dos muestras. (NDT)21 (Tabla 4).
Este procedimiento es una buena alternativa
cuando no se puede usar la prueba t de Student, Tabla 3. Valores de medición del dolor (en una escala
en razón de no cumplir con los requisitos que de 0 a 10) en dos grupos de pacientes sometidos a
esta prueba exige de normalidad de los datos. dos tratamientos analgésicos diferentes
Por ejemplo, se obtienen datos tras una inter-
vención analgésica diferente en dos grupos de n Trata- Rango Trata- Rango
miento A asignado miento B asignado
pacientes, se pretende examinar si el grado de
dolor es el mismo para estos grupos. La escala 1 100 22 85 18
de dolor tiene una escala de 0 a 10 puntos. Los 2 85 18 62 8
datos se presentan en la Tabla 316. 3 72 15 57 6,5
Dado este ejemplo, se plantea la hipótesis 4 64 9,5 32 1
nula H0: No existen diferencias significativas 5 70 12,5 70 12,5
tras someter a los pacientes a terapias con anal- 6 56 5 54 4
gésicos diferentes. Utilizando un nivel de con-
7 87 20 45 2
fianza del 95%, es posible concluir que si exis-
8 71 14 50 3
ten diferencias estadísticamente significativas
según el tipo de analgésico utilizado (p < 0,05) 9 95 21 64 9,5
en cuanto a dolor percibido por ambos grupos. 10 80 16 66 11
11 85 18 57 6,5
Prueba T de Wilcoxon17 Suma de rangos 171   82
p = 0,002.
Es una prueba flexible7,18 que se puede uti-
lizar en distintas situaciones, con muestras de
Tabla 4. GMFM: Test de Wilcoxon con rangos
diferentes tamaños y con pocas restricciones. asignados por ciclo de evaluación
Lo único que se requiere es que la variable sea
continua y que sean observaciones emparejadas,   Test de Wilcoxon
es decir, que sean sujetos de una misma muestra Dimensión/puntaje total Test inicial-final
con medidas pre y post prueba, o bien sujetos Decúbitos y giros 0,028 (z= -2,19)*
que hayan sido emparejados bajo criterios bien
Sedente 0,123 (z= -1,54)
definidos. Ahora la hipótesis de nulidad será
Gatear y arrodillarse 0,114 (z= -1,58)
H0: No existen diferencias significativas entre
los resultados obtenidos en el momento basal y De pie 0,109 (z= -1,60)
después de aplicar la intervención. Caminar, correr y saltar 0,180 (z= -1,34)
Esta prueba consiste en calcular las dife- GMFM - 88 0,050 (z= -1,96)*
rencias entre los pares de datos y se registran GMFM - 66 0,263 (z= -1,12)
los valores absolutos entre ellas. Luego, los *Puntajes que alcanzan niveles estadísticamente significativos
valores absolutos de las diferencias entre las dos (p < 0,05).

96 Rehabil. integral 2011; 6 (2): 93-99


APLICACIÓN DE LA ESTADÍSTICA NO PARAMÉTRICA EN EL ÁREA DE REHABILITACIÓN

Se tiene entonces, que la medición de logros Tabla 5. Puntaje GMAE de niños con PC evaluados con
en habilidades sensoriales y motoras luego de la GMFM-66 Institutos Teletón 2008
intervención kinesiológica entre el ciclo inicial y     Puntaje GMAE
final a través de GMFM-88 fue significativa, es
IRI n Mín. - Máx. Mediana - R.I.
decir, en su total, hubo incremento en el puntaje
Arica 13 12,12 - 71,22 23,37 (22,05)
de la función motora gruesa. Por dimensiones,
sólo decúbitos y giros, mostró cambios signifi- Santiago 18 10,42 - 40,44 20,54 (9,16)
cativos entre ciclo inicial-final (p = 0,028); en Talca 15 22,66 - 41,61 38,96 (3,06)
el resto de los ítems la intervención NDT no Concepción 16 14,86 - 37,79 20,90 (11,40)
produjo efectos importantes21. R.I.: Rango Intercuartílico = Percentil (75) – Percentil (25) =
P75-P25.
Significativo p = 0,000.
Prueba H de Kruskal-Wallis

Esta prueba es una extensión a la prueba U de los datos generados en cada período de tiem-
de Mann-Whitney, para el supuesto de trabajar po para determinar si las variables comparten
con tres o más grupos y resulta aplicable cuando la misma distribución continua de su origen.
las muestras son independientes22. Es especialmente útil cuando la variable de-
La prueba de Kruskal-Wallis (K-W) es una pendiente es continua pero su distribución se
alternativa a la prueba F del análisis de varianza encuentra sesgada24.
para diseños de clasificación simple. En este La hipótesis nula que se contrasta es que las
caso (K-W) se comparan varios grupos pero respuestas asociadas a cada uno de los “trata-
usando la mediana de cada uno de ellos, en mientos” tienen la misma distribución de proba-
lugar de las medias. bilidad o distribuciones con la misma mediana,
En la Tabla 5 se tiene información resumida frente a la hipótesis alternativa de que por lo
de los resultados obtenidos tras la evaluación con menos la distribución de una de las respuestas
GMFM-6619 en niños con PC de nivel GMFCS difiere de las demás. Para poder utilizar esta prue-
V durante un periodo del año 2008; se desea ba las respuestas deben ser variables continuas y
analizar si se presentan diferencias significativas estar medidas por lo menos en una escala ordinal.
entre los Institutos de Rehabilitación (IR). Se presenta a continuación información de
Con un nivel de confianza del 95%, se ob- puntajes de la funcionalidad medidos en tres
tuvo como resultado la existencia de diferen- períodos. Se desea establecer si existe diferencia
cias significativas entre los resultados del test significativa entre los tres períodos de medición
GMFM-66 en los distintos IR de aplicación. de la funcionalidad.
La hipótesis alternativa en que se plantea que
los rangos promedio de arcos de movimiento
Prueba χ 2 de Friedman23 activo y funcionalidad total, son diferentes a
través de los tres períodos considerados, se
Esta prueba es una extensión a la prueba T confirma (p < 0,004)25 (Tabla 6).
de Wilcoxon, para el supuesto de trabajar con
tres o más grupos. Esta prueba puede utilizarse Síntesis
en aquellas situaciones en las que se seleccio-
nan n grupos de k elementos de forma que los Los procedimientos estadísticos no paramé-
elementos de cada grupo sean lo más parecido tricos descritos buscan ayudar en la planifica-
posible entre sí, y a cada uno de los elementos ción, conducción e interpretación de estudios en
del grupo se le aplica uno de entre k “tratamien- el área de rehabilitación. En todo caso, se debe
tos”, o bien cuando a cada uno de los elementos tener precaución en cuanto al uso apropiado de
de una muestra de tamaño n se le aplican los k éstos y consultar a un especialista en estadística,
“tratamientos”. si existen dudas sobre el buen uso y aplicación
Esta prueba consiste en examinar los rangos de estos análisis.

Rehabil. integral 2011; 6 (2): 93-99 97


P. SAN MARTÍN P.

Tabla 6. Medidas de resumen y prueba Friedman para 11. Bioestadística: Métodos y Aplicaciones. Disponible en:
arcos de movimientos y funcionalidad total http://www.bioestadistica.uma.es/libro/ [Consulta: 15
marzo 2010].
Medidas de Funcionalidad
12. Estadística No Paramétrica: Prueba Chi-Cuadrado χ2.
resumen de Vídeo 1 Vídeo 2 Vídeo 3
puntajes Disponible en: http://www.uoc.edu/in3/emath/docs/
(Pre TBA) (Post TBA) (Post TO)
Chi_cuadrado.pdf [Consulta: 07 de marzo 2010]
Mínimo 68 60 70 13. Curso de Estadística I. Disponible en: http://www.itch.
Máximo 101 90 111 edu.mx/academic/industrial/estadistica1/cap04c.html
[Consulta: 07 de marzo 2010]
Media 86,4 80 91,4
14. Análisis no paramétrico: El procedimiento Pruebas no
Mediana 85,5 82 91,5 paramétricas. Disponible en: http://www.ucm.es/info/
Amplitud intercuartil* 10,6 13,5 13,8 socivmyt/paginas/D_departamento/materiales/anali-
sis_datosyMultivariable/19nparam_SPSS.pdf [Consulta:
Prueba de Friedman
2,08 1,29 2,63 07 de marzo 2010].
(rango promedio)**
15. Armitage P, Berry G. Estadística para la investigación
*Amplitud intercuartil: ([percentil 75-percentil 25]/percentil
50)*100. biomédica. Barcelona, Harcourt Brace. 1999; p. 593.
**Significativo. p < 0,004. 16. Pértega S, Pita S. Métodos no paramétricos para la
comparación de dos muestras. Cad Aten Primaria 2006;
13: 109-113.
Referencias 17. Wilcoxon F. Individual comparision by ranking me-
thods. Biometrika 1945; 1: 80-3.
1. Berenson M, Levine D, Krehbiel T. Basic Business 18. Gómez M, Danglot C, Velásquez L. Bases para la re-
Statistics: Concepts and Applications. EE.UU, Prentice visión crítica de artículos médicos. Rev Mex Pediatr
Hall. 2005; p.898. 2001; 69: 152-9.
2. Milton J, Tsokos J. Estadística para biología y ciencias 19. Wang H, Yang Y. Evaluating the responsiveness of 2 ver-
de la salud. Madrid, Interamericana-McGraw Hill. sions of the Gross Motor Function Measure for Children
1987; p.527. with cerebral palsy. Arch Phys Med Rehabil 2006; 87:
3. Pett M. Nonparametrics statistics for health care re- 51-6.
search. Thousand Oasks, Cal., Sage Publications Inc. 20. Russell D, Rosenbaum P, Avery L, Lane M. Gross Motor
1997; p. 312. Function Measure (GMFM-66 & GMFM-88). User´s
4. Bradley J. Distribution-free statistical test. Englewood Manual. Ontario, Canada: Cambridge University. 2002;
Cliffs NJ, Prentice-Hall. 1968; p. 388. p. 234.
5. Downie N, Heath R. Métodos estadísticos aplicados. 21. Barraza M, Illanes H, Keller M. Cambios funcionales
México, Harla. 1983; p. 274. en niños con parálisis cerebral sometidos a tratamiento
6. Siegel S, Castellan N. Estadística no paramétrica aplica- de neurodesarrollo medidos con GMFM y WeeFIM.
da a las ciencias de la conducta. México D.F., Editorial Rehabil integral 2009; 4: 17-24.
Trillas. 1995; p. 207. 22. Kruskall W, Wallis A. Use of ranks in one-criterion
7. Viasuta, B. Análisis Estadístico con SPSS 14. Estadística variance analysis. J Amer Statis Assn 1952; 47 (260):
Básica. Madrid, Mc Graw Hill. 2007; p. 281. 583-621.
8. Marín V, Rotter K, Solís F, San Martín P. Enfermeda- 23. Friedman Test. Disponible en: http://wapedia.mobi/en/
des raquimedulares congénitas en Teletón Santiago: Friedman_Test [Consulta: 14 julio 2010].
Factores demográficos, sociales, clínicos y funcionales 24. Gómez M, Danglot C, Vega L. Sinopsis de pruebas
asociados. Rehabil integral 2010; 5 (1): 16-26. estadísticas no paramétricas. Cuándo usarlas. Rev Mex
9. Pita S, Pértega S. Asociación de variables cualitativas: Pediatr 2003; 70: 91-99.
test de Chi-cuadrado. Disponible en http://www.fisterra. 25. Mery H, Lodo R, Zamora V, Solis F. Efecto del trata-
com/mbe/investiga/fisher/fisher.asp [Consulta: 21 sep- miento combinado de toxina botulínica tipo A y terapia
tiembre 2011]. ocupacional en la funcionalidad de extremidad superior
10. Altman D. Practical statistics for medical research. en pacientes hemiparéticos. Rehabil integral 2009; 4:
London, Chapman & Hall. 1991; p. 611. 9-16.

98 Rehabil. integral 2011; 6 (2): 93-99


APLICACIÓN DE LA ESTADÍSTICA NO PARAMÉTRICA EN EL ÁREA DE REHABILITACIÓN

Addendum

Fórmulas de interés

Prueba de asociación basado en distribución c2:

Donde:
Oi: Frecuencia observada para la i-ésima categoría de la variable de interés.
Ei: Frecuencia esperada (dado que Ho es verdadera) para la i-ésima categoría.
Se rechaza Ho si c2 es mayor o igual que el valor tabulado de c2 para el valor seleccionado de α.

Prueba U-Mann Whitney:

Donde:
n1 y n2: Tamaños muestrales
R1 y R2: Sumatoria de los rangos respectivos a cada una de las muestras.
Se rechaza Ho si U<Un1; n2; α

Prueba T de Wilcoxon:

Donde:
Ri: Suma de los rangos en la i-ésima muestra.
Se Rechaza H0 si T ≤ To, donde To es el valor crítico (prueba de dos colas) o Rechazo Ho si T- ≤ To, donde To es el valor crítico (prueba
de una cola).

Prueba H de Kruskal Wallis:

Donde:
k: Número de muestras
ni: Número de observaciones de la i-ésima muestra
n: Número de observaciones en todas las muestras combinadas
Ri: Suma de los rangos en la i-ésima muestra.
Se rechaza Ho si el valor calculado de H es tan grande que la probabilidad de obtener un valor mayor o igual, cuando Ho es verda-
dero, es menor o igual que el nivel de significación α.

Prueba χ2 de Friedman:

Donde:
n: Número de bloques (filas)
k: Número de columnas (tratamientos)
Ri: Suma de los rangos en la i-ésima muestra.
Se rechaza Ho si la probabilidad de obtener un valor de χ2, es mayor o igual que el valor calculado, es menor o igual que α, cuando
Ho es verdadera.

Rehabil. integral 2011; 6 (2): 93-99 99

Você também pode gostar