Você está na página 1de 16

Elementos para evitar errores en el diseo de investigaciones en ciencias de la

salud

Andr Choc
Farmacutico Epidemilogo
Contacto: panteisme@gmail.com

Resumen
La Estadstica y el rigor metodolgico deben guiar una investigacin en todo su desarrollo
para asegurar la coherencia investigativa; el desconocimiento y el uso incorrecto de las
herramientas estadsticas y metodolgicas se traduce en investigaciones con discutible
validez interna, reflejada en errores. En este artculo se revisan los elementos necesarios
para evitar errores metodolgicos y estadsticos en la fase del diseo de una investigacin
en el contexto de las ciencias de la salud. Se abordan los diferentes tpicos con un
enfoque crtico y haciendo uso de diversos ejemplos de investigaciones reales. Una vez
planteado correctamente un problema de investigacin debe elegirse el diseo que est
ms protegido de posibles sesgos; el muestreo debe asegurar la representatividad y
adecuacin en tamao de la muestra, as como la definicin precisa de criterios de
seleccin. Para aplicar una herramienta estadstica deben evaluarse: el tipo y escala de
las variables dependientes e independientes, la cantidad y grado de independencia de los
grupos de comparacin, el alcance y tipo de investigacin, entre otros.
Palabras clave: Bioestadstica, Epidemiologa, Diseo de Investigacin, Muestreo, Anlisis
de datos.
Abstract
Statistics and methodological rigor must guide the entire development of a research, to
ensure consistency in research process; the lack of knowledge and the incorrect us of
statistical and methodological tools results in research questionable internal validity,
reflected in errors. In this article, it reviews the necessary elements in order to avoid
methodological and statistical errors in the design phase of an investigation in the context
of the Health Sciences. Different topics are addressed with a critical approach, using
various examples of actual research. Once it has been raised successfully a research
problem, it must choose the design that is more protected from possible bias; sampling
must ensure the representativeness and adequacy of the sample size and the precise
definition of selection criteria. To apply a statistical tool should be assessed: the type and
scale of the dependent and independent variables, the amount and degree of
independence of the comparison groups, the scope and type of research, among others.
Keywords: Biostatistics, Epidemiology, Research Design, Sampling, Data Analysis.
Introduccin
La importancia de la Estadstica en la investigacin clnica y epidemiolgica radica en
proporcionar herramientas que conviertan las observaciones clnicas y de laboratorio en
aseveraciones cuantitativas sobre los efectos, y la magnitud de los mismos, que tiene una
o varias intervenciones sobre un grupo de paciente (Glantz, 2006). Sin embargo, se debe
garantizar que estas aseveraciones, como respuestas a preguntas de investigacin, sean
vlidas y precisas a travs de un diseo capaz de disminuir la probabilidad de errores que
conduzcan a una respuesta equivocada (Argimon Palls y Jimnez Villa, 2000). La
validez interna es el grado en que los resultados de una investigacin son correctos para
los participantes del estudio. Est determinada por la seleccin adecuada del diseo, la
recogida de datos y el anlisis, y amenazada por los errores sistemticos y la variacin
debida al azar (Fletcher, Fletcher y Wagner, 1998).
Este artculo tiene como objetivo exponer sistemticamente los elementos necesarios
para evitar errores metodolgicos y estadsticos que se presentan en la fase del diseo de
una investigacin.
En cada seccin se abordan las definiciones necesarias con un enfoque crtico, las cuales
se complementan con ejemplos aplicados a investigaciones en el campo de las ciencias
de la salud. Para desarrollar esta revisin se utilizaron textos que gozan de prestigio entre
investigadores y docentes de Latinoamrica y Estados Unidos; se consult en su mayora
publicaciones recientes: sin embargo, tambin debieron ser consultados otros textos
menos recientes, debido a que pueden considerarse como bsicos, por la importancia de
que gozan. Adems, se utilizaron como fuente de informacin algunos artculos de
revisin.
Como primer punto se tratar el tema del diseo del estudio, explicando la nomenclatura
bsica del tipo de investigacin y de diseos especficos utilizados en la investigacin
epidemiolgica, haciendo nfasis en que la idoneidad del diseo y del muestreo influye
directamente sobre la validez del estudio. A continuacin, se hablar sobre el diseo de
muestreo, dividiendo este tpico en dos subtemas: los mtodos de muestreo y el clculo
del tamao de muestra. Finalmente se discutirn los diferentes mtodos estadsticos
disponibles, agrupndolos en descriptivos, inferenciales, multivariantes y epidemiolgicos,
aunque debe quedar claro que actualmente hay otras modalidades y enfoques de anlisis
para investigaciones cuantitativas.

Contenido
Diseo del estudio
Las decisiones metodolgicas se orientan segn el problema de investigacin, a travs
del diseo, que consiste en la planificacin de las actividades para solucionar los
problemas o responder a las preguntas planteadas. Tanto en la investigacin cuantitativa
como en la cualitativa, para cada tipo de pregunta existe un diseo que resultar ms
apropiado (Hernndez vila, 2007; Ruiz y Morillo, 2004).
Jerarqua de la investigacin

Es prioritario indicar que existe una jerarqua en la investigacin, y que la mayor evidencia
metodolgica para aportar informacin slida en cuanto a la determinacin de la
asociacin entre variables dependientes e independientes, estar dada por los estudios
experimentales, seguida de los estudios analticos y finalmente los estudios
observacionales (Villa Romero, Moreno Altamirano y Garca de la Torre, 2012). En
general, cuanto ms se aleje de los estudios experimentales una investigacin, menos
proteger el diseo de investigacin frente a los posibles sesgos, y ms dbiles sern las
evidencias de la asociacin entre variables (Fletcher y otros, 1998). Con relacin a la
evidencia que sustenta la asociacin entre variables, las investigaciones se pueden
ordenar, de mayor a menor evidencia, segn la siguiente jerarqua: Experimentos
aleatorizados > cuasi experimentos > pre experimentos > estudio de cohortes prospectivo
> estudio de cohortes retrospectivo > estudio de casos y controles > estudio transversal
analtico.

Es frecuente encontrar que los objetivos que han sido enunciados en una investigacin no
podran ser alcanzados con el diseo propuesto: es prioritario distinguir entre el diseo
planteado en una investigacin y el diseo que realmente se utiliz segn los
procedimientos de diseo de muestreo, recoleccin, tabulacin y anlisis de datos
utilizados. Pues bien, si lo que realmente se hizo fue un estudio descriptivo, tomando en
cuenta que no se cont con un grupo control, aunque previamente se haya pensado en un
estudio transversal analtico, no se podr evaluar la asociacin entre una posible variable
respuesta y una variable independiente; si fuese el caso que s se realiz un estudio
transversal analtico entonces no se puede hablar de investigar factores de riesgo, porque
esto solo se puede realizar con un estudio de casos y controles, uno de cohortes o uno
experimental, mientras que lo que puede evaluarse en un estudio transversal analtico es
la asociacin estadstica puntual (transversal) entre dos variables, debido a la
simultaneidad de la medicin de la variable respuesta y la variable independiente (Altman,
1998; Ercan y otros, 2007; Strasak, Zaman, Pfeiffer, Gobel y Ulmer, 2007).

Sesgos

Aqu se hablar de los sesgos o errores sistemticos, y su importancia en el diseo de


investigacin. Los sesgos ms importantes son los siguientes: a) el sesgo de seleccin,
que se relaciona con la forma de identificar y seleccionar a los individuos para un estudio;
b) el sesgo de medicin, que ocurre cuando el procedimiento usado para identificar la
presencia de la respuesta vara o se modifica segn la presencia o la ausencia del factor
de estudio; y c) el sesgo de confusin, que ocurre cuando dos factores estn asociados
entre s y el efecto de uno est confundido con otro o distorsionado por el efecto de otro
(Bonita, Beaglehole y Kjellstrom, 2006; Fletcher y otros, 1998, Velasco Rodrguez,
Martnez Ordaz, Roiz Hernndez, Huazano Garca y Nieves Rentera, 2002).

Es frecuente encontrar en las investigaciones la comparacin de grupos que no son


equivalentes con relacin a sus caractersticas sociodemogrficas y clnicas, y por tanto la
variable respuesta podra estar presente con mayor frecuencia en uno de esos grupos,
posiblemente debido a la diferencia entre las caractersticas. Por ejemplo, se compara la
letalidad entre dos grupos de pacientes, pero resulta que el grupo A tiene un cuadro
clnico de mayor gravedad que el grupo B; si la letalidad es mayor en el grupo A, se
deber a que ellos estn ms enfermos o a la variable independiente que sirve para
clasificarlos como grupo A o B? El anterior es un ejemplo de sesgo de seleccin
(Fletcher y otros, 1998)

Ahora se ejemplificar el sesgo de medicin. Si se comparan los niveles de alguna prueba


clnica entre dos grupos, sanos y enfermos podra tenerse mayor cantidad de
determinaciones de estas pruebas en el grupo de enfermos dado que ellos tienen un
seguimiento clnico y de laboratorio rutinario, y posiblemente la medicin de estas pruebas
se realice con mayor cuidado que en personas sanas que constituirn el grupo control.
Finalmente se dar un ejemplo sobre el sesgo de confusin. En muchas investigaciones
se concluye que hay asociacin estadstica entre dos variables, mas esa asociacin no
parece ser lgica ni verosmil; esto apuntar a la necesidad de realizar anlisis
estadsticos estratificados si es que en el estudio se han recolectado variables que
podran estar asociadas simultneamente a la variable dependiente e independiente,
estas variables con conocidas como variables confusoras (Argimon Palls y Jimnez Villa,
2000; Fletcher y otros, 1998; Hernndez vila, 2007; Lodoo, 2010; Ruiz y Morillo, 2004;
Szklo y Nieto, 2003; Villa Romero y otros, 2012). En un estudio para comparar los valores
en la densidad mineral sea entre pacientes que reciben dos tratamientos, ser necesario
hacer anlisis separando a hombres de mujeres, y en diferentes grupos de edad; dado
que sexo y edad son variables que estn asociadas al nivel de densidad mineral sea, si
los anlisis no se realizan de forma estratificada podran actuar como variables
confusoras, sesgando los resultados. Lo concerniente al sesgo de muestreo ser tratado
en la seccin siguiente.

Diseo de muestreo
El diseo de muestreo es una etapa crtica de la planificacin de una investigacin, y
cuyas deficiencias repercutirn directamente en la validez de los resultados y en las
decisiones tomadas con base en los mismos (Bethlehem, 2009; Elorza, 2008), una
muestra que se ha seleccionado correctamente puede representar a la poblacin de la
que fue extrada, y por tanto, permitir que los resultados puedan extrapolarse a un
nmero mayor de personas (validez externa) (Ruiz y Morillo, 2004). En el diseo de
muestreo se tendr que especificar: a) la definicin de la poblacin en estudio, b) el
tamao de muestra o cantidad mnima de personas que se requieren estudiar, c) mtodo
para seleccionar la muestra y d) el marco de donde se seleccionar la muestra
(Bethlehem, 2009; Stopher, 2012; Velasco Rodrguez y otros, 2002). En la redaccin del
protocolo es necesario establecer con gran precisin los criterios de seleccin de los
sujetos que se incluirn en el estudio (Argimon Palls y Jimnez Villa, 2000; Ruiz y
Morillo, 2004).

Errores de muestreo
Los errores relacionados con la muestra y el proceso de muestreo ocurren cuando: a) la
muestra no es representativa: es decir, la muestra seleccionada no posee todas las
caractersticas importantes de la poblacin de la que se tom, incluyendo el nmero
suficiente de miembros de todos los subgrupos en los que se divide la poblacin de
origen; b) la muestra no es adecuada en tamao (Ercan y otros, 2007; Fletcher y otros,
1998; Stopher, 2012; Strasak y otros, 2007; Velasco Rodrguez y otros 2002).
Se discutirn ahora los errores que pueden afectar la representatividad y adecuacin de la
muestra a partir de sesgos de muestreo. El sesgo de muestreo puede ocurrir en las
siguientes ocasiones: a) las personas seleccionadas para el estudio no participan o no
responden total o parcialmente; b) en el estudio participan solamente voluntarios; tanto
para este caso como para el anterior, resulta prioritario preguntarse si los sujetos que no
respondieron difieren de manera crtica de los que s lo hicieron; adems, un muestreo de
pacientes voluntarios no es un muestreo aleatorio; c) tomar una muestra solo de personas
registradas; d) prdida de casos de corta duracin; e) sesgo estacional: algunas
enfermedades estarn influenciadas por la estacin del ao, por lo que estudiar su
frecuencia y factores asociados en diferentes estaciones dar diferentes resultados; f)
realizacin del muestreo solamente en reas accesibles; g) sustitucin de un miembro
conveniente por un miembro designado; h) eleccin deliberada o que busca una muestra
representativa (muestra de juicio, pues el investigador emplea su propio juicio para elegir
las unidades especficas); i) no comparabilidad de los grupos; por ejemplo, en un estudio
donde se compara la letalidad asociada a una enfermedad mictica sistmica en un grupo
de pacientes con VIH y otro de pacientes sin VIH, debera asegurarse que los grupos
fuesen comparables, para que factores como la edad avanzada y la presencia de
enfermedades crnicas no sesguen los resultados, pues estos factores son ms
frecuentes en los pacientes con VIH, y un aumento en la letalidad en este grupo podra
atribuirse errneamente al nico hecho de tener VIH (Argimon Palls y Jimnez Villa,
2000; Bethlehem, 2009; Loht, 2000; Scheaffer, Mendenhall y Ott, 1987; Stopher, 2012;
Velsco Rodrguez y otros, 2002).
Como podra deducirse de lo expuesto anteriormente, la existencia de marcos de
muestreo incompletos es una fuente importante de sesgo, como lo ser la total
inexistencia de los mismos o de los estratos (y su tamao) que conforman la muestra. Un
marco utilizable es aquel cuyos elementos coinciden con la poblacin de inters
(Bethlehem, 2009; Garca y otros, 2014).

Mtodos de muestreo
En este punto conviene hablar de la aleatorizacin y de los mtodos de muestreo. Una
muestra aleatoria es aquella donde cada individuo tiene la misma probabilidad de ser
seleccionado y una muestra probabilstica aquella en la que cada individuo tiene una
probabilidad conocida de ser seleccionado (Fletcher y otros, 1998). Los procedimientos
de aleatorizacin influyen positivamente en la posible y muy probable eleccin de una
muestra representativa; sin embargo, conviene indicar que tambin el azar puede
seleccionar (pero con poca probabilidad) una muestra no representativa de una poblacin
(Argimon Palls y Jimnez Villa, 2000; Velasco Rodrguez y otros, 2002). Los mtodos de
muestreo no probabilsticos podran estar sesgados, y por tanto, no necesariamente
representaran a la poblacin original. Estos mtodos son los ms usados en la
investigacin biomdica (Barton y Peat, 2014; Elorza, 2008; Fletcher y otros, 1998;
Pagano, 2013; Strasak y otros, 2007).
La construccin de un marco de muestreo utilizable depende del conocimiento de los
pacientes en su contexto, y por supuesto, de la definicin detallada y precisa de los
criterios de seleccin (Garca y otros, 2014). Por ejemplo, se realiza una investigacin en
pacientes jvenes con diabetes tipo II que asisten regularmente a una clnica de
seguimiento, donde se estudiar la funcin renal a travs de diversas pruebas clnicas y
paraclnicas, entre las cuales est contemplada la realizacin de una tomografa axial
computarizada (TAC) renal, y se elige utilizar un muestreo sistemtico con base en datos
histricos de la institucin. A travs del muestreo sistemtico, es posible que algunas
mujeres embarazadas sean seleccionadas, lo cual ser problemtico, pues en ellas est
contraindicada la TAC renal, y deber por tanto excluirlas y, en consecuencia, se
necesitar ms tiempo para alcanzar el tamao de muestra requerido, por no haberse
construido correctamente el marco de muestreo.
Adems, existen otros mtodos de muestreo que se utilizan cuando la poblacin de
referencia es muy grande y est dispersa. En estos casos frecuentemente se combinan
diferentes mtodos con el objeto de minimizar los costos o maximizar los resultados. En
el muestreo por etapas, se extraen muestras cada vez ms pequeas obtenidas de
muestras ms grandes en etapas sucesivas, hasta tener la representatividad de las
unidades de la poblacin que se desea estudiar. La muestra es fcil de seleccionar ya
que las unidades estn fsicamente unidas en grupos en lugar de estar diseminadas en la
poblacin (Argimon Palls y Jimnez Villa, 2000; Ruiz y Morillo, 2004; Velasco Rodrguez
y otros, 2002). Como ejemplo se plantea un estudio para determinar infeccin por Brucella
abortus en personas que trabajan en el ordeo de ganado bovino en fincas de una regin
costera. Se calcul una muestra para estudiar la prevalencia de la infeccin que result
en 217 individuos (tamao poblacional no especificado, prevalencia estimada a priori del
10%, error tipo I del 5% y error de muestreo del 4%). Las unidades de muestreo (fincas)
correspondieron a 78 fincas positivas a brucelosis, segn estadsticas del ministerio
correspondiente. Ya sea que la distribucin de la muestra en cada estrato se realice
proporcionalmente a su tamao o de manera uniforme, en promedio deberan estudiarse
3.19 individuos por finca si se decide estudiar cada finca: ello implica un gran reto logstico
para acudir a cada una de las fincas, pero de poca inversin pues la cantidad de personas
que deberan tomarse de cada finca es muy pequea lo cual repercute en la
representatividad y adecuacin de la muestra por cada unidad de muestreo.
Para el ejemplo anteriormente descrito, un muestreo polietpico podra sugerir la
seleccin de no todas las unidades de muestreo buscando informacin adicional para
reconocer conglomerados, por ejemplo, de tipo geogrfico, con capacidades tcnicas y de
tamao similar, ndice de higiene, nmero de casos detectados con anterioridad, etc. De
tal forma, si la muestra total se divide en un nmero menor de unidades de muestreo
posiblemente se planteen menores dificultades logsticas y muestras ms grandes en las
unidades de muestreo seleccionadas, que probablemente las representen mejor (Argimon
Palls y Jimnez Villa, 2000).

Criterios para seleccin de las muestras


Los criterios de inclusin y exclusin permiten al investigador seleccionar su poblacin de
estudio, y al lector, decidir si puede o no extrapolar los resultados a sus pacientes: a) los
criterios de inclusin permiten definir y caracterizar la poblacin del estudio; b) los criterios
de exclusin indican que quien ya cumpli los criterios de inclusin tendr que ser
excluido por alguna razn (Ruiz y Morillo, 2004). Por lo anterior, no es correcto escribir
criterios de exclusin como aquellos contrarios a los criterios de inclusin. Por ejemplo, si
en un estudio para evaluar las alteraciones en la tasa de filtracin glomerular en pacientes
con VIH con tratamiento antirretroviral, uno de los criterios de inclusin es: pacientes que
tengan resultados de creatinina srica, peso, talla y edad registradas para estimar la
depuracin de creatinina, entonces, un criterio de exclusin no podr ser pacientes que
NO tengan resultados de creatinina srica, peso, talla y edad registradas para estimar la
depuracin de creatinina, pues un criterio de exclusin deber ser complementario, por
ejemplo: pacientes que adems de la terapia antirretroviral recibieron tratamiento con
algn otro medicamento nefrotxico, como los aminoglucsidos o la anfotericina B.

Clculo del tamao de la muestra


La determinacin del tamao de muestra necesita una idea a priori de los resultados que
se obtendrn: en un clculo de tamao de muestra, una frmula solo es una herramienta
donde se computan datos obtenidos de estudios previos, de opiniones de expertos o de
estudios piloto (Crdenas y Arancibia, 2014; Prajapati, Dunne y Armstrong, 2010; Velasco
Rodrguez y otros, 2002). Por ejemplo, si se desea investigar los valores de presin
arterial de estudiantes de medicina que realizan prcticas en servicios de salud estatales,
no podr utilizarse ninguna frmula para el clculo de muestra si no se tiene una idea de
los niveles de presin arterial sistlica y diastlica de estos estudiantes y de la variacin
de tales niveles.
Segn la pregunta de investigacin, se deben usar diferentes mtodos de clculo del
tamao de la muestra (Argimon Palls y Jimnez Villa, 2000; Velasco Rodrguez y otros,
2002). El mtodo y la frmula utilizada variaran dependiendo de si lo que se busca es
determinar la frecuencia de una enfermedad o sndrome, estimar los valores promedio de
alguna prueba bioqumica en un grupo de pacientes, comparar los niveles de la prueba
bioqumica en dos o ms grupos de individuos, o evaluar la correlacin entre una prueba
bioqumica y otra antropomtrica en un grupo de pacientes. Se puede observar
frecuentemente que para investigaciones con diferentes diseos y preguntas de
investigacin se utiliza la misma frmula, que nicamente debera utilizar para el clculo
del tamao de muestra en aquellos estudios que buscan estimar una proporcin
poblacional, es decir, las investigaciones descriptivas, cuyo objetivo principal consiste en
determinar la frecuencia de aparicin de un suceso, enfermedad o fenmeno en un
conjunto mayor de observaciones; frmula que se muestra a continuacin:
N Z2 p q
n=
d2 (N 1) + ( Z2 p q)

Particularmente en los estudios con personas, para el clculo de tamao de muestra,


debe lograrse un equilibrio entre lo deseable y factible, dependiendo de la disponibilidad
de tiempo, accesibilidad, presupuesto, entre otros factores (Velasco Rodrguez y otros,
2002). El tamao mximo de la muestra se fijar con base en los recursos disponibles,
mientras que el tamao mnimo, se fijar segn las necesidades del plan de anlisis
(Pineda y De Alvarado, 2008). Con una muestra demasiado pequea se corre el riesgo de
no detectar resultados vlidos, es decir equivocarse al dar una respuesta; con una
muestra demasiado grande se expone a los sujetos a un riesgo de forma innecesaria y se
desperdician recursos (Fras, Pascual, y Garca, 2000; Prajapati y otros, 2010; Velasco
Rodrguez y otros, 2002); adems de eso se corre el riesgo de detectar asociaciones o
diferencias espurias (Szklo y Nieto, 2003).
Los clculos del tamao de la muestra pueden clasificarse en dos tipos: los utilizados para
estudios descriptivos (estimacin de parmetros estadsticos, estimacin de frecuencias
poblacionales) y los utilizados para estudios analticos (comparaciones, asociacin de
variables) (Argimon Palls y Jimnez Villa, 2000; Datallo, 2008; Lwanga y Lemeshow,
1991; Silva, 1997; Velasco Rodrguez y otros, 2002). Conocer el tamao poblacional no
es imprescindible para realizar el clculo del tamao de la muestra en los estudios
analticos; nicamente servir conocerlo para el proceso de seleccin de las muestras
(Velasco Rodrguez y otros 2002). Para finalizar esta seccin, vale la pena recordar que
en un tamao de muestra debera realizarse un ajuste de prdidas por seguimiento, sobre
todo en estudios analticos donde se realiza seguimiento a travs del tiempo (Ruiz y
Morillo, 2004).

Diseo de anlisis de datos


En esta seccin se considerarn los aspectos fundamentales para elegir procedimientos
de estadstica descriptiva e inferencial en funcin de los objetivos propuestos, las
variables utilizadas, entre otros.

Criterios para elegir pruebas estadsticas


Un plan de anlisis consiste en la evaluacin, procesamiento y presentacin de la
informacin obtenida a travs de los datos recolectados. Las pautas sobre el anlisis final
de la informacin dependern de: a) el correcto planteamiento de los objetivos; b) la
formulacin de la hiptesis, la cual proviene de la pregunta de investigacin y que deber
estar enunciada de forma estadstica, haciendo referencia a un parmetro (proporcin,
media, diferencia de proporciones, coeficiente de correlacin, OR, etc.) y a la variable (o
variables) para la cual se calcular dicho parmetro; adems deber redactarse de
acuerdo al anlisis estadstico propuesto; c) el tipo de estudio: en estudios descriptivos se
utilizar estadstica descriptiva y estimacin de parmetros (intervalos de confianza),
mientras que en estudios analticos estadstica descriptiva y tcnicas de inferencia
estadstica para evaluacin de hiptesis; d) el tamao de la muestra y el mtodo de
muestreo utilizado; e) la escala de medida de las variables utilizadas (tanto dependientes
como independientes; f) el carcter apareado o independiente de los grupos de
comparacin, ya que en los estudios apareados (tambin llamados relacionados o de
medidas repetidas), dado que los sujetos son los mismos, existe menor variacin en las
mediciones, lo cual permite el uso de pruebas ms potentes; g) las condiciones de
aplicabilidad especficas, que incluyen la evaluacin de la normalidad de datos
cuantitativos, evaluacin de la homocedasticidad (igualdad de varianzas de los grupos de
comparacin) y la potencia requerida (Argimon Palls y Jimnez Villa, 2000; Baptist,
Rhrig, Hommel y Blettner, 2010; Gomez, Danglot y Vega, 2013; Jaykaran, 2010; Ruiz y
Morillo, 2004, Siegel, 1970).
Estadstica descriptiva
La presentacin descriptiva de los resultados es el primer paso en la evaluacin de los
mismos; es el punto de partida indispensable para procedimientos metodolgicos ms
complejos como las pruebas inferenciales y los mtodos multivariados de anlisis (Garca
y otros, 2014). Aqu se mencionan algunos procedimientos: a) las tablas de frecuencias
absolutas y relativas; b) grficas; c) estadsticos para una variable de resumen, de
posicin, de dispersin y de forma; d) estadsticas de asociacin como los coeficientes de
correlacin, coeficiente de contingencia y otros para variables ordinales (Barton y Peat,
2014; Blair y Taylor, 2008; Bluman, 2009; Cobo, Muoz y Gonzlez, 2007; Johnson y
Kuby, 2004; Pagano y Gauvreau, 2001).

Estadstica inferencial
La estadstica inferencial se divide en dos grupos de procedimientos/enfoques: a) los
intervalos de confianza y b) las pruebas de hiptesis. En los primeros se evala el grado
de certeza con que los parmetros estn incluidos en un intervalo calculado a travs de
una muestra; en los segundos, se evala, segn los datos de la muestra, si hay suficiente
evidencia para rechazar una hiptesis nula de no efecto, no asociacin o no diferencia
segn grupos de comparacin o parejas de variables contrastadas (Altman, Machin,
Bryant y Gardner, 2000; Daniel y Chad, 2013; Elorza, 2008).
Las pruebas de hiptesis pueden clasificarse en dos grupos: a) las pruebas paramtricas:
que utilizan datos cuantitativos en las que suelen realizarse determinadas
presuposiciones sobre la distribucin de las variables en las poblaciones que estn
comparndose; b) las pruebas no paramtricas, menos potentes que sus equivalentes
paramtricas; aquellas donde la variable respuesta no posee una distribucin normal o
aquellas en las que no es posible determinar si se cumplen las asunciones (Argimon
Palls y Jimnez Villa, 2000; Blair y Taylor, 2008; Daniel y Chad, 2013; Johnson, Johnson
y Bhattacharyya, 2010; Moreno Altamirano, 2013; Pagano, 2013).
Entre las pruebas estadsticas paramtricas se pueden mencionar: a) la prueba de T de
Student y la prueba de Z, para contrastar una variable cuantitativa entre dos grupos
independientes; b) el anlisis de varianza (ANDEVA) y la prueba de Welch, para
contrastar una variable cuantitativa entre tres o ms grupos; c) la correlacin de Pearson,
para evaluar la magnitud de la asociacin entre dos variables cuantitativas continuas; d) la
regresin lineal, para predecir el valor medio de una variable cuantitativa a partir de una
variable independiente cuantitativa; e) las pruebas de comparaciones mltiples de Tukey,
Duncan y Dunnet, entre otras; f) la T para datos apareados; g) el anlisis de varianza de
medidas repetidas para variables relacionadas en ms de dos grupos (Barton y Peat,
2014; Blair y Taylor, 2008; Forthofer, Lee y Hernandez, 2007; Geoffrey y Streiner, 2014;
Glantz, 2006; Gonin, Fisher y Van Belle, 2004; Peacock y Peacock, 2011).
Dentro de las pruebas no paramtricas, estn: a) la prueba de signos para una muestra;
b) las pruebas de bondad de ajuste DAgostino-Pearson y de Kolmogorov-Smirnof para
evaluar la normalidad de un conjunto de datos cuantitativos; c) la prueba de las rachas
para evaluar aleatoriedad; d) la prueba binomial, para variables dicotmicas; e) las
pruebas de signos y de rangos signados de Wilcoxon para contrastar una variable
cuantitativa no paramtrica entre dos grupos relacionados; f) las pruebas de Mann-
Whitney y de la suma de rangos de Wilcoxon, para contrastar una variable cuantitativa no
paramtrica entre dos grupos independientes; g) las pruebas de la mediana y de Kruskall-
Wallis, para contrastar una variable cuantitativa no paramtrica en tres o ms grupos
independientes; h) las pruebas de Friedman y Cochran, para contrastar una variable
cuantitativa no paramtrica entre tres o ms grupos relacionados; i) la correlacin no
paramtrica de Spearman, para dos variables cuantitativas; j) la prueba de ji cuadrado de
tablas de contingencia, para asociar dos variables cualitativas independientes; y k) la
prueba de McNemar para asociar dos variables cualitativas dicotmicas relacionadas
(Blair y Taylor, 2008; Daniel y Chad, 2013; Forthofer y otros, 2007; Geoffrey y Streiner,
2014; Glantz, 2006; Gonin y otros, 2004; Kraska, 2014; Moreno Altamirano, 2013;
Sheskin, 2004; Siegel, 1970).

Mtodos multivariados de anlisis


Los mtodos multivariados de anlisis se utilizan cuando existe una variable dependiente
(variable respuesta) y mltiples variables independientes (factores de estudio y posibles
variables confusoras, intervinientes, etc.). Se usan con finalidades de prediccin,
descripcin o de estimacin del efecto de las variables independientes controlando las
variables confusoras. Entre las tcnicas con que pueden identificarse tanto variables
dependientes como independientes (mtodos de independencia) se pueden mencionar: el
anlisis discriminante, el anlisis conjunto, los modelos de segmentacin jerrquica y los
mtodos predictivos conocidos como mtodos de regresin (regresin logstica, regresin
de Cox); por otra parte, las tcnicas descriptivas (mtodos de interdependencia) no
distinguen las variables independientes de las dependientes, y se usan para reducir la
cantidad de variables o formar agrupaciones basadas en variables u observaciones; entre
ellas se encuentran: el anlisis factorial, el anlisis de componentes principales, el anlisis
de conglomerados, el anlisis de correspondencia, los rboles de clasificacin y el
escalamiento multidimensional (Argimon Palls y Jimnez Villa, 2000; Catena, Ramos y
Trujillo, 2003; Johnson, 2000; Johnson y Wichern, 2007; Juez y Diez, 1997; Pea, 2002;
Prez, 2004). Adems, existen mtodos de respuesta mltiple, es decir aquellos con que
se explica ms de una variable, como es el caso del anlisis cannico y los mtodos
multivariados de la varianza y la covarianza (Johnson, 2000; Prez, 2004).
Los mtodos multivariados exigen, antes de su aplicacin, la realizacin de anlisis
univariantes para conocer las posibles relaciones entre variables; as como la evaluacin
de datos ausentes y datos anmalos; y la comprobacin de los supuestos subyacentes:
esta informacin previa, as como tcnicas especficas para cada tipo de anlisis
orientarn la seleccin de las variables a incluir (Prez, 2004). Resulta prioritario advertir
que la aplicacin de un modelo multivariante no debe sustituir el desarrollo previo de un
modelo conceptual, con el fin de asegurar la parsimonia del modelo: incluir variables
irrelevantes no solo limita la generalizacin de los resultados sino podra enmascarar el
efecto verdadero de ciertas variables debido a la multicolinealidad (Hair, Anderson,
Tatham y Black, 1999).
Mediciones epidemiolgicas
Finalmente se hablar de las mediciones epidemiolgicas: a) las que investigan la
frecuencia de una enfermedad o evento de salud; y b) las que investigan la asociacin o
cuantifican el riesgo de que se presente una enfermedad o evento en funcin de las
caractersticas sociodemogrficas, clnicas, epidemiolgicas, y de otro tipo, de los
individuos de estudio; o de la aplicacin de intervenciones. Las medidas de frecuencia
epidemiolgicas son: a) la prevalencia, que evala la proporcin de individuos en los que
est presente una enfermedad o evento de salud en un tiempo determinado; b) la
prevalencia de periodo que evala la proporcin de individuos enfermos o con un evento
de salud en un periodo de tiempo; c) la incidencia, o proporcin de casos nuevos de una
enfermedad o evento de salud; d) la letalidad, o medida de la proporcin de personas
fallecidas por una enfermedad o sndrome. La prevalencia puntual se utiliza en los
estudios transversales y en los estudios de casos y controles para medir la frecuencia de
la exposicin a los factores de riesgo en el grupo de casos y controles; la prevalencia de
periodo se usa en estudios longitudinales; la letalidad y la incidencia se usan en estudios
longitudinales, de cohortes y en todos los estudios experimentales (Argimon Palls y
Jimnez Villa, 2000; Bonita y otros, 2006; De Shea y Toothaker, 2015; Gordis, 2014;
Guyatt, Rennie, Meade y Cook, 2008; Hernndez vila, 2007; Moreno Altamirano, 2013;
Ruiz y Morillo, 2004; Villa Romero y otros, 2012).
Las medidas epidemiolgicas para evaluar asociacin y riesgo son las siguientes: a) la
razn de prevalencias, usada en estudios transversales analticos, que mide el cociente
de la proporcin de individuos que presentan el evento en estudio entre los expuestos y
no expuestos a determinados factores de riesgo o protectores; b) el riesgo relativo, usado
en estudios de cohortes y ensayos clnicos, que evala el cociente de la proporcin de
individuos que presentan el evento en estudio entre los expuestos y no expuestos a
determinados factores de riesgo o protectores; y c) las OR (odds ratio o razones de
momios), que miden, en estudios de casos y controles y transversales analticos, el
cociente de la proporcin de individuos expuestos y no expuestos a determinados factores
de riesgo o protectores entre los enfermos y los sanos (Argimon Palls y Jimnez Villa,
2000; Bonita y otros, 2006; De Shea y Toothaker, 2015; Gordis, 2014; Guyyat y otros,
2008; Hernndez vila, 2007; Moreno Altamirano, 2013; Ruiz y Morillo, 2004; Villa
Romero y otros, 2012).
Existen otras mediciones epidemiolgicas de inters, como el nmero de pacientes a
tratar o el nmero de pacientes a daar, que son consideradas, como las anteriores,
medidas de efecto. Otras, como el riesgo atribuible para sujetos expuestos y el riesgo
atribuible poblacional, se conocen como medidas de impacto y se usan en estudios
longitudinales prospectivos (Henquin, 2013).

Errores comunes en el diseo de anlisis de datos


Entre los errores que se pueden mencionar en esta seccin se encuentran: a) la omisin
de la especificacin de los mtodos estadsticos a utilizar, por desconocimiento de los
mismos; b) hacer mencin de pruebas ms populares como la prueba de T, de ji
cuadrado y ANDEVA, cuando no se adaptan a las hiptesis de trabajo; c) no considerar
previo al anlisis de datos la evaluacin de los supuestos en variables cuantitativas como
la normalidad, homocedasticidad, independencia de mediciones, entre otros y proponer
pruebas paramtricas para variables que no poseen distribucin normal o cuya
distribucin de probabilidad no puede conocerse; d) no elegir las pruebas en funcin del
carcter apareado/independiente de los datos: aplicar una prueba de variables
independientes a datos relacionados le resta potencia a la conclusin obtenida; e)
proponer anlisis estadsticos inferenciales que no fueron contemplados en la fase del
diseo de muestreo: en estos casos no se sabe si con la muestra utilizada, las
conclusiones que resulten del estudio tendrn suficiente validez; f) escribir el listado de
pruebas a utilizar sin especificar qu objetivos se cumplirn con su desarrollo o para qu
servir aplicarlas; g) proponer medidas epidemiolgicas de frecuencia o asociacin no
acordes al diseo epidemiolgico elegido; h) no mencionar los criterios de interpretacin
de las prueba propuestas; i) omitir la explicacin de la fase descriptiva por considerarla de
poca importancia o tcita; j) omitir los procedimientos de transformaciones previas de los
datos antes de su anlisis; k) no prever la existencia y tratamiento de posibles variables
confusoras e intervinientes (Altman, 1998; Cumming, 2014; Ercan y otros, 2007, Hanif y
Ajmal, 2011; Schroter y otros, 2008; Strasak y otros, 2007).

Conclusiones
Para una pregunta de investigacin correctamente planteada, existe un diseo de
investigacin idneo: la correcta aplicacin del mismo, proteger de posibles sesgos y, en
consecuencia, la validez del estudio no ser cuestionable.
Para evitar sesgos en el diseo, hay que tomar en cuenta tanto las ventajas y desventajas
de cada estudio, como la consideracin de que existe una jerarqua en el proceso de
investigacin que implica que mientras mayor evidencia se desee para evaluar la
asociacin entre variables, ms deber invertirse en los recursos utilizados.
Adicionalmente, la coherencia en el proceso de investigacin exige que, en cada paso, lo
realizado coincida con lo propuesto.
El muestreo influye tambin en la validez de la investigacin, pues se requiere que la
muestra sea representativa (mtodo de muestreo idneo) y de tamao adecuado.
Adems, se requiere de criterios de seleccin claros y completos.
El uso de mtodos de muestreo probabilsticos y la correcta eleccin del mtodo de
clculo de muestra son los elementos ms importantes para evitar sesgos en el proceso
de muestreo.
En la seleccin de pruebas estadsticas influyen diversos criterios como: el tipo y escala
de las variables dependientes e independientes, la cantidad y grado de independencia de
los grupos de comparacin, el alcance y tipo de investigacin, entre otros.
Los anlisis descriptivos deben hacerse siempre y sirven para describir la muestra o
estudiar el comportamiento de las variables de inters en esa muestra particular. Los
anlisis inferenciales se utilizan para generalizar los resultados obtenidos en la muestra a
la poblacin de la que esta se extrajo. Los mtodos multivariantes permiten el estudio
simultneo de las relaciones establecidas entre mltiples variables e individuos, la
reduccin del nmero de variables sin comprometer la informacin disponible, y
determinar el tamao del efecto ajustado en funcin de variables intervinientes. Los
anlisis epidemiolgicos se utilizan para describir la frecuencia de la enfermedad, evaluar
la asociacin entre variables, y el impacto de las intervenciones.

Referencias
Altman, D. (1998). Statical reviewing for medical journals. Statistics in Medicine, 17, 2661
2674.
Altman, D., Machin, D., Bryant, T., y Gardner, M. (2000). Statistics with Confidence (2
ed.). Reino Unido: British Medical Journal.
Argimon Pallas, J., y Jimnez Villa, J. (2000). Mtodos de investigacin clnica y
epidemiolgica (3 ed.). Madrid: Elsevier.
Baptist, J., Rhrig, B., Hommel, G., y Blettner, M. (2010). Choosing Statistical Tests.
Deutsches rzteblatt International, 107(19).
Barton, B., y Peat, J. (2014). Medical statistics: A guide to SPSS, data analysis and critical
appraisal (2 ed.). Reino Unido: BMJ Books.
Bethlehem, J. (2009). Applied survey methods: A statistical perspective. Nueva Jersey:
John Wiley & Sons, Inc.
Blair, C., y Taylor, R. (2008). Bioestadstica. Mxico: Pearson Educacin, S.A.
Bluman, A. (2009). Elementary Statistics: A step by step approach (7 ed.). Nueva York:
Mc Graw Hill.
Bonita, R., Beaglehole, R., y Kjellstrm, T. (2006). Basic Epidemiology (2 ed.). Ginebra:
World Health Organization.
Crdenas, M., y Arancibia, H. (2014). Potencia estadstica y clculo de tamao de efecto
en G*Power: Complementos a las pruebas de significacin estadstica y su
aplicacin en Psicologa. Salud Y Sociedad, 5(2), 210224.
Catena, A., Ramos, M., y Trujillo, H. (2003). Anlisis multivariado: Un manual para
investigadores. Madrid: Biblioteca Nueva.
Cobo, E., Muoz, P., y Gonzlez, J. (2007). Bioestadstica para no estadsticos: Bases
para interpretar artculos cientficos. Barcelona: Elsevier Masson.
Cumming, G. (2014). Understanding the new Statistics: Effect sizes, confidence intervals,
and meta-analysis. Nueva York: Routledge.
Daniel, W., y Chad, C. (2013). Biostatistics: A Foundation for Analysis in the Health
Sciences (2 ed.). Estados Unidos: John Wiley & Sons.
Datallo, P. (2008). Determining sample size: Balancing, power, precision and practicality.
Nueva York: Oxford University Press.
De Shea, L., y Toothaker, L. (2015). Introductory Statistics for the Health Sciences. Boca
Raton, Florida: CRC Press.
Elorza, H. (2008). Estadstica para las ciencias sociales, del comportamiento y de la salud
(3 ed.). Mxico, D.F.: Cengage Learning.
Ercan, I., Yazici, B., Yang, Y., Ozkaya, G., Cangur, S., Ediz, B., Y Kan, I. (2007). Misusage
of Statistics in Medical Reserch. Eur J. Gen Med, 4(3), 128134.
Fletcher, R., Fletcher, S., & Wagner, E. (1998). Epidemiologa Clnica: Aspectos
fundamentales (2 ed.). Barcelona: Masson.
Forthofer, R., Lee, E., & Hernandez, M. (2007). Biostatistics: A Guide to Design, Analysis
and Discovery. (2 ed.). Estados Unidos: Elsevier, Academic Press.
Fras, M., Pascual, J., y Garca, J. (2000). Tamao del efecto del tratamiento y
significacin Estadstica. Psicothema, 12(2), 236240.
Garca, J., Lpez, J., Jimnez, F., Ramrez, Y., Lino, L., & Reding, A. (2014). Metodologa
de la investigacin: Bioestadstica y bioinformtica en ciencias mdicas y de la salud
(2 ed.). Mxico, D.F.: Mc Graw Hill Education.
Geoffrey, N., y Streiner, D. (2014). Biostatistics: The Bare Essentials with SPSS (4 ed.).
Londres: PMPH-USA Limited.
Glantz, S. (2006). Bioestadstica (6 ed.). Mxico, D.F.: Mc Graw Hill.
Gmez, M., Danglot, C., y Vega, L. (2013). Cmo seleccionar una prueba estadstica
(Primera de dos partes). Revista Mexicana de Pediatra, 80, 3034.
Gonin, R., Fisher, L. D., y Van Belle, G. (2004). Biostatistics: A Methodology for the Health
Sciences. (2 ed.). Nueva York: Wiley.
Gordis, L. (2014). Epidemiology (5 ed.). Filadelfia: Elsevier Saunders.
Guyatt, G., Rennie, D., Meade, M., y Cook, D. (2008). Users guides to the medical
literature: Essential of evidence-based clinical practice (2 ed.). Estados Unidos: Mc
Graw-Hill Medical / JAMAevidence.
Hair, J., Anderson, R., Tatham, R., y Black, W. (1999). Anlisis Multivariante (5 ed.).
Madrid: Prentice Hall Iberia.
Hanif, A., y Ajmal, T. (2011). Statistical errors in medical journals: A critical appraisal.
Annals, 17(2).
Henquin, R. (2013). Epidemiologa y Estadstica para principiantes. Buenos Aires: Corpus.
Hernndez vila, M. (2007). Epidemiologa: Diseo y anlisis de estudios. Mxico, D.F.:
Editorial Mdica Panamericana.
Jaykaran. (2010). How to select appropriate statistical test? Journal of Pharmaceutical
Negative Results, 1(2), 61.
Johnson, D. (2000). Mtodos multivariados aplicados al anlisis de datos. Mxico, D.F.:
Thompson Editores.
Johnson, R., y Bhattacharyya, G. (2010). Statistics: principles and methods (6 ed.).
Estados Unidos: John Wiley & Sons, Inc.
Johnson, R., y Kuby, P. (2004). Estadstica elemental: lo esencial (3 ed.). Mxico, D.F.:
Thompson Learning.
Johnson, R., y Wichern, D. (2007). Applied multivariate statistical analysis (6 ed.). Nueva
Jersey: Pearson Education, Inc.
Juez, P., y Diez, F. (1997). Probabilidad y Estadstica en medicina. Madrid: Diaz de
Santos.
Kraska, M. (2014). Nonparametric Statistics for social and behavioral sciences. Boca
Raton, Florida: CRC Press.
Lang, T. (2004). Twenty statical errors even you can find in biomedical research articles.
Croatian Medical Journal, 45(4), 3702004.
Lohr, S. (2000). Muestreo: Diseo y anlisis. Mxico, D.F.: Thompson Editores.
Londoo, J. L. (2010). Metodologa de la investigacin epidemiolgica (4 ed.). Bogot: El
Manual Moderno.
Lwanga, S., y Lemeshow, S. (1991). Determinacin del tamao de las muestras en los
estudios sanitarios: Manual prctico. Ginebra: Organizacin Mundial de la Salud.
Moreno Altamirano, L. (2013). Epidemiologa clnica. Mxico, D.F.: Mc Graw Hill.
Pagano, M., & Gauvreau, K. (2001). Fundamentos de Bioestadstica (2 ed.). Mxico,
D.F.: Thompson Learning.
Pagano, R. (2013). Understanding Statistics in the behavioral sciences (2 ed.). California:
Wadsworth CENGACE Learning.
Peacock, J., y Peacock, P. (2011). Oxford handbook of medical statistics. Reino Unido:
Oxford University Press.
Pea, D. (2002). Anlisis multivariante de datos. Madrid: Mc Graw-Hill / Interamericana.
Prez, C. (2004). Tcnicas de anlisis multivariante de datos: Aplicaciones con SPSS.
Madrid: Pearson Educacin, S.A.
Pineda, E., y De Alvarado, E. L. (2008). Metodologa de la investigacin (3 ed.).
Washington, D.C.: Organizacin Panamericana de la Salud.
Prajapati, B., Dunne, M., y Armstrong, R. (2010). Sample size estimation and statistical
power analyses. Optometry Today, 50, 19.
Ruiz, A., y Morillo, L. (2004). Epidemiologa clnica: Investigacin clnica aplicada. Bogot:
Editorial Mdica Panamericana.
Scheaffer, R., Mendenhall, W., y Ott, L. (1987). Elementos de muestreo. Mxico, D.F.:
Grupo Editorial Iberoamrica.
Schroter, S., Nick, B., Evans, S., Goodlee, F., Osorio, L., y Richard, S. (2008). What errors
do peer reviewers detect, and does training improve their ability to detect them? JR
Soc Med, 101(19), 507514.
Sheskin, D. (2004). Handbook of parametric and nonparametric statistical procedures (3
ed.). Estados Unidos: Chapman & Hall/CRC.
Siegel, S. (1970). Estadstica no paramtrica: aplicada a las ciencias de la conducta.
Mxico, D.F.: Editorial Trillas.
Silva, L. (1997). Cultura estadstica e investigacin cientfica en el campo de la salud: Una
mirada crtica. Madrid: Diaz de Santos.
Stopher, P. (2012). Collecting, managing, and assesing data: Using sample surveys.
Nueva York: Cambridge University Press.
Strasak, A., Zaman, Q., Pfeiffer, K., Gobel, G., y Ulmer, H. (2007). Statistical errors in
medical research: A review of common pitfalls. Swiss Med WKLY, 137, 4449.
Szklo, M., y Nieto, J. (2003). Epidemiologa intermedia: Conceptos y aplicaciones. Madrid:
Diaz de Santos.
Velasco Rodrguez, V., Martnez Ordaz, V., Roiz Hernndez, J., Huazano Garca, F., y
Nieves Rentera, A. (2002). Muestreo y tamao de muestra: Una gua prctica para
personal de salud que realiza investigacin. Buenos Aires: e-libro.net.
Villa Romero, A., Moreno Altamirano, L., y Garca de la Torre, G. (2012). Epidemiologa y
Estadstica en salud pblica. Mxico, D.F.: Mc Graw Hill.

Você também pode gostar