Escolar Documentos
Profissional Documentos
Cultura Documentos
Universidad de La Frontera,
Hierarchy of evidence. Levels of evidence and grades of recommendation from Temuco, Chile.
Departamento de Ciruga y
current use Traumatologa (CM).
Universidad de Concepcin,
There are multiple proposals and classifications that hierarchize evidence, which may confuse those who are Concepcin, Chile.
dedicated to generate it both in health technology assessments, as for the development of clinical guidelines, Centro de Rehabilitacin Avanzada
etc. The aim of this manuscript is to describe the most commonly used classifications of levels of evidence and e Implantologa-C RAI- (CA).
Universidad Autnoma de Chile.
grades of recommendation, analyzing their main differences and applications so that the user can choose the one Escuela de Psicologa (TO).
that better suits your needs and take this health decisions basing their practice on the best available evidence. Conflictos de inters: Ninguno.
A systematic literature search was performed in PubMed and MEDLINE databases and in Google, Yahoo and Financiamiento: Programa de
Ixquick search engines. A wealth of information concerning levels of evidence and degrees recommendation Doctorado en Ciencias Mdicas,
Universidad de La Frontera.
was obtained. It was summarized the information of the 11 proposals more currently used (CTFPHC, Sackett,
USPSTF, CEBM, GRADE, SIGN, NICE, NHMRC, PCCRP, ADA y ACCF/AHA), between which it emphasizes Recibido: 30 de marzo de 2014
the GRADE WORKING GROUP, incorporated by around 90 national and international organizations such as the Aceptado: 31 de mayo de 2014
World Health Organization, The Cochrane Library, American College of Physicians, American Thoracic Society,
Correspondencia a:
UpToDate, etc.; and locally by the Ministry of Health to create clinical practice guidelines. Carlos Manterola Delgado
Key words: Evidence-Based Practice[Mesh], Evidence-Based Medicine, levels of evidence, grades of carlos.manterola@ufrontera.cl
recommendation, clinical recommendation.
Palabras clave: Prctica clnica basada en la evidencia; medicina basada en la evidencia niveles de evidencia,
grados de recomendacin, recomendacin clnica.
L
en 1984, quienes organizaron los niveles de evidencia
os primeros indicios de la prctica de la medicina (NE) y grados de recomendacin (GR) para sujetos
basada en la evidencia (MBE), se remontan a los asintomticos, indicando cules procedimientos eran los
tiempos del emperador Qianlong, cuando se utili- ms adecuados y cules deban ser evitados.
zaba el mtodo kaozheng que representa la prctica de En general, las clasificaciones se basan en los diseos
la investigacin probatoria1,2. Desde entonces, numerosas de los estudios de donde proviene la evidencia, asumiendo
instancias aisladas se fueron desarrollando hasta que en que algunos de ellos estn sujetos a ms sesgos que otros;
la dcada de los ochenta, el grupo de la Universidad y por ende, justifican ms dbilmente las decisiones cl-
McMaster, liderado por David Sackett, desarroll los nicas. Por otro lado, el anlisis constante de la evidencia
principios de la enseanza y prctica de la MBE que disponible desde la perspectiva de los diferentes escena-
rigen hasta hoy, y que se pueden resumir como integrar rios clnicos, permite establecer GR para el ejercicio de
la experiencia clnica individual con la mejor evidencia procedimientos diagnsticos, teraputicos, preventivos,
disponible a partir de la investigacin sistemtica3-5. econmicos en salud, etc.; e indican la forma de valorar la
En la bsqueda de la mejor evidencia disponible, evidencia disponible en funcin de etiologa, dao, mor-
es necesario otorgar un valor jerrquico a la evidencia bilidad y complicaciones; pronstico, historia natural y
disponible, con el objetivo de tener una gua para decidir curso clnico, etc. de una enfermedad o evento de inters6.
si aplicar o no una determinada intervencin, tratamiento Ha existido una proliferacin de propuestas y clasifi-
o procedimiento; a partir de la cual se pueda emitir una caciones que jerarquizan la evidencia; y junto con ello,
recomendacin basada en la solidez de la evidencia que sus respectivos GR. Ambos, pueden confundir a quienes
la respalda. se dedican a generar la evidencia a travs del reporte de
La primera jerarquizacin de la evidencia fue formu- resultados por medio de artculos primarios y revisiones
lada por la Canadian Task Force on the Periodic Health sistemticas; as como de la realizacin de documentos
Examination en 1979. sta, se desarroll para la evalua- de resumen de la evidencia (overviews), elaboracin de
cin de medidas preventivas. Fue adaptada posteriormente guas clnicas, evaluaciones de tecnologa sanitaria, etc.
Esto es debido a las diferencias y a la complejidad de las de los resultados y la validez externa del artculo (posible
escalas de valoracin existentes. Adicionalmente, el len- reproducibilidad de los resultados en la poblacin que nos
guaje utilizado para expresar la informacin no es de uso interesa). Previo a ello, el o los artculos seleccionados
rutinario en la prctica cotidiana6, lo que determina an deben ser asignados a algn escenario clnico (tratamiento,
ms confusin e incertidumbre respecto de cul aplicar. prevencin, etiologa, dao, pronstico e historia natural,
El objetivo de este artculo es actualizar la informacin diagnstico diferencial, prevalencia, tamizaje, estudios
y describir las clasificaciones ms utilizadas para valorar econmicos y anlisis de decisin), a propsito de lo
la evidencia en el mbito de la salud, analizando sus cual se elegir la gua de usuario o pauta de lectura crtica
principales diferencias y aplicaciones para que el usuario correspondiente con la que se evaluar cada artculo.
pueda elegir la que mejor se adapte a sus necesidades Una vez identificado el escenario en el que corresponde
y tomar de este modo decisiones sanitarias basando su catalogar al artculo (en ocasiones, puede ser asignado a
prctica en la mejor evidencia disponible. ms de uno), se aplica segn el tipo de diseo del estudio
en cuestin, la propuesta de NE y GR. Por lo anteriormen-
Clasificacin de la evidencia y tipos de te expuesto, es fundamental identificar el escenario y los
estudio diseos de investigacin para poder valorar la evidencia
utilizando alguna de las clasificaciones existentes.
En las dos ltimas dcadas se ha producido un incre- Realizamos una bsqueda sistemtica de la literatura
mento significativo de la investigacin clnica basada en las bases de datos PubMed y MEDLINE y en los
en la evidencia, como pilar fundamental en la toma de buscadores Google, Yahoo e Ixquick, utilizando los
decisiones para los cuidados en salud. Sin embargo, trminos: medicina basada en la evidencia, evidencia,
no todos los conocimientos provenientes de artculos niveles de evidencia, grados de recomendacin, fuerza de
cientficos tienen el mismo impacto o valor sobre la toma recomendacin; en idiomas ingls y castellano. Obtuvi-
de decisiones; por tal razn, se debe aplicar un mtodo mos una gran cantidad de informacin referente a niveles
riguroso para compilar la evidencia cientfica en torno de evidencia y grados de recomendacin, para finalmente
a una pregunta; analizar de forma crtica los artculos resumir la informacin de 11 de las propuestas ms utiliza-
cientficos de los que disponemos para responder a la das en la actualidad (CTFPHC, Sackett, USPSTF, CEBM,
interrogante en cuestin, valorando la validez interna GRADE, SIGN, NICE, NHMRC, PCCRP, ADA y ACCF/
(metodologa empleada y riesgo de sesgos), el impacto AHA), que son las que se describen a continuacin.
Niveles de Descripcin
certeza
Alta La evidencia disponible incluye resultados consistentes de estudios bien diseados, bien conducidos en poblaciones represen-
tativas de atencin primaria. Estos estudios evalan los efectos del servicio de prevencin en la salud. Esta conclusin es por lo
tanto poco probable que sea fuertemente afectada por los resultados de futuros estudios
Moderada La evidencia disponible no es suficiente para determinar los efectos de la accin preventiva, pero la confianza en la estimacin
se ve limitada por factores tales como:
Nmero, tamao o calidad de los estudios individuales
Inconsistencia de los resultados entre los estudios individuales
Generalizacin limitada de los resultados en la prctica habitual la atencin primaria
Falta de coherencia en la cadena de la evidencia existente
A medida que ms informacin se encuentre disponible, la magnitud o la direccin del efecto observado podra cambiar, y este
cambio puede ser lo suficientemente importante como para alterar la conclusin
Baja La evidencia disponible es insuficiente para evaluar los efectos sobre los resultados de salud, debido a:
Limitado nmero o tamao de los estudios
Defectos importantes en el diseo del estudio o los mtodos
Inconsistencia de los resultados entre los estudios individuales
Figura 5. Descripcin de Lagunas en la cadena de la evidencia existente
los niveles de evidencia para Hallazgos no generalizables para la prctica habitual de la atencin primaria
exmenes peridicos de salud Falta de informacin sobre los resultados importantes de salud
(USPSTF). Ms informacin puede permitir la estimacin de los efectos sobre los resultados de salud
A los GR se le asigna una letra (A, B, C, D, o I). Se innovacin complementaria a otras iniciativas. Tiene la
apoyan en grados de certeza, que se definen como la pro- ventaja que grada la evidencia de acuerdo al mejor diseo
babilidad que el beneficio neto de un servicio preventivo para cada escenario clnico, otorgndole intencionalidad,
que ha sido evaluado por la USPSTF sea correcto. El agregando las revisiones sistemticas (RS) en los distintos
grado A, sugiere recomendar la accin ya que existe un mbitos. Por ejemplo, al tratarse de un escenario de pro-
alto grado de certeza que el beneficio neto es sustancial; nstico, la evidencia ser valorada a partir de una RS de
el extremo opuesto es el grado I, que sugiere que no hay estudios de cohortes con homogeneidad, o en su defecto,
suficiente evidencia para evaluar el beneficio neto de una de estudios de cohortes individuales con un seguimiento
accin y por lo tanto, no se puede recomendar. superior al 80% de la cohorte; en cambio, si el escenario
El USPSTF ha actualizado sus definiciones de las se refiere a terapia o tratamiento, la evidencia se valorar
calificaciones que asigna a las recomendaciones y ahora principalmente a partir de RS de EC, o en su defecto de
incluye una columna de sugerencias para la prctica EC individuales con intervalos de confianza estrechos.
asociados con cada grado (Figura 6)13. Esta clasificacin tiene la ventaja que nos asegura el
conocimiento ms atingente a cada escenario, por su alto
Centre for Evidence-Based Medicine, Oxford grado de especializacin. Adems tiene la prerrogativa de
La propuesta del Centre for Evidence-Based Medicine aclarar cmo afecta la falta de rigurosidad metodolgica
de Oxford (CEBM) se caracteriza por valorar la evidencia al diseo de los estudios, disminuyendo su valoracin no
segn el rea temtica o escenario clnico y el tipo de estu- slo en la gradacin de la evidencia, sino que tambin en
dio que involucra al problema clnico en cuestin14. Es una la fuerza de las recomendaciones (Figura 7).
No obstante lo cual, presenta algunos inconvenientes abarcar todos los aspectos con la mxima exhaustividad,
para su prctica habitual. Por una parte, vemos como en pierde la simpleza para hacerla aplicable6.
su estructura se presentan trminos epidemiolgicos poco El ao 2009 se realiz una revisin de la tabla original
amigables y con mltiples aclaraciones que hacen su con la idea de simplificarla para permitir una bsqueda
lectura poco fluida y, que rpidamente pueden frustrar a heurstica rpida y al mismo tiempo que permitiese
quien se aproxima a ella por primera vez. En su intento por jerarquizar la evidencia encontrada. Se adicion un
3a RS de estudios de casos y RS de estudios con homoge- RS de estudios con homoge- RS de estudios con homoge-
controles con homogeneidad neidad de estudios 3b y mejor neidad de estudios 3b y mejor neidad de estudios 3b y mejor
calidad calidad calidad
3b Estudios de casos y controles Comparacin enmascarada Estudio no consecutivo de co-
individuales y objetiva de un espectro de horte, o anlisis muy limitado
pacientes que podra ser exa- de la poblacin basado en
minado para un determinado pocas alternativas o costes,
trastorno, pero el estndar de datos de mala calidad, pero
referencia no se aplica a todos con anlisis de sensibilidad
los pacientes del estudio. Es- que incorporan variaciones
tudios no consecutivos o sin clnicamente sensibles
aplicacin de un estndar de
referencia
C 4 Series de casos, estudios de Series de casos y estudios de Estudios de casos y controles Series de casos o estndares Anlisis sin anlisis de sen-
cohortes y de casos y contro- cohortes de pronstico de con escasos o sin estndares de referencia obsoletos sibilidad
les de baja calidad baja calidad de referencia independientes
D 5 Opinin de expertos sin eva- Opinin de expertos sin eva- Opinin de expertos sin eva- Opinin de expertos sin eva- Opinin de expertos sin eva-
luacin crtica explcita, ni ba- luacin crtica explcita, ni ba- luacin crtica explcita, ni ba- luacin crtica explcita, ni ba- luacin crtica explcita, ni ba-
sada en fisiologa, ni en traba- sada en fisiologa, ni en traba- sada en fisiologa, ni en traba- sada en fisiologa, ni en traba- sada en fisiologa, ni en traba-
jo de investigacin juicioso, ni jo de investigacin juicioso, ni jo de investigacin juicioso, ni jo de investigacin juicioso, ni jo de investigacin juicioso, ni
en principios fundamentales en principios fundamentales en principios fundamentales en principios fundamentales en principios fundamentales
Figura 7. Niveles de evidencia de CEBM (2009).
Pregunta Paso 1 (Nivel 1*) Paso 2 (Nivel 2*) Paso 3 (Nivel 3*) Paso 4 (Nivel 4*) Paso 5 (Nivel 5*)
Qu tan comn es el Encuestas locales y actua- RS de encuestas que Muestra local no aleatoria Serie de casos N/A
problema? les aleatorias de la mues- coincidan con las circuns-
tra (o censos) tancias locales
Es preciso el test RS de estudios transver- Estudios individuales de Estudios no consecutivos, Estudios caso control o es- Mecanismos basados en el
de monitoreo o test sales con estndar de corte transversal con es- estudios sin un estndar tndar de referencia pobre razonamiento
diagnstico? referencia aplicado de tndar de referencia apli- de referencia aplicado de o no independiente
(Diagnstico) forma consistente y con cado de forma consistente forma consistente
enmascaramiento y con enmascaramiento
Qu pasara si no se RS de estudios de cohorte Estudios de cohorte de Estudio de cohorte o el Estudio de caso-control o N/A
agrega una terapia? de inicio inicio brazo control de un EC estudios de cohorte pro-
(Pronstico) con AA * nstica de pobre calidad
Esta intervencin ayuda? RS de EC con AA o ensa- EC con AA o estudios Estudio de cohorte, con Serie de casos, estudios Mecanismos basados en el
(beneficios del yos n-de-1 observacionales con un seguimiento controlado caso-control o estudios razonamiento
tratamiento) efecto dramtico sin AA * histricos controlados
Cules son los daos RS de EC con AA, RS de EC individual con AA o Estudio de cohorte, con Series de casos, estudios Mecanismos basados en el
comunes? estudios de casos y con- (excepcionalmente) estu- seguimiento controlado de casos y controles, o razonamiento
(efectos nocivos del troles anidados, ensayo dios observacionales con (post-comercializacin) estudios histricos con-
tratamiento) n-de-1 con el paciente un efecto dramtico con un nmero suficiente trolados
sobre el que est plan- para descartar un dao
teando la pregunta, o comn. (Para los daos a
estudio observacional con largo plazo, la duracin
un efecto dramtico. del seguimiento debe ser
suficiente)
Cules son los daos RS de EC con AA ensayo EC con AA o (excepcio-
raros? n-de-1 nalmente) estudios obser-
(efectos nocivos del vacionales con un efecto
tratamiento) dramtico
Vale la pena esta prueba RS de EC con AA EC con AA Estudios de cohortes con Serie de casos, estudios de Mecanismos basados en el
para deteccin temprana? seguimiento controlado casos y controles o estu- razonamiento
(tamizaje) dios histricos controlados
*El NE se podr clasificar hacia abajo en base a la calidad del estudio, de las imprecisiones, del carcter indirecto de la evidencia, debido a la inconsistencia entre los estu-
dios, o porque el tamao del efecto absoluto es muy pequeo, y el nivel se podrn clasificar hacia arriba si hay un tamao de efecto grande o muy grande. AA : Asignacin
aleatoria
Figura 8. Niveles de evidencia de CEBM (2011).
glosario con la definicin de los trminos relevantes, en desventaja que al no existir subcategoras en relacin
forma precisa y entendible. Adems, se consider que las a la calidad de los estudios, puede sesgar el valor que
pruebas de screening o tamizaje deban considerarse se le otorga a la evidencia. Por ejemplo, si la evidencia
como una entrada independiente y que se deba resaltar encontrada para una pregunta de terapia proviene de una
la importancia de las RS. RS, probablemente se categorizar como NE 1, pero si
En esta nueva versin15, se distinguen las filas que al continuar con la bsqueda nos encontramos con un EC
representan la serie de pasos que se deberan seguir con doble enmascaramiento y alta calidad metodolgica
en bsqueda de la mejor evidencia. Hacia el extremo que presenta un resultado contrario a la RS, a cul le
izquierdo se encuentra la evidencia ms fuerte y hacia la creeremos? No slo el NE que representa un determinado
derecha la ms dbil. Las columnas representan los tipos diseo va a avalar la decisin ya que pueden existir RS con
de preguntas que el clnico pudiera encontrarse: Qu tan fallas metodolgicas que limitan la validez del estudio,
comn es el problema?, Es precisa la prueba diagns- situaciones en que las subcategoras seran de gran ayuda;
tica?, Qu pasara si no se instaura el tratamiento?, La sin embargo, al incluir estas subcategoras la simpleza de
intervencin ayudar al paciente?, Qu tan frecuente o esta herramienta se pierde. Por lo tanto, CEBM sugiere
infrecuente es la complicacin?, Vale la pena utilizar que los NE se interpreten con una dosis de sentido comn
esta prueba diagnstica para deteccin precoz? (Figura 8). y buen juicio, lo que es posible lograr realizando una sis-
En primer lugar se debe identificar a cul de las temtica y exhaustiva bsqueda de la literatura cientfica
preguntas de la columna izquierda corresponde el art- que permita obtener los artculos relevantes y realizar un
culo del que proviene la evidencia que se desea valorar. acucioso anlisis crtico de la literatura antes de valorar
Posteriormente, se debe identificar en la fila hacia la la evidencia y aplicarla en la prctica si as lo amerita16.
derecha, el diseo del estudio. Este punto es el que indica No obstante que CEBM actualiz la propuesta, es me-
el NE, el que se identifica en la fila superior. Si bien la nester sealar que la anterior (Figura 7), sigue siendo uti-
tabla es de fcil manejo y permite una valoracin rpida lizando de forma masiva por los grupos de investigacin,
y prctica de la evidencia, presenta al mismo tiempo la que ven en sta una mejora de la clasificacin de Sackett.
Grado de recomendacin. Beneficio vs. Riesgo y cargas Calidad metodolgica que apoya la Implicancias
Descripcin. evidencia
1A. Recomendacin fuerte, Los beneficios superan claramente los riesgos EC sin importantes limitaciones o evidencia Recomendacin fuerte, puede aplicarse a la
evidencia de alta calidad y cargas, o viceversa. abrumadora de estudios observacionales. mayora de los pacientes en la mayora de
circunstancias, sin reserva.
1B. Recomendacin fuerte, Los beneficios superan claramente los riesgos EC con importantes limitaciones (resultados Recomendacin fuerte, puede aplicarse a la
evidencia de moderada calidad y cargas, o viceversa. inconsistentes, defectos metodolgicos, mayora de los pacientes en la mayora de
indirectos o imprecisos) o pruebas excep- circunstancias, sin reserva
cionalmente fuertes a partir de estudios
observacionales.
1C. Recomendacin fuerte, Los beneficios superan claramente los riesgos Estudios observacionales o series de casos. Recomendacin fuerte, pero puede cambiar
evidencia de baja o muy baja y cargas, o viceversa. cuando se disponga de mayor evidencia de
calidad calidad.
2A. Recomendacin dbil, Beneficios estrechamente equilibrados con los EC sin importantes limitaciones o evidencia Recomendacin dbil, la mejor accin puede
evidencia de alta calidad riesgos y la carga. abrumadora de estudios observacionales. variar dependiendo de las circunstancias de
los pacientes o de los valores de la sociedad.
2B. Recomendacin dbil, Beneficios estrechamente equilibrados con los EC con importantes limitaciones (resultados Recomendacin dbil, la mejor accin puede
evidencia de moderada calidad riesgos y la carga. inconsistentes, defectos metodolgicos, variar dependiendo de las circunstancias de
indirectos o imprecisos) o pruebas excep- los pacientes o de los valores de la sociedad.
cionalmente fuertes a partir de estudios
observacionales.
2C. Recomendacin dbil, Incertidumbre en las estimaciones de be- Estudios observacionales o series de casos. Recomendaciones muy dbiles, otras alter-
evidencia de baja o muy baja neficios, riesgos y cargas; los beneficios, nativas pueden ser igualmente razonables.
calidad riesgos, y la carga puede estar estrechamente
equilibrado.
Figura 9. GRADE modificado: grados de recomendacin.
Grade Working Group de la asociacin es fuerte, con un RR > a 2 < 0,5 basado
GRADE (The Grading of Recommendations As- en evidencia consistente derivada de dos o ms estudios
sessment, Development and Evaluation), es un sistema observacionales, sin factores de confusin plausibles (+1);
para clasificar la calidad de la evidencia y fuerza de reco- o cuando la evidencia de la asociacin es muy fuerte, con
mendacin aplicable a una amplia gama de intervenciones un RR > a 5 < 0,2 basado en evidencia directa, sin ame-
y contextos. Fue elaborado en base a la experiencia previa nazas importantes para la validez (+2); o cuando existe
con otras herramientas existentes para conseguir un siste- evidencia de un gradiente dosis respuesta (+1); o cuando
ma ms razonable, confiable y ampliamente aplicable17. todos los potenciales factores de confusin posibles se
La principal diferencia de este sistema en relacin a han podido controlar en su efecto (+1).
otros, es que GRADE no valora la calidad de un estudio Las ventajas del sistema GRADE respecto de los otros
individual; sino que le da un valor a la evidencia para sistemas de clasificacin son: que utiliza definiciones
una medida resultado en particular, a partir de varios explcitas y juicios secuenciales durante el proceso de
estudios primarios. clasificacin; que proporciona una descripcin detallada
Los juicios sobre la fuerza de una recomendacin de los criterios para la calidad de la evidencia para los
deben tener en cuenta el balance entre beneficios y riesgos, resultados individuales y para la calidad general de la evi-
la calidad de la evidencia, la aplicacin de sta en circuns- dencia; que pesa la importancia relativa de los resultados;
tancias especficas y la situacin de riesgo basal, que son que considera el equilibrio entre los beneficios de salud
los puntos claves evaluados en cada artculo (Figura 9). versus los daos, costos y gastos; y, que permite desarro-
Destaca en esta propuesta, la elaboracin de una tabla llar perfiles de evidencia y resmenes de los hallazgos19.
de sntesis que se obtiene de forma sistemtica y que se Es una herramienta muy completa que incorpora el
basa en la evaluacin de la calidad de la evidencia segn uso de un software de uso libre para extraer los datos
el tipo de diseo18: EC con asignacin aleatoria: calidad y realizar la sntesis, por ende, requiere tiempo para su
alta; estudios observacionales: calidad baja; y cualquier aplicacin ya que el anlisis de un estudio individual
otra evidencia: calidad muy baja. es muy exhaustivo. Ha sido incorporada por diversas
El grado disminuye si es que en la calidad del estudio instituciones para para evaluar la calidad de la evidencia
existe: una limitacin importante (-1) o muy importante disponible, realizar recomendaciones y generar guas de
(-2); una inconsistencia importante (-1); incertidumbre res- prctica clnica. Entre ellas, destacan organismos interna-
pecto de si la evidencia es directa o indirecta: si es alguna cionales tales como World Health Organization, Cochrane
(-1) y si es mxima (-2); informacin imprecisa o escasa Library, World Allergy Organization (WAO), Surviving
(-1); y alta probabilidad de sesgo de informacin (-1). Sepsis, UpToDate, etc; instituciones norteamericanas
Por otra parte, el grado aumenta si es que: la evidencia como CDCs Healthcare Infection Control Practices
Advisory Committee (HICPAC), CDCs Division of Viral Tuberculosis Diagnosis, The Canadian Cardiovascular
Hepatitis, Infectious Diseases Society of America, CDCs Society, La Socit Canadienne de Cardiologie, Canadian
Advisory Committee on Immunization Practices (ACIP), Task Force on Preventive Health Care (CTFPHC), etc.10;
Agency for Healthcare Research and Quality (AHRQ), a las que habra sumar alrededor de 50 instituciones ms10.
The University of Pennsylvania Health System Center En Chile, el Ministerio de Salud, ha hecho interesantes
for Evidence-based Practice, American College of Phy- esfuerzos por incorporar GRADE en la elaboracin de
sicians, American Thoracic Society, American Gastroen- guas de prctica clnica.
terological Association (AGA), The American Society
of Colon and Rectal Surgeons, The Eastern Association Scottish Intercollegiate Guidelines Network
for the Surgery of Trauma (EAST), American College of El Scottish Intercollegiate Guidelines Network (SIGN)
Chest Physicians, American Society for Gastrointestinal desarrolla guas de prctica clnica basadas en la eviden-
Endoscopy (ASGE), The American Association for the cia, realizadas para el Servicio Nacional de Salud (NHS)
Study of Liver Diseases, etc; organizaciones europeas de Escocia. Derivan de RS de la literatura cientfica y son
como British Medical Journal (UK), Clinical Evidence diseadas como un vehculo para acelerar la traduccin
(UK), National Institute for Clinical Excellence (NICE, del nuevo conocimiento en accin para cumplir con el
UK), The Scottish Intercollegiate Guidelines Network objetivo de reducir la variabilidad de la prctica y mejorar
(SIGN, UK), NHS Quality Improvement (UK), German los resultados relevantes para los pacientes20.
Center for Evidence-based Nursing sapere aude (Ale- La propuesta del SIGN, se origin teniendo como foco
mania), Evidence-based Nursing Sdtirol, Alto Adige de inters la temtica del tratamiento y los procedimientos
(Italia), European Society of Thoracic Surgeons, Euro- teraputicos. Se diferencia de las anteriores por su par-
pean Respiratory Society, European Association for the ticular nfasis en el anlisis cuantitativo que aportan las
Study of the Liver (EASL), Belgian Centre for Evidence- RS; y otorga adems importancia a la reduccin del error
Based Medicine (CEBAM), etc; instituciones canadienses sistemtico o sesgo (Figuras 10 y 11)21.
como Health Quality Ontario, The Canadian Agency Como fortaleza, es relevante destacar que considera la
for Drugs and Technologies in Health, Evidence-Based calidad metodolgica de los estudios que componen las
RS, situacin de sumo inters, dada la alta produccin
anual de RS.
NE Interpretacin
Como debilidad podemos sealar que no considera en
1++ Meta-anlisis de alta calidad, RS de EC EC de alta calidad con muy poco riesgo de sesgo
la elaboracin de las recomendaciones la realidad cient-
1+ Meta-anlisis bien realizados, RS de EC EC bien realizados con poco riesgo de sesgos
fica y tecnolgica del momento, pues stas se crean con
1- Meta-anlisis, RS de EC EC con alto riesgo de sesgos
RS de alta calidad de estudios de cohortes o de casos y controles. Estudios de cohortes o
una rigidez que puede ser peligrosa para quienes usan con
2++ de casos y controles con bajo riesgo de sesgo y con alta probabilidad de establecer una ortodoxia las recomendaciones para la implementacin
relacin causal de polticas de salud. Por otro lado, se basa de forma
2+
Estudios de cohortes o de casos y controles bien realizados con bajo riesgo de sesgo y con puntual en los aspectos metodolgicos y de diseo, pero
una moderada probabilidad de establecer una relacin causal
no as en la dimensin de la perspectiva del padecer una
Estudios de cohortes o de casos y controles con alto riesgo de sesgo y riesgo significativo de
2-
que la relacin no sea causal
enfermedad o las implicancias econmicas de las medidas
3 Estudios no analticos, como informes de casos y series de casos recomendadas; situacin que puede limitar su utilizacin
4 Opinin de expertos en la prctica clnica latinoamericana.
Figura 10. Niveles de evidencia para estudios de tratamiento. Propuesta del SIGN.
Antiguamente, el SIGN se basaba en los NE desarro-
lladas por la Agencia de E.U.A. para el Cuidado de la
Salud y la Investigacin (AHCPR). Dadas las limitaciones
Grado de Interpretacin
recomendacin
encontradas con este sistema, desarrollaron una nueva
A Al menos un meta-anlisis, RS EC clasificado como 1++ y directamente
clasificacin que utilizan desde el ao 200022.
aplicable a la poblacin diana de la gua; o un volumen de evidencia cientfica Este sistema de clasificacin pretende dar mayor peso
compuesto por estudios clasificados como 1+ y con gran consistencia entre ellos. a la calidad de la evidencia que respalda cada recomen-
B Volumen de evidencia cientfica compuesta por estudios clasificados como 2 dacin, y hacer hincapi en que el cuerpo de la evidencia
++, directamente aplicable a la poblacin blanco de la gua y que demuestran
gran consistencia entre ellos; o evidencia cientfica extrapolada desde estudios
debe ser considerado en su conjunto, y no depender de un
clasificados como 1 ++ 1+ slo estudio para apoyar a cada recomendacin. Tambin
C Volumen de evidencia cientfica compuesta por estudios clasificados como 2 pretende dar ms peso a las recomendaciones respaldadas
+ directamente aplicables a la poblacin blanco de la gua y que demuestran por estudios observacionales de gran calidad donde los
gran consistencia entre ellos; o evidencia cientfica extrapolada desde estudios
clasificados como 2 ++ EC no se pueden realizar por razones prcticas o ticas.
D Evidencia cientfica de nivel 3 4; o evidencia cientfica extrapolada desde estu- En 2009, el SIGN tom la decisin de implementar
dios clasificados como 2+ el enfoque GRADE en su directriz metodolgica, me-
Figura 11. Grados de recomendacin para estudios de tratamiento. Propuesta del SIGN. todologa que se encuentra actualmente en desarrollo21.
Nivel II. EC sin asignacin aleatoria (estudio prospec- casos y controles; y la investigacin de servicios de salud
tivo, previamente planificado, con criterios de elegibilidad que incluya ajustes por posibles variables de confusin.
y medidas de resultado pre-determinados). Nivel IV. Estudios observacionales sin grupo control
Nivel III. Estudios observacionales. Incluye estudios (estudios de cohortes sin controles y series de casos).
de cohortes prospectivos y retrospectivos, estudios de Y, nivel V, que corresponde a la opinin de expertos.
NE Descripcin
A Clara evidencia de EC controlados con asignacin aleatoria, generalizables bien realizados, que estn adecuadamente conducidos,
incluyendo:
Evidencia de un EC multicntrico bien conducido
Evidencia de un meta-anlisis que incorpora las calificaciones de calidad en el anlisis
Evidencia no experimental convincente, es decir, la norma todo o nada desarrollada por el CEBM.
Evidencia de apoyo de EC controlados bien realizados que estn adecuadamente conducidos, incluyendo:
Evidencia de un EC bien realizado en una o ms instituciones
Evidencia de una RS que incorpora las calificaciones de calidad en el anlisis
B Evidencia de apoyo de estudios de cohortes bien realizados, que incluyen:
Evidencia de un estudio de cohortes prospectivo bien realizado o registro
Evidencia de un meta-anlisis de estudios de cohortes bien realizado
Evidencia de apoyo de un estudio de casos y controles bien realizado
C Evidencia de apoyo de estudios pobremente controlados o no controlados, que incluyen:
Evidencia de los EC con asignacin aleatoria con defectos metodolgicos menores, que pudieran invalidar los resultados
Evidencia de estudios observacionales con un alto potencial de el sesgo (como una serie de casos con comparacin con controles
histricos)
Evidencia de serie de casos o reporte de casos
Figura 16. Niveles de eviden-
E Consenso de expertos o experiencia clnica cia de la ADA.
el juicio clnico en base al grado de confiabilidad que los antes sealadas, tanto en universidades como estableci-
resultados de las investigaciones cientficas nos entregan mientos sanitarios; razn por la que es relevante cono-
y que permita evaluar beneficios vs riesgos, a la luz de cerlas, de modo tal de comprender mejor la metodologa
la evidencia actual. a travs de la cual se efectan estos procesos.
Existen mltiples propuestas de clasificaciones para La sistematizacin de la bsqueda de la evidencia es el
valorar la evidencia (se estima que superan el centenar); paso fundamental para la obtencin de la mejor evidencia
desde la inicial y ms simple (Sackett), que sirvi de base disponible. Sin embargo, al momento de acercarnos a ella
para las actuales; hasta otras que han querido considerar siempre se ha de considerar la existencia de caractersticas
todas las posibles situaciones que se pueden encontrar, poblacionales, culturales, econmicas, tecnolgicas,
hacindolas inmanejables debido a su extensin. Entre ambientales, etc.; es decir, darle relevancia al concepto
otras tantas, se pueden mencionar las de la Agency de validez externa sin importar lo que parece resultar
for Healthcare Research and Quality30, de la Agncia en otras latitudes, sin pruebas previas en nuestra realidad.
dAvaluaci de Tecnologia Mdica (AATM) de la Gene- El paso siguiente corresponde a darle un valor a esta
ralitat de Catalunya31, de la Canadian Asthma Consensus evidencia, para lo cual se debe elegir la clasificacin que
Group32; la de NANDA-I33, del Servicio Andaluz de ms se ajuste a nuestra necesidad y que permita discrimi-
Salud34, SORT35, etc. nar entre un nivel y otro, para realizar las recomendaciones
Junto a ello, el lenguaje epidemiolgico empleado, ha ms adecuadas al entorno asistencial y poblacional. Es
llevado consigo confusin e incomprensin por parte de as como se dispone de clasificaciones amplias, con una
los mdicos clnicos, quienes ven en esta gran variedad propuesta distinta para diferentes escenarios (CEBM,
de opciones ms conflictos que ayuda al desarrollo de NHMRC, etc.), como de clasificaciones ms especficas,
la prctica profesional. En este artculo se presentan las que apuntan a un escenario puntual (CTFPHC, SIGN,
clasificaciones ms relevantes existentes; utilizando como etc.) y otras como GRADE que ha sido incorporada para
criterio de seleccin, el nivel de utilizacin de cada cual, evaluar la calidad de la evidencia disponible, realizar
el que se asocia directamente con el grado de aceptacin recomendaciones y generar guas de prctica clnica
de ellas por parte de la comunidad cientfica general o basadas en la evidencia, por alrededor de 90 prestigiosas
particular. instituciones nacionales e internacionales10.
Sin embargo, lo interesante de todo esto, es que el Finalmente, nos parece oportuno sealar, que este
desarrollo creciente de las guas clnicas y la realizacin manuscrito aporta el resumen de la informacin referente
de evaluaciones de tecnologas sanitarias, ha determinado a los 11 sistemas, propuestas y clasificaciones de jerarqui-
la necesidad de utilizacin de cada una de las iniciativas zacin de la evidencia y GR de mayor uso en la actualidad
Clasificacin Tratamiento Prevencin Etiologa Dao Pronstico Diagnstico Prevalencia Tamizaje Econmicos
CTFPHC X
SACKETT X X X X X X X
USPSTF X
CEBM X X X X X X X X
GRADE X
SIGN X
NICE X X X X
NHMRC X X X X X
PCCRP X
ADA X
ACCF/AHA X
Figura 18. Clasificaciones de niveles de evidencia y grados de recomendacin analizadas. Se puede observar que algunas de ellas son especficas para cierto tipo de escenarios.
(Figura 18); actualizacin de la informacin publicada y tomar de este modo decisiones sanitarias basando su
en 20096, documento en el que se plasm la informacin prctica en la mejor evidencia disponible. Se realiz
relacionada a las seis propuestas de jerarquizacin ms una bsqueda sistemtica de la literatura en las bases de
utilizadas en ese momento. datos PubMed y MEDLINE y en los buscadores Goo-
gle, Yahoo e Ixquick. Se obtuvo una gran cantidad de
informacin referente a niveles de evidencia y grados de
Resumen recomendacin, para finalmente resumir la informacin
de 11 de las propuestas ms utilizadas en la actualidad
Existen mltiples propuestas y clasificaciones que (CTFPHC, Sackett, USPSTF, CEBM, GRADE, SIGN,
jerarquizan la evidencia, que pueden confundir a quienes NICE, NHMRC, PCCRP, ADA y ACCF/AHA), entre las
se dedican a generar la evidencia tanto en evaluaciones que destaca la del GRADE WORKING GROUP, incor-
de tecnologa sanitaria, elaboracin de guas clnicas, etc. porada por alrededor de 90 organizaciones nacionales e
El objetivo de este artculo es actualizar la informacin y internacionales, tales como la World Health Organization,
describir las clasificaciones ms utilizadas para valorar The Cochrane Library, American College of Physicians,
la evidencia en el mbito de la salud, analizando sus American Thoracic Society, UpToDate, etc. y a nivel
principales diferencias y aplicaciones para que el usuario local por el Ministerio de Salud, para generar guas de
pueda elegir la que mejor se adapte a sus necesidades prctica clnica.
Referencias bibliogrficas 6.- Manterola C, Zavando D. (Grupo MINCIR). HJ; GRADE Working Group. GRADE: an
Cmo interpretar los Niveles de Evidencia en emerging consensus on rating quality of
1.- Sackett D L, Rosenberg W M, Gray J A, los diferentes escenarios clinicos. Rev Chil Cir evidence and strength of recommendations.
Haynes R B, Richardson W S. Evidence based 2009; 61: 582-95. Br Med J 2008; 336: 924-6.
medicine: what it is and what it isnt. Br Med J 7.- Birtwhistle R, Pottie K, Shaw E, Dickinson J A, 11.- Sackett D L. Rules of evidence and clinical
1996; 312: 71-2. Brauer P, Fortin M, et al. Canadian Task Force recommendations on the use of antithrombotic
2.- Sackett D L, Richardson W S, Rosenberg W H on Preventive Health Care: were back! Can agents. Chest 1989; 95 (2 Suppl): 2S-4S.
R. Evidence-based medicine: how to practice Fam Physician 2012; 58: 13-5. 12.- Harris R P, Helfand M, Woolf S H, Lohr K N,
and teach EBM. (Churchill Livingstone, 2000). 8.- Canadian Task Force on Preventive Health Care. Mulrow C D, Teutsch S M, et al; Methods Work
3.- Evidence-Based Medicine Working Group. New grades for recommendations from the Group, Third US Preventive Services Task
Evidence-based medicine. A new approach to Canadian Task Force on Preventive Health Care. Force. Current methods of the US Preventive
teaching the practice of medicine. JAMA 1992; Can Med Assoc J 2003; 169: 207-8. Services Task Force: a review of the process.
268: 2420-5. 9.- Canadian Task Force on Preventive Health Am J Prev Med 2001; 20 (3 Suppl): 21-35.
4.- Manterola C. Medicina basada en la evidencia Care. Putting prevention into practice. Grades of 13.- U.S. Preventive Services Task Force. Grade
o medicina basada en pruebas. Generalidades Recommendation, Assessment, Development, Definitions. Disponible en http://www.
acerca de su aplicacion en la practica clinica and Evaluation (GRADE) Working Group. uspreventiveservicestaskforce.org/uspstf/grades.
cotidiana. Rev Med Clin Condes 2009; 20: Disponible en http://canadiantaskforce.ca/ htm. (acceso el 13 de febrero de 2014).
125-30. methods/grade. (acceso el 10 de marzo de 14.- Centre for Evidence-based Medicine
5.- Manterola C. Medicina basada en la evidencia. 2014). (CEBM)-Levels of Evidence (March 2009).
Conceptos generales y razones para aplicacion 10.- Guyatt G H, Oxman A D, Vist G E, Kunz R, Disponible en http://www.cebm.net/index.
en cirugia. Rev Chil Cir 2002; 55: 550-4. Falck-Ytter Y, Alonso-Coello P, Schnemann aspx?o=1025. (acceso el 15 de febrero de 2014).
15.- Centre for Evidence-based Medicine 22.- Harbour R, Miller J. A new system for grading College of Cardiology Foundation/American
(CEBM)-Levels of Evidence (2011). Disponible recommendations in evidence based guidelines. Heart Association Task Force on Practice
en http://www.cebm.net/mod_product/design/ Br Med J 2001; 323: 334-6. Guidelines. 2010 ACCF/AHA guideline
files/CEBM-Levels-of-Evidence-2.1.pdf. 23.- National Institute for Health and Care for assessment of cardiovascular risk in
(acceso el 16 de febrero de 2014). Excellence. NICE web page. Disponible en asymptomatic adults: executive summary: a
16.- Howick J, Chalmers I, Glasziou P, http://www.nice.org.uk. (acceso el 21 de febrero report of the American College of Cardiology
Greenhalgh T, Heneghan C, Liberati A, de 2014). Foundation/American Heart Association Task
et al. Explanation of the 2011 Oxford 24.- NICE. The guidelines manual: consultation Force on Practice Guidelines. Circulation 2010;
Centre for Evidence-Based Medicine on the 2012 update. Disponible en http:// 122: 2748-64.
(OCEBM) Levels of Evidence (Background www.nice.org.uk/aboutnice/howwework/ 30.- Agency for Healthcare Research and Quality
Document). (2011). Disponible en http://www. developingniceclinicalguidelines/ (AHRQ). EPC Evidence Reports [Internet].
cebm.net/index.aspx?o=5653. (acceso el 16 de GuidelinesManualConsultation2012.jsp. (acceso Rockville: AHRQ. Disponible en http://www.
febrero de 2014). el 21 de febrero de 2014). ahrq.gov/clinic/epcindex.htm#methodology.
17.- Canfield S E, Dahm P. Rating the quality 25.- Merlin T, Weston A, Tooher R. Extending an (acceso el 19 de marzo de 2014).
of evidence and the strength of evidence hierarchy to include topics other than 31.- Jovell A J, Navarro-Rubio M D. Evaluacin de
recommendations using GRADE. World treatment: revising the Australian levels of la evidencia cientfica. Med Clin (Barc) 1995;
J Urol 2011; 29: 311-7. evidence. BMC Med Res Methodol 2009; 9: 105: 740-3.
18.- Guyatt G, Oxman A D, Akl E A, Kunz R, 34. 32.- Canadian Asthma Consensus Group. Disponible
Vist G, Brozek J, et al. GRADE guidelines: 1. 26.- PCCRP Document Section I. PCCRP web page. en http://www.lung.ca/cts-sct/pdf/Adult_
Introduction-GRADE evidence profiles and Disponible en http://www.pccrp.org. (acceso el Asthma_Consensus.pdf. (acceso el 19 de marzo
summary of findings tables. J Clin Epidemiol 21 de febrero de 2014). de 2014).
2011; 64: 383-94. 27.- Phillips B, Ball C, Sackett D, Badenoch D, 33.- NANDA-I. Disponible en http://
19.- Guyatt G, Gutterman D, Baumann M H, Straus S, Haynes B D M: The Oxford Centre eldiagnosticoenfermero.blogspot.com.
Addrizzo-Harris D, Hylek E M, Phillips B, et al. for Evidence-based Medicine Levels of es/2010/12/niveles-de-evidencia-de-la.html.
Grading strength of recommendations and Evidence. Levels of Evidence and Grades of (acceso el 19 de marzo de 2014).
quality of evidence in clinical guidelines: report Recommendation (2001). Disponible en http:// 34.- Niveles de evidencia. Servicio Andaluz
from an American College of Chest Physicians www.cebm.net/levels_of_evidence.asp. (acceso de Salud. Disponible en http://www.
Task Force. Chest 2006; 129: 174-81. el 21 de febrero de 2014). juntadeandalucia.es/servicioandaluzdesalud/
20.- SIGN. Methodological principles. Disponible en 28.- American Diabetes Association. Introduction. hrs3/index.php?id=manual_procedimientos_
http://www.sign.ac.uk/methodology/index.html. ADA evidence-grading system for clinical niveles. (acceso el 19 de marzo de 2014).
(acceso el 18 de febrero de 2014). practice recommendations. Diabetes Care 35.- Ebell M H, Siwek J, Weiss B D, Woolf S H,
21.- SIGN. SIGN 50 a guideline developers 2008;31:S1-S2. Disponible en http://care. Susman J, Ewigman B, et al. Strength
handbook. (Scottish Intercollegiate Guidelines diabetesjournals.org/content/31/Supplement_1/ of Recommendation Taxonomy (SORT):
Network, 2011). Disponible en http://www.sign. S1.full. (acceso el 22 de febrero de 2014). a patient-centered approach to grading evidence
ac.uk/guidelines/fulltext/50/index.html. (acceso 29.- Greenland P, Alpert J S, Beller G A, Benjamin in the medical literature. Am Fam Physician
el 18 de febrero de 2014). E J, Budoff M J, Fayad Z A, et al; American 2004; 69: 548-56.