Você está na página 1de 19

APÉNDICE

El proceso de selección de una escala


en salud: aplicación directa o validación
Edith Mireya Mora
Carlos Humberto Torres
Juan Camilo Aponte

El ser humano siempre ha tratado de explicar los fenómenos que le


suceden, para lo cual ha desarrollado sistemas de medición. La medición es
algo natural, somos medidos y usamos la medición en todas las etapas de la
vida, ya que esto nos permite definir o establecer atributos a los cuales se les
puede asignar un valor y de esta manera poderlos ponderar o calificar. La
epidemiología es una ciencia que no se ha apartado de este tipo de conceptos y
ha tratado de volver cada vez más objetivas las diferentes técnicas empleadas
para medir eventos de manera que independiente de quien los realice o el
momento en que se haga, los resultados sean confiables y válidos.

Cuando se inicia un proceso de medición solo existen dos alternativas:


diseñar y validar los instrumentos que permitan medir el evento estudiado
o utilizar instrumentos ya probados. El presente capítulo inicia con los
elementos que deben ser evaluados en un artículo en el que se valida una
escala (lectura crítica de la literatura) y continua con los aspectos que se
deben contemplar cuando la metodología con la que se ha validado la escala
no cumpla con los requisitos establecidos.

En el proceso de medición, existen cuatro conceptos fundamentales1:

1. Una escala, es un instrumento de medición, que consiste en


un conjunto de preguntas encaminadas a revelar determinados
niveles de una categoría o variable.2,3

2. El instrumento ideal, es aquel que permite registrar los datos que


realmente describen el evento o fenómeno que se estudia. En
402 Temas de Psicología Evolutiva y Psiquiatría Infantil

este aspecto se debe garantizar que la escala cumpla los criterios


en cuanto a validez (precisión) y confiabilidad (exactitud) que se
le exigen a una prueba de laboratorio o una imagen diagnóstica
cuando se utiliza para clasificar o estratificar una enfermedad4.
La evaluación de toda escala se fundamenta en la psicofísica y la
psicometría.

3. La psicofísica permite cuantificar las percepciones, para lo


cual se deben encontrar equivalencias en un sistema numérico
de fenómenos intangibles (síntomas, sensaciones, molestias,
malestares o similares).

4. La psicometría, permite estudiar la adecuación de la escala al


fenómeno que se va a medir y la calidad de su medición.

Por lo tanto, al seleccionar una escala se debe elegir el instrumento


ideal, que será aquel que permita obtener los resultados más validos (precisos)
y confiables (exactos) de las situaciones o fenómenos estudiados.

Un instrumento ideal debe4:

• Establecer altos estándares de confiabilidad y validez en los


nuevos grupos lingüísticos a ser aplicados

• Garantizar comparabilidad entre diferentes versiones de la misma


escala.

• Permitir procesos económicos, rápidos y eficientes.

• Ser mundialmente aceptada con el fin de efectuar estudios


multicéntricos

Etapas para la Validación


de una Escala1,2,3,4
El proceso de elección de un instrumento de medición inicia con
la definición del tema de estudio (constructo) que surge del grupo de
investigadores, continua con la búsqueda de la literatura publicada hasta el
momento, la lectura crítica de la información encontrada y, si luego de realizar
este proceso no se ha identificado el instrumento ideal para ser aplicado, se
debe proceder a la validación del instrumento que mejor se aproxime a la
definición del tema de estudio. Estas etapas se desarrollan a continuación.
Mora, Torres, Aponte 403

Comité de Revisión
Se requiere la conformación de un comité que revise y controle, todas
las actividades propias del proceso de elección del instrumento. Este comité
deberá estar conformado por al menos cinco personas, dentro de las cuales:
2 deben ser miembros del grupo encargado de la validación, 1 ó 2 personas
con experiencia en el área de aplicación del instrumento y conocimiento del
idioma nativo de la escala que se va a validar y 1 ó 2 personas que presenten
la condición a medir. Este comité es el encargado de definir el constructo.

Definición de constructo1
El tema objeto del estudio es lo que se denomina “constructo”. El
constructo debe tener varias áreas específicas o tópicos a tratar los cuales
se denominan dimensiones, factores o dominios. Los dominios a su vez
pueden considerar diferentes aspectos específicos cada uno de los cuales se
denominan ítems. Un ítem es la unidad básica de información de una escala
y se compone de una pregunta y una serie de posibilidades de respuesta.
Así entonces, un conjunto de ítems conforman un dominio o factor y un
conjunto coherente de factores conforman un constructo.

Búsqueda de la Literatura
En salud, hoy por hoy no es posible tan solo leer por leer. El volumen
de publicaciones crece a velocidades exponenciales con el agravante de la
desigualdad respecto a la calidad de los mismos, por lo que se hace necesario
aprender a utilizar herramientas que permitan realizar lectura critica de la
literatura científica. La lectura crítica ofrece la oportunidad de aumentar
las habilidades necesarias que permiten realzar la capacidad de elección,
discriminación y toma de decisiones en relación a un área del conocimiento
a partir de la mejor evidencia disponible de las publicaciones revisadas.

En todo proceso de validación de escalas, es necesario realizar una


búsqueda de la literatura disponible como herramienta para definir la teoría
que sustente los conceptos que motivaron el estudio, la cual debe identificar el
mayor número de postulados que sobre el tema diferentes autores o expertos
hayan realizado. La búsqueda debe ser lo suficientemente sensible para que
no se escape un artículo relevante, y a su vez lo suficientemente específica
para que no se pierda tiempo leyendo literatura que no le agregue valor al
tema objeto del estudio.
404 Temas de Psicología Evolutiva y Psiquiatría Infantil

En esta fase se deben tener en cuenta los siguientes aspectos5:

1. Formular la pregunta específica que se pretende responder.


Del constructo deben extraerse las palabras claves para realizar
la búsqueda. En términos generales, deben incluir: el evento
estudiado, uno o dos desenlaces principales y la población objeto
del estudio.
2. Seleccionar los recursos (motor) de búsqueda más apropiados
para llevarla a cabo, no siempre Google o PUBMED son las
mejores herramientas. Entre estos recursos podemos mencionar:
supermercados de información (OVID, Proquest, o MDconsult),
bases de datos de revistas publicadas (Pubmed, Lilacs, Embase),
buscadores de revistas (Google, Altavista, Free Medical Journals),
páginas web de revistas especializadas y/o revistas con análisis
critico de literatura (Cochrane, Medical Evidence, ACP Journal
Club), entre otras.
3. Diseñar la estrategia de búsqueda y obtener los artículos que se ajusten
a los criterios preestablecidos, lo que consiste en conectar las palabras
claves entre sí, y realizar ciertas restricciones o límites para obtener un
volumen suficiente pero no exagerado de artículos que puedan ser
susceptible de ser revisados a la luz de la literatura crítica
4. Seleccionar la información relevante para poder identificar
las escalas que potencialmente puedan servir, utilizando las
herramientas de la apreciación crítica de la literatura (validez de
apariencia, aplicabilidad, tipo de instrumento y control de sesgos
entre otros).

Lectura crítica para la validación de escalas


Según Guyatt5 la apreciación critica de literatura científica, se aborda
teniendo en cuenta tres aspectos fundamentales: validez del estudio,
resultados y aplicación en el contexto. Antes de estos aspectos existe uno
adicional que se denomina “pregunta de investigación” importante porque
delimita el tema del artículo a evaluar. El proceso de lectura crítica se dinamiza
al aplicar sistemáticamente cada uno de estos aspectos secuencialmente,
pues si el artículo no cumple o responde de manera admisible las preguntas
que evaluan a cada uno de ellos debe ser descartado. Lo anterior parte del
concepto que no existen artículos perfectos sino que se debe identificar los
defectos de cada uno y determinar como pueden afectar los resultados al
aplicar la escala.
Mora, Torres, Aponte 405

Las siguientes preguntas deben responderse durante la lectura crítica


de artículos relacionados con la validación de escalas. Como los conceptos
que se necesitan para responder estas preguntas están inmersos en dicho
proceso, para una mayor comprensión al lado de cada pregunta encontrará el
paso de referencia que permitirá ubicarlo en la tabla: “proceso de validación
de escalas que se presenta al final del capítulo”.

Preguntas* Pasos

1) ¿Cuál es la pregunta de investigación?


a) ¿Cuál fue el constructo evaluado? No. 0
b) ¿Cuál fue el tipo de escala evaluado? No. 6

2) ¿Son validos los resultados del estudio?


a) ¿Se consideraron todos los ítems importantes? No. 0
b) ¿Se probó la comprensión de los ítems de la escala? No. 2c

3) ¿Cuáles fueron los resultados del estudio?


a) ¿Qué tan valida es la escala? No. 3
b) ¿Qué tan confiable es la escala? No. 6
c) ¿Qué tanta sensibilidad al cambio tiene la escala? No. 4

4) ¿Son aplicables los resultados al entorno


donde la escala se va a utilizar?
a) ¿La escala se encuentra en el idioma en que
se va aplicar? No. 2
b) ¿Está la escala adaptada al entorno de aplicación? No.2b
c) ¿Es sencillo aplicar la escala? No. 5
* Adaptado de: Guyatt GH, Rennie D. Users’ Guides to the Medical Literature: A Manual for Evidence-
Based Clinical Practice. Edition July 2001. London. JAMA; 2001.

Para responder estas preguntas se deben tener en cuenta los conceptos


que se presentan a continuación.

1. ¿Cuál es la pregunta de investigación?

La pregunta de investigación es el punto de entrada al proceso de


selección de una escala, con ésta se perfecciona y estructura más formalmente
406 Temas de Psicología Evolutiva y Psiquiatría Infantil

la idea motivo de estudio. Quien quiera seleccionar este tipo de instrumento,


debe responder la siguiente pregunta: “¿Cuál es el problema al que se quiere
encontrar respuesta?”; una pregunta correctamente planteada hace que el
problema esté parcialmente resuelto, de modo que con una acertada pregunta
hay una mayor exactitud en la delimitación del problema, lo que aumenta
las posibilidades de alcanzar conclusiones satisfactorias, este es quizás el paso
más importante y muchas veces el más difícil de lograr.

La pregunta tienen algunas características que se deben tener en cuenta,


como: factibilidad es decir que se pueda contestar, interés o motivaciones para
encontrar la respuesta, novedad o producción de cambios en lo establecido,
ética que corresponde al respeto que se dá a los sujetos involucrados en los
estudios, relevancia que hace referencia a cómo y en que magnitud, se van
a ver afectadas las poblaciones con los resultados, justificación el porque
se planteó, pertinencia social que tanto los potenciales beneficios como
perjuicios se reflejaran en los pacientes, precisión concerniente a claridad,
disponibilidad de recursos que se cuente con ellos en el momento en que se
necesitan y consideraciones respecto al tiempo real de ejecución.

a. ¿Cuál fue el constructo evaluado?

Se debe concretar el constructo, es decir determinar cual es la


elaboración teórica del concepto, motivo del estudio. Sobre los constructos
teóricos se sabe de su existencia, pero deben ser transformados en variables
para que puedan ser considerados de forma operativa. Al definir un constructo
debemos especificar sus variables mediante evidencias empíricas observables
y medibles, con el fin de poder aplicar las diferentes pruebas estadísticas y
metodológicas. Si no se hace esto se caerá en el terreno de la filosofía o de la
opinión (válidas en su caso) pero incapaces de demostrar (o mejor, mostrar)
de una forma científica un hecho.

b. ¿Cuál fue el tipo de escala evaluado?

Definido el constructo a ser evaluado, el paso siguiente es determinar el


tipo de escala que se utilizó en el artículo revisado, ya que de ella dependieron
los resultados obtenidos. Las escalas pueden ser de tres tipos6:

• Escalas Discriminativas: Son aquellas utilizadas para establecer


diferencias en relación a una dimensión seleccionada. Su objetivo
es describir un estado o condición subyacente, para el cual no
existe un patrón de oro, como por ejemplo diferenciar entre la
presencia o ausencia de la condición medida o la magnitud del
Mora, Torres, Aponte 407

aspecto evaluado. En la validación de este tipo de escalas es


necesario realizar evaluaciones de confiabilidad prueba – reprueba
y de confiabilidad inter-evaluador.

• Escalas Predictivas: Son aquellas que permiten clasificar el evento


estudiado en categorías de interés de acuerdo a un criterio externo
disponible, esto es, un patrón de oro o un desenlace específico
como por ejemplo: la recaída de una enfermedad o la respuesta
a un tratamiento. Los instrumentos más comunes dentro de
esta categoría lo constituyen las pruebas diagnósticas y los
cuestionarios o entrevistas estructuradas. En la validación de este
tipo de escalas es necesario realizar evaluaciones de confiabilidad
prueba – reprueba, de confiabilidad inter-evaluador, y verificar si
se evaluó la validez de criterio.

• Escalas evaluativas: Son aquéllas utilizadas para evaluar la


magnitud de cambio en el tiempo, de una dimensión o de una
categoría de interés. Se usan primordialmente para medir la
evolución de una enfermedad o resultado de un tratamiento.
En la validación de este tipo de escalas es necesario realizar
evaluaciones de confiabilidad inter-evaluador y la confiabilidad
prueba-reprueba.

2. ¿Son válidos los resultados del estudio?

a. ¿Se consideraron todos los item importantes?

Hace referencia a los diferentes distractores planteados para realizar las


mediciones, se busca que hallan sido contempladas todas las posibilidades
que permiten encontrar la respuesta en estudio.

b. ¿Se probó la comprensión de los ítems de la escala?3,4,7,8

El artículo revisado debe incluir si se hizo una prueba piloto de la escala


o instrumento. El objetivo de realizar una prueba piloto es prevenir errores o
fallas durante la aplicación del material seleccionado, identificando posibles
dificultades en los item, la estrategia de recolección, la estimación de tiempo
o de costos, la disposición de tiempo de las personas, la dotación, aspectos de
la logística, el procesamiento de la información y el plan de trabajo. Para su
realización se debe garantizar que los sujetos tengan el mismo nivel educativo
y la misma patología o desenlace de interés de la población en la cual se va
408 Temas de Psicología Evolutiva y Psiquiatría Infantil

a aplicar el instrumento definitivo se debe solicitar a cada participante la


evaluación en cada ítem de los siguientes aspectos: grado de dificultad para
la respuesta, e identificación de las palabras que causen dificultad o duda en
su interpretación7. El grupo de investigación debe estar atento en esta etapa
a la interpretación de cada pregunta por los sujetos evaluados y a su forma
de respuesta.

En la prueba piloto se deben evaluar:

• entendimiento de los ítems como parte de la adaptación


transcultural,
• aspectos técnicos en la aplicación como: la claridad de
las instrucciones, el seguimiento a las instrucciones y las
recomendaciones impartidas al personal que aplica la escala,
así como la legibilidad de los formularios y la necesidad de
entrenamiento de los encuestadores
• aspectos logísticos: el método de selección y acceso a los sujetos
de investigación, espacios, tiempo de aplicación, traslados y,
distribución de funciones, entre otros.
En relación a la evaluación de cada ítem se debe considerar:8

• Compresión: En general, se dice que una pregunta debe ser


entendible por un niño de 8 a 10 años. En lo práctico, se debe
asegurar que las preguntas sean entendidas por personas con
un grado de escolaridad básico y que estén en el lenguaje más
sencillo posible.
• Ambigüedad: Se deben evitar el uso de palabras que impliquen
diferente interpretación de cada persona. Por ejemplo, la palabra
frecuentemente podría significar desde un 60% hasta un 90% de
las oportunidades, de acuerdo a cada sujeto. Es preferible utilizar
rangos claramente establecidos o frecuencias precisas.
• Redacción: Debe utilizarse el lenguaje más sencillo y coloquial
posible, evitando agregarle carga afectiva a las preguntas (las
preguntas deben formularse en tono neutral). Por ejemplo, es
preferible preguntar ¿Cómo le pareció la atención del servicio de
urgencias?, a preguntar ¿le pareció malo el tiempo de respuesta
del servicio de urgencias?
• Rango de Respuesta: Se debe verificar que las respuestas de
cada ítem sean exhaustivas (cubrir todas las posibles respuestas
a la pregunta) y excluyentes (para cada pregunta debe poderse
Mora, Torres, Aponte 409

escoger tan solo una y no mas de una respuesta). De igual manera


se debe evaluar la frecuencia de escogencia de las respuestas
extremas, para evitar el sesgo de “aversión a los extremos”
(tendencia a escoger las opciones centrales cuando existen gran
cantidad de opciones a elegir). De presentarse problemas con el
rango de respuesta en la evaluación de un ítem se debe pensar en
reformular o dividir la pregunta para evitarlo.
• Frecuencia de Respuesta: Consiste en determinar el número de
veces que se repite una respuesta en un determinado ítem. Si
en una pregunta el 90 o 95% de las personas marcan el mismo
distractor debe evaluarse si la pregunta está bien formulada, es
incomprensible, o simplemente no discrimina el aspecto deseado,
signo de que esta pregunta debe ser excluida o reformulada.

De esta manera, la prueba piloto debió convertirse en una herramienta


que permitió establecer el instrumento definitivo a implementar de acuerdo a
los inconvenientes y resultados encontrados a lo largo de su aplicación. Una
vez se realizan los ajustes del instrumento, de acuerdo a los resultados de
la prueba, se esta ante un instrumento validado que puede ser aplicado de
conformidad a los propósitos de la investigación que se pretende desarrollar.

3. ¿Cuáles fueron los resultados del estudio?

Una vez identificada la escala utilizada en el artículo, es necesario que


el lector la someta a un proceso de evaluación, con el propósito de identificar
si se determinó su aplicación como instrumento de medición del evento que
se pretendía estudiar, de manera que se hubiera determinado si “la escala o
instrumento media lo que decía medir.” Este proceso debe incluir:

a. ¿Qué tan valida es la escala?1,3,8

Las evaluaciones de validez: pretenden determinar si el resultado


obtenido corresponde realmente al fenómeno estudiado y no a otro. Incluye
realizar evaluaciones de validez de apariencia (la cual se considera el paso
más subjetivo de todos), validez de contenido, validez de constructo y validez
de criterio.

b. ¿Qué tan confiable es la escala?1,3,8

Las evaluaciones de confiabilidad, consistencia, reproducibilidad o


precisión consisten en determinar la capacidad de la escala para proveer
los mismos resultados en mediciones sucesivas. Al evaluar la escala se
410 Temas de Psicología Evolutiva y Psiquiatría Infantil

debe medir el mismo constructo cada vez que se aplica, no importa si se


cambia alguna circunstancia externa (las personas que la aplican, las que lo
responden, el tiempo que se emplea, o la situación en la que se realiza). La
evaluación de confiabilidad incluye pruebas que miden la homogeneidad en
la escala (pruebas relacionadas con el instrumento) y las pruebas que miden
la estabilidad de la escala. A su vez las pruebas de estabilidad se pueden
clasificar en pruebas relacionadas con el tiempo y pruebas relacionadas con
la aplicación por diferentes personas. En las evaluaciones de confiabilidad
se puede estimar la proporción de la variabilidad debida a las verdaderas
diferencias entre individuos. En general, se podría afirmar que Coeficientes
por encima de 0.8 sugieren consistencia o confiabilidad adecuadas.

c. ¿Qué tanta sensibilidad al cambio tiene la escala?1,8

Se refiere a la propiedad de la escala para detectar las variaciones o


cambios que se presentan en el fenómeno medido. Para la evaluación se
requiere aplicar la escala de manera repetida en el mismo sujeto, o bien de
la aplicación de la escala a diferentes poblaciones en las cuales se piense que
el constructo será calificado de manera muy diferente.

4. ¿Son aplicables los resultados al entorno donde la escala


se va a utilizar?

a. ¿La escala se encuentra en el idioma en que se va aplicar?8

Si la escala seleccionada estaba en un idioma diferente al de la población


donde se aplicó, el primer paso debió ser la traducción con el objetivo de
lograr lo que algunos autores han llamado “equivalencia translinguistica”
entre el instrumento original y el traducido. Se recomienda que para la
versión en el idioma original se hayan realizado 2 traducciones por parte
de personal calificado, bilingüe, con habla nativa en el idioma que se va
a aplicar la escala y algún conocimiento del área objeto del estudio. Estas
versiones debieron ser evaluadas por un comité de traducción constituido
al menos por 5 personas quienes debieron escoger la versión más adecuada
o ensamblar un documento derivado de las 2 versiones obtenidas, el cual
debió ser nuevamente traducido al idioma original, por dos personas que
cumplieron con los criterios antes mencionados.

b. ¿Está la escala adaptada al entorno de aplicación?1,3,4,8

Una vez se encuentra el documento en el idioma a ser aplicado, se


debe iniciar el proceso de “adaptación transcultural”, fundamentado en el
Mora, Torres, Aponte 411

hecho de que las diferencias en lenguas y culturas también pueden afectar la


medición a través de la escala seleccionada y se requieren instrumentos de
medida que hayan sido suficientemente probados, ya sea para diagnóstico,
pronóstico o seguimiento. En este orden de ideas se debe tratar de generar
instrumentos universales de medición que sean comprensibles, fáciles de
aplicar, válidos y reproducibles. Los objetivos de una adaptación transcultural
son: adaptar la escala al contexto cultural, evaluar los aspectos técnicos de
su aplicación y administración y asegurar la adecuada interpretación de las
medidas en la población de estudio.

En otras palabras, la “adaptación transcultural” pretende garantizar la


“equivalencia métrica” entre la escala en el contexto donde se creó y en el
que se va a utilizar. Se refiere a cambiar y ajustar los términos al lenguaje local
(bacinilla o pómelo, por ejemplo) o preguntas específicas del sitio (¿cuál es el
alcalde actual de Madrid? ¿Cuál es su jugador de jockey preferido?), revisar
los conceptos y significados de las palabras usadas. Para esta adaptación se
debe aplicar una metodología que garantice la reducción de sesgos culturales
y que maximice la utilidad de la escala.

El documento final debió ser evaluado por el comité de revisión. En


caso de que las dos versiones hayan sido similares, ésta etapa culminaría.
Sin embargo, si existieron diferencias significativas que pudieron alterar los
resultados, o la comprensión se debió enviar la nueva versión al autor de
la escala con el fin de obtener sus sugerencias y recomendaciones como
experto en la materia.

c. ¿Es sencillo aplicar la escala?8

Consiste en determinar la utilidad de la escala, estableciendo si la escala


o instrumento de medición seleccionado se puede utilizar y aplicar fácilmente
en la vida real. Se debe tener en cuenta que el tiempo de diligenciamiento
y aplicación no sea excesivo, pues una escala en que sea largo el tiempo
de aplicación disminuye la colaboración y atención del sujeto evaluado y
puede ir en detrimento de la confiabilidad del instrumento. De otra parte, la
necesidad de entrenamiento y la facilidad para su calificación hacen también
que entre menos entrenamiento sea necesario y más sencilla su calificación,
más fácil será su aplicación.

Si al finalizar la lectura crítica de los artículos seleccionados no existen


respuestas satisfactorias o estas son inciertas y/o confusas que hagan que no
se confíe en los resultados, se debe iniciar el proceso de validación de una
nueva escala siguiendo los pasos que se esquematizan en la tabla “proceso
de validación de escalas” que se presenta a continuación:
Proceso de validación de escalas
412
Paso PROPÓSITOS U ¿QUIEN?
QUE HACER? ESPECIFICACIONES ACTIVIDADES (CÔMO) RESULTADOS ESPERADOS
No. OBJETIVOS RESPONSABLE

Definición del
Delimitar el problema que Búsqueda de la literatura Comité de
0 tema u objeto de Definición del constructo
se va estudiar Opinión de expertos. revisión
estudio

Establecer los
Identificar las escalas que
instrumentos Acopio del mayor número
se han utilizado como
disponibles Comité de de instrumentos que podrían
1 instrumento de medición y Revisión de la literatura publicada y no publicada.
relacionados con revisión aplicarse para la medición del
han sido aplicado en otros
el tema objeto del evento objeto del estudio.
contextos
estudio

1. Validez de apariencia: Determinar si el


instrumento permitirá evaluar o medir el
evento objeto del estudio
Determinar el mejor
Temas de Psicología Evolutiva y Psiquiatría Infantil

2. Aplicabilidad: Establecer si el instrumento


instrumento para la podrá aplicarse en la población objeto del
medición del evento objeto estudio.
del estudio mediante la 3. Tipo de instrumento: Establecer las
evaluación de: 1. Confrontación de las especificaciones con la
características que debería tener del
Selección de la 1. Validez de apariencia experiencia y el conocimiento sobre el tema objeto Comité de Elección de un instrumento
2 instrumeno a utilizar
escala a validar 2. Aplicabilidad del estudio y/o revisión para validación
4. Diseño de los item: Las caracteristicas
3. Tipo de instrumento 2. Consulta de expertos
del evento pueden medirse a traves de los
4. Diseño de los ítems items que presenta el instrumento
5. Tipo de respuestas 5. Tipo de respuestas escalares: Las
escalares respuestas son susceptibles de análisis
6. Control de sesgos estadístico
6. Control de sesgos: El instrumento
permite identificar posibles sesgos

Instrumento adecuado
Mantener el sentido
Ajuste de los terminos utilizados en el instrumento Personal linguisticamente al idioma
2A Traducciones conceptual de la escala
seleccionado al idioma del lugar donde se aplicará calificado de la población donde se
original
aplicará.
Paso PROPÓSITOS U ¿QUIEN?
QUE HACER? ESPECIFICACIONES ACTIVIDADES (CÔMO) RESULTADOS ESPERADOS
No. OBJETIVOS RESPONSABLE

Instrumento adecuado
Mantener la Ajuste cultural del instrumento al entorno en
culturalmente a la poblaciòn
Adecuación conceptualización de la el cual se va a aplicar (modismos propios de la Comité de
2B donde se aplicará, el cual se
transcultrual escala seleccionada en el región y conceptos o significados de las palabras revisión
denominarà versión oficial del
ámbito de aplicación en el sitio de aplicaciòn del instrumento)
instrumento.

Aplicación de la
escala para evaluar el
instrumento (medición de
variables, distractores) en
terminos de:
- Lenguaje, expresión y 1. Comprensión
Prueba piloto 1. Selección del grupo donde se aplicará el
estilo a utilizar. 2. Claridad
(pretest cognitivo, instrumento (ver página 407) Comité de Versión oficial del instrumento
2C - Ajuste de aspectos 3. Redacción
según algunos 2. Aplicación del instrumento revisión ajustada
logísticos 4. Rango de respuesta
autores) 3- Evaluación de resultados
- Evaluación de los 5. Frecuencia de respuesta
sistemas de recolección y
manejo de la información
- Evaluaciòn del
funcionamiento del
equipo.

3 Pruebas de validez Analizar la escala y dictaminar que el resultado obtenido corresponda al fenómeno real y no a otro. Determinar la exactitud del instrumento

Validez de Apariencia
¿La escala mide lo que Concepto del grupo de
Determinar la aceptabilidad que puede
debe medir?. De acuerdo Revisión de la versión oficial del instrumento por experto en el que se precise
tener la escala en el escenario de aplicación Comité de
3A a los conceptos de los un grupo de expertos. que “La escala aparentemente
de manera que efectivamente mida lo que revisión
expertos si el instrumento La decisión se toma por conceso mide lo que se pretende
Mora, Torres, Aponte

se pretende medir.
en apariencia mide las medir”
cualidades deseadas.
413
414

Paso PROPÓSITOS U ¿QUIEN?


QUE HACER? ESPECIFICACIONES ACTIVIDADES (CÔMO) RESULTADOS ESPERADOS
No. OBJETIVOS RESPONSABLE

Validez de contenido
Consistencia de relación
entre los objetivos Determinar si cada una de las áreas
Determinar como representan
del estudio y las temáticas que se están midiendo está
los dominios (por medio de
preguntas o enunciados representado por un dominio. Los
Validación de ítems/dominios por grupo de los ítems) las diferentes áreas
correspondientes dominios de mayor peso generalmente
expertos, por medio del análisis factorial se Comité de temáticas del estudio.
3B ¿La escala refleja en tienen mayor número de ítems. Debe
determina el paso de los dominios. revisión Pruebas estadísticas de análisis
sus dominios el evento considerarse que algunos dominios
Cinco pacientes por item a evaluar. Máximo 100 factorial.
estudiado? corresponden a situaciones que se piensa
paciente por instrumento Retirar items que no aportan
Dominio:Caracterísìstica pueden representar el fenómeno que se
variabilidad a la mediciòn.
que se pretende evaluar quiere medir (representaciones teóricas)
o medir mediante un
conjunto de items
Temas de Psicología Evolutiva y Psiquiatría Infantil

Validez de constructo:
Medida que expresa el
grado de correlación Determinar que los resultados
entre el instrumento Aplicar otros instrumentos para medir la al aplicar la versión oficial del
Comparación con otros instrumentos que
seleccionado y otras caracteristica a estudio y contrastar los resultados instrumento, son comparables
midan la misma condición o evaluar Comité de
3C pruebas aceptadas como obtenidos con la escala que se está validando. con los resultados de aplicar
valores de correlación mediante estructuras revisión
validas para el mismo Al análisis factorial permite determinar el peso de instrumentos similares.
matriciales
grupo de sujetos los dominios. Pruebas estadísticas de análisis
¿Funciona de manera factorial
similar a otros
instrumentos?
Paso PROPÓSITOS U ¿QUIEN?
QUE HACER? ESPECIFICACIONES ACTIVIDADES (CÔMO) RESULTADOS ESPERADOS
No. OBJETIVOS RESPONSABLE

El coeficiente de Pearson
Aplica únicamente cuando hay un patrón
debe variar entre 03 y 0.8:
de oro o de referencia.
Validez de criterio - Si es mayor de 0.8 no tiene
- Validez concurrente: Correlacionar el Mediante coeficiente de Pearson:
¿Funciona de manera sentido aplicar la escala nueva
resultado actual del instrumento con el Prueba estadística para establecer la magnitud de
similar al patrón de oro? Comité de porque funciona de manera
3D resultado de aplicar el patrón de oro relación entre las mediciones de dos variables.
Patrón de oro: La mejor revisión similar al gold estándar
- Validez predictiva: Correlacionar el Presenta indices con valores postivos o negativos
escala disponible en el área - Si es menor de 0.3 es
resultado actual del instrumento con un con valor de 0 a 1
de aplicación. probable que la escala mida
evento relacionado que ocurrirá en el
un fenómeno diferente al que
futuro
se pretende evaluar

Sensibilidad al cambio: Comparar una puntuación inicial con una


¿Puede la escala medir posterior en un momento en el cual se haya La escala detecta las
Poder medir cambios en la respuesta o
los cambios cuando la modificado el evento estudiado Comité de variaciones o cambios que
4 evento estudiado en diferentes momentos a
condición que se esta Aplicar la escala repetidamente en un mismo revisión se presentan a lo largo del
lo largo del tiempo
estudiando es alterada? sujeto. Los resultados se compraran mediante tiempo en el evento estudiado
análisis de covarianza

* Describir el tiempo promedio requerido


para aplicar el instrumento
*Identificar la necesidad de las condiciones
Corto tiempo de aplicación
particulares en las cuales haya que poner al
Escaso o ningun
Utilidad práctica sujeto antes de iniciar el procedimiento.
entrenamiento especial para
¿Se puede aplicar y utilizar * Establecer el grado de capacitación Aplicar el instrumento y evaluar los criterios Comité de
5 su aplicación
la escala fácilmente en la o calificación profesional que requieren especificados revisión
Evitar ítems que requieren
vida real? quienes se encargarán de aplicar el
algortimos complicados para
instrumento.
la calificación
Mora, Torres, Aponte

* Registrar el tiempo, la forma y el método


requerido para calificar el puntaje de la
escala.
415
416
Paso PROPÓSITOS U ¿QUIEN?
QUE HACER? ESPECIFICACIONES ACTIVIDADES (CÔMO) RESULTADOS ESPERADOS
No. OBJETIVOS RESPONSABLE

Mediante pruebas estadísticas determinar


si la escla funciona de manera similar
bajo diferentes condiciones dependiendo Instumento Discriminativo: Evaluar
del mismo intrumento, del tiempo de de - La confiabilidad test-retest explorando la
aplicación y del evaluador capacidad del instrumento para dar el mismo
Las pruebas de confiabilidad varian según resultado en una nueva aplicación. Se realiza
el tipo de instrumento: implementando el instrumento en dos ocasiones En general, para estas pruebas
Discriminativo: Permiten hacer diferencias diferentes despues de un pequeño lapso de se aceptan estos rangos de
entre individuos en relaciòn a una tiempo con un intervalo entre 15 y 30 días a un confiabilidad (especialmente
Pruebas de dimensión seleccionada, cuando no existe mínimo de 30 personas. Se evalua la correlación para Kappa)
confiabilidad Evaluar la escala segùn la patrón de oro. mediante el coefciente de pearson (para datos Comité de Pobre: <0
6
según el tipo de pregunta del estudio Predictivo: Permiten clasificar los eventos continuos) y coeficiente de correlación por rangos revisión Leve: 0 - 0,2
instrumento en categorìas de interes de acuerdo con un de Spearman (para datos categóricos). Baja: 0,21 - 0,4
criterio externo disponible (patron de oro o - La confiabilidad inter-evaluador consiste en Moderada: 0,41 - 0,6
desenlace específico). El instrumento debe realizar una evaluación independiente de por lo Buena: 0,61 - 0,8
ser estable a largo del tiempo y por lo tanto menos 15 personas por dos o mas evaluadores. Casi Perfecta: 0,81 - 1
Temas de Psicología Evolutiva y Psiquiatría Infantil

requiere alta y estable variabilidad entre Los resultados se comparan mediante prueba de
sujetos y no debe haber mayor variación condordancia Kappa (para datos discretos) o por
del puntaje total a traves del tiempo. coeficientes de corelación intraclase (para datos
Evaluativo: Permiten evaluar la magnitud continuos)
del cambio en el tiempo en una dimensión
o categoría de ínteres

Instumento predictivo: En general, para estas pruebas


- Prueba test-retest: Prueba de concordancia se aceptan estos rangos de
mediante indice de kappa confiabilidad (especialmente
- Confiabilidad intra-individual: Mediante pruebas para Kappa)
estadísticas se determina la correlación entre Comité de Pobre: <0
6A
los valores repetidos obtenidos por un mismo revisión Leve: 0 - 0,2
evaluador. Se establece a traves de la prueba de Baja: 0,21 - 0,4
condordancia Kappa (para datos discretos) o por Moderada: 0,41 - 0,6
coeficientes de correlación intraclase (para datos Buena: 0,61 - 0,8
continuos) Casi Perfecta: 0,81 - 1
Paso PROPÓSITOS U ¿QUIEN?
QUE HACER? ESPECIFICACIONES ACTIVIDADES (CÔMO) RESULTADOS ESPERADOS
No. OBJETIVOS RESPONSABLE

Instumento predictivo: En general, para estas pruebas


- Prueba test-retest: Prueba de concordancia se aceptan estos rangos de
mediante indice de kappa confiabilidad (especialmente
- Confiabilidad intra-individual: Mediante pruebas para Kappa)
estadísticas se determina la correlación entre Comité de Pobre: <0
6A
los valores repetidos obtenidos por un mismo revisión Leve: 0 - 0,2
evaluador. Se establece a traves de la prueba de Baja: 0,21 - 0,4
condordancia Kappa (para datos discretos) o por Moderada: 0,41 - 0,6
coeficientes de correlación intraclase (para datos Buena: 0,61 - 0,8
continuos) Casi Perfecta: 0,81 - 1

Instumento evaluativo: La confibilaidad test-


retest e intra-individual están estrechamente
Ej: Prueba apareada t-student,
relacionadas con la magnitud de la varibilidad
prueba Wilcoxon, prueba de
intra-individual
Friedman o coeficiente de
- Prueba test-retest:Las prueban deben aplicarse
concordancia de Kendall
en un cortro intervalo de tiempo de manero que
En general, para estas pruebas
no permita cambios en el evento evaluado Grupo
se aceptan estos rangos de
- Confiabilidad intra-individual: Mediante pruebas encargado
6B confiabilidad:
para muestras no independientes de acuerdo de hacer la
Pobre: <0
con el tipo de variable (Ej: Prueba apareada validación.
Leve: 0 - 0,2
t-student, prueba Wilcoxon, prueba de Friedman
Baja: 0,21 - 0,4
o coeficiente de concordancia de Kendall)
Moderada: 0,41 - 0,6
y determinando la varianza intraindivuidual
Buena: 0,61 - 0,8
calculando la desviación estándar de los puntajes
Casi Perfecta: 0,81 - 1
de cada sujeto y el promedio de éstas entre los
Mora, Torres, Aponte

sujetos
417
Paso PROPÓSITOS U ¿QUIEN?
QUE HACER? ESPECIFICACIONES ACTIVIDADES (CÔMO) RESULTADOS ESPERADOS
No. OBJETIVOS RESPONSABLE 418
1. KR - 20 (Fórmula de
Relacionados con el instrumento Kunder Richarson), para
Revisar los ítems que conforman la respuestas dicotómicas.
Relacionados con el instrumento:
escala, para verificar si tienen niveles de 2. Alfa de Cronbach (21) para
Establecer si los ítems que miden un mismo
correlación entre ellos, si conforman una ítems cuya respuesta incluyen
dominio estan más correlacionados entre si
estructura y tienen estabilidad. mas de dos alternativas.
Determinar el error que los ítem que miden diferentes dominios
Pruebas de Relacionados con el tiempo Grupo En general, para estas pruebas
que puede generar un (Consistencia Interna), mediante medios
confiabilidad Evaluar si la escala cuando de aplica en encargado se aceptan estos rangos de
6C instrumento al ser inestable estadìsticos:
relacionadas con diferentes momentos permaneciendo de hacer la confiabilidad:
y aplicarse en diferentes 1. KR - 20 (Fórmula de Kunder Richarson), para
el constructo estable la condición que se mide, mantiene validación. Pobre: <0
condiciones respuestas dicotómicas.
un resultado similar en la medición. Leve: 0 - 0,2
2. Alfa de Cronbach (21) para ítems cuya
Relacionados con la aplicación por Baja: 0,21 - 0,4
respuesta incluye mas de dos alternativas.
diferentes personas. Moderada: 0,41 - 0,6
Determinar si la escala presenta variaciones Buena: 0,61 - 0,8
dependiendo de quien realiza la evaluaciòn Casi Perfecta: 0,81 - 1

Relacionados con el tiempo de aplicación


Confiabilidad test - retest
Temas de Psicología Evolutiva y Psiquiatría Infantil

Se aplica la escala por lo menos dos veces, en Coeficiente de correlación


diferentes momentos, en situaciones de estabilidad intraclase: Debe ser mayor
del evento estudiado. Se puede evaluar mediante: de 0.8. Se inerpreta como el
- Coeficiente de correlación de Pearson: Evalua porcentaje de la variabilidad
como se relacionan los puntajes de los diferentes de los puntajes que dependen
Comité de
6D momentos, en términos de asociación lineal. Poco solo de la variabilidad entre
revisión
utilizado dado que asume que toda la vairanza es los sujetos medidos. Ej: Si
explicada por la diferencia entre los sujetos el valor es 0.9 significa que
- Coeficiente de relación intraclase: Incorpora el 90% de la varianza de los
en el análisis la variabilidad entre los sujetos, puntajes dependen solo de la
diferentes observadores, carácteristicas de los variabilidad de los sujetos
pacientes. Se calcula mediante ANOVA (Análsis
de varianza de mediciones repetidas)

Relacionados con la aplicación por diferentes


persona:
Puntajes similares al aplicar la
Confiabilidad inter-evaluador: Si en el mismo
Comité de escala en el mismo momento
6E momento, ante el mismo paciente la escala es
revisión y en el mismo paciente
aplicada por diferentes observadores previamente
diferentes observadores
estandarizados, los resultados de la medición
deben se similares..
Mora, Torres, Aponte 419

Referencias
1. Streiner D.L. Health Measurment Scales. 3rd Edition. Oxford University
Press. 2004.
2. Gómez C, Ospina MB. Adaptación y validación de escalas. Investigación
Clínica. Epidemiología Clínica Aplicada. CEJA, 2001. 69-82.
3. Gómez C, Ospina MB. Desarrollo de cuestionarios, adaptación y
validación de escalas. En: Ruíz M A, Morillo Z Luis. Epidemiología
clínica. investigación clínica aplicada. 1a ed. Bogotá, DC, Colombia:
Panamericana; 2004. p. 163-80.
4. Martín MC. Diseño y validación de cuestionarios. Matronas Profesión
2004; vol. 5(17): 23-29.
5. Guyatt GH, Rennie D. Users’ Guides to the Medical Literature: A Manual
for Evidence-Based Clinical Practice. Edition July 2001. London. JAMA;
2001.
6. Gómez C, Ospina MB. Adaptación y validación de escalas. Investigación
Clínica. Epidemiología Clínica Aplicada.Bogotá, D.C., Colombia: Centro
Editorial Javeriano, CEJA, 2001. p.69-84.
7. Phillip MR.”Evaluation and Revision of translated Western Escales”. En
Wang XD. Rating Scalesr Mental Health.Beijing: Chineese Journal of
Mental Health; 1993. p. 343-51. (Unpublished translation).
8. Sanchez, Ricardo y Echeverry, Jairo. Validación de escalas de medición
en salud. Rev. salud pública. [online]. nov. 2004, vol.6, no.3 [citado 05
Julio 2007], p.302-318. Disponible en la World Wide Web: http://www.
scielo.org.co/scielo.php?script=sci_arttext&pid=S0124- 00642004000
300006&lng=es&nrm=iso>. ISSN 0124-0064.

Você também pode gostar