Escolar Documentos
Profissional Documentos
Cultura Documentos
Validacin psicomtrica
Cabe agregar que un instrumento de medicin puede ser confiable pero no vlido,
puede medir consistentemente un aspecto ms no medir lo que pretende medir el
investigador. Por ello es requisito que un instrumento de medicin que demuestre
ser confiable y vlido.
Mtodo de mitades divididas. Aqu se administra un solo instrumento, una sola vez,
pero se dividen las preguntas o los tems (Por ejemplo, los tems pares con respecto
a los impares, o la primera mitad con respecto a la segunda mitad). Si correlacionan
los resultados de las dos partes, se considera el instrumento confiable. Ahora bien,
la confiabilidad vara de acuerdo al nmero de tems de la prueba. Cuantos ms
tem mayor es la confiabilidad.
Como sealan algunos autores (Hambleton y Bollwark, 1991; Wesbury, 1992), los
estudios comparativos deberan de usarse para comprender las semejanzas y
diferencias entre los grupos analizados, pero nunca para establecer comparaciones
sin ms. Y no es adecuado establecerlas porque raramente encontraremos dos
comunidades que sean equiparables completamente en aspectos tan influyentes
como motivacin a la hora de hacer las pruebas, curricula escolares, valores
culturales, nivel de vida, polticas educativas, oportunidades de acceso a la
educacin, etc.
Finalmente, para interpretar las puntuaciones el psiclogo debe de disponer de una
documentacin exhaustiva acerca de cmo se llev a cabo el proceso de
adaptacin. El manual del test deber incluir todo tipo de detalles del proceso
adaptativo, que en determinadas circunstancias pueden dar las claves
interpretativas de un resultado.
Directrices para la adaptacin de los tests
Para tratar de minimizar los errores en las cuatro grandes reas citadas (contexto,
adaptacin, aplicacin e interpretacin), el Comit de la Comisin Internacional de
Tests (ITC), propuso recomendar veintids directrices que se consideran claves para
una correcta adaptacin o construccin simultnea de los tests psicolgicos y
educativos.
Contexto
1. Los efectos de las diferencias culturales que no sean relevantes para los objetivos
centrales del estudio deberan minimizarse en la medida de lo posible.
2. Debera de evaluarse la cuanta del solapamiento de los constructos en las
poblaciones de inters.
Adaptacin del test
1. Los constructores/editores de tests deberan de asegurar que el proceso de
adaptacin tiene en cuenta las diferencias lingsticas y culturales entre las
poblaciones a las que se dirigen las versiones adaptadas del test.
2. Los constructores/editores de los tests deberan de proporcionar datos que
garanticen que el lenguaje utilizado en las instrucciones, en los propios tems y en
el manual del test, son apropiados para todas las poblaciones culturales e
idiomticas a las que va dirigido el test.
3. Los constructores/editores de tests deberan de aportar evidencia de que las
tcnicas de evaluacin elegidas, los formatos de los tems, las reglas de los tests, y
los procedimientos son familiares a todas las poblaciones a las que van dirigidos.
4. Los constructores/editores de test deberan de facilitar evidencia de que el
contenido de los tems y los materiales de los estmulos son familiares para todas
las poblaciones a las que van dirigidos.
5. Los constructores/editores de test deberan aportar una justificacin racional
sistemtica, tanto lingstica como psicolgica, para mejorar la precisin del
proceso de adaptacin, as como reunir datos acerca de la equivalencia de todas las
versiones en los distintos idiomas.
6. Los constructores/editores de tests deberan asegurar que el diseo de recogida
de datos permite el uso de tcnicas estadsticas apropiadas para establecer la
equivalencia entre los tems correspondientes a las diferentes versiones idiomticas
del test
Adaptacin. Una vez que los constructores del test han aportado los datos que
garantizan que hay una equivalencia apropiada entre los constructos a medir en
ambas poblaciones, y por tanto tiene sentido adaptar el test, empieza el proceso
real de su construccin. Este proceso une a la problemtica psicomtrica general
para construir un test la dificultad aadida de plasmar fielmente el test original, si
se trata de una adaptacin; podra darse el caso tambin de una doble construccin
simultnea en las dos (o ms) poblaciones de inters.
El meollo central de la construccin/adaptacin gira en torno al funcionamiento
adecuado del equipo de traductores. Amn de la posibilidad de utilizar diseos
tcnicos sofisticados, con la utilizacin de monolnges y bilnges para asegurarse
de las equivalencias, es clave que los traductores conozcan las culturas implicadas
adems de los idiomas (Bracken y Barona, 1991; Brislin, 1986; Hambleton y Kanjee,
1995; Prieto, 1992). Tal vez algunos puristas apuntarn que no se puede dominar un
idioma sin hacerlo tambin con la cultura y costumbres, y seguramente tienen
razn, pero hay que asegurarse de ello. Es imprescindible que los traductores, an
sin ser expertos, conozcan las reglas bsicas de la construccin de los tests.
Por poner un solo ejemplo, los traductores tienen que saber que cuando se utilizan
tems de eleccin mltiple la longitud de las alternativas tiene que ser
aproximadamente la misma. Una buena exposicin en castellano sobre la
construccin de los tems puede consultarse en Prieto y Delgado (1996). Las
directrices subrayan la necesidad de asegurarse que los contenidos, formatos,
estmulos, grficos, diagramas, figuras, unidades de medida, y signos en general,
son igualmente familiares para las culturas implicadas.
Otro aspecto clave subrayado en varias de las directrices es que los constructores
recojan datos de todo tipo que permitan evaluar la validez y comparabilidad de las
dos versiones. La tecnologa estadstica es actualmente potente y variada para
analizar los datos, pero no hay que olvidar que cuanto ms amplias sean las
muestras utilizadas con ms eficacia funcionan las tcnicas estadsticas. Estas
tcnicas son complementarias de los correspondientes anlisis racionales, no los
sustituyen. En los ltimos aos se ha perfeccionado notablemente la tecnologa
para evaluar el sesgo de las puntuaciones (Camilli y Shepard, 1994; Fidalgo, 1996;
Holland y Wainer, 1993), pero sigue siendo de suma importancia el anlisis racional
por parte de un equipo de expertos en las culturas implicadas. Lo que las tcnicas
detectan es que cierto tem funciona de modo diferente en un grupo que, en otro,
por eso suelen agruparse bajo el nombre genrico de Funcionamiento Diferencial de
los tems, ser el psiclogo quien tenga que analizar las razones de ese
funcionamiento diferencial. En sntesis, hay que garantizar tanto por medios
estadsticos como analtico-racionales que el test es igualmente vlido para las
poblaciones de inters.
Estandarizacin de Instrumentos de Medicin
Las amenazas ms frecuentes tienen que ver con la falta de entrenamiento para el
correcto uso de los instrumentos de medicin. Este riesgo se controla de manera
sencilla mediante el entrenamiento a los usuarios de los instrumentos; tal como
tambin fue mencionado previamente, en algunos casos el correcto uso de los test
solo requiere la lectura previa y el seguimiento de instrucciones puntuales
consignados en los manuales de uso. Sin embargo, por lo regular una correcta
interpretacin de tales instrucciones, as como el seguimiento de las mismas
implica el dominio disciplinar por parte del evaluador.
El primer aspecto involucra un tiempo calendario y un tiempo dentro del proceso
de intervencin; en cuanto al tiempo calendario, se deben tener en cuenta el
cronograma de actividades que realizan tanto el evaluador como el evaluado y la
duracin del proceso de medicin; por su parte el momento dentro del proceso de
intervencin es an ms relevante en tanto que se requiere un parmetro claro de
por qu realizar el proceso de medicin en ese momento y no en otro. Un tercer
aspecto que debe controlarse dentro del proceso de aplicacin del instrumento de
medicin est relacionado con la interaccin entre evaluador y evaluado. Esto tiene
que ver bsicamente con el dar las instrucciones claras y precisas para que el
evaluado puede abordar el proceso de medicin de manera tranquila, sepa en qu
consiste tal proceso y que se busca con el mismo; igualmente, en las instrucciones
debe estar claro cules son los comportamientos que debe emitir el examinado
respecto al instrumento.
El otro aspecto se refiere al trato personal que realiza el evaluador con el fin de
tranquilizar y orientar el proceso de medicin que est realizando, en general, los
procesos de medicin generan tensin, en especial si de ella se desprenden
consecuencias importantes para la vida del evaluado, lo cual puede llevar a que
ste se bloqu y la medicin no se realice de manera adecuada, llevando a posibles
resultados errneos.
Estandarizacin de calificacin
Tal como se ha indicado, los instrumentos de medicin permiten obtener un
resultado numrico, que en la mayora de los instrumentos consiste en una suma
simple de los valores dados a las respuestas dadas por el examinado. Algunos
instrumentos son un poco ms sofisticados y requieren de operaciones matemticas
algo complejas, pero son la excepcin y no la regla. En la actualidad la mayora de
Validacin y Estandarizacin de Instrumentos 14 instrumentos de medicin vienen
acompaados de un programa de computo que permite sistematizar este paso, es
estos casos, la atencin debe dirigirse en alimentar correctamente el programa de
calificacin. El proceso de calificacin comprende dos etapas, la primera es la
obtencin de la puntuacin cruda o directa, mientras que el segundo es la
transformacin del puntaje directo a escalas estndares de resultados.
La obtencin del puntaje directo se estipula durante la construccin de los
instrumentos, ah se establecen los pesos que tendrn las diferentes seales
recolectadas por el instrumento, as como el parmetro mediante el cual se
obtendrn el o los resultados del proceso de medicin. Por lo tanto, el usuario debe
estar atento a comprender y aplicar los procedimientos que se deben realizar para
pasar de la aplicacin del instrumento a la obtencin del resultado.
Por su parte, el clculo del puntaje tpico presenta dos niveles, el primero que se
realiza durante la construccin y evaluacin del instrumento, donde no solo se
estipula el tipo de transformacin de puntajes que se realizar sino tambin se hace
eleccin de la muestra de estandarizacin y la equivalencia entre puntajes directos
y tpicos denominados baremos. En cuanto a las escalas utilizadas, en general lo
que se hace es transformar una escala ordinal en una escala intervalar en la que
existe un punto de referencia definido y se pueden establecer comparaciones entre
los distintos valores de la escala a diferencia de la escala ordinal donde solo se
indica que existe una mayor o menor magnitud de atributo, pero no cunta en
realidad.
Las transformaciones ms populares se basan en modificaciones de la puntuacin
normal estndar que tiene media cero con desviacin 1, por lo que la magnitud de
atributo se expresa en distancias respecto al comportamiento promedio de la
muestra de estandarizacin utilizada en el proceso de medicin. La muestra de
estandarizacin est constituida por el conjunto de examinados a quienes se le
aplica el instrumento y que con base en sus respuestas se determinan los rangos de
manifestacin del atributo y con ello establecer los intervalos de resultados que se
considerarn bajos, medios o altos. La eleccin de sta muestra es fundamental en
el proceso de medicin, pues debe ser representativa de la Validacin y
Estandarizacin de Instrumentos 15 poblacin a la cual se dirige el instrumento; de
lo contrario la estimacin ser incorrecta, ya por sobreestimacin o por
subestimacin de la magnitud del atributo del examinado en relacin con su grupo
de referencia.
Finalmente, los baremos son tablas que los constructores de instrumentos elaboran
para establecer la equivalencia entre los puntajes directos y tpicos. Estas
herramientas descargan al usuario de la labor de realizar clculos para la
transformacin de los puntajes. As pues, la labor de ste consiste en saber a qu
escala se transformaron las puntuaciones directas y como se interpretan las
mismas, pues el significado de una magnitud particular solo es interpretable dentro
del marco conceptual y disciplinar en el cual se circunscribe el atributo medido.
Estandariza
cin
Validacin
psicomtric
a
Redaccin y
conformacin
Traduccin y
adaptacin
-
Validez de contenido
Validez de constructo
TIPOS DE
VALIDACI
ON
Validez factorialValidez
convergente-discriminante