Você está na página 1de 10

ESTANDARIZACION, TRADUCCION Y ADAPTACION

QU REQUISITOS DEBE CUBRIR UN INTRUMENTO DE MEDICION? Toda medicin o


instrumento de recoleccin de datos debe reunir dos requisitos esenciales; confiabilidad y
validez.
LA CONFIABILIDAD de un instrumento de medicin se refiere al grado de precisin o
exactitud de la medida, en el sentido de que si aplicamos repetidamente el instrumento al
mismo sujeto u objeto produce iguales resultados. Es el caso de una balanza o de un
termmetro, los cuales sern confiables si al pesarnos o medirnos la temperatura en dos
ocasiones seguidas, obtenemos los mismos datos.
LA VALIDEZ se refiere al grado en que un instrumento mide la variable que pretende
medir. Por ejemplo, un test de inteligencia no ser vlido, si lo que mide es realmente
memoria y no inteligencia. Ciertas variables como el sexo, la nacionalidad, son muy fciles
de observar o de preguntar y obtener una respuesta vlida. Pero cuando se trata de
diversas variables que se trabajan en ciencias sociales como motivaciones, actitudes,
sentimientos, emociones, etc., la validez de un instrumento que pretenda medirlas se
torna ms compleja, y por lo tanto, cabe preguntarse si realmente el instrumento estar
midiendo lo que pretende medir?
LA VALIDEZ ES UN CONCEPTO DEL CUAL PUEDEN TENERSE DIFERENTES TIPOS DE
EVIDENCIA:

Evidencia relacionada con el contenido LA VALIDEZ DE CONTENIDO se refiere al


grado en que un instrumento refleja un dominio especfico de contenido de lo que
se mide. Por ejemplo, una prueba de operaciones aritmticas no tendr validez de
contenido si explora suma y divisin y excluye problemas de resta y multiplicacin.
Un instrumento de medicin debe contener representados a todos los items del
dominio de contenido de las variables a medir.
Evidencia relacionada con el criterio. LA VALIDEZ DE CRITERIO implica que la
medicin del instrumento se ajusta o sirve a un criterio externo. Si el criterio se
ajusta al futuro se habla de validez predictiva. Por ejemplo, una prueba de admisin
en las universidades puede comparar sus resultados con el rendimiento futuro de
los estudiantes en la carrera. Si el criterio se fija en el presente se habla de validez
concurrente; es cuando los resultados del instrumento correlacionan con el criterio
en el mismo momento o punto de tiempo. Por ej. una encuesta administrada un da
antes de las votaciones para detectar preferencias del electorado, correlaciona con
los resultados finales de la eleccin.
Evidencia relacionada con el constructo. LA VALIDEZ DE CONSTRUCTO es
probablemente la ms importante, sobre todo desde la perspectiva cientfica, ya
que se refiere al grado en que una medicin aportada por un instrumento relaciona
consistentemente con otras mediciones que han surgido de hiptesis y construccin
de teoras antecedentes. VALIDEZ TOTAL = Validez de contenido + validez de
criterio + validez de constructo

Validacin psicomtrica

Cabe agregar que un instrumento de medicin puede ser confiable pero no vlido,
puede medir consistentemente un aspecto ms no medir lo que pretende medir el
investigador. Por ello es requisito que un instrumento de medicin que demuestre
ser confiable y vlido.

FACTORES QUE PUEDEN AFECTAR LA CONFIABILIDAD Y LA VALIDEZ


a) La improvisacin. Algunas personas creen que elegir un instrumento de
medicin o desarrollar uno es algo fcil y que no requiere de supervisin alguna.
Para poder construir un instrumento se requiere conocer muy bien la variable que
se pretende medir y la teora que la sustenta
b) El no estar validados en el contexto donde se aplican. Traducir un instrumento,
aun cuando adaptemos los trminos a nuestro lenguaje no es ni remotamente
validarlo. Es simplemente un primer paso ya que validar un instrumento implica
realizar una investigacin extensa y compleja. Los grupos, las personas cambian y
tienen valores diferentes de acuerdo a la cultura. Por lo tanto, se deben aplicar
instrumentos ya validados en el contexto.
c) El instrumento e inadecuado o no es emptico. Hay instrumentos que tienen un
lenguaje muy elevado para el entrevistado o no toma en cuenta diferencias de sexo,
edad nivel ocupacional y educativo; todo esto puede resultar en errores de validez y
confiabilidad del instrumento de medicin
d) El cuarto factor lo constituyen las condiciones en que se aplica el instrumento. El
ruido, presionar para que una persona conteste un instrumento largo en un perodo
de tiempo corto, el hambre o falta de motivacin para responder influir
negativamente en la validez y confiabilidad de la medida.
e) El quinto factor se refiere a los aspectos mecnicos. Que el instrumento tenga
instrucciones precisas, que se lea bien (si se trata de un cuestionario escrito), que
no le falten pginas, que haya un espacio adecuado para contestar. CMO SE
SABE SI UN INSTRUMENTO ES CONFIABLE Y VALIDO? PROCEDIMIENTOS: En la
prctica es casi imposible que una medicin sea perfecta, generalmente se tiene un
grado de error. Desde luego, se trata que este error sea el mnimo posible y para
ello hay formas de calcular la confiabilidad y la validez.
Para la confiabilidad, generalmente todos los procedimientos utilizan frmulas que
producen coeficientes de confiabilidad, los cuales pueden oscilar entre 0 y 1,
donde 0 significa confiabilidad nula y 1 representa el mximo de confiabilidad. Entre
ms se acerque el coeficiente a 0 habr mayor error en la medicin. Los
procedimientos ms utilizados son 4:

Medida de estabilidad (confiabilidad por test-retest). Un mismo instrumento es


aplicado dos o ms veces a un mismo grupo de personas. Si la correlacin entre los
resultados de las diferentes aplicaciones es altamente positiva, el instrumento se
considera confiable. Desde luego, el perodo de tiempo entre las mediciones es un

factor a considerar. Si es muy largo, otros factores como maduracin o cambio de


condiciones pueden afectar la segunda medida. Si es muy corto, las personas
pueden recordar cmo contestaron la primera vez y aparecer como ms
consistentes la segunda vez.

Medidas paralelas o formas equivalentes de medir. En este procedimiento no se


aplica el mismo instrumento de medicin sino dos o ms versiones equivalentes de
ste. Las versiones deben ser similares en contenido, instrucciones, duracin, etc.
Por ej. cuando un profesor administra 2 o ms modalidades de examen en su grupo
de alumnos. El instrumento es confiable si la correlacin entre los resultados de las
dos o ms pruebas administradas es significativamente positiva.

Mtodo de mitades divididas. Aqu se administra un solo instrumento, una sola vez,
pero se dividen las preguntas o los tems (Por ejemplo, los tems pares con respecto
a los impares, o la primera mitad con respecto a la segunda mitad). Si correlacionan
los resultados de las dos partes, se considera el instrumento confiable. Ahora bien,
la confiabilidad vara de acuerdo al nmero de tems de la prueba. Cuantos ms
tem mayor es la confiabilidad.

Cotejo entre observadores. Se utiliza fundamentalmente cuando se aplican


instrumentos de observacin y registro. Dos o ms observadores aplican el mismo
instrumento al mismo tiempo. Luego se calcula la correlacin de aspectos
coincidentes observados. Se considera confiable el instrumento si hay un porcentaje
de coincidencias superior al 80%. Por supuesto que este mtodo implica que los
observadores tengan el mismo nivel de preparacin o de entrenamiento para
observar. Para calcular la validez, la validez que ms interesa obtener en una
investigacin es la validez de contenido. Para obtener validez de contenido primero
que nada hace falta revisar cmo ha sido tratada esta variable por otros
investigadores anteriormente. Segundo, elaborar un universo de tems tan amplio
como sea posible, para medir la variable en todas sus dimensiones. Posteriormente,
se consulta con investigadores familiarizados con el tema y la variable a medir para
ver si el contenido es exhaustivo. Esto se conoce con el nombre de validacin por
expertos.
Construccin y adaptacin del test: La filosofa general que ha de guiar la
adaptacin es que el test mida el mismo constructo de la misma forma, pero
ajustndose a las peculiaridades de la nueva poblacin. Naturalmente esto no
resulta nada fcil. La primera decisin difcil es la seleccin de los traductores. Es
fundamental que los traductores no slo conozcan ambos idiomas, sino que estn
familiarizados tambin con ambas culturas. En numerosas situaciones hay que
cambiar los tems casi completamente, y eso slo se puede hacer desde un
conocimiento profundo de la cultura objetivo del nuevo tem. Es tambin necesario
que los traductores tengan un cierto conocimiento de la tecnologa para la
construccin de test, y de la materia a traducir, para lo cual han de recibir algn
tipo de formacin. Si no disponen de esos conocimientos tienden a traducir
literalmente, lo cual obviamente no siempre es lo ms adecuado.

Una tcnica habitual en la traduccin es lo que se denomina traduccin inversa.


Primero se traduce el test al idioma objetivo por uno, o mejor, un equipo de
traductores, y otro equipo vuelve a traducir esa versin al idioma original, la bondad
de la traduccin se juzga en funcin del grado de coincidencia con la versin
original. Este popular mtodo no est exento de problemas, existiendo otros diseos
recomendables, vase por ejemplo el captulo de Hambleton (1996).
Una traduccin correcta es slo el punto de partida para que un test resulte bien
adaptado. A partir de ah hay que comprobar empricamente sus propiedades
psicomtricas, tales como la fiabilidad, validez y estandarizacin en la nueva
poblacin. Elaborar y mantener actualizados los baremos es trabajoso, y caro en
tiempo y dinero, pero bajo ningn concepto deben de utilizarse los de la poblacin
de origen sin ms. Otro aspecto clave es asegurarse de que ciertos tems no estn
sesgados contra determinado grupo. La tecnologa psicomtrica para la deteccin
del sesgo es en la actualidad abundante y eficaz, vase, por ejemplo, una
exposicin en castellano en el trabajo de Fidalgo (1996).
Dos aspectos claves que los adaptadores deben de valorar, aparte de la adecuacin
de los propios estmulos, es el tipo de formato de los tems y el concepto de
velocidad en la ejecucin de las tareas. Hay formatos, como el de eleccin mltiple,
muy habituales en ciertas culturas, que no lo son tanto en otras. Estas diferencias
pueden mitigarse con suficientes ejemplos y ejercicios. Los occidentales tendemos
a asumir que no slo hay que hacer las cosas bien, sino rpido, y as somos
socializados desde nios. Pero esta asuncin no se da en todas las culturas (van
Leest y Bleichrodt, 1990; van de Vijver y Poortinga, 1991), y cuando se les pide que
trabajen en la prueba lo ms rpidamente posible, no entienden qu prisa puede
haber para acabar pronto, pues probablemente tiempo es de las pocas cosas de las
que estn sobrados. Hay que tratar de minimizar los efectos de la velocidad de
respuesta, siempre y cuando, claro est, no forme parte del constructo a evaluar.
Aplicacin: La forma en la que se aplica un test influye en sus propiedades
psicomtricas, tales como su fiabilidad y validez. Las relaciones de los aplicadores
con las personas a las que se pasa el test (rapport), la forma de dar las
instrucciones de la prueba, y en general las interacciones aplicador-examinado
deben de cuidarse al mximo. Como seala Hambleton (1996), los aplicadores, a)
deben ser elegidos entre personas de la poblacin a la que se aplica el test, b) estar
familiarizados con los distintos matices de la cultura de que se trate, c) tener
experiencia y aptitudes para la aplicacin de tests, y d) conocer la importancia de
seguir al pie de la letra los procedimientos reglados para la aplicacin de los tests.
Deben de programarse sesiones de entrenamiento riguroso para los aplicadores.
Interpretacin: En general, interpretar los resultados de cualquier test requiere un
psiclogo especialista en el rea del test y con la formacin psicomtrica apropiada.
Y esto sigue siendo vlido cuando el test proviene de una adaptacin. Lo que ocurre
es que con los tests adaptados hay un peligro adicional, a saber, la tentacin de
comparar grupos o pases en el test y establecer una clasificacin de ganadores y
perdedores.

Como sealan algunos autores (Hambleton y Bollwark, 1991; Wesbury, 1992), los
estudios comparativos deberan de usarse para comprender las semejanzas y
diferencias entre los grupos analizados, pero nunca para establecer comparaciones
sin ms. Y no es adecuado establecerlas porque raramente encontraremos dos
comunidades que sean equiparables completamente en aspectos tan influyentes
como motivacin a la hora de hacer las pruebas, curricula escolares, valores
culturales, nivel de vida, polticas educativas, oportunidades de acceso a la
educacin, etc.
Finalmente, para interpretar las puntuaciones el psiclogo debe de disponer de una
documentacin exhaustiva acerca de cmo se llev a cabo el proceso de
adaptacin. El manual del test deber incluir todo tipo de detalles del proceso
adaptativo, que en determinadas circunstancias pueden dar las claves
interpretativas de un resultado.
Directrices para la adaptacin de los tests
Para tratar de minimizar los errores en las cuatro grandes reas citadas (contexto,
adaptacin, aplicacin e interpretacin), el Comit de la Comisin Internacional de
Tests (ITC), propuso recomendar veintids directrices que se consideran claves para
una correcta adaptacin o construccin simultnea de los tests psicolgicos y
educativos.
Contexto
1. Los efectos de las diferencias culturales que no sean relevantes para los objetivos
centrales del estudio deberan minimizarse en la medida de lo posible.
2. Debera de evaluarse la cuanta del solapamiento de los constructos en las
poblaciones de inters.
Adaptacin del test
1. Los constructores/editores de tests deberan de asegurar que el proceso de
adaptacin tiene en cuenta las diferencias lingsticas y culturales entre las
poblaciones a las que se dirigen las versiones adaptadas del test.
2. Los constructores/editores de los tests deberan de proporcionar datos que
garanticen que el lenguaje utilizado en las instrucciones, en los propios tems y en
el manual del test, son apropiados para todas las poblaciones culturales e
idiomticas a las que va dirigido el test.
3. Los constructores/editores de tests deberan de aportar evidencia de que las
tcnicas de evaluacin elegidas, los formatos de los tems, las reglas de los tests, y
los procedimientos son familiares a todas las poblaciones a las que van dirigidos.
4. Los constructores/editores de test deberan de facilitar evidencia de que el
contenido de los tems y los materiales de los estmulos son familiares para todas
las poblaciones a las que van dirigidos.
5. Los constructores/editores de test deberan aportar una justificacin racional
sistemtica, tanto lingstica como psicolgica, para mejorar la precisin del
proceso de adaptacin, as como reunir datos acerca de la equivalencia de todas las
versiones en los distintos idiomas.
6. Los constructores/editores de tests deberan asegurar que el diseo de recogida
de datos permite el uso de tcnicas estadsticas apropiadas para establecer la
equivalencia entre los tems correspondientes a las diferentes versiones idiomticas
del test

7. Los constructores/editores de tests deberan aplicar tcnicas estadsticas


apropiadas para 1) establecer la equivalencia entre las diferentes versiones de un
test, y 2) identificar componentes problemticos o aspectos del test que puedan ser
inadecuados para alguna de las poblaciones a las que va destinado el test.
8. Los constructores/editores de tests deberan proporcionar informacin sobre la
evaluacin de la validez en todas las poblaciones objetivo a las que va dirigido el
test adaptado.
9. Los constructores/editores de tests deberan aportar datos estadsticos sobre la
equivalencia de los tests para todas las poblaciones a las que van dirigidos.
10. No deben utilizarse preguntas no equivalentes en todas las versiones dirigidas a
diferentes poblaciones cuando se prepara una escala comn, o cuando se comparan
estas poblaciones. Sin embargo, pueden ser tiles para reforzar la validez de
contenido de las puntuaciones de cada poblacin por separado.
Aplicacin
1. Los constructores y los aplicadores de los tests deberan tratar de prever los tipos
de problemas que cabe esperar, y tomar las medidas oportunas para evitarlos
mediante la preparacin de materiales e instrucciones adecuados.
2. Quienes aplican los tests deberan de ser sensibles a cierto nmero de factores
relacionados con los materiales utilizados para los estmulos, los procedimientos de
aplicacin, y las formas de respuesta, que pueden reducir la validez de las
inferencias extraidas de las puntuaciones.
3. Aquellos aspectos del entorno que influyen en la aplicacin del test deberan de
mantenerse lo ms parecidos posible para todas las poblaciones a las que va
dirigido el test.
4. Las instrucciones para la aplicacin del test en el idioma fuente y en el objetivo
deben minimizar la influencia de fuentes de variacin no deseadas.
5. El manual del test debera de especificar todos los aspectos del test y de su
aplicacin que han de revisarse al utilizarlo en un nuevo contexto cultural.
6. El aplicador no debe de interferir, debiendo minimizarse su influencia sobre los
examinados. Deben de seguirse al pie de la letra las reglas explcitas descritas en el
manual del test.
Interpretacin de las puntuaciones
1. Cuando se adapta un test para utilizarlo en otra poblacin, debe de facilitarse la
documentacin sobre los cambios, as como los datos acerca de la equivalencia
entre las versiones.
2. Las diferencias entre las puntuaciones obtenidas por las muestras a las que se
aplic el test no deben de tomarse sin ms directamente. El investigador tiene la
responsabilidad de sustanciar las diferencias con otros datos empricos.
3.Las comparaciones entre poblaciones slo pueden hacerse al nivel de la
invarianza que se haya establecido para la escala en la que se expresan las
puntuaciones.
4. El constructor del test debera de proporcionar informacin especfica acerca de
las distintas formas en las que los contextos socioculturales y ecolgicos de las
poblaciones pueden afectar al rendimiento en el test, y debera sugerir
procedimientos para tener en cuenta estos efectos en la interpretacin de los
resultados.

Adaptacin. Una vez que los constructores del test han aportado los datos que
garantizan que hay una equivalencia apropiada entre los constructos a medir en
ambas poblaciones, y por tanto tiene sentido adaptar el test, empieza el proceso
real de su construccin. Este proceso une a la problemtica psicomtrica general
para construir un test la dificultad aadida de plasmar fielmente el test original, si
se trata de una adaptacin; podra darse el caso tambin de una doble construccin
simultnea en las dos (o ms) poblaciones de inters.
El meollo central de la construccin/adaptacin gira en torno al funcionamiento
adecuado del equipo de traductores. Amn de la posibilidad de utilizar diseos
tcnicos sofisticados, con la utilizacin de monolnges y bilnges para asegurarse
de las equivalencias, es clave que los traductores conozcan las culturas implicadas
adems de los idiomas (Bracken y Barona, 1991; Brislin, 1986; Hambleton y Kanjee,
1995; Prieto, 1992). Tal vez algunos puristas apuntarn que no se puede dominar un
idioma sin hacerlo tambin con la cultura y costumbres, y seguramente tienen
razn, pero hay que asegurarse de ello. Es imprescindible que los traductores, an
sin ser expertos, conozcan las reglas bsicas de la construccin de los tests.
Por poner un solo ejemplo, los traductores tienen que saber que cuando se utilizan
tems de eleccin mltiple la longitud de las alternativas tiene que ser
aproximadamente la misma. Una buena exposicin en castellano sobre la
construccin de los tems puede consultarse en Prieto y Delgado (1996). Las
directrices subrayan la necesidad de asegurarse que los contenidos, formatos,
estmulos, grficos, diagramas, figuras, unidades de medida, y signos en general,
son igualmente familiares para las culturas implicadas.
Otro aspecto clave subrayado en varias de las directrices es que los constructores
recojan datos de todo tipo que permitan evaluar la validez y comparabilidad de las
dos versiones. La tecnologa estadstica es actualmente potente y variada para
analizar los datos, pero no hay que olvidar que cuanto ms amplias sean las
muestras utilizadas con ms eficacia funcionan las tcnicas estadsticas. Estas
tcnicas son complementarias de los correspondientes anlisis racionales, no los
sustituyen. En los ltimos aos se ha perfeccionado notablemente la tecnologa
para evaluar el sesgo de las puntuaciones (Camilli y Shepard, 1994; Fidalgo, 1996;
Holland y Wainer, 1993), pero sigue siendo de suma importancia el anlisis racional
por parte de un equipo de expertos en las culturas implicadas. Lo que las tcnicas
detectan es que cierto tem funciona de modo diferente en un grupo que, en otro,
por eso suelen agruparse bajo el nombre genrico de Funcionamiento Diferencial de
los tems, ser el psiclogo quien tenga que analizar las razones de ese
funcionamiento diferencial. En sntesis, hay que garantizar tanto por medios
estadsticos como analtico-racionales que el test es igualmente vlido para las
poblaciones de inters.
Estandarizacin de Instrumentos de Medicin
Las amenazas ms frecuentes tienen que ver con la falta de entrenamiento para el
correcto uso de los instrumentos de medicin. Este riesgo se controla de manera
sencilla mediante el entrenamiento a los usuarios de los instrumentos; tal como

tambin fue mencionado previamente, en algunos casos el correcto uso de los test
solo requiere la lectura previa y el seguimiento de instrucciones puntuales
consignados en los manuales de uso. Sin embargo, por lo regular una correcta
interpretacin de tales instrucciones, as como el seguimiento de las mismas
implica el dominio disciplinar por parte del evaluador.
El primer aspecto involucra un tiempo calendario y un tiempo dentro del proceso
de intervencin; en cuanto al tiempo calendario, se deben tener en cuenta el
cronograma de actividades que realizan tanto el evaluador como el evaluado y la
duracin del proceso de medicin; por su parte el momento dentro del proceso de
intervencin es an ms relevante en tanto que se requiere un parmetro claro de
por qu realizar el proceso de medicin en ese momento y no en otro. Un tercer
aspecto que debe controlarse dentro del proceso de aplicacin del instrumento de
medicin est relacionado con la interaccin entre evaluador y evaluado. Esto tiene
que ver bsicamente con el dar las instrucciones claras y precisas para que el
evaluado puede abordar el proceso de medicin de manera tranquila, sepa en qu
consiste tal proceso y que se busca con el mismo; igualmente, en las instrucciones
debe estar claro cules son los comportamientos que debe emitir el examinado
respecto al instrumento.
El otro aspecto se refiere al trato personal que realiza el evaluador con el fin de
tranquilizar y orientar el proceso de medicin que est realizando, en general, los
procesos de medicin generan tensin, en especial si de ella se desprenden
consecuencias importantes para la vida del evaluado, lo cual puede llevar a que
ste se bloqu y la medicin no se realice de manera adecuada, llevando a posibles
resultados errneos.
Estandarizacin de calificacin
Tal como se ha indicado, los instrumentos de medicin permiten obtener un
resultado numrico, que en la mayora de los instrumentos consiste en una suma
simple de los valores dados a las respuestas dadas por el examinado. Algunos
instrumentos son un poco ms sofisticados y requieren de operaciones matemticas
algo complejas, pero son la excepcin y no la regla. En la actualidad la mayora de
Validacin y Estandarizacin de Instrumentos 14 instrumentos de medicin vienen
acompaados de un programa de computo que permite sistematizar este paso, es
estos casos, la atencin debe dirigirse en alimentar correctamente el programa de
calificacin. El proceso de calificacin comprende dos etapas, la primera es la
obtencin de la puntuacin cruda o directa, mientras que el segundo es la
transformacin del puntaje directo a escalas estndares de resultados.
La obtencin del puntaje directo se estipula durante la construccin de los
instrumentos, ah se establecen los pesos que tendrn las diferentes seales
recolectadas por el instrumento, as como el parmetro mediante el cual se
obtendrn el o los resultados del proceso de medicin. Por lo tanto, el usuario debe
estar atento a comprender y aplicar los procedimientos que se deben realizar para
pasar de la aplicacin del instrumento a la obtencin del resultado.

Por su parte, el clculo del puntaje tpico presenta dos niveles, el primero que se
realiza durante la construccin y evaluacin del instrumento, donde no solo se
estipula el tipo de transformacin de puntajes que se realizar sino tambin se hace
eleccin de la muestra de estandarizacin y la equivalencia entre puntajes directos
y tpicos denominados baremos. En cuanto a las escalas utilizadas, en general lo
que se hace es transformar una escala ordinal en una escala intervalar en la que
existe un punto de referencia definido y se pueden establecer comparaciones entre
los distintos valores de la escala a diferencia de la escala ordinal donde solo se
indica que existe una mayor o menor magnitud de atributo, pero no cunta en
realidad.
Las transformaciones ms populares se basan en modificaciones de la puntuacin
normal estndar que tiene media cero con desviacin 1, por lo que la magnitud de
atributo se expresa en distancias respecto al comportamiento promedio de la
muestra de estandarizacin utilizada en el proceso de medicin. La muestra de
estandarizacin est constituida por el conjunto de examinados a quienes se le
aplica el instrumento y que con base en sus respuestas se determinan los rangos de
manifestacin del atributo y con ello establecer los intervalos de resultados que se
considerarn bajos, medios o altos. La eleccin de sta muestra es fundamental en
el proceso de medicin, pues debe ser representativa de la Validacin y
Estandarizacin de Instrumentos 15 poblacin a la cual se dirige el instrumento; de
lo contrario la estimacin ser incorrecta, ya por sobreestimacin o por
subestimacin de la magnitud del atributo del examinado en relacin con su grupo
de referencia.
Finalmente, los baremos son tablas que los constructores de instrumentos elaboran
para establecer la equivalencia entre los puntajes directos y tpicos. Estas
herramientas descargan al usuario de la labor de realizar clculos para la
transformacin de los puntajes. As pues, la labor de ste consiste en saber a qu
escala se transformaron las puntuaciones directas y como se interpretan las
mismas, pues el significado de una magnitud particular solo es interpretable dentro
del marco conceptual y disciplinar en el cual se circunscribe el atributo medido.

Unidad 1. ELABORACION DE INSTRUMENTOS DE MEDICION

persigue el objetivo de que la prueba sea


valida
Se ajuste y se adapte a cualquier
poblacin, tomando en cuenta su idioma,
localizacin geogrfica, cultura, etc.
Su rol es Comprobar que la prueba es
viable, confiable y aplicable.

Estandariza
cin

Validacin
psicomtric
a

Desde el punto de vista psicomtrico, la


validez es el resultado de un proceso de
recopilacin de evidencias empricas
sustentado en supuestos tericos que,
en suma, permiten emitir un juicio
valorativo.
afirme la pertinencia y la suficiencia de
las interpretaciones basadas en los
resultados de una prueba.
Este juicio no depende nicamente de
los temes de la prueba, sino tambin de
la muestra sobre la que se efecte el
test, y del contexto de aplicacin

Redaccin y
conformacin

Traduccin y
adaptacin
-

Validez de contenido
Validez de constructo

TIPOS DE
VALIDACI
ON

Validez factorialValidez
convergente-discriminante

Listar las variables


Revisar su definicin conceptual y comprender su significado
Revisar cmo han sido definidas operacionalmente las variables

La adaptacin de tests y cuestionarios para su uso en contextos


lingsticos y culturales diferentes a aquellos en que fueron
construidos es una prctica tan antigua como los propios tests
que se remonta a la aparicin de las primeras escalas de Binet y
Simon (1905) en los albores del siglo XX
Una tcnica habitual en la traduccin es lo que se denomina
traduccin inversa. Primero se traduce el test al idioma objetivo
por uno, o mejor, un equipo de traductores, y otro equipo vuelve a
traducir esa versin al idioma original, la bondad de la traduccin
se juzga en funcin del grado de coincidencia con la versin
original.

Você também pode gostar