Escolar Documentos
Profissional Documentos
Cultura Documentos
ORIENTACIONES DIDCTICAS.
Test: trmino general para referirnos a cualquier instrumento de medicin psicolgica; pero sobre
todo referido a instrumentos de medicin de variables de tipo cognitivo (aptitudes, conocimientos,
rendimiento, habilidades, etc); donde las respuestas de los sujetos son correctas o incorrectas
y la puntuacin total en el test es la suma (directa o ponderada) de todas las respuestas correctas,
dando lugar a una escala jerrquica o acumulativa. Ej. de Test de conocimientos: La capital de Espaa
es: a) Pars b) Londres c)Madrid
Escala: hace referencia a los instrumentos elaborados para medir variables no cognitivas
(preferencias, opiniones, etc; ) y se caracteriza porque los sujetos han de responder eligiendo, sobre
una escala de categoras graduada y ordenada, aquella categora que mejor represente su posicin;
no hay respuesta correctas o incorrectas, y la puntuacin total en la escala ser la suma de las
puntuaciones asignadas a las categoras elegidas por los sujetos. Ej. de Escala: 2. Debera estar
prohibido fumar en todos los restaurantes: a) Completamente de acuerdo. b) De acuerdo. c) Indiferente. d) En
desacuerdo. e) Completamente en desacuerdo
Cuestionarios: formados por tems o elementos que no estn necesariamente relacionados unos
con otros, cuyas opciones de respuesta no estn ordenadas ni graduadas, que pueden ser
puntuados e interpretados individualmente y en los que tampoco hay respuestas correctas e
incorrectas. Se utilizan para obtener una mayor informacin del sujeto y de su entorno (edad,
profesin, estudios, etc); y se utilizan cuando la investigacin es mediante encuestas. Ej. de
Cuestionario: Qu parte de la asignatura de Psicometra le resulta ms fcil de estudiar? A) Fiabilidad.
b)Validez. C)Anlisis de elementos. D)La construccin de test
Inventario: vinculado a los instrumentos elaborados para medir variables de personalidad. Las
respuestas no son correctas o incorrectas, lo nico que demuestran es la conformidad o no con los
enunciados de los tems. Ej. de inventario: 1 A menudo me siento como si los dems me ignoraran
(V
F). El problema de mucha gente es que no toma las cosas en serio
( V F)
3.
EL PROCESO DE CONSTRUCCIN DE UN TEST
El conocimiento del objetivo del test es el paso previo que va a condicionar la siguientes etapas de la
construccin.
Etapas
4.
LA FINALIDAD DEL TEST
Como paso previo para la construccin del test, es necesario tener claro su objetivo, es decir, lo que se
quiere medir, a quien se quiere medir y para qu se quiere medir.
4.1.
4.2.
4.3.
Decisiones a tomar
SELECCIN
DIAGNSTICO
CERTIFICACIN
ORIENTACIN/CONSEJO
DESCRIPCIN/INFORMACIN
5.
ESPECIFICACIN DE LAS CARACTERSTICAS DEL TEST.
Aqu es importante la habilidad del constructor para planificar y desarrollar las especificaciones del test.
5.1.
Cuando el constructo no esta claramente definido, se recomienda (como seala Martnez-Arias, 1995):
a) Hacer un anlisis del contenido del constructo (hacer preguntas abiertas a los sujetos acerca
del constructo y seleccionando las respuestas de mayor frecuencia).
b) Revisar las investigaciones publicadas anteriormente.
c) Llevar a cabo un anlisis de tareas (y segn estas observaciones elaborar una lista de
conductas crticas)
d) La observacin directa por parte del constructor del test (podr identificar conductas
relacionadas con el constructo a medir).
e) Utilizar el juicio de expertos (que ya hayan trabajado en el constructo).
f) Revisar los objetivos instruccionales o de programas de intervencin.
Todo esto da una idea de la dificultad de definir un constructo y determinar su dominio de conductas, no son
procesos distintos, sino que estn fuertemente relacionados. A medida que tiene una mayor informacin
acerca del constructo que se quiere medir se ir modificando el contenido de la prueba y viceversa, las
investigaciones encaminadas a determinar el dominio de conductas del constructo aumentarn el
conocimiento del mismo y permitirn clarificar su concepcin.
Los test de rendimiento y conocimientos y, sobre todo, en los test referidos al criterio (TRC), en lugar de
hablar de un dominio de conductas se hablar de un dominio de contenidos a evaluar y la especificacin
del mismo cobrar una importancia extraordinaria.
Cuando se quiere construir un test para ser utilizado en el mbito acadmico, el camino que se suele seguir
para especificar el contenido del test es construir una tabla de doble entrada, en la que las columnas
representan las distintas reas de contenido o facetas del constructo a medir y las filas los distintos
procesos u operaciones implicados en la resolucin de las tareas planteadas.
Aunque los contenidos de las filas variarn en funcin de aquello que se quiera medir, se ha intentado hacer
una categorizacin jerrquica uniforme (American Educational Research Association) que recoge los
siguientes procesos ordenados jerrquicamente en funcin de su menos o mayor complejidad:
reas de Contenido
Conocimiento 25 %
Comprensin 25%
Aplicacin 25%
Anlisis 25%
Medicin 20%
4
4
4
4
Fiabilidad 35%
7
7
7
7
Validez 35 %
7
7
7
7
A. de tems 10 %
2
2
2
2
Total
16
28
28
Es importante que estn representadas todas las reas de la Psicometra para que tenga validez y que en
cada una de ellas haya nmero suficiente de tems para asegurar la fiabilidad.
Cada casilla de la matriz representa la interaccin entre un rea de contenido y un proceso, esto facilita la
redaccin de tems que cubran todos los aspectos que se consideran importantes. No obstante hay otro
punto que hay que aclarar: si a todos los procesos y a todas las reas de contenido se les concede la
misma importancia; ser necesario cubrir todas las celdas de la matriz con el mismo nmero de tems. Por
el contrario si se considera que no todas las reas son igualmente importantes, ni todos los procesos, ser
necesario establecer una ponderacin para poder establecer el nmero de tems de cada casilla.
Se pueden dar dos casos: que las reas de fiabilidad y validez por ejemplo fueran mas importantes,
despus el rea de medicin y por ltimo el anlisis, quedando a 35%, 35%, 20% y 10% respectivamente, o
bien dar la misma importancia a todos los procesos, con lo cual le correspondera a c/ uno de ellos una
ponderacin del 25%.
Una vez asignadas las ponderaciones, la versin piloto debe contar como mnimo con el doble o el triple de
los tems de la versin final del test, en nuestro caso queremos que tenga 80, entonces asignamos:
fiabilidad 35% y validez 35% 28 tems c/u, rea 20% 16 tems y anlisis 10% 8 tems. De los 16 tems del
rea de medicin, un 25 % corresponde a c/u de los procesos, as habr que construir 4 tems por cada uno
de los procesos y as el resto.
Un test de aptitudes tiende a ser menos especfico en cuanto a su contenido puesto que est pensado
para medir una caracterstica ms general y persistente de la persona.
Cuando lo que se quiere construir es un test para medir constructos de naturaleza no cognitiva, las
especificaciones pueden ser bastante esquemticas y a veces el contenido de los tems se deduce
fcilmente de la misma definicin del constructo. En este tipo de tests hay veces que a partir del anlisis y
reflexin sobre las teoras existentes acerca del constructo que se quiere medir surgen los tems que se
deben incluir.
5.2.
Emparejamiento: el sujeto debe emparejar los elementos de dos columnas de acuerdo a las
instrucciones dadas en el enunciado. Se utiliza para medir vs de tipo cognitivo (sobre todo,
conocimientos).
Formato Cloze o incompleto: frase con espacio en blanco para rellenar con palabra de una
lista.
* los formatos vistos hasta ahora se utilizan para la medida de habilidades, aptitudes y conocimientos; en los que
se decide de antemano cul es la respuesta correcta. Los test elaborados con este tipo de tems se denominan
tests objetivos.
Listados (checklists): Tb es una escala valorativa en la que los sujetos han de mostrar su
opinin. No uso para vs cognitivas. Las opciones son independientes entre s ( escalas
clasificacin); y no hay respuestas correctas o incorrectas ( tems eleccin mltiple). El n de
respuestas suele ser grande y es posible elegir varias opciones. Es un formato tpico de los
cuestionarios.
*las escalas de clasificacin y los listados se utilizan para la medida de vs de personalidad, actitudes, opiniones,
etc. Vs no cognitiva. En estas pruebas no hay respuestas correctas o incorrectas.
5.2.2.
tems de respuesta corta: el sujeto ha de elegir una nica palabra o frase sin que se le
presente en ninguna lista.
tems de respuesta extensa o de ensayo: se pide a los sujetos que desarrollen un tema.
Dando a los sujetos la oportunidad de expresarse con sus propias palabras, se podr evaluar no
slo el nivel de conocimientos de los sujetos y su forma de estructurarlos, sino sus habilidades
cognitivas de orden superior, los procesos cognitivos que ponen en marcha a la hora de solucionar
un problema.
Se utilizan para medir todo tipo de variables, tanto cognitivas como orcticas o afectivas.
Inconveniente: las respuestas son difciles de analizar y valorar pues el investigador tiene que
codificarlas en una serie de categoras antes de comenzar el anlisis, agrupar juntos a los sujetos
que han emitido respuestas similares y es muy difcil encontrar a sujetos que hayan dado la misma
respuesta. Cuando la poblacin es pequea se utilizan tests con tems de respuesta corta.
5.3.
No hay un nmero de tems adecuado en cada caso ya que son muchos los factores que hay que
tener en cuenta: a la poblacin a la que va dirigido, el tiempo del que se dispone, los objetivos del
test.
La tabla de especificacin nos puede dar una idea acerca del n de tems a incluir. Se puede partir
del n mnimo, teniendo en cuenta los factores de ponderacin asignados a c/ rea de conducta y c/
proceso a evaluar, se van calculando el n de tems del resto de las casillas. Al final se podr contar
con el n de tems total del test. En cualquier caso se recomienda que el n de tems de la prueba
piloto sea mayor que el de la versin final.
5.4.
Esto se refiere a:
o
su nivel de dificultad (Un tem es fcil o difcil para una determinada poblacin, en funcin de la probabilidad que
tengan de responder a l correctamente). 3 tipos de tests:
Test de velocidad: los tems deben ser fciles de resolver. La dificultad est en el tiempo limitado de
ejecucin.
Test de ejecucin mxima (Test de potencia): se utiliza para la evaluacin del rendimiento acadmico
y para la medida de las aptitudes y destrezas. Aqu los tems tienen diferentes grados de dificultad
(de muy fciles a muy difciles); y el tiempo de ejecucin no es un factor importante.
Test de ejecucin tpica: son los test de personalidad, actitudes, intereses, etc. Como no hay
respuestas correctas e incorrectas, no se puede hablar de dificultad de los tems.
su homogeneidad en relacin con los dems tems (Un tem tendr un alto grado de homogeneidad con el resto
de tems que forman el test cuando mida lo mismo que ellos). Si el constructo a medir es unidimensional, los
tems han de ser ms homogneos que si el constructo es multidimensional.
su capacidad de discriminacin (Un tem tendr poder distriminativo en la medida en que sirva para diferenciar
entre sujetos que han obtenido en el test puntuaciones extremas). Depende de la poblacin a la que va dirigida el
test.
6.
REDACCIN DE LOS TEMS.
Consideraciones para la tarea:
1) Debe existir un alto grado de congruencia entre el tem y el constructo psicolgico que se quiere medir
(validez del constructo).
2) Los constructos deben estar claramente definidos para poder valorar el grado de congruencia entre temconstructo..
3) Hay que tratar de minimizar los errores de medida cometidos al medir el constructo con cada tem.
4) El formato de los tems debe ha de ser adecuado para los objetivos del test.
5) Los tems deben reunir las caractersticas psicomtricas ms adecuadas en cada caso.
6) Los tems deben estar bien redactados.
7) Los tems deben satisfacer las consideraciones legales y tcnicas pertinentes. (Por ejemplo se deben evitar
plagios).
6.1.
Recomendaciones generales.
Evitar enunciados que provoquen respuestas sesgadas (aquella que es ms probable que elijan
los sujetos independiente_ de su opinin).
Dos alternativas: Verdadero-Falso: (1.- estar completa_ seguro de que el tem es verdadero o
falso. 2.- no utilizar frases que sean universalmente verdaderas o falsas. 3.- evitar poner en el
enunciado palabras que puedan inducir la respuestas correcta (como siempre, todo, nada, nunca, a
veces, en general, etc). 4.- evitar patrones de respuesta, colocando a lo largo del test, de forma
aleatoria, los tems cuyo enunciado sea correcto.
Eleccin mltiple: 1.- asegurarse de que el enunciado del tem formula el problema con claridad.
2.- Incluir la mayor parte del texto en el enunciado para evitar repeticiones innecesarias en las
opciones de respuesta. 3.- Incluir distintas opciones de respuesta al final del enunciado. 4.Asegurarse de que los distractores, son plausibles. 5.- Evitar opciones de respuesta como:
ninguna de las anteriores o todas las anteriores. 6.- Que slo haya una opcin correcta, a no ser
que se indique lo contrario claramente en las instrucciones. 7.- Tratar de que todas las alternativas
de respuesta tengan una longitud aproximada igual y con una construccin gramatical parecida.
8.- Aleatorizar la ubicacin de la alternativa correcta. 9.- Hacer que todas las alternativas le
parezcan igualmente atractivas a una persona no informada del problema al que alude el
enunciado. 10.- Asegurarse de que cada alternativa concuerda gramaticalmente con el enunciado
del tem. Si el enunciado est en singular, asegurarse de que cada alternativa est en singular.
Emparejamiento: 1.- Asegurarse de que tanto las premisas como las opciones de respuesta que
hay que emparejar son homogneas. 2.- Utilizar el formato adecuado (las premisas se deben
presentar de forma aleatoria en una columna a la izquierda y en una columna paralela, situada a la derecha, se
deben presentar las distintas alternativas de respuesta). 3.- El enunciado del tem debe reflejar
claramente la tarea que se espera del sujeto y la forma en que hay que llevar a cabo el
emparejamiento.
Formato Cloze o incompleto: necesario que en el enunciado del tem haya tantos espacios en
blanco como alternativas de respuesta; y si no es as, debe constar en las instrucciones.
Escalas de Clasificacin: 1.-Evitar expresiones coloquiales, por si alguien no las conoce. 2.Incluir en el test completo aproximadamente el mismo n de tems formulados de manera positiva y
negativa. 3.- Asignar las etiquetas lingsticas: al menos en los extremos de la escala deben
aparecer las etiquetas lingsticas para facilitar la respuesta de los sujetos. Tambin es
conveniente introducir una categora central que represente el punto medio o neutral, (No se,
Indiferente, Ni de acuerdo ni en desacuerdo) pues refleja la actitud u opinin de muchas personas.
tems de respuesta corta: 1.- Asegurarse de que el enunciado puede ser contestado con una
nica frase o palabra y que hay una nica respuesta correcta. 2.- Los espacios en blanco para las
respuestas han de ser de la misma longitud. 3.- Evitar dar pistas de la respuesta correcta, (por
ejemplo con el artculo de antes de la palabra etc). 4.- Indicar el grado de precisin exigido, (por ejemplo
el n de decimales). 5.- Evitar determinantes especficos como Todo o Nada y ambiguos como
Frecuentemente o Algunas veces.
tems de respuesta extensa o de ensayo : 1.- Asegrese de que el problema est bien enfocado,
con palabras que definan claramente la tarea (Compare, Contraste, etc). 2.- No permitir a los sujetos
que elijan entre varias preguntas de ensayo. 3.- Decidir de antemano cmo se van a puntuar las
preguntas de ensayo. 4.- Redactar las preguntas referidas a cuestiones controvertidas de manera
que los sujetos que deben responder sean evaluados en relacin a la evidencia que presentan no
a su posicin personal respecto al tema.
6.4.
Este tipo de respuestas suelen aparecer en tests construidos para la medida de aspectos orcticos
y afectivos.
Principales sesgos:
1.
Una vez que se han redactado los tems del test, y antes de dar forma a la prueba piloto, es conveniente
que estos tems sean revisados por un grupo de personas que no hayan intervenido en su elaboracin, para
que analicen todos aquellos aspectos que contribuyen a la calidad del tem. Una vez revisados, se puede
construir la versin preliminar del test, la prueba piloto, con aquellos que han pasado este primer control de
calidad.
8.
CONFECCIN DE LA PRUEBA PILOTO.
Dos aspectos bsicos:
8.1.
Instrucciones de administracin.
En los test de ejecucin mxima se debe explicar que hay algunos tems que resultaran muy
difciles para todos los sujetos y que la prueba est pensada para que haya ejercicios que no
puedan resolver. Si se incluye esta observacin se reducir la ansiedad de los sujetos.
En los test de velocidad, avisar que el tiempo est limitado y muy pocos llegarn al final, Tb. hay
que explicitarlo en las instrucciones.
Las instrucciones deben informar acerca de cmo distribuir el tiempo y que hacer cuando no se
conoce la respuesta de un tem.
Las instrucciones deben animar al sujeto a responder a todas las preguntas y favorecer as su
rendimiento, pues ste tiende a bajar considerablemente cuando se dejan muchas respuestas en
blanco.
Una vez elaboradas las instrucciones hay que organizar y ordenar los tems seleccionados para su
posterior presentacin a los sujetos y decidir el formato de registro de respuesta. Se puede optar
por que los sujetos respondan en la misma hoja o cuadernillo o en un folio aparte ( en este caso los
test podrn ser reutilizados) y se puede contestar en una lectora ptica que facilitar su correccin.
9.
Los formatos diferentes deben aparecer agrupados para evitar provocar desconcierto.
Hay que tratar de que los tems sigan una ordenacin lgica.
Una vez construida la prueba es necesario hacer un estudio piloto de la misma para su evaluacin
psicometra (ver si cumple los requisitos necesarios que permitan considerarla como un instrumento cientfico de
medicin). Esta requiere, decidir acerca de la forma de administracin y seleccionar una muestra de sujetos
que pertenezcan a la misma poblacin que aquellos para los cuales se ha diseado el tet.
Formas de administracin de la prueba:
Colectiva individual: preferible la colectiva (aunque WAIS , WISC son individuales).
Oral: las instrucciones y las respuestas se dan de forma oral.
Papel y lpiz: la presentacin y el registro de las respuestas se hace de forma impresa.
Mediante ordenador: aparecen los tems en pantalla y se responde a travs del teclado.
A travs del correo: alta tasa no responde y falta de seguridad de que el que responde es al que iba dirigido
10.
Una vez que se ha aplicado la prueba piloto, la primera tarea es valorar las respuestas dadas por los sujetos
a cada uno de los tems para asignarles puntuacin. Siempre que se emite un juicio de algo es inevitable un
cierto grado de subjetividad, pero tambin es necesario tratar de eliminarla o al menos controlarla.
10.1
Tambin llamados de respuesta cerrada, tiene la ventaja que el examinador no debe realizar
ninguna valoracin de las respuestas emitidas por los sujetos a cada uno de los tems, eliminndose
la posibilidad de introducir subjetividad en la puntuacin que les asigne.
10.1.1. Pruebas cognitivas:
Se conoce de antemano cual es la respuesta correcta, solo hay que comprobar si coincide.
Una vez corregida es necesario combinar las puntuaciones asignadas a cada elemento para
n
X
i 1
Xc
X c A Aa A
E = n errores. K = n alternativas de los tems.
E
K 1
Si llamamos Ra al n de respuestas aleatorias que emite el sujeto en el total del test, se puede
establecer que el n de errores ser
k 1
E Ra 1 Ra
k
k
1
Aa = Ra K
El n de errores al azar:
Ra = E
k
k 1
Aa E
K 1
E
K 1 k
k 1
X c A Aa A
O
K
Aunque este procedimiento permitira hacer comparaciones entre las puntuaciones, estaran
sobrevaloradas. No corresponderan al verdadero nivel de los sujetos, por lo tanto es ms
adecuado utilizar el primer procedimiento.
Cuando un mismo tem esta formado por tems con distinto n de alternativas, para conocer
cual es la puntuacin de cada sujeto ser necesario ir aplicando la correccin del azar por
partes; se agruparan los tems en funcin del nmero de alternativas y se calcular la
puntuacin del sujeto en cada uno de los grupos. La puntuacin final ser la suma de las
puntuaciones parciales obtenidas.
10.1.2. Pruebas no cognitivas
En estas no hay respuestas correctas ni incorrectas, los tems llevan asignado un valor n
distinto a cada alternativa de respuesta, lo que implica un escalamiento previo de los tems
en funcin del grado de atributos que manifiesten. La forma de corregir es sumando los
valores numricos asignados a las alternativas o categoras de repuesta elegidas por el
sujeto.
Cuando se utiliza un formato de escalas de categoras o clasificaciones hay que tener muy
claro cul es la direccin del continuo de la variable que se est midiendo.
10.2
Cuando se trata de que el sujeto construya la respuesta correcta con una palabra o frase corta
(tems de respuesta corta) es fcil la asignacin de la puntuacin a los sujetos. El problema ser
cuando sean ms abiertas y extensas puesto que es ms difcil corregir sin subjetividad.
Este tipo de test permite expresarse de forma abierta, y as valorar no solo los conocimientos del
tema sino otros aspectos importantes en algunas situaciones, el inconveniente es la correccin de
las mismas ya que es muy laboriosa y bastante subjetiva.
Formas de controlar la subjetividad:
10.2.1. Mtodo de la puntuacin analtica: Requiere:
1. Definir de forma inequvoca y aislar las dimensiones que se consideran importantes
para la realizacin de la tarea a evaluar.
2. Establecer las formas de evaluarlas, definiendo claramente lo que se considera una
respuesta adecuada o correcta en cada dimensin y estableciendo el nmero de
respuestas correctas que se necesitan, a cada una de ellas, para poder decir que la
tarea ha sido correctamente realizada.
3. Las pruebas pueden ser corregidas por personas que no sean expertas en la materia a
evaluar, ya que no habr dificultad en decidir si la respuesta es correcta o no.
10
4. La puntuacin final viene expresada por dos nicos valore: correcta / incorrecta, apto /
no apto, pero se obtiene informacin de cada una de las dimensiones.
11