Escolar Documentos
Profissional Documentos
Cultura Documentos
%~&~orth
Personal Data Sheet (Hoja de Datos PersonalesWoodworth), prototipo de muchas pruebas de
personalidadposteriores. El Inventario Multifsicode
la personalidad Minnesota (MMPI) se invent para
en la clasificacin de los pacientes mentales,
en la pctica clnica de los hospitales de la Universidad de Minnesota. La Scholastic Assessment Test
(sAT;Prueba de Evaluacin Acadtmica) se cre en
al inters de una reducida cantidad de uni"midades selectas para pasar por alto a algunos estudiantes brillantes de bachilleratos mediocres en el
ingreso a esas universidades. debido a que no haban
expuestos a un plan de estudios complejo que
los preparara para la universidac. Por supuesto, la
enorme cantidad de trabajo dirigido ai d e s ~ l l de
o
las pruebas de aprovechamiento para su uso en las
y la industria tambitn tiene una orientacin
altamente prctica. Se trata slo de algunos ejemplos
del hecho de que muchas pruebas se originan en respuesta a una necesidad muy prctica. En estos casos,
la elegancia te6rica y la bibliografa sobre la investigacin existente no son intereses primarios, en re&&& in~esti~aciones
posteriores con estas pruebas han
demostrado a menudo que tenan problemas tericos
considerables.
:
Algunas pruebas se fojan a partir de un fundamento terico, como el Test de Apercepcin Tematica (Tm.que se ide con la finalidad de ofrecer un
indicador de la personalidad en funcin de la teorfa a
-'%%e respecto propuesta por Murray. Asf sucedi m-?, &in con el Edwards Personal Preferente Schedule
S de Preferencias Personoiones correspondientes a
de Murray. Las Matrices
159
urstone, prototipo de
ncia multifactoriales
do generan nuevas
160
(capid
Z
CONDICIONES
FORMATO DE
RESPUESTA
QUE RIGEN
LA
RESPUESTA
PROCEDIMIENTOS
DE CALIFICACION
Figura 6-2.
mltiple y
wwses y p'
OVOc:
pesta que
es el form:
de reactivo
10s que va
pletamentc
pmba po<
rcc puntos.
carse en ct
tn dos po
forma nun
ocasiones
1954)o e s
1994). se nr
p~edemai
las rzspue
en este eji
Una aplic;
REACTIVOS DE SELECCIN
DE RESPUESTA
En los reactivos de seleccin de respuesta. al ex
se le presentan al menos dos, pero no ms de una
nable y pequea cantidad de opciones, de las cuales
elegir una respuesta. Los reactivos de seleccin de
puesta tambiii se deiiominan reactivos de respu
,
mltiple, opcin mltiple o de eleccin forzada.
En las pruebas de uso ms generalizado, el e
ma de seleccin de respuesta es a todas luces e
popular.1En la mayor parte de las pruebas de capacidad
y aprovechamiento aplicadas a grupos, se utiliza una
estructura de opcin mltiple con 4 o 5 opciones por
cada reactivo; con seguridad todo lector estar familiarizado con este tipo de preguntas. Un caso especial del
reactivo de opcin mltiple pero con tan solo dos opciones, es el de Verdadero o Falso: En el cuadro 6-3 se
ilustran los reactivos de opcin mltiple y de Verdadero o Falso de una prueba de aprovechamiento.
Los formatos de seleccin de respuesta son ms
familiares en el mbito de la evaluacin de capacidades y desempeo, \in embargo, tambin son ampliamente utilizados en prueba5 de personalidad, intereses
Elrihor~~cicri
de nruebas 1. anlisis de reuctiim
161
en tanto
Procedihr tcnicas
que de.
dreactim
E=
1
LGuil
de &tos es un mktodo para determinar la confiabilidad de una prueba?
A. test-retest
B. estanina
C. validez
1
4
.ii
1 -3-
'@hicamente. el formato Likut dude d mLtodo de ela1 boracin de la exala completa. Sin embargo, es comn
T~cferirseal formato de respuesta mismo como formato
*Likat Para un aniilisis adicional sobre este tema, vase el
$ Captulo 14.
ocasiones se dude al diferencial semntico como si se
:tratara de una pmeba especfica. Pero como se seala en
' e* babajo cisico sobre el tema (Osgood, SuB. Tannenbaum,
1957). el diferencial semntico denota una tcnica gene& y no una pmeba en particular.
C~MO
CAL1FlCAR LOS REACTIVOS
DE SELECCI~NDE RESPUESTA
En el campo de las pruebas de capacidad y aprovechamiento, h mayor parte de los reactivos de seleccin de
respuesta se califican como coirectos o incorrectos; se
concede un punto o cero:a una respuesta correcta o
i n c o k t a , respectivamente, luego, se califica la prueba contabilizando la cantidad total de aciertos. Sin
embargo, hay otras formas de calificar estos reactivos.
una de ellas consiste en conceder un crdito parcial por
elegir una opcin que no es la mejor respuesta posiblei
pero que no est del todo equivocada Otra variante
supone otorgar una ponderacin adicional a los
reactivos que son muy importantes; por ejemplo, para
calcular la puntuacir total en la prueba, una respuesta
correcta a ciertos reactivos podra valer tres puntos, a
otros dos puntos y uno a los restantes. Otra variante
para calificar reactivos para los que hay una respuesta
correcta consiste en aplicar una correccin por adivi- nacin'(v&se el captulo 3, pp. 55-56). Las comparaciones del mtodo de calificacin simple de cero o uno
con estos mktodos ms complicados han sido materia
de muchas investigaciones;la duda radica en si los sistemas de calificacin ms complicados generan puntuaciones ms confiables y vlidas o alguna de ellas,
en comparacincon los ms simples sistemas de calificacin de cero o uno. La respuesta se divide en dos,
por una parte, los sistemas ms complicados suelen generar slo puntuaciones un tanto mejores (mas
confiablcs o ms vlidas). En cuanto a la segunda parte
de la respuesta, los autores difieren, hay quienes afirman que con esas ganancias marginales, no vale la pena
molestarse en utilizar los sistemas ms complicados
(vase, por ejemplo, Nunnally, Bernstein, 1993);otros
comentan que con la facilidad que ofrecen los sistemas
modernos de calificacin por computadora, las llamadas "complicaciones" son triviales, de modo que cualquier ganancia en confiabilidad o validez merece la
pena. Para una descripcin de algunos de estos procedimientosde ponderacin de reactivos y opciones, vase
Millman y Greene (1993).
La calificacin de los reactivos de seleccin de
respuesta en las pruebas de personalidad, intereses y
162
c a p t u l ~61
actitudes se da de diversas maneras. En algunas aplicaciones. cada reactivo se califica con uno o cero un
forma anloga al procedimiento de respuesta c o m t a
o 'incorrecta de las pmebas de capacidzd; pero esta calificacin no supone una respuesta correcta'o inco- :
=atta, sino una respuestaen cierta direccin, por ejemplo, que la persona esta ms ansiosa, ms deprimida,
mejor adaptada o ms interesada en cierta actividad.
Adems, w cs bfnxuentc asignar diversas cif.
a las distintas respuestas a los reactivos en las pruebas
de personaIidad, intenses y actitudes.d% la escala de
"Me agrada-?-Me desagrada", podnan asignarse puntuaciones de 3,2 y 1o +l. O y -1 a diversas respuestas.
En la escala de cinco puntos de "Muy de acuerdo-Muy
en desacuerdo", quiz se adjudiquen calificaciones de
5.4, 3. 2 y 1, o bien, +2, +1, 0, -1 y -2 puntos a las
difecentes respuestas. Observe que sera posible asignar una puntuacin de uno a las respuestas de 'Muy de
acuerdo" o r)e amerdo" y cero a todas las dems respuestas. Las consideracionesde diseo preliminares a
la elaboracin de la prueba determinan en parte el mtodo de calificacin de estos reactivos.
REACTIVOS DE CONSTRUCCI~N
DE RESPUESTA
En el reactivo de construccin de respuesta se presen-,
ta un estnulo, pero no se restringe al examinado a
-A
.--..
".
.-4
A = De acuerdo
Me gusta el dlgebra.
Las mlces cuadradas son fantticas.
..
D = Desacuerdo
?=No&
MD = Muy en desacuerdo'!!
. ,$
MA
MD
O
O
O
O
O
O
O
O
O
O
O
O
0
O
O
O
O
O
O
O
O
O
.$
:S
O
O
'%
Y-.
l
i
13
Maque en cualquier parte a lo largo de la linea, para mostrar cmo califica a este maestro.
Horrible
l.
Grandioso
1-
1-
1--5
-I
6
10
1+si.
Dicha calificacin plantea desafos especiaies,.debido a que las respuestas pueden ser muy diversas; en
casi todos los casos, la calificacin exige cierto juicio. Hay dos factores clave para crear puntuaciones
tiles a los reactivos de construccin de respuesta: el
primero consiste en asegurar la confiabilidad entre
calificadores; el segundo es concebir un esquema de
calificacin.
Wque esta escuela en cada una de las escalas que aparecen abajo. Ponga una marca en cualquier parte a la
[CALIDA
[AMIGABLE
[COMPFTENTE
[ASPERA
i..
1 &; Figura 6-4. Ejemplo de modelo de diferencial serndntico.
FRIA]
HOSTIL]
INCOMPETENTE]
SUAVE]
164
(Captulo 6)
\
...
Enunciados incompletos
Dado que la calificacinde los reactivos de construccin de respuesta de manera habitual exige juicio, el grado de acuerdo entre los calificadores (quienes emiten el juicio) es crucial. Si hay un acuerdo
deficiecteentre los calificadores,entonces no se desprwidera puntuaciones significativas de la prueba.
Por supuesto. la confiabilidad entre calificadores no
establece la validez de las puntuaciones. ni siquiera
otros tipos de codabilidad. por ejemplo. la confiabilidad test-retest. Sin embargo, cuando nc-hay confiabilidad entre calificadores todo lo dems se pierde;
cabe resaltar que la confiabilidad entre calificadores
es un problema especial de los reactivos de construccin de respuesta.
Concebir un esquema para calificar reactivos es
un desafo an mayor, las modalidades de los esquemas varan mucho; por tal razn, no es factible ofrecer aqu una lista completa; no obstante. se vern
.algunos ejemplos del campo de las pniebas de apmvahamiento para iuego volver la atencin hacia las
pruebas de personalidad.
, Se han desarrollado .varios mtodos diferentes
para calificar los ensayos. Una distincin comh es
entre la calificacin hoistica y*la analtica. En la
hoistica, el lector -la persona que califica el ensayo- se forma un juicio hostico (ofrecer una mejor
explicacin, el trmino definido no debe entrar en la
definicin) general sobre la calidad del ensayo; la puntuacin asignada al ensayo refleja ese juicio general.
La escala de calificacin puede tener cualquier cantidad
de puntos, 1 4 , 1-10 o 1-100 y la lectura suele realizarse con rapidez, sin correcciones o anotaciones escritas en el documento. Qu calidad del ensayo se
califica? Esto depende de la aplicacin de que se trate:
el ensayo puede calificarse en trminos de la calidad
de la exptesin escrita en una prueba de composicin
en ingls o de los conocimientos sobre la materia en
el caso de una prueba de historia. La caracterstica
fundamental de la calificacin holfstica consiste en
que slo hay una calificacin general sobre la calidad
total del ensayo.
-...
En la @ificacin &tiai
el nkrno ensayo se
valora en varias dfitiensionerdiferentes y exige que se:
especifique con antelacin las dimensiones impomtes de la calidad del ensayo. Las calificaciones que se
dan por separadoa estas dimensiones puede realizarlas
el mismo evaluador u otros diferentes. uno por ca&,
dimensin. El ensayo de composicin en ingls, por?
ejemplo. podra calificarsepor separadoen funcinde 1
a) la correccin gramatical, b) la organizacin y c) el'
uso de vocabulario; el de historia quiz se evale por '
separado, en funcin del uso de hechos hist6ricos;b{
identificacinde los principaies temas y la calidad dc?
. la rtdaccih. Desde la ptica de la medicin, la caIii-jj
cacin analtica supone que hay cierta indepen1encia-j
significativa entre los rasgos especificados en este
quema de calificacin pero, con frecuencia, tal in
pendencia parece estar ausente, como lo sealan
correlacionestan elevadas en@ las escalas
esquemas anaiticos. Antes de adoptar un
calificacin analtica,es necesarioestablecercierto
do de independencia en@ las d a s .
!c. Otro mtodo creado .para medir.la
redaccin es la calicaande rasgo p
considera que cada ej&cicio escrito tiene una
minada findidad.el grado en que un producto es
logra esa finalidad es su rasgo primario. La tarea pqM a consistiren escribir una carta en la que se solicita
cierto modelo de videojuego: una carta redactada para
este fin quiz lleve faltas de ortografa y enunciados'
incompletos, pero si el pedido logra despacharse conj
base en la carta, sta es entonces exitosa; empero, unai
carta elegantemente redactada, en la que no se espe-4
cifica el modelo deseado N la direccin a la que debe*
enviarse el artculo resulta fallida.
11
ap
I
4
sus orige
wmo prueba de habilidad de redacci6n en la Natio
Assessrnent of Educational Progress. que se describe
la p. 465; el m6todo luego se amplio a algunos programas
de evaluaci6n psicomttica estatales y otras aplicacio-
alas ltimas,
165
-/- -
<--
- --
167
4-2:
La validez de la prueba
A. Es la caracterstica aislada ms importante de
una pmeba.
B. Determina de una sola manera.
C. Es lo mismo que la confiabilidad.
D. Todas las anteriores.
Este reactivo infringe varias de las reglas: la 15, en el
sentido de que carece del contenido suficiente; la 24, ya
que la respuesta cofiecta (A) destaca por su extensin; la
25, al incluir la opcin D. Si alguien puede determinar
que slo una de las opciones es incorrecta o falsa, entonces "todo lo anterior" puede eliminarse como posibiidad. El m t i v o tambitn infringe la regla 27c, ya que la
opcin B no completa un enunciado gramaticalmente
correcto, de modo que no puede ser la opcin correcta,
aun cuando el examinadotal vez no sepa si la validez se
determina o no de una sola manen
168
Pruebas psicol~icns.Unc~irlrroduc.%rl
prtjcricc~
f Cal>tul~
6):
\
- ..5
,d
,q
'
3,4
y validez de la medicin por lo general se satisfacen mejor al incluir ms reactivos. Si slo hay
uno y, por alguna razn, el examinado no lo
entiende o "toma la va equivocada". no hay
forma de contrarrestar la situacin con respuestas a otros reactivos. Aunque el formato de construc_cin-.deLespuesta suele permitir mencg
reactivos que el formato de seleccin de respuesta, el especialista debe tender a mas y no a
menos reactivos al utilizar reactivos de construccin de respuesta.
CONSIDERACIONES PRACTICAS
PARA REDACTAR LOS REACTIVOS
Aqu se consideran algunos asuntos prcticos sobre la
redaccin de reactivos para las pruebas. Si el investigador est preparando un conjunto de reactivos de prueba, cuntos deben redactarse? No hay una respuesta
definitiva a esta pregunta, pues depende en parte de que
se tomen las decisiones adecuadas enia etapa de diseo preliminar, por ejemplo, sobre el tipo de reactivo
apmpiado que se emplead e investigar de modo concienzudo el rea que se evaiuar. La respuesta depende
tambidn de que se haga una labor razonable de prueba
informal, para asegurarse de que funcionen los pmtotipos de los reactivos buscados. Con estas consideraciones en mente, una regla prctica consiste en preparar
entre 2 y 3 veces ms reactivos de los necesarios para
la prueba final. As que, si la prueba final contar con
50 reactivos, uno debera preparar entre 100 y 150 para
probarlos. Considere las sisientes desviaciones extremas a esta regla prctica: si la prueba final tendr 50
reactivos y slo se someten a prueba 55, es casi seguro
que el anlisis de los reactivos revele ms de 5 reactivos
con caractersticasindeseables, si la perspectiva es desechar s610 5 reactivos, se ver obligado a incluir en la
prueba final algunos que no sean muy buenos. En el
extremo opuesto, si prepara 500 reactivos para probarlos, en primer lugar, evidentemente, elaborar 500 reactivos sobre casi cualquier tema es una tarea difcil, pero
ms importante ain. si va a elegir 50 reactivos de una
reserva de 500, es muy probable que el especialista aproveche algunos factores fortuitos que no sobrevivan a
un proceso de validacin cruzada (vase ms adelante.
bajo el subdtuo Validacin cruzada y disminucin de
la validez); si se requiere probar 500 reactivos para obtener 50 tiles, probablemente sea necesario reconsiderar la forma en que se est abordando la prueba.
170
. .
...
,.", ".."",
1
someten a una revisin desde varias perspectivas. Primero se revisan en funcin de su claridad. correccin
gramatical y conformidad con las reglas para la redaccin de reactivos, ya expuestas.zEn segundo lugar,
en el caso de los reactivos de las pruebas de aprove- ,
chamiento, se hace una revisin de la correccin delcontenido (estas revisiones las realizan expertos en el
campo temtico de que se trate).
En tercer lugar, en los ltimos aos se ha vuelta
una costumbre revisar los reactivos en busca de posip
bles sesgos de gCnero. raciales o tnicos, revisioms
que por lo general son realizadas por individuos que
representan a los grupos de referencia. La cuestin es
si algo en el reactivo pejudica o es injusto con algn
miembro del grupo, por "injusto" se entiende que los
integrantesdel grupo quiz respondan de manera iniid2CiAi. r.3 porque tengan un nivel bajo en el rasgo
que se mide, sino por su pertenencia al grupo. Si se
sospecha que un reactivo afecta de manera no equitativa el desempeo en la prueba. la tendencia comn '
es eliminarlo de la reserva, incluso antes de probarlo.
Por ejemplo, suponga que la mayor parte de los
reactivos preparados para una pr~ebade,lectura aborda temas de un deporte predominantemente masculino. como el ftbol americano, en la cual se incluyen
prrafos sobre formaciones de defensa, bloqueos y la
pausa de los dos minutos. Las chicas podran obtener
una calificacin menor en la prueba, no porque tengan una capacidad de lectura deficiente, sino porque
no han pasado las tardes de los sabados y los domingos escuchandocmo estos temas se analizan de manera interminable. Tales reactivos deben eliminarse o
quiz equilibrarse con otros que operen en sentido
contrario. En secciones ulteriores de este captulo, se
abordan algunos mCtodos estadsticosque sirven para
examinar este mismo tema
.
Consulte la revisin de alguna prueba en cualquier
del Mental Measurement Yearbook (Anuariode Mediciom
Mentales) del Instituto Buros. ya sea en forma electrnicao
impresa; explore la revisin de la prueba para ver lo que rt
dice sobre el proceso de elaboracin del instrumento; e&
atento en especial a los estadisticos de los reactivos. a$
les se mencionan?
;di
. . . . . . . . . . . . . . . . . . .-. . . .
..ld
:9
4
PRUEBA DE REACTIVOS
4I
muestrat
cuando
tiwS cl
cin de 1
quiz er
Ha:
ba de re
miento5
y de an
zar un t
isi'
{ dponden
a man a 1
para a!
6 dadde
sta es una de las etapas mciales en la elaboracin
de las pruebas, pues conlleva el anlisis de los datos
obtenidos al someter a prueba los reactivos. Los reactivos se eligen para su inclusin en la prueba final con
base en este anlisis, el cual consiste en realidad en
tres procesos muy relacionados: prueba de los reactivos, anlisis estadstico y seleccin de reactivos. En
esta seccin se analiza cada uno de estos procesos.
Por quC es importante el anlisis de reactivos?
Como ya se seal, la gran mayora de las pruebas
educativas y psicolgicas consta de un conjunto de
reactivos individuales. Los reactivos de las pruebas
dio int
anlisi
unas c