Técnicas Psicométricas: Construcción y Adaptación de Test Psicológicos

Tcnicas psicomtricas: construccin y adaptacin de test psicolgicos
Introduccin a la construccin y adaptacin de test (Mikulic)
La medicin significa asignar valores numricos definidos por escalas de medicin, siento estas
las reglas por las cuales se asignan esos valores. Se denomina escalamiento al proceso por el
cual se transforman las puntuaciones en respuestas puesto que las escalas contribuyen
instrumentos para medir algo, un rasgo o atributo. Existen distintos tipos de escalas:
- Nominal: nmeros solo cumplen funcin simblica que sirven para categorizar: ejemplo: 1=si
2=no
- Ordinal: diferenciacin y ordenamiento jerrquico segn las categoras, se establecen

relaciones de menor a mayor
- Intervalar: diferenciacin y ordenamiento jerrquico con cero relativo, arbitrario, se pueden

realizar operaciones matemticas
-De Razones: diferenciacin y ordenamiento jerrquico con cero absoluto, indica la ausencia del
constructo. Ej: ingresos del sujeto en LISRES
La psicologa reconoce en la psicometra esa rama que se ocupa de las cuestiones relacionadas
con la medicin. El objetivo de la psicometra ser hallar la mejor forma de observar, clasificar,
transformar categoras manifiestas en escalas cuantitativas. Busca articular los diferentes
fundamentos tericos con la diversidad de mbitos de aplicacin a travs de la evaluacin
psicolgica. La psicometra como ciencia de la medicin psicolgica estudia la confiabilidad y
validez de las pruebas.
Los esfuerzos por revisar las pruebas existentes y adaptarlas conservando su estructura
fundamental del instrumento, han logrado extender su uso a poblaciones especiales. Ya sea por
la diferencia de idioma o por la existencia de discapacidades, la elaboracin o adaptacin de las
nuevas versiones de las ediciones existentes.
Prueba era el trmino usado para referirse a todo, desde la administracin de una prueba hasta
la interpretacin de la evaluacin de la misma. Sin embargo para la poca de Segunda Guerra
Mundial comenz a surgir una distincin entre prueba y evaluacin.
Definiremos la evaluacin psicolgica como la recopilacin e integracin de datos relacionados

con la psicologa con el propsito de hacer una valoracin psicolgica, lograda con el uso de
herramientas como pruebas, entrevistas, estudios de casos, observacin conductual, etc.
Y definiremos prueba al proceso de medir variables relacionadas con la psicologa por medio de
dispositivos o procedimientos diseados para obtener una muestra de comportamiento.
El test es un instrumento de evaluacin cuantitativa de atributos psicolgicos de un individuo.

Tambin se lo define como un procedimiento evaluativo por medio del cual una muestra de
comportamiento de un dominio especificado es obtenida y posteriormente evaluada y puntuada
empleando un proceso estandarizado.
Las tcnicas psicomtricas son herramientas necesarias para la investigacin cientfica y clnica.
Son tipos de tcnicas que se utilizan en tareas de evaluacin y diagnostico. Estas tcnicas tienen
base teorica en la psicologa clsica, la psiquiatra, el anlisis factorial, los estudios sobre estilos
cognitivos y perceptivos, etc. Es este marco teorico desde el cual se operacionalizan las
variables y los constructos y desde donde se establecen puntajes y sus valores significativos.
Hay siete supuestos en las pruebas y evaluacin psicolgica:
- los rasgos y estados psicolgicos existen. Un rasgo es cualquier forma distinguible,

relativamente perdurable, en la que un individuo varia de otro. Los estados tambin distinguen a
una persona pero son relativamente perdurables.
- los rasgos y estados psicolgicos pueden clasificarse y medirse
- pueden ser tiles diversos enfoques para medir sujetos del mismo objeto de estudio: pueden
variar pruebas y tcnicas de medicin para medir el mismo constructo
- la evaluacin puede sealar fenmenos que requieran una mayor atencin o estudio. Por
ejemplo un diagnstico, que es la conclusin alcanzada con base en la evidencia y opinin por
medio de un proceso de distincin de la naturaleza de algo y descartar conclusiones alternativas
- diversas fuentes de informacin enriquecen y son parte del proceso de evaluacin
-diversas fuentes de error son parte del proceso de evaluacin. El error se refiere a la suposicin
de que factores distintos al que pretende medir la prueba influirn en el desempeo de esta. Las
fuentes potenciales de error son variadas.
- las pruebas y otras tcnicas de medicin tienen ventajas y desventajas. Esto implica conocer
las limitaciones de las pruebas y compensarlas con datos de otras fuentes.
Quienes son las partes de las pruebas?
El que construye la prueba: quienes de dedican a eso brindan una amplia variedad de
antecedentes y detalles respecto del proceso de elaboracin. Hay que tener en cuenta las
publicaciones de normas de comportamiento tico referidas a la elaboracin y uso de
pruebas.
El que usa la prueba: si bien son usadas por variedad de profesionales, todos debern
cumplir con los principios ticos correspondientes. El que administra la prueba tiene
que estar familiarizado con los materiales y procedimientos de la prueba y tener todos
los materiales necesarios para administrarla apropiadamente. Es fundamental el
comportamiento del evaluador y la empata que debe tener con el evaluado.
El que responde la prueba: las personas evaluadas enfocan una situacin de evaluacin
de diferentes maneras y el administrador debe ser sensible a la diversidad de respuestas
posibles ante una situacin de prueba. El evaluado puede variar en ansiedad, capacidad
y disposicin, dolos fsico o angustia, malestar o incomodidad por situaciones fsicas o
emocionales, grado de alerta, grado de predisposicin a estar de acuerdo o desacuerdo
con la presentacin de reacivos, grado de suerte si no conoce de lo que responde, etc.
Contextos en los que se realizan evaluaciones
Contexto clnico: ejemplo en hospitales pblicos, consultorios privados, etc.
Contexto educativo: escenarios educativos para diagnosticar por ejemplo problemas de

aprendizaje, o administrar a aspirantes a un nuevo ingreso o en un contexto de
orientacin vocacional.
Contexto jurdico: fuente de informacin para ayudar a responder si la persona es

competente para ser enjuiciada o para saber si en el momento de cometer el delito
distinguia entre el bien y el mal
Contexto organizacional: en particular en rea de recursos humanos. Evaluar

conocimiento o habilidades en las que el evaluado puede ser un empleado, un candidato
a ser empleado.etc
Otros contextos
Teoras de los test
Existen diversos paradigmas o modelos que permiten explicar el significado de las puntuaciones
obtenidas en los test. El objetivo de cualquier teora de test es realizar inferencias sobre el nivel
en que los sujetos poseen las caracterstica o rasgo inobservable que mide el test, a partir de las
respuestas que estos han dado a los elementos que forman el mismo. Las distintas teoras
difieren en la funcin que utilizan para relacionar la actuacin observable en el test con el nivel
de sujetos en la variable inobservable.
Teora clsica de los test: iniciada por Spearman sostiene que la puntuacin observable
de una persona en un test es una funcin de dos componentes: su puntaje verdadero
(inobservable) y el error de medicin implcito en la prueba.
La TCT es el conjunto de principios tericos y mtodos cuantitativos derivados de esos

principios, que fundamentan la construccion, aplicacin, validacin e interpretacin de
distintos tipos de test. Es un modelo de puntuacin verdadera como valor esperado, es
decir, el promedio de las puntuaciones empricas obtenidas en infinitas aplicaciones lo
cual permite derivar escalas estandarizadas aplicables a una poblacin.
Durante sus diferentes fases de desarrollo se elaboraron procedimientos de anlisis

cuantitativos que han sido de gran utilidad, destacndose en lo general, tres grandes
etapas:
- itemetria: denominada asi por Cattell y se caracteriza por la construccin de pruebas

conformadas por reactivos cuyas propiedades estadsticas eran el centro de atencin
principal. Hizo contribuciones valiosas a la psicologa debido al nfasis que puso en el
anlisis del error.
- psicometra estructural: tambin la denomino asi Cattel, se caracteriza por el uso de
la nuevas herramientas estadsticas (como anlisis factorial) como un medio para
encontrar la estructura natural de las habilidades en el contexto de los factores
culturales,, la dotacin gentica, la personalidad, los rasgos,etc. Su objetivo primordial
no era aplicar pruebas, sino determinar la relacin que hay entre los conceptos clnicos
sobre personalidad, y los fundamentos de investigacin experimental multivariada
(cuantitativa) asi como analizar interacciones dinmicas entre los rasgos y los estadios
de la personalidad.
-etapa funcional: es aquella que trasciende a las aplicaciones inmediatas y simplistas

que identificaban a las estadsticas con factores conductuales, y profundiza en las leyes
y formulaciones conceptuales del comportamiento: relaciona rasgos, procesos, estados
psicolgicos con las mediciones y estrategias conductuales.
Es decir que la TCT procedio de etapas orientadas en forma pragmtica para desarrollar
tests y validar reactivos hacia etapas mas elaboradas en que los test se derivan de teoras
del comportamiento mas articuladas, y donde cada reactivo tiene un significado
conceptual definido en un contexto teorico particular.
La TCT tiene limitaciones: el xito de las tcnicas depende de que tan parecida es la
poblacin con la cual se obtuvieron los ndices respecto de la poblacin a la que se la
pretende aplicar. Si la diferencia es grande, los ndices obtenidos de los tems no sern
apropiados para la poblacin objetivo. Es decir, es imposible predecir como repondera
el individuo a los tems, a menos que esos tems hayan sido administrados a personales
similares. Otro problema es que es centrada en el test mas que en el reactivo.
Teora de la generalizabilidad: Cronbach y Glaser postularon esta teora que es una

extensin del modelo clsico en que las diversas mediciones del mismo individuo
pueden variar tanto por efecto de una variacin en lo que se mide como por el error de
medicin. Las decisiones sobre la bondad de un instrumento se basan en estudiar las
fuentes y tipos de error, utilizando el anlisis de la varianza. El puntaje universo es
semejante al puntaje verdadero en el modelo clsico. La diferencia es que en la TCT se
considera que la varianza de error es de una sola clase, en cambio en la TG se reconoce
que existen otros universos de generalizaciones, muchos puntajes universos posibles.
Las diferentes fuentes de error se denominan facetas, son caractersticas de la situacin

de medicin que pueden cambiar de un momento a otro generando asi variaciones en
los resultados obtenidos. Las distintas variaciones asociadas a las facetas contribuyen a
la varianza de error, y disminuyen la generalizabilidad de los puntajes obtenidos en las
personas evaluadas.
Teora de despus al tem: fue desarrollada para resolver los problemas de la TCT,
como por ejemplo el uso de ndices de los reactivos cuyos valores depende de la
poblacin particular del cual fueron obtenidos y la estimacin de la habilidad del
examinado depende del conjunto especifico de reactivos incluidos en la prueba.
Las principales caractersticas de la TRI como una alternativa a la TCT son:
-las caractersticas de los reactivos no dependen del grupo del cual fueron obtenidos
-los puntajes que describen la habilidad de los examinados no dependen del test en su
conjunto
-el modelo se expresa a nivel del reactivo mas que a nivel del test
-el modelo no requiere de pruebas paralelas para determinar la confiabilidad
-provee una medida de la precisin de cada ndice de habilidad
Construccin
Definicin del dominio del test: siguiendo a Tornimbeni en la especificacin del

dominio de conductas o clase de tareas que el individuo debe realizar, propone:
- Definicion del objetivo: se establece cual o cuales sern los objetivos que se evaluaran
a travs de la prueba, por ejemplo: la habilidad de comprensin, que incluye despuestas
que se refieren nicamente a una comprensin de los mensajes literales contenidos en la
comunicacin.
-Descripcion del objetivo: se define en trminos de conductas observables el o los

objetivos a ser evaluados. Ej anterior: se especificara un objetivo de la habilidad de
compresin tal como ser capaz de analizar el propsito del autor y su punto de vista
examinando una comunicacin escrita
- Estacificacion de las caractersticas de la situacin de evaluacin: se especifican

todos aquellos aspectos a tener en cuenta en la situacin de evaluacin. Ejemplo: en un
texto de divulgacin cientfica, seleccionar el parrados e identificar la oracin donde se
expresa la intencin del autor.
-Caracteristicas de la respuesta: se especifica cual es la respuesta que se espera del

sujeto.
Seleccin y elaboracin de las escalas: la medicin es la asignacin numrica de

acuerdo con relgas y las escalas son las reglas de medicin. La elaboracin de escalas
puede definirse como el proceso de establecimiento de reglas para la asignacin
numrica en la medicin. O sea es el proceso por el cual se disea y calibra un
dispositivo de medicin y la forma en que se asignan nmeros, valores de escala, a
diferentes cantidades del rasgo o atributo que se est midiendo. Las escalas son
instrumentos usados para medir algo, ese algo en psicometra es un rasgo o atributo
psicolgico. Las escalas pueden clasificarse a lo largo de un continuo del nivel de
medicin y denominarse por su naturaleza como nominales, ordinales, de intervalo o de
razn. Esto depender en parte de los objetivos de la escala y de la legitimidad
matemtica de las manipulaciones y transformaciones de los datos resultantes.
El mtodo de elaboracin de escalas depender de las variables que se van a medir, el

grupo para el cual se pretende la prueba (los nios pueden requerir un mtodo menos
complicado que los adultos) y de las preferencias del elaborador de la prueba.
Redaccin de tems: existen pautas convencionales para la redaccin de tems de

prueba. Estas incluyen recomendaciones tales como: redactar tems congruentes con el
objetivo de medicin y evitar los tems demasiado largos, las oraciones complejas con
ambigedades de sentido, las frases con dobles negaciones, el uso de expresiones
extremas (nunca, todos, siempre) y utilizar el lenguaje mas apropiado al nivel de
maduracin y educativo de la poblacin.
Los dos errores mas comunes son: ambigedad, preguntas difusas que admites varias
respuestas y trivalidad, centrarse en aspectos poco importantes del rasgo o dominio en
cuestin.
Existe el formato de construccin de respuesta o de seleccin de respuesta (opcin

multiple, tem de relacin, verdadero/falso)
Revisin del test por expertos: la mayora de los autores recomiendan que los tems
preliminares de un test sean revisados por expertos en construccin de pruebas, en el
dominio o rasgo a medir y en el nivel de comprensin de la poblacin a la cual se
apunta con la prueba. Las caractersticas que los expertos deben evaluar en cada tem
son: claridad semntica y correcion gramatical, adecuacin de su dificultad al nivel
educativo y evolutivo de las personas, congruencia con el rasgo o dominio medido.
Anlisis y seleccin de tems: existen varios procedimientos de anlisis de los tems de

una prueba preliminar, que se ocupan de la distribucin de los puntajes en cada tem y
de la relacin estadstica entre el tems y la prueba total.
El primer paso para obtener info psicomtrica sobre los tems homogneas consiste en
administrar los elementos preliminares a una muestra amplia representativa de la
poblacin que se quiere evaluar en la prueba final. Para descartar tems que no
funcionan bien debe contarse con una cantidad de sujetos cinco veces superior al
numero inicial de reactivos y el doblr de tems de los que aparecern en la versin
definitiva.
Una vez aplicada la prueba piloto se podrn tomar decisiones sobre cuales de los tems
debern integrarse a la forma final del test. El objetivo es que todos los reactivos se
relacionen con un ncleo comn de medicin que es el constructo o dominio.
El anlisis factorial es un mtodo para agrupar las variables que se correlacionan

fuertemente entre si y cuyas correlaciones con las variables de otros agrupamientos es
menor. En el anlisis factorial se extraen factores sin una estructura teorica previa
conjeturada de modo explicito. Antes de realizar un anlisis factorial debe determinarse
si los tems estn suficientemente interrelacionados.
Adaptacin
Mtodos de adaptacin de test: actualmente se reconoce que la adaptacin de un test

es un proceso mas complejo que la mera traduccin de ese test a un idioma diferente.
Una adaptacin implica considerar no solo las palabras utilizadas sino tambin las
variables culturales involucradas.
Van de Vijver y Leung establecieron tres niveles de adaptacin de las pruebas

psicolgicas:
- Aplicacin: la simple traduccin de un test de un idioma a otro. Este mtodo asume la

equivalencia de constructo. Desafortunadamente es el mtodo mas comn y el mas
utilizado, pero la sola traduccin de una prueba no nos indica ningn nivel de
equivalencia,
- Adaptacion: la traduccin se agrega a la transformacin, adicion o substraccin de

algunos tems de la escala original. Algunos tems pueden cambiar su signiicado de una
cultura a otra y por lo tanto se necesitan modificaciones o ser eliminados.
- Ensamble: puede emerger al momento de adaptar un instrumento, en este caso el

instrumento original ha sido modificado tan profundamente que prcticamente se ha
transformado en un nuevo instrumento. Esto ocurre cuando mucho de los tems son
evidentemente inadecuados para representar el constructo a medir. El ensamble se da
tambin cuando es constructo no esta representado adecuadamente en la forma original.
Tcnicas de traduccin: el proceso de traduccin es complejo e implica mas que la

traduccin lineal de las palabras. Existen dos mtodos:
- Traduccin directa: un traductor o un grupo de traductores traducen el test desde el

idioma original al nuevo. Luego, otro grupo de traductores juzga la equivalencia entre
las dos versiones.
-Traduccion inversa: el mas utilizado, un grupo de traductores realiza una traduccin

desde el idioma original al nuevo idioma, luego un segundo grupo toma el test traducido
y lo vuelven a traducir al idioma original. Se realizan comparaciones entre las dos
versiones.
Mtodos para establecer la equivalencia entre test: una vez realizada la traduccin se
debe realizar el estudio para establecer si esa traduccin es equivalente a la original. 3
metodos:
- Administracin de la prueba en el idioma original y de la prueba traducida a sujetos
bilinges: se aplica ambas versiones de las prueba a sujetos que hablan ambos idiomas.
La ventaja es que se pueden controlar las diferencias de las caractersticas de los
participantes en el test ya que ambas pruebas se administran a las mismas personas. La
desventaja es que se basa en la premisa de que los sujetos son igualmente competentes
en ambos idiomas, no puede asegurarse que los bilinges tengan el mismo nivel de
competencia de la poblacin den general por el hecho de conocer otro idioma es
probable que se trate de personas con mayor capacidad intelectual o mejor educacin.
-Administracin de la versin original y su traduccin inversa a monolinges en el

idioma original: se compara el desempeo de cada sujeto en cada tems de ambas
versiones. La ventaja nuevamente esta en el control de caractersticas de los
participantes, la desventaja esta en que el diseo no permite obtener datos con la versin
del idioma meta, adems puede existir un efecto de aprendizaje entre la primer y la
segunda prueba.
-Administracion de la versin original a monolinges que hablan el idioma original y

de la versin traducida a monolinges que hablan el idioma meta.
Fuentes de sesgo: sesgo es un error constante o sistematico (no al azar).
-Sesgo de constructo: cuando es constructo medido no es idntico a travs de los grupos

culturales
-Sesgo metodolgico: sesgo de muestra (muestras incomparables entre si) sesgo en el

instrumento, sesgo de administracin.
Adaptacin de test de una cultura a otra
Contexto
-Los efectos de las diferencias culturales que no sean relevantes para los objetivos
centrales del estudio deberan minimizarse en la medida de lo posible.
- Debera de evaluarse la cuanta del solapamiento de los constructos en las poblaciones

de inters
Adaptacin de los tests
-Los constructores/ editores de tests deberan de asegurarse que el proceso de

adaptacin tiene en cuenta las diferencias lingsticas y culturales entre las poblaciones
a las que se dirigen las versiones adaptadas de los tests.
- Los constructores / editores de los tests deberan de proporcionar datos que garanticen
que el lenguaje utilizado en las instrucciones, en los propios tem y en el manual del
tests, son apropiados para todas la poblaciones culturales e idiomticas a las que va
dirigido el tests.
-Los constructores / editores de tests deberan de aportar evidencia de que las tcnicas
de evaluacin elegidas, los formatos de los tems, las reglas de los tests y los
procedimientos son familiares a todas las poblaciones a las que van dirigidos.
-Los constructores / editores de tests deberan de facilitar evidencia de que el

contenido de los tems y los materiales de los estmulos son familiares a todas las
poblaciones a las que van dirigidos.
-Los constructores / editores de tests deberan de aportar una justificacin racional

sistemtica, tanto lingstica como psicolgica, para mejorar la precisin del proceso de
adaptacin, as como reunir datos acerca de la equivalencia de todas las versiones en los
distintos idiomas.
-Los constructores / editores de tests deberan de asegurarse que el diseo de recogida

de datos permite el uso de tcnicas estadsticas apropiadas para establecer la
equivalencia entre los tems correspondientes a las diferentes versiones idiomticas del
test.
-Los constructores / editores de tests deberan aplicar tcnicas estadsticas apropiadas

para 1) establecer la equivalencia entre las diferentes versiones de un test, 2) identificar
componentes problemticos o aspectos del test que puedan ser inadecuados para alguna
de las poblaciones a las que va destinado el test.
-Los constructores / editores de tests deberan de proporcional informacin sobre la

evaluacin de la validez en todas las poblaciones objetivo a las que va dirigido el test
adaptado.
-Los constructores / editores de tests deberan de aportar datos estadsticos sobre la

equivalencia de los tests para todas las poblaciones a las que van dirigidos.
-No deben utilizarse preguntas no equivalentes en todas las versiones dirigidas a

diferentes poblaciones cuando se prepara una escala comn, o cuando se comparan
estas poblaciones. Sin embargo, pueden ser tiles para reforzar la validez de contenido
de las puntuaciones de cada poblacin por separado.
Aplicacin
-Los constructores y los aplicadores de los tests deberan tratar de prever los tipos de
problemas que cabe esperar, y tomar las medidas oportunas para evitarlos mediante la
preparacin de materiales e instrucciones adecuados.
-Quienes aplican los tests deberan de ser sensibles a cierto numero de Editores
relacionados con los materiales utilizados para los estmulos, los procedimientos de
aplicacin, y las formas de respuesta, que pueden reducir la validez de las inferencias
extradas de las puntuaciones.
-Aquellos aspectos del entorno que influyen en la paliacin del test deberan de
mantenerse lo mas parecidos posibles para todas las poblaciones a las que va dirigido el
test.
-Las instrucciones para la aplicacin del test en el idioma fuente y en el objetivo deben
minimizar la influencia de variacin no deseada.
-El manual del test debera de especificar todos los aspectos del test y de su aplicacin
que han de revisarse al utilizarlo en un nuevo contexto cultural.
-El aplicador no debe de interferir, debiendo minimizarse su influencia sobre los

examinados. Deben de seguirse al pie de la letra las reglas explicitas descritas en el
manual del test.
Interpretacin de las puntuaciones
-Cuando se adapta un test para utilizarlo en otra poblacin, debe de facilitarse la

documentacin sobre los cambios , as como los datos acerca de la equivalencia entre
las versiones.
-Las diferencias entre las puntuaciones obtenidas por las muestras a las que se aplic el
test no deben de tomarse sin ms directamente. El investigador tiene la responsabilidad
de sustanciar las diferencias con otros datos empricos.
-Las comparaciones entre poblaciones solo pueden hacerse al nivel de la invarianza que
se haya establecido para la escala en la que se expresan las puntuaciones.
-El constructor del test debera de proporcionar informacin especfica acerca de las
distintas formas en las que los contextos socioculturales y ecolgicos de las poblaciones
pueden afectar al rendimiento en el test , y debera sugerir procedimientos para tener en
cuenta estos efectos en la interpretacin de los resultados.
CONCLUSIONES: La utilizacin de los tests psicolgicos construidos en otros

contextos culturales es una prctica frecuente. El uso de un test en un contexto cultural
diferente, donde se usa un lenguaje distinto y se esta familiarizado con estmulos muy
diversos, produce dificultades traducibles como fuentes de sesgo. La existencia de sesgo
puede tener consecuencias iatrognicas al aplicar los tests y al obtener resultados
totalmente errneos. Es por ello que para poder evaluar si un determinado rasgo
psicolgico existe en culturas diferentes es necesario contar con instrumentos
equivalentes a travs de diferentes culturas, es decir que midan lo mismo en ambas
culturas en donde va a ser aplicado. Para ello proponemos comenzar por desarrollar
mayor cantidad de instrumentos que cumplan con los requisitos necesarios para ser
aplicados segn las teoras de los tests que ltimamente han cobrado vigor y siguiendo
parmetros internacionales
Elaboracin de pruebas y anlisis de reactivos (Hogan)
La elaboracin de una prueba se da en 6 pasos, que no siempre estn del todo

diferenciadas.
Definicin de la finalidad de la prueba: la elaboracin de una prueba

comienza por un planteamiento de la finalidad del instrumento, que consiste en
el o los rasgos que se medirn y la audiencia meta de la prueba. El planteamiento
debe formularse atendiendo a la clase de interpretacin que se pretende dar en
ltima instancia o las puntuaciones de la prueba. No se debe proceder de
inmediato a elaborar el instrumento, sino que la estaba siguiente debe determinar
si ya existe una prueba apropiada.
Se plantean las preguntas de porque, para que construirlo. Se define el dominio

del test. Exhaustivo anlisis del dominio o rasgo a medir. Rastreo de bibliografa
sobre el constructo. Anlisis previo de los indicadores que van a formar parte del
test, operacionalizacion.
Aspectos de diseo preliminares: tomar decisiones sobre el diseo del

instrumento, las cuales se basan en la finalidad de la prueba y en las
interpretaciones que se busca dar con las puntuaciones. Deben abordarse los
siguientes aspectos del diseo:
-Modo de aplicacin: se aplicara de forma individual o grupal, la colectiva ser

mas eficaz pero la individual permite mas adaptabilidad en los formatos de los
reactivos y la observacin clnica del examinado
-Duracin: cuantos durara la prueba, ser breve? Con que periodo de aplicacin?
Una breve es mas eficaz pero tendr menos confiabilidad que una extensa
-Formato de reactivos: que formato se utilizara, opcin multiple, v/f,

construccin de respuestas (Es mas rica y mas flexible pero mas difcil de
calificar)
-Cantidad de puntuaciones: cuantas puntuaciones generara la prueba
-Informes de las puntuaciones: que clase de reportes de puntuaciones se

producirn, registro simple escrito a mano o conjunto elaborado de informes? Se
informara solo el puntaje total de la prueba o el desempeo en conjuntos de
reactivos?
-Capacitacion del aplicador: cuanta capacitacin necesitara para la aplicacin y

calificacin de la prueba. Quienes implementan la prueba requieren
adiestramiento profesional exhaustivo para aplicar, calificar e interpretar el
instrumento?
-Investigacion de antecedentes: investigacin de antecedentes sobre el mbito
que se probara, una bsqueda de bibliografa estndar.
La redaccin de los reactivos no debe iniciarse hasta que estas consideraciones

de diseo preliminares hayan sido exploradas al detalle. Estas condiciones
declararan que clase y cantidad de reactivos se redactaran. Las deliberaciones
sobre estos aspectos de diseo preliminares pueden conducir a una depuracin
en el planteamiento de la finalidad de la prueba.
Qu motiva la elaboracin de pruebas nuevas?
-necesidad practica
-necesidad teorica
-revisar o adaptar las pruebas existentes: la idea es conservar lo mas posible la

estructura fundamental del instrumento, pero con una modificacin para
poblaciones especiales.
Preparacin de reactivos: esto incluye tanto la redaccin de estos como su

revisin. Esta redaccin no debe realizarse hasta que se haya definido la
finalidad de la prueba u explorado de manera minuciosa las consideraciones de
diseo preliminares.
El reactivo de una prueba posee cuatro partes:
- estimulo: se denomina a menudo la base del reactivo, es a lo que responde el

examinado, puede ser una pregunta, una imagen acompaada por una pregunta
oral, etc. El reactivo debe tener una instruccin, sino esta incompleto.
- formato de respuesta: incluye factores respecto de si este es un reactivo de

opcin mltiple o de construccin de respuesta.
- condiciones que rigen la respuesta: se hallan variables como el lmite de

tiempo para responder o si quien aplica la prueba puede sondear las respuestas
ambiguas y como se registra exactamente la respuesta.
- el procedimiento para calificar: por ejemplo si es opcin mltiple podra

calificarse como correcto o incorrecto, o que se de crdito parcial por elegir
ciertas opciones (wais si se ofrece buena respuesta es 2 sino 1 o 0)
Tipos de reactivos de las pruebas
- Reactivos de seleccin de respuesta: al examinado se le presentan al menos dos

opciones de respuesta de las cuales debe elegir una. Por ejemplo v/f o de
acuerdo-completamente de acuerdo-desacuerdo. Poseen 3 ventajas: dado que la
calificacin no exige juicio la confiabilidad entre los calificadores o entre jueces
es en esencia perfecta su eficacia temporal el examinado responde a ms
reactivos de seleccin de respuesta que de construccin de respuesta la eficacia
de la calificacin ya que un empleado o escner electrnico pueden calificar
estos reactivos de manera veloz.
- Reactivos de construccin de respuesta: se presenta un estmulo pero no se

restringe al examinado a elegir un conjunto fijo de respuestas, el mismo debe
crear o construir la respuesta. Es una respuesta libre en el sentido de que no esta
limitado a una serie fija de opciones, hay condiciones que rigen la respuesta.
Una versin es llenar el espacio en blanco, donde se omite una palabra o frase
clave de un enunciado para que el examinado coloque las palabras faltantes.
Otra es la prueba de ensayo en la cual el reactivo de prueba se presenta una
situacin o tema, y el examinado escribe la respuesta. La calificacin plantea
desafos especiales ya que las respuestas pueden ser muy variadas, hay dos
factores clave para crear puntuaciones: el primero consiste en asegurar la
confiabilidad entre calificadores, el segundo es concebir un esquema de
clasificacin que varian dependiendo el tipo de prueba (ejemplo wais)
Poseen tambin 3 ventajas: permiten una observacin mas sencilla del

comportamiento y los procesos al realizar la prueba, facilita observar en el
experimentado su motivacin, ansiedad, forma de abordar los problemas y otros
permite explorar reas inusuales que probablemente tal vez nunca afloraran
con uno de seleccin de respuesta influye en los habitos de estudio de los
estudiantes ya que promueve una aproximacin mas holista y significativa al
estudio
Consideraciones para redactar los reactivos: una regla practica consiste en

preparar 2 o 3 veces ms reactivos de los necesarios para la prueba final. Deben
tener claridad semntica, adecuacin al nivel madurativo y educativo de la
poblacin, utilizar la cantidad suficiente de reactivos, etc.
Una vez redactados los reactivos se someten a una revisin desde varias
perspectivas. Primero se revisan en funcin de su claridad, correccin gramatical
y conformidad con las reglas para la redaccin de reactivos. En segundo lugar se
hace una revisin de la correccin de contenido. Y en tercer lugar se revisan en
busca de posibles sesgos de gnero, raciales, tnicos, etc. Luego son revisados
por jueces especializados y se evalua la validez de contenido, permite saber si
los tems representan al constructo. Proceso de depuracin de tems que no
cumplen los requisitos y no representan al indicador al que pretenden remitir.
Anlisis de los reactivos: etapa crucial que conlleva el anlisis de datos

obtenidos al someter a prueba los reactivos. Los reactivos se eligen para su
inclusin en la prueba final con base en este anlisis, el cual consiste en 3
procesos:
- Prueba de reactivos: una etapa formal y otra informal. Los datos del anlisis
de reactivos se basan en la prueba formal. Sin embargo antes de realizar esta, se
lleva a cabo una prueba informal de los reactivos del instrumento. Esta
aplicacin informal se le pide a los individuos que comenten los reactivos y las
instrucciones o que piensen en voz alta, asi el creador puede identificar
formulaciones ambiguas, interpretaciones inesperadas de un reactivo, confusin
sobre mtodos de respuesta,etc. La prueba formal supone aplicar los nuevos
reactivos de la prueba a muestras de examinados que sean representativas de la
poblacin meta del instrumento. Hay tres prcticas para realizar la prueba
formal: procedimientos de estudio independiente (realizar un estudio con solo la
finalidad de hacer un anlisis de los reactivos, no hay limite de tiempo), de
acomplamiento (incluir reactivos de prueba en la aplicacin regular de una
prueba existente) y de anlisis continuo (se utilice de forma reiterada una
prueba o reserva de reactivos, a la cual se suman nuevos reactivos en cada uso)
Tambin se realizan estadsticos de los reactivos:
- Dificultad de los reactivos: se eliminan tanto los tems fciles porque no

discriminan el indicador o rasgo y los difciles porque no se comprenden.
- Discriminacion del reactivo: capacidad de un reactivo para diferenciar en

trminos estadsticos entre los grupos de examinados. Se pretende que los
reactivos diferencien a los individuos que tienen mas el rasgo evaluado de
quienes no lo tienen. Se expresa por medio de ndices de correlacin. Se evala
por medio de dos mtodos: externo (grupos contrastados) e interno (mismo
instrumento que se toma la muestra piloto se divide la distribucin en cuartos
con los grupos que tuvieron mas y menos puntaje y se comparan los tems)
- Anlisis de distractores: se eliminan tems que no son claros
- Anlisis factorial: se intenta agrupar en dimensiones se ve la correlacin de los

tems con un factor. Se eliminan los tems que no correlacionan con ninguna
dimensin.
Programas de estandarizacin y de investigacin auxiliares: el programa de

estandarizacin genera las normas de la prueba. Se trata de un importante
aspecto de la diligencia que se emprende al elaborar una prueba y que inicia
despus de haber seleccionado los reactivos en la fase final de la etapa de
anlisis de estos. La prueba que se estandariza debe ser la misma que habr de
publicarse al final.
Habr otros programas de investigacin que se ejecuten con la versin final de la

prueba, pero antes de su publicacin. La ndole y extensin de estos programas
auxiliares dependen del alcance del instrumento. Pueden llevarse a cabo varios
tipos de estudios como por ejemplo el test-retest sobre confiabilidad, entre otros.
Hay 3 tipos de programas de equivalencia que podran realizarse como parte o al

mismo tiempo que el programa de estandarizacin. 1- si la prueba tienen formas
alternas, para que las normas se apliquen a todas las formas, estas deben
corresponderse. 2- si el instrumento posee mas de un nivel, entonces es menester
hacer que se correspondan los diferentes niveles 3- si la prueba recin
estandarizada es una revisin de un instrumento estandarizado de manera previa,
tal vez convenga ofrecer cuadros en los que se haga corresponder las normas de
las ediciones anterior y nueva.
Preparacion de los materiales finales y publicacin: la etapa final del proceso

de elaboracin de una prueba es la publicacin. Tiene que ver con las
instrucciones de aplicacin e interpretacin, los manuales tcnicos, los reportes
de puntuaciones y otros materiales complementarios. Una prueba publicada
cuenta con un manual tcnico que es la fuente de informacin fundamental sobre
la finalidad, los fundamentos y la estructura de la prueba, mismo que debe
contener informacin acerca de la confiabilidad, validez y procedimiento de
normalizacin del instrumento.
El proceso nunca esta completo, al momento de su publicacin no hay prueba

para la que se haya hecho una demostracin exhaustiva de su validez, adems
siempre surgen interrogantes sobre su aplicacin a diversas poblaciones
especiales. Una prueba publicada siempre esta sujeta a investigaciones
adicionales. Las pruebas se revisan de forma peridica para determinar si
necesitan revisiones.
Cosas principales para la elaboracin de pruebas segn Hogan:
- la concepcin original es mas importante que la labor tcnica o estadstica
- se requiere dedicar mucho tiempo a estudiar el rea que se desea evaluar, antes de
empezar a redactar reactivos
- en la etapa de diseo original es necesario pensar en los informes de las puntuaciones

finales
- al preparar los reactivos, buscar la sencillez de los mismos
-asegurarse de probar los reactivos suficientes
-antes de la evaluacin principar se realizara una evaluacin informal simple
-es vital la publicacin de un manual final

Test psicolgicos (Anastasi y Urbina)
Por qu se hace un uso incorrecto de los instrumentos de evaluacin psicolgica? POR 3

RAZONES:
- Intencin deliberada de deformar la realidad
- Negligencia
- Insuficiente conocimiento de los instrumentos evaluativos (la ms frecuente)

A los psiclogos les cabe la responsabilidad, si usan tcnicas, de especializarse en ellas y
actualizarse en los nuevos avances-> SUPUESTO: si un profesional est suficientemente
capacitado y entrenado en la prctica con instrumentos de evaluacin se reduce la probabilidad
de que sean incorrectamente usados. Es importante que dispongan de una valoracin realizada
por personas expertas en el rea de evaluacin psicolgica que informaran la calidad de la
tcnica de los instrumentos, construidos y adaptados en nuestro medio.
PUNTUACIONES CRUDAS Y PORCENTAJES-> por s solos no significan nada, sino que

solo pueden interpretarse en un marco de referencia definido y uniforme-> puntuaciones se
interpretan en referencia a NORMAS (desempeo de la muestra de estandarizacin
representativa en la prueba).
PUNTUACIONES TRANSFORMADAS O DERIVADAS-> distribucin de las

puntuaciones obtenidas por la muestra de estandarizacin para ver qu lugar ocupa en
esa estandarizacin. Cumplen un doble propsito:
a- Indican la posicin del individuo en relacin con la muestra normativa lo que permite la
evaluacin de su desempeo
b- Si se expresan en la misma unidad, proporcionan medidas equivalentes que permiten la
comparacin directa del desempeo del individuo en pruebas diferentes para comparar
funciones diferentes. No as con las puntuaciones crudas porque se expresan en
unidades diferentes o se influye por el nivel de dificultad de la prueba
Las puntuaciones derivadas se expresan en:
- Nivel de desarrollo alcanzado
- Posicin relativa dentro de un grupo especfico
NORMAS DE DESARROLLO: Puntuaciones adquieren significado si indican qu

tanto ha progresado el individuo en el patrn de desarrollo normal.
- NORMAS DE EDAD MENTAL: EDAD BASAL (mayor edad en la que todas las
pruebas eran pasadas por los sujetos) + MESES ADQUIRIDOS COMO CRDITOS
EN LOS NIVELES SUPERIORES. No es constante con la edad: tiende a disminuir con
los aos. Puntuaciones se agrupan cronolgicamente. Puntuacin de un nio-> mayor
nivel que ha alcanzado con xito. O por nmero total de aciertos o de errores. Promedio
de puntuaciones de los nios: NORMA DE EDAD de esa prueba.
- GRADOS EQUIVALENTES: en las pruebas de aprovechamiento acadmico-> los
resultaos se interpretan como equivalentes a grados.
- NORMAS DE GRADO: puntuacin promedio de los nios de cada grado. Hay grados
intermedios tambin. Tienen varios defectos:
Contenido de la instruccin vara de grado a grado-> por eso slo sirve para las
materias enseadas en comn en todos los grados y no son aplicables a los aos
donde hay materias que se dan slo en algn grado, como es en la secundaria
Pueden ser malinterpretadas (a menos en que se sepa siempre de dnde deriv
los resultados)
Tienden a ser consideradas de forma errnea como criterios de desempeo, en
vez de considerar tambin las diferencias individuales entre los sujetos del
grado.
- ESCALAS ORDINALES: Se usa en la psicologa infantil. Se describe las conductas
de los nios en funcin de la locomocin, comunicacin lingstica, discriminacin
sensomotora, etc. en base a observaciones empricas de su desarrollo conductual. Es la
etapa alcanzada por el nio en el desarrollo de funciones conductuales especficas (qu
puede hacer el nio). Es la progresin uniforme del desarrollo por las etapas sucesivas.
NORMAS INTRAGRUPO: la ejecucin del individuo se evala en funcin del

desempeo del grupo de estandarizacin ms prximo (de su mismo grupo u otro)
- PERCENTILES: porcentajes de sujetos de la muestra de estandarizacin que caen

bajo determinada puntuacin cruda. Indica la posicin del sujeto en esa muestra. Ms
bajo el percentil=ms pobre la posicin. Son puntuaciones transformadas que se
expresan en trminos del porcentaje del individuo. VENTAJA: sencilla de calcular y
comprender, de aplicacin universal y para cualquier prueba. DESVENTAJA:
disparidad de sus unidades-> en la distribucin normal los porcentajes ms cercanos a la
media se exageran (ms casos en el medio), a diferencia de los extremos donde se
acortan las puntuaciones (ms distancia entre ellas)
- CALIFICACIONES ESTNDARES: distancia del individuo de la media en trminos
de una desviacin de la distribucin normal.
- EL CI DE DESVIACIN: El CI (coeficiente intelectual) se cre con el fin de
convertir las calificaciones de la edad mental en un indicador uniforme de la posicin
relativa del sujeto. Es la edad mental + la edad cronolgica X 100 (porcentaje). CI DE
DESVIACIN: reemplaza al CI anterior para poder realizar comparaciones.
RELATIVIDAD DE LAS NORMAS:
- COMPARACIONES ENTRE PRUEBAS: los resultados de ellas no pueden interpretarse

en abstracto, sino que tienen que ser referidos a pruebas particulares y a su posicin en otras
pruebas-> tens que fijarte que las normas de las pruebas sean comparables antes de realizar
las comparaciones del mismo sujeto y su posicin relativa en ellas. Adems tens que fijarte
en qu se igualan los instrumentos para abarcar con eso la comparacin. El contenido, las
unidades e escala y la composicin de las muestras de estandarizacin de cada una de las
pruebas puede diferir y ah NO PODES COMPARAR.
- LA MUESTRA NORMATIVA: cualquier norma se restringe de la poblacin
normativa particular de la que se tom la muestra. Estas normas no son absolutas,
universales o permanentes, sino que representan la ejecucin en la prueba de personas
de esa muestra especfica. MUESTRA-> grupo de individuos realmente examinados.
POBLACIN-> el grupo mayor, pero de similar constitucin, de donde se extrajo la
muestra y a donde se generalizar los resultados. La MUESTRA debe ser lo
SUFICIENTEMENTE GRANDE (para proporcionar valores estables y para que
cuando se aplique a otra muestra de la poblacin misma se obtengan los mismos
resultados) y debe ser REPRESENTATIVA de la poblacin (se debe estudiar aquellos
factores que pudieran hacer disminuir la representatividad, analizar las limitaciones as
de la muestra y requiere que se defina bien la poblacin en funcin de los objetivos de
la prueba)
- NORMAS FIJAS NACIONALES: La comparabilidad de las pruebas depende de la
similitud de las pruebas en cuanto a su contenido, propiedades psicomtricas y
procedimientos estadsticos para lograr la comparabilidad. Una solucin a la falta de
comparabilidad de las normas es usar una prueba ancla para buscar equivalencias para
los resultados de distintas pruebas (ej.: METODO EQUIPERCENTIL-> puntuaciones
equivalentes cuando tienen percentiles iguales en determinado grupo) o se puede
calibrar cada nueva prueba contra una sola prueba ancla que haya sido administrada a
una muestra representativa a nivel nacional. Siempre hay subgrupos identificables
dentro de la poblacin que obtienen puntuaciones diferentes por lo que tambin es
importante las NORMAS DEL SUBGRUPO
- NORMAS ESPECFICAS: Otra manera de superar la no equivalencia entre las
normas es estandarizarlas sobre poblaciones definidas de forma ms restringida y
elegidas para adaptarse a los propsitos especficos de cada prueba (es la ms realista
porque se basa en grupo pequeo y no en toda la poblacin como hacen las normas fijas
internacionales). DESVENTAJA: no son generalizables a la poblacin amplia que la
define, VENTAJA: las normas se adecan mejor a un grupo ms pequeo porque son
ms especficas. El uso que se le d a la prueba determinar si se necesitar de normas
generales o especficas.
NORMAS LOCALES: en ambientes particulares surgen y los grupos empleados para
derivar dichas normas son definidos de una forma ms limitada que los subgrupos.
- GRUPO FIJO DE REFERENCIA: se usa en escalas no normativas. Gracias a este
grupo se asegura la comparabilidad y continuidad de las calificaciones sin brindar una
evaluacin normativa del desempeo. Se emplean normas especficas, especialmente las
locales. IMPORTANTE: mantener la escala constante en su forma y aplicacin y
disponer de datos normativos complementarios para ayudar a la interpretacin y toma
de decisiones.
- TEORA DE LA RESPUESTA A LOS TEMS: se utiliz para establecer una escala
de medicin uniforme y libre de muestra que pueda aplicarse a individuos y grupos
con diversos niveles de habilidad y que permita probar contenidos de diversa dificultad.
Requiere de reactivos ancla o una prueba comn (al igual que los grupos fijos de
referencia) como puente entre las muestras examinadas y las pruebas o conjuntos de
reactivos. Las unidades de escala se establecen en trminos de datos que representan
una amplia gama de habilidades y dificultades de los reactivos que pueden provenir de
varias muestras. La unidad comn de la escala se deriva matemticamente de los datos
de los reactivos.
LAS COMPUTADORES Y LA INTERPRETACIN DE LAS
CALIFICACIONES DE LAS PRUEBAS:
- DESARROLLOS TCNICOS: computadora da incremento en rapidez en los procesos

de calificacin y anlisis de datos, puede realizar una aplicacin automatizada de la
prueba, proporciona formas ms sensibles de aplicacin y contribuye a la exploracin
de nuevos procedimientos gracias a su flexibilidad y capacidad de procesamientos.
Evala el desempeo en una prueba (calificacin computarizada), interpretacin
computarizada de los resultados. sistemas interactivos de cmputo-> el individuo
est en contacto directo con la computadora por medio de estaciones de respuesta y
entabla un dialogo con la misma y los resultados se incorporan a la base de datos de la
computadora. La computadora combina toda la informacin disponible sobre el
individuo con los datos almacenados acerca de las reas que se estudian y ayuda a
tomar decisiones sobre individuo.
- RIESGOS Y DIRECTRICES: se puede conducir a abusos en su aplicacin e
interpretacin errnea de los resultados, los individuos pueden diferir en cuanto a su
experiencia con el uso de computadoras lo que puede dar resultados diferentes, se debe
dar informacin al usuario sobre la confiabilidad, la validez y otras propiedades del
sistema interpretativo y siempre que se usen estos sistemas interpretativos se debe
buscar informacin aparte disponible sobre los examinados y los temas a tratar.
INTERPRETACIN DE LOS TEST REFERIDOS A DOMINIO O DE CRITERIO:
- NATURALEZA Y USOS: utilizan su marco interpretativo como referencia a un dominio

especfico de contenido ms que a una poblacin especfica de personas. Usa normas para
comparacin e interpretacin de los resultados-> para interpretar las calificaciones de un
individuo las compara con los de otros en la misma muestra.
-SIGNIFICADO DEL CONTENIDO: interpreta el desempeo en la prueba en trminos del

significado del contenido. Se busca lo que los examinados pueden hacer y lo que conocen y
no cmo se comparan con otros. REQUISITO: se debe definir claramente los conocimientos
o habilidades que la prueba mide. El dominio grande que mide seleccionado debe
subdividirse en pequeas unidades (subdominios) definidas en trminos de ejecucin para
as preparar los reactivos. VENTAJA: es bueno para dominio de habilidades bsicas.
DESVENTAJA: no es prctico formular objetivos tan especficos como pide.
-PRUEBAS DE DESTREZA: el procedimiento a una calificacin de todo o nada que indica

si el individuo ha alcanzado o no el nivel establecido de habilidad. Diferencias individuales:
son de poco inters y se dan por diferencia en el tiempo para obtener esa habilidad
(aprendizaje) ms que por el resultado final. Es una anlisis secuencial que consiste en hacer
observaciones una tras otra acerca si el individuo por medio de los reactivos con un
contenido especial va a aprendiendo o aprendi. Si aprendi se pasa al siguiente nivel y si
no se sigue con el dominio no dominado. DESVENTAJA: son inaplicables o insuficientes
ya que el individuo puede progresar ilimitadamente y el contenido de la prueba puede seguir
diversas direcciones dependiendo de las habilidades, intereses y metas del individuo y de
sus facilidades-> DESTREZA TOTAL ES POCO REALISTA
- TEST REFERIDOS A NORMAS: se usa para superar las desventajas de las pruebas de
destreza. As se usa para determinar el grado de rendimiento de un sujeto.
EN TODAS LAS FORMAS DE EVALUACIN EST IMPLCITO UN MARCO

NORMATIVO, INDEPENDIENTEMENTE DE CMO SE EXPRESEN LOS RESULTADOS.
LA MERA ELECCIN DEL CONTENIDO O HABILIDADES A MEDIR EST INFLUIDA
POR EL CONOCIMIENTO DEL EXAMINADOR DE LO QUE PUEDE ESPERARSE, LO
QUE SUPONE QUE SE CUENTA CON INFORMACIN ACERCA DE LO QUE OTRAS
PERSONAS HAN HECHO EN SITUACIONES SIMILARES (NORMAS)
CALIFICACIONES MNIMAS Y PUNTUACIONES DE CORTE:
- NECESIDADES PRCTICAS PELIGROS LATENTES: PUNTOS DE CORTE->

calificaciones mnimas para una variedad de propsitos. Se debe establecer o verificar sobre la
base de datos empricos. Requiere variables crticas para el desempeo de ciertas funciones y no
puede ser compensada por un buen desempeo en otras variables. Es esencial para estar al tanto
de los riesgos de las evaluaciones y reducirlos.
- TABLA DE EXPECTABILIDAD: muestra la probabilidad de diferentes resultados del criterio

(algo con que se compara la prueba) para quienes obtienen cada resultado de la prueba->
probabilidad de caer en cualquiera de los criterios. PRIMERO-> defins el criterio, el dominio y
los subgrupos. SEGUNDO-> muestra para obtener informacin de rendimiento para armar
datos para luego realizar comparaciones. TERCERO -> de cualquier nueva persona que tome el
instrumento podes obtener la probabilidad (o expectabilidad) de que tenga tal o cual resultado.
VENTAJA: da idea general de la validez de una prueba para predecir un criterio determinado y
pods ya interpretar los resultados de las pruebas refirindolos al criterio.

Técnicas Psicométricas: Construcción y Adaptación de Test Psicológicos

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Técnicas Psicométricas: Construcción y Adaptación de Test Psicológicos

Enviado por

Direitos autorais:

Formatos disponíveis

Tcnicas psicomtricas: construccin y adaptacin de test psicolgicos

Introduccin a la construccin y adaptacin de test (Mikulic)

- Ordinal: diferenciacin y ordenamiento jerrquico segn las categoras, se establecen

- Intervalar: diferenciacin y ordenamiento jerrquico con cero relativo, arbitrario, se pueden

Definiremos la evaluacin psicolgica como la recopilacin e integracin de datos relacionados

El test es un instrumento de evaluacin cuantitativa de atributos psicolgicos de un individuo.

Hay siete supuestos en las pruebas y evaluacin psicolgica:

- los rasgos y estados psicolgicos existen. Un rasgo es cualquier forma distinguible,

- los rasgos y estados psicolgicos pueden clasificarse y medirse

- diversas fuentes de informacin enriquecen y son parte del proceso de evaluacin

Quienes son las partes de las pruebas?

Contextos en los que se realizan evaluaciones

Contexto clnico: ejemplo en hospitales pblicos, consultorios privados, etc.

Contexto educativo: escenarios educativos para diagnosticar por ejemplo problemas de

Contexto jurdico: fuente de informacin para ayudar a responder si la persona es

Contexto organizacional: en particular en rea de recursos humanos. Evaluar

Teoras de los test

La TCT es el conjunto de principios tericos y mtodos cuantitativos derivados de esos

Durante sus diferentes fases de desarrollo se elaboraron procedimientos de anlisis

- itemetria: denominada asi por Cattell y se caracteriza por la construccin de pruebas

-etapa funcional: es aquella que trasciende a las aplicaciones inmediatas y simplistas

Teora de la generalizabilidad: Cronbach y Glaser postularon esta teora que es una

Las diferentes fuentes de error se denominan facetas, son caractersticas de la situacin

-el modelo no requiere de pruebas paralelas para determinar la confiabilidad

-provee una medida de la precisin de cada ndice de habilidad

Definicin del dominio del test: siguiendo a Tornimbeni en la especificacin del

-Descripcion del objetivo: se define en trminos de conductas observables el o los

- Estacificacion de las caractersticas de la situacin de evaluacin: se especifican

-Caracteristicas de la respuesta: se especifica cual es la respuesta que se espera del

Seleccin y elaboracin de las escalas: la medicin es la asignacin numrica de

El mtodo de elaboracin de escalas depender de las variables que se van a medir, el

Redaccin de tems: existen pautas convencionales para la redaccin de tems de

Existe el formato de construccin de respuesta o de seleccin de respuesta (opcin

Anlisis y seleccin de tems: existen varios procedimientos de anlisis de los tems de

El anlisis factorial es un mtodo para agrupar las variables que se correlacionan

Mtodos de adaptacin de test: actualmente se reconoce que la adaptacin de un test

Van de Vijver y Leung establecieron tres niveles de adaptacin de las pruebas

- Aplicacin: la simple traduccin de un test de un idioma a otro. Este mtodo asume la

- Adaptacion: la traduccin se agrega a la transformacin, adicion o substraccin de

- Ensamble: puede emerger al momento de adaptar un instrumento, en este caso el

Tcnicas de traduccin: el proceso de traduccin es complejo e implica mas que la

- Traduccin directa: un traductor o un grupo de traductores traducen el test desde el

-Traduccion inversa: el mas utilizado, un grupo de traductores realiza una traduccin

-Administracin de la versin original y su traduccin inversa a monolinges en el

-Administracion de la versin original a monolinges que hablan el idioma original y

Fuentes de sesgo: sesgo es un error constante o sistematico (no al azar).

-Sesgo de constructo: cuando es constructo medido no es idntico a travs de los grupos

-Sesgo metodolgico: sesgo de muestra (muestras incomparables entre si) sesgo en el

Adaptacin de test de una cultura a otra

- Debera de evaluarse la cuanta del solapamiento de los constructos en las poblaciones

Adaptacin de los tests

-Los constructores/ editores de tests deberan de asegurarse que el proceso de

-Los constructores / editores de tests deberan de facilitar evidencia de que el

-Los constructores / editores de tests deberan de aportar una justificacin racional

-Los constructores / editores de tests deberan de asegurarse que el diseo de recogida

-Los constructores / editores de tests deberan aplicar tcnicas estadsticas apropiadas

-Los constructores / editores de tests deberan de proporcional informacin sobre la

-Los constructores / editores de tests deberan de aportar datos estadsticos sobre la

-No deben utilizarse preguntas no equivalentes en todas las versiones dirigidas a

-El aplicador no debe de interferir, debiendo minimizarse su influencia sobre los

Interpretacin de las puntuaciones

-Cuando se adapta un test para utilizarlo en otra poblacin, debe de facilitarse la