Escolar Documentos
Profissional Documentos
Cultura Documentos
Teora de la Medida
Licenciatura en
PSICOLOGA
Material de Estudio Obligatorio
Teora de la Medida
Licenciatura en Psicologa
Modalidad Mixta
Universidad Insurgentes
Mxico, 2013
DIRECTORIO
Universidad Insurgentes
2013
CIVU
Centro de Investigacin y Vinculacin Universitaria
Teora de la Medida
Clave B11
Material de Estudio Obligatorio
NDICE
Introduccin.
V. Recursos.
Actividad Autodiagnstica
Desarrollo de contenidos
Materiales de consulta
Glosario de trminos...
Fuentes de informacin..
Anexos...
PRESENTACIN DEL MATERIAL
Estudiar una disciplina a travs de una modalidad mixta posibilita abordar los diversos
manifestados en los planes y programas de estudio, resulta ser de gran apoyo para el
alumno, ya que le permite organizar de forma efectiva las estrategias para alcanzar las
Es por ello que el presente material tiene como finalidad ofrecer previamente el
desarrollo de los contenidos temticos con el propsito de avanzar en cada uno de los
profundas dado que constituye una plataforma inicial desde la cual los actores
El material que tienes en tus manos est diseado para facilitar tu aprendizaje sobre la
su modalidad mixta.
El material de estudio obligatorio est organizado con los cinco temas que
confiabilidad. El tercer tema comprende aspectos del error de medida. Por otra parte, en
el cuarto tema se revisar la validez. Finalmente, el quinto tema abarca las unidades de
calificaciones.
psicosociales concretos.
SOCIALES
2. CONFIABILIDAD
significativa.
4. VALIDEZ
5. UNIDADES DE CALIFICACIONES
Lecturas previas.
Trabajo autorregulado.
Asesora presencial.
Prctica extraclase.
Criterios:
temtica.
Instrumentos:
Actividades.
V. RECURSOS DIDCTICOS
Instrucciones:
A continuacin se te presenta una tabla con tres columnas; la primera contiene un listado de
1. No lo s.
3. Lo s bien.
4. Lo s muy bien.
Medicin
Escalas de medicin
Confiabilidad
Instrumentos de
medicin
Error de variable
Error estndar
Medidas de control
Error constante
Podras dar la Conoces el procedimiento
Trmino Estadstico
definicin? o la aplicacin?
Validez
Tipos de validez
Anlisis factorial
Varianza
Unidad de calificacin
Parmetro
Norma o normas
Escala
PUNTAJE
Ya que hayas resuelto la actividad, debers sumar los valores de cada columna.
Como se mencion, sta es solo una actividad diagnstica que permitir familiarizarte
con los temas que vers a lo largo del curso, o bien reafirmar lo que ya conoces.
SLO PIENSA...
Para muchas personas, las puntuaciones que
obtienen en los exmenes, evaluaciones u otro tipo
de pruebas son importantes en la vida. Pero, por
qu son tan significativos esos nmeros?
SOCIALES
Todos tenemos una definicin de medicin en mente cuando nos plantean la pregunta: qu
es medir? Stevens (1951, citado en Camacho, 1997) propuso la definicin de medicin que ha
hecho ms fortuna: ...medir es asignar nmeros a objetos o hechos de acuerdo con reglas....
Por otra parte Magnusson (1978) dice que: medir es asignar nmeros a las cantidades
de las propiedades de los objetos de acuerdo con reglas dadas cuya validez puede probarse
Para Nunnally (1970, citado en Barbero, 2006), la medicin se reduce en algo muy
sencillo: consiste en un conjunto de normas para asignar nmeros a los objetos de modo tal
que estos nmeros representen cantidades de atributos, entendiendo por atributos las
o smbolos a caractersticas de los objetos (personas, eventos o lo que sea) de acuerdo a ciertas
reglas. Las reglas usadas al asignar nmeros son lineamientos para presentar la magnitud (o
La mayor parte de los modelos matemticos que se desarrollan en psicologa con anterioridad
y durante los aos 50 del pasado siglo, se adentran en el campo de los nmeros reales cuando
tratan de hacer ciencia, ya que la introduccin del lenguaje cuantitativo que est relacionado
con la medicin, es lo que comnmente se considera como garanta, e incluso como piedra
angular del establecimiento del mtodo cientfico. En sus publicaciones los psiclogos
psicometra y aprendizaje, que se remonta a finales del siglo XIX y principios del XX con
figuras tan destacadas como Weber (1795-1878), Fechner (1801-1887), Donders (1818-1870),
Ahora bien, de acuerdo con Coombs, Dawes y Tversky (1981. Citado en Barbero, 2006)
explicacin y prediccin de los fenmenos observables por medio de unas cuantas leyes
generales que expresen las relaciones entre las propiedades de los objetos investigados. La
psicologa como ciencia tendr su base cientfica en la medicin, que le permitir contrastar
psicolgicas dada la singularidad de las mismas y, por lo tanto, las dificultades que hubo que
ir superando hasta que se consigui que se aceptara la necesidad y posibilidad de medir este
tipo de variables. La dificultad principal deriva, fundamentalmente, de que, a diferencia de
los atributos fsicos de los sujetos, como el peso y la estatura, que pueden ser medidos
directamente con los instrumentos pertinentes, la mayora de los atributos psicolgicos como
cabo de forma directa sino que debe inferirse a travs de la medicin de una serie de
citados en Barbero, 2006) plantean una nueva concepcin de la medicin; consideran que se
Las dificultades que entraa la medicin psicolgica se comprenden mejor si, como
seala Muiz (1998, citado en Barbero, 2006), se tiene en cuenta que la conducta humana se
desarrolla en una banda acotada por una base neurobiolgica y un entorno sociocultural y
personalidad, procesos cognitivos, actitudes, valores, etc.) hay una serie de objetivos comunes
fundamentales: en primer lugar estimar los errores aleatorios que conlleva toda medicin
(fiabilidad de las medidas) y garantizar que la misma no es algo intil sino que sirve para
explicar y predecir los fenmenos de inters (validez de las medidas) (Barbero, 2006).
Las matemticas y la estadstica en la medicin
Desde el primer nmero con tinta roja encerrado en un crculo en la parte superior de su
primera prueba de ortografa hasta la impresin por computadora de sus resultados del
su vida. stas parecen salir del papel y estrechar su mano cuando lo hace bien y son como un
puetazo cuando falla. Pueden guiarlo o alejarlo de alguna escuela o plan de estudios en
particular. Pueden ayudarle a identificar los puntos fuertes y dbiles en sus capacidades
Ejemplo:
-Supongamos que nos gusta correr y queremos unos zapatos deportivos, por lo que los
elementos, segn si poseen ms, menos o la misma cantidad de la variable medida, es decir,
Ejemplo:
-La premiacin de competidores en un evento deportivo: Juan lleg en 1er. lugar, Pedro en
cero absoluto.
Ejemplo:
Ejemplo:
-En la escala Kelvin el menor punto es el cero absoluto (ausencia completa de calor).
-Longitud: 0-10 m.
Por otra parte, el nivel ordinal de medicin es el que se usa con mayor frecuencia en
bastante a un nivel de intervalo, aunque adverta que si las mediciones ordinales eran
tratadas como si fueran mediciones de intervalo, el usuario de la prueba deba: estar alerta
de la forma constante ante la posibilidad de una desigualdad gruesa de los intervalos (pp.
Stevens (1951, citado en Camacho, 1997) plante desde la operaciones hasta los
estadsticos que pueden ser empleados segn el tipo de escala en la que se encuentre la
ACTIVIDADES DE APRENDIZAJE
Actividad 1.
psicologa.
medicin.
psicolgica?
Actividad 3.
Instrucciones: realiza un ensayo de dos cuartillas donde menciones la importancia que tienen
Actividad 4.
Actividad 5.
Actividad 7.
muestra a continuacin.
cuantitativas en psicologa.
tema de medicin.
ciencias sociales.
M E D I R W Z A L M E I O V Y O
I A G N E C F I E Q R F F K J A
Z X C V L B N M L K H G E I D
N K O I P I U Y T R E W D A S
C V E L G O P Q D N J K I O N A
W V F G I U E M N C X Z L J Z I
F E H I O L I D F G V N U N O C
A F E O N I L N B X C A L O N
R T Y U J T O P N V R I N M E E
L D C Z C T E O Y G R F D S A G
G V B R T A E R U A L P V B I
D E I N B O C Z V O H I J M N L
A B C R S R T I H A L O P M I E
K N U U E I F D C P L O F W V T
A S T B I O L K N H I A O F G N
P R E D I C C I O N H I R D V I
L W I D W E F K J U O G F A B N
No olvides que estas actividades te sirven para verificar los conocimientos que has adquirido
A continuacin se presenta una serie de reactivos que comprenden el contenido del tema 1,
Actividad 1.
escribe en las lneas las palabras que completen la oracin. Debes seleccionarlas del recuadro
_______________ planteadas.
abstractos (constructos).
______________________.
________________.
f) La ______________, __________________ y _________________ son papeles fundamentales
asignados a la ciencia.
Actividad 2.
Instrucciones: a continuacin se presentan tres columnas. Del lado derecho menciona los
tipos de variables, del lado izquierdo una caracterstica de cada escala de medicin y en el
centro los tipos de escalas, debes unir con una lnea (las tres columnas) el tipo de escala con
Actividad 3.
Instrucciones: menciona tres ejemplos por cada tipo de escala de medicin. Debes colocarlos
Actividad 4.
algunos de los procedimientos estadsticos que se relacionan con cada una de ellas, debers
Ejemplo:
Frecuencia
Escala Nominal X
Nominal
Ordinal
Intervalar
Razn
Revisa la seccin de Materiales de Consulta para este tema con el objetivo de profundizar
tus conocimientos.
SLO PIENSA...
Recuerdas la puntuacin del examen ms reciente
que hayas realizado. Ahora bien, Qu porcentaje
de esa puntuacin consideras que representa tu
capacidad verdadera y qu porcentaje, el error?
TEMA 2. CONFIABILIDAD
2006).
ndice de confianza, una proporcin que indica la razn entre la varianza de la puntuacin
a) Mtodo test-retest
que pretende medir algo relativamente estable a lo largo del tiempo, como un rasgo de
personalidad. Si se supone que la caracterstica que se est midiendo flucta con el tiempo,
tendra poco sentido evaluar la confiabilidad de una prueba utilizando este mtodo (Cohen,
2006).
Una estimacin de la confiabilidad test-retest de un examen de matemticas podra ser
baja si quienes respondieron la prueba tomaron un curso de matemticas antes de que se les
aplicara sta por segunda vez. Una estimacin de la confiabilidad test-retest de un perfil de
personalidad podra ser baja si quien la responde sufri algn trauma emocional o recibi
incluso al medir variables como sta y aun cuando el periodo entre las dos aplicaciones de la
prueba sea relativamente pequeo, ntese que pueden intervenir diversos factores (como
Aunque con frecuencia se usan de manera indistinta los trminos formas paralelas y formas
alternas, existe una diferencia entre ellos. Existen formas paralelas de una prueba cuando,
para cada forma del examen, las medias y las varianzas de las puntuaciones de la prueba
Las formas alternas, de modo simple, son versiones diferentes de una prueba que se han
construido para que sean paralelas. Aunque no cumplen con los requisitos para la asignacin
legitima de paralelas, las formas alternas de una prueba generalmente estn diseadas para
ser equivalentes con respecto a variables como contenido y nivel de dificultad (Cohen, 2006).
La obtencin de las estimaciones de confiabilidad de las formas paralelas y alternas es
2006):
2) Las puntuaciones obtenidas pueden ser afectadas por factores como la motivacin, la
o la terapia.
c) Divisin en mitades
una sola prueba aplicada una sola vez. Es una til medida de confiabilidad cuando es poco
prctico o indeseable evaluar la confiabilidad con dos pruebas o hacer dos aplicaciones de
prueba.
Spearman-Brown.
Una forma aceptable de dividir una prueba es asignar al azar las preguntas a una u otra
mitad de la prueba. Una segunda forma es asignar las preguntas con nmeros nones a una
mitad de la prueba y las identificadas con nmeros pares para la otra mitad. Este mtodo
nmero de tems que lo componen. Cuantos ms tems representativos del rasgo a medir se
utilicen, mayor ser la informacin que obtengamos acerca del atributo que estemos
estudiando. Cabe pensar que tambin ser menor el error que cometamos al tratar de estimar
Entonces, una forma de aumentar la confiabilidad del test es aumentar su longitud (Barbero,
2006).
Puede ser de inters, dado un cierto test, lograr un determinado nivel de confiabilidad
que hayamos establecido de antemano. Para ello, debemos conocer el nmero de tems que
Ejemplo:
Tenemos un test compuesto por 50 tems y cuya confiabilidad es de 0.8. Cuntos tems
0.8 (1-0.9)
Si inicialmente disponamos de 50 tems, ahora pasaremos a tener:
2.4 Estimacin del nmero de reactivos o tems para obtener una confiabilidad
significativa
El problema de determinar la longitud del test, o el nmero de tems que se van a evaluar en
cada uno de los objetivos incluidos en el test, constituye un problema crucial ya que de ello va
limitado. Si tenemos un test con pocos elementos, la estimacin del dominio ser imprecisa y
dar lugar a las clasificaciones que o bien son inconsistentes a lo largo de varias
con el nmero de errores de clasificacin tolerables. Por otra parte, cuando el nmero de
cometer sin tener que aumentar la longitud del test. Por una parte, la utilizacin de modelos
bayesianos (Novick y Jackson, 1974, citados en Barbero, 2006) y, por otra parte, se pueden
Eignor, 1978; Spineti y Hambleton, 1977; Wilcox, 1980; citados en Barbero, 2006).
en Barbero, 2006).
Modelo de Millman
El modelo propuesto por Millman (1973, citado en Barbero, 2006) est basado en el modelo
3) Las respuestas dadas a los items del test son independientes unas de otras.
Dnde:
Ejemplo:
apto en 0.85. Se desea saber cul es la longitud del test si estamos dispuestos a admitir un
0.052 0.022
y 0.90. En el segundo caso tendramos 319 tems y un margen de aciertos entre 0.83 y 0.87.
Ahora bien, es evidente que la fiabilidad de un test, como suma de un conjunto de tems
depender de la naturaleza de stos. Es decir, depende de tales tems y las relaciones entre
ellos. Es importante la naturaleza de cada tem, por cuanto de la calidad de los elementos
constituyentes derivar la bondad del conjunto. Adems, cuanto mejor construidos estn los
tems, menor nmero de ellos necesitaremos para configurar un buen test, logrando de esta
ndice de dificultad. Todos ellos afectan, como veremos, a la varianza total del test, que incide
Finalmente, se define como ndice de discriminacin del tem a la correlacin entre las
puntuaciones de un determinado tem y las puntuaciones totales del test. Se entiende que el
test sirve para discriminar entre unos sujetos y otros en relacin a un cierto rasgo de inters,
de forma tal que permita distinguir aquellos sujetos que presentan un nivel alto de aquellos
otros ms bajos en dicho rasgo. Segn esto, si la correlacin de un determinado tem con el
conjunto del test es elevado, dicho tem contribuir a distinguir unos sujetos de otros. A este
ndice se le suele llamar tambin ndice de homogeneidad, por cuanto expresa la contribucin de
Una estadstica til para describir fuentes de variabilidad en las puntuaciones de una prueba
es la varianza, la desviacin estndar al cuadrado. Esta estadstica es til debido a que puede
entre reactivos contenidos en una prueba, as como la variacin entre los reactivos de diversas
prueba as como por la forma en que es manejado dicho contenido (es decir, la forma en que
est construido dicho reactivo) es una fuente de varianza de error (Cohen, 2006).
prueba; por lo tanto, sus reacciones ante estas influencias son la fuente de una clase de
una prueba incluyen factores relacionados con el ambiente durante la prueba: la temperatura
Finalmente, las variables relacionadas con el examinador tambin son parte de estas
fuentes. Entre ellas, la apariencia fsica y comportamiento del examinador y hasta la presencia
computadora han eliminado la varianza de error causada por diferencias de los evaluadores
en muchas pruebas. Sin embargo, no todas las pruebas pueden calificarse con valos rellenos
con lpices del nmero 2. Las pruebas de inteligencia administradas de forma individual,
innumerables pruebas todava requieren ser calificadas en forma manual por personal
capacitado.
Las personas que califican y los sistemas de calificacin son fuentes potenciales de la
ACTIVIDADES DE APRENDIZAJE
Actividad 1.
1. Qu es la confiabilidad?
Actividad 2.
y sus caractersticas.
Actividad 3.
Suponga que tenemos un test compuesto por 45 tems y cuya confiabilidad sea de 0.5.
Actividad 4.
tems.
Actividad 5.
Instrucciones: realiza en tu cuaderno un cuadro sinptico sobre los tipos de errores que
afectan a la confiabilidad.
No olvides que estas actividades te sirven para verificar los conocimientos que has adquirido
Actividad 1.
la columna de la izquierda las caractersticas. Anota dentro del parntesis la letra que
corresponda.
f. Divisin por mitades ( ) Para tipo de examen las puntuaciones sern iguales
Actividad 2.
Instrucciones: completa el siguiente mapa conceptual utilizando las palabras que se presentan
Fuentes de error
que afectan a la
confiabilidad
Administracin Calificacin e
de pruebas interpretacin de
la prueba
Muestreo de
reactivos
Actividad 4.
Revisa la seccin de Materiales de Consulta para este tema con el objetivo de profundizar
tus conocimientos.
SLO PIENSA...
No siempre se es lo suficientemente cuidadoso en la medicin
de las variables. De no realizarse adecuadamente, quedarn
desvirtuadas de manera significativa las conclusiones obtenidas.
En estas circunstancias, qu valor tendrn nuestras decisiones?
Camacho (1997)
Conocido tambin como errores conceptuales son consecuencia no tanto de medir mal una
relativamente frecuente en psicologa donde no suele estar muy claro qu es lo que estamos
vocabulario como expresin de la inteligencia, o bien cuando tomamos los ingresos como
indicativo del nivel social. Son errores que quedaran enmarcados dentro del tema de la
El error estndar de medicin, abreviado SEM o SEM (por sus siglas en ingls) proporciona
El error estndar de una medicin es la herramienta que se usa para estimar o inferir la
distancia hasta la cual una puntuacin observada se desva de una puntuacin verdadera. El
error estndar de una medicin se puede definir como: la desviacin estndar de una
distribucin que, en teora, se comporta normalmente, formada por las puntuaciones de
El error constante tambin puede recibir el nombre de error sistemtico y es aquel error que
siempre se produce en una misma direccin. Por ejemplo, una prueba puede medir siempre
ms; o bien, todos los individuos de un grupo que han realizado cierto test con diez minutos
a una determinada respuesta. Todas estas situaciones darn lugar a respuestas sesgadas que
repercutirn en los estimadores obtenidos. Es obvio que la estadstica como tal poco tiene que
hacer con este tipo de errores, donde slo cabe ser cuidadoso en la planificacin y desarrollo
Si bien las pruebas son usadas por una variedad de profesionales, todos debern cumplir los
forma apropiada. Tambin debe asegurarse de que el saln en el que se realice la prueba sea
s/f).
Es fundamental la empata entre el evaluador y el evaluado. En el contexto de situacin
de prueba, la empata puede definirse como una relacin de trabajo entre evaluador-
pruebas de inteligencia como por ejemplo: que el evaluador sea familiar o no, que est
presente o ausente, y sus modales en general. Otro factor importante ha sido el gnero
(Miculik, s/f).
ACTIVIDADES DE APRENDIZAJE
Actividad 1.
b) Qu es el error estndar?
c) Qu es el error variable?
d) Qu es el error constante?
Actividad 2.
Actividad 3.
Instrucciones: realiza un en tu cuaderno un collage sobre las medidas de control que se deben
No olvides que estas actividades te sirven para verificar los conocimientos que has adquirido
Actividad 1.
Instrucciones: elabora un ensayo donde englobes todos los subtemas referentes a los errores
de medida y su relacin con las medidas de control. Debers dar tu punto de vista sobre la
Actividad 2.
Instrucciones: para esta actividad debes buscar un artculo que hable sobre la elaboracin de
una prueba o instrumento psicomtrico. Debes elaborar un anlisis sobre lo que mide, en qu
escala se encontraban sus variables, la confiabilidad y las caractersticas que tienen como
Revisa la seccin de Materiales de Consulta para este tema con el objetivo de profundizar
tus conocimientos.
SLO PIENSA...
Por qu el trmino prueba vlida
es a veces engaoso?
Cohen (2006, p.156).
TEMA 4. VALIDEZ
La validez es un juicio o una estimacin acerca de que tan bien una prueba mide lo que
un juicio con base en la evidencia sobre lo apropiado de las diferencias realizadas a partir de
Por su parte Camacho (1997) dice que la validez garantiza que medimos aquello que nos
hace referencia al proceso que permite ir depurando, delimitando y perfeccionando cada vez
realmente permite medir los conocimientos que los estudiantes tienen de esa materia y no (tal
Finalmente, Barbero (2006) dice que el trmino de validez hace referencia al grado en
que el test mide aquello que pretende medir. En este sentido, un test ser vlido para medir
razonamiento espacial, por ejemplo, si mide este tipo de razonamiento y no otra cosa.
4.2 Tipos de validez
Ahora bien, una manera en que los especialistas de la medicin tradicionalmente han
1) Validez de contenido.
3) Validez de constructo.
Validez de contenido
La validez de contenido describe un juicio segn el cual se puede saber cun adecuadamente
una prueba es una muestra de la conducta representativa dentro del universo de conductas
que la prueba fue diseada para ejemplificar. Por ejemplo, el universo de comportamiento
calificado como asertivo tiene un rango muy amplio. Una prueba de asertividad, escrita, de
contenido vlido, ser la que represente adecuadamente este amplio rango. Podramos
esperar que dicha prueba contenga reactivos que sean una muestra de situaciones hipotticas
en el hogar (tales como si el respondiente tuviera dificultad para dar a conocer sus opiniones
a otros miembros de la familia), en el trabajo (como sera si quien responde tuviera dificultad
para pedir a sus subordinados que hagan lo que se requiere de ellos) y hasta en situaciones
sociales (tal como si quien responde devolviera un filete que no est cocinando de la forma en
una medida de contenido vlido cuando la proporcin del cubierto de la prueba se aproxima
Para que una prueba de reclutamiento laboral tenga un contenido vlido, debe ser una
hemos de intentar garantizar que dicho test contenga una muestra relevante y representativa
(Messick, 1975, citado en Camacho 1997) del dominio que integra tal parcela de nuestra
conducta.
Crocker y Algina (1986, citados en Camacho, 1997) proponen los siguientes pasos en la
dominio referido.
posible el universo de contenidos del test (cuadro de especificaciones del test), normalmente
que se asigna a cada uno de los contenidos de la prueba, si se entendiese que no todos los
ello, se recurre al concurso de expertos a quienes se les entregarn junto con los objetivos a
medir, una serie de tems que debern emparejar con tales objetivos. Al final, se asegurar
Por ltimo, se ofrece un resumen estadstico de los resultados obtenidos, tal como el
prueba para inferir la posicin ms probable de un individuo con respecto a cierta medida de
inters siendo el criterio esa medida de inters . Dos tipos de evidencias de validez se
encuentran asumidas bajo el rubro de validez relacionada con el criterio: validez concurrente,
la cual es un ndice del grado en que se relaciona la puntuacin de una prueba con alguna
medida de criterio obtenida al mismo tiempo (de manera concurrente) que la puntuacin; y la
validez predictiva, que es un ndice del grado en que la puntuacin de una prueba predice
Antes de analizar cada uno de los tipos de validez, mencionados en el prrafo anterior,
Un criterio puede ser definido en forma amplia como el modelo contra el cual se
compara y evala una prueba o la puntuacin de una prueba. Desde el punto de vista
operativo, un criterio puede ser casi cualquier cosa: el desempeo de un piloto al volar un
Cualquiera que sea el criterio, de manera ideal es relevante, vlido y sin contaminacin
(Cohen, 2006).
tiempo (o casi) (Camacho, 1997); es decir, si las calificaciones de una prueba se obtienen ms o
menos al mismo tiempo que las medidas del criterio, entonces las medidas de relacin entre
las calificaciones de la prueba y el criterio proporcionan evidencia de este tipo de validez. Las
prueba pueden servir para estimar la posicin actual de un individuo frente a un criterio. Si,
por ejemplo, las puntuaciones (o clasificaciones) hechas con base en una prueba de
diagnosticados, el proceso a seguir sera uno de validacin concurrente. En general una vez
proporcionar una forma ms rpida y menos costosa para ofrecer un diagnstico o una
Por otra parte, cuando el criterio se mide con posterioridad al test, nos encontramos con
prueba se pueden obtener en cierto momento y las medidas de criterio en uno posterior,
usualmente despus de que algn evento mediador ha ocurrido. Dicho evento podra ser la
capacitacin, la experiencia, alguna terapia, alguna medicin o tan slo el paso del tiempo.
Las medidas de la relacin que existen entre las puntuaciones de la prueba y una medida
prueba; es decir, con cunta precisin las pruebas predicen alguna medida de criterio. Por
ejemplo, las medidas de la relacin entre las pruebas de admisin a la universidad y los
promedios de calificaciones de un estudiante universitario de primer ao, son evidencia de la
Validez de constructo
cientfica, desarrollada como una hiptesis para describir o explicar el comportamiento. Por
ejemplo: la inteligencia es un constructo que puede ser citado para describir por qu un
recurrir para describir por qu un paciente psiquitrico va y viene por la habitacin. Otros
es, de qu factores depende, cmo se entrelaza con otros aspectos (Camacho, 1997).
Finalmente, los constructos son rasgos inobservables, supuestos (subyacentes) a los que
una prueba debe formular varias hiptesis acerca del comportamiento esperado en quienes
Uno de los errores que afecta a la validez es el error de estimacin. Una estimacin es un
juicio numrico o verbal (o ambos) que coloca a una persona o a un atributo a lo largo de un
continuo identificado por una escala de descriptores numricos o de palabras, conocido como
resultante del mal uso intencional o no intencionado de una escala de estimacin. As, por
ejemplo, un error de lenidad (tambin conocido como error de generosidad) es, como su
nombre lo implica, un error de estimacin que surge de la tendencia por parte del evaluador
En el otro extremo se encuentra el error de la severidad. Los crticos de cine que critican
duramente casi todo lo que revisan pueden ser culpables de errores de severidad. Por
supuesto, esto slo es verdad si ellos han revisado una amplia gama de pelculas que podran
Otro tipo de error podra denominarse error de tendencia central. Aqu, el evaluador,
por cualquier razn, muestra una renuencia general y sistemtica al hacer evaluaciones en el
Por otra parte, el efecto de halo describe el hecho de que, para algunos evaluadores,
tambin puede ser definido como una tendencia a dar a una persona evaluada una estimacin
superior de la que merece en forma objetiva debido a la falla del evaluador para discriminar
evaluador respecto a la raza o gnero del evaluado (Landy y Farr, 1980, citados en Cohen,
2006). Se ha demostrado que los hombres reciben evaluaciones ms favorables que las
integracin muy alta, los evaluados tienden a recibir calificaciones ms elevadas por parte de
los evaluadores de la misma raza (Landy y Farr, 1980, citados en Cohen, 2006).
Para la exposicin de este apartado nos basaremos en Martnez y rias (1995, citados en
Barbero, 2006), quienes mencionan que, cuando se quiere obtener un ndice numrico que
depende del diseo de recogida de datos para la validacin y del nmero de variables
implicadas: a) un slo test predictor y un slo indicador del criterio, b) varios predictores y un
decisiones.
caso los procedimientos que se utilizan son la correlacin y regresin lineal mltiple. Si el
correlacin. Sin embargo, rara vez se utilizan a la hora de llevar a cabo un estudio de
decisiones
de la utilidad multiatributo.
El anlisis factorial es un trmino singular , abreviado, que es usado para describir una clase
de manera particular son atributos, caractersticas o dimensiones en las que es posible inferir
confirmatoria, para poner a prueba las hiptesis planteadas acerca de la estructura interna del
constructo y de las relaciones del mismo con otras variables. Es importante entender la
descubrir la estructura que subyace a las puntuaciones obtenidas por los sujetos en los
hiptesis previas acerca del nmero de dimensiones, es la propia tcnica la que nos aportar
se pueden aceptar las hiptesis propuestas (Barbero, 2006). Es decir, se plantea la hiptesis de
covarianza observada en las variables medidas (Floyd y Widaman, 1995, citados en Cohen,
2006).
Bajo el epgrafe Anlisis Factorial (AF), se incluyen una serie de tcnicas estadsticas que
test, conjunto de test, escalas, etc.) mediante un menor nmero de variables latentes o
inobservables llamadas factores. Cada factor podra ser considerado como un constructo
(variable latente) que vendra definido por las variables observables que lo conforman. stas
variables son las que van a permitir dar una interpretacin psicolgica del constructo (factor)
(Barbero, 2006).
Para llevar a cabo el anlisis factorial se parte de un conjunto de n medidas tomadas a la
misma muestra de sujetos en un conjunto de variables observables (supongamos que son las
puntuaciones obtenidas por una muestra de sujetos en los n items de un test) y, a partir de
ellas, se obtiene una matriz (n x n) con las intercorrelaciones entre todas ellas. Es a partir de
esta matriz de correlaciones cuando, aplicando alguna de las tcnicas estadsticas incluidas
Supongamos a este respecto que no sabemos muy bien cules son las funciones que integran
siguiente figura. Despus del anlisis estadstico obtenemos la matriz factorial de orden 9x3,
donde las filas representan las variables y las columnas, las dimensiones o factores, tal como
variables con dicho factor. A stos valores se les denominan saturaciones. Por ejemplo, en el
primer factor la prueba de vocabulario presenta una correlacin de 0.85, lo que se interpreta
como una varianza explicada de 0.73 por parte del factor respecto a dicha variable. Se
observa, igualmente, que hay ciertas familias de variables. As, la mencionada prueba de
vocabulario junto a la comprensin, fluidez verbal y sinnimos estn emparentadas por sus
saturaciones en el primer factor. Otro tanto sucede en el segundo factor con las pruebas de
tercer factor, con saturaciones importantes en fluidez verbal y sumas (nmero de sumas). La
tabla se completa con una cuarta columna denominada Comunalidad que expresa el total de la
vocabulario tendremos que entre todos los factores explican 0.723 2+0.022+0.122 = 0.737; esto es,
Actividad 1.
1. Qu es la validez?
o prueba?
Actividad 2.
Actividad 3.
Instrucciones: realiza en tu cuaderno un cuadro comparativo sobre los tipos de validez y sus
caractersticas.
Actividad 4.
validez.
Actividad 6.
especfica.
No olvides que estas actividades te sirven para verificar los conocimientos que has adquirido
AUTOEVALUACIN
Actividad 1.
Instrucciones: completa las siguientes oraciones con las palabras que se presentan en el
siguiente recuadro.
de la misma.
tiempo.
3. __________________________ es una idea informada, cientfica, desarrollada como una
largo de un continuo.
medida de criterio.
diseada.
pretende medir.
Actividad 2.
1. Qu es el error de estimacin?
2. Qu es el error de severidad?
Actividad 3.
Instrucciones: elabora un cuadro sinptico en una hoja de rotafolio sobre el anlisis factorial
Actividad 4.
Revisa la seccin de Materiales de Consulta para este tema con el objetivo de profundizar
tus conocimientos.
SLO PIENSA...
Por qu puede una prueba mostrar ser
vlida para su uso con un propsito
particular con los miembros de una
poblacin y no ser vlida para su
utilizacin con el mismo propsito, pero
con los miembros de otra poblacin?
(Cohen, 2006. p. 99).
El supuesto de unidimensionalidad establece que todos los tems de un test miden la misma
aptitud, lo que implica que cuando aplicamos ese test a una muestra de sujetos, es de esperar
que exista relacin entre las respuestas de los sujetos a diferentes tems. Es decir, las
respuestas del primer tem estn relacionadas con las respuestas al segundo tem, las del
primero con el tercero, y as en todos los posibles pares de tems que se puedan formar con el
test. Es lgico que ocurra de esta forma debido a que si todos los tems miden el mismo rasgo,
las respuestas de los sujetos van en la misma direccin en todos los tems. De este modo, los
sujetos con bajo nivel de aptitud tienden a responder incorrectamente en todos los tems
mientras que los sujetos con alto nivel de aptitud tienden a responder correctamente a los
tems. La dependencia estadstica entre los tems viene explicada por la dimensin
explica el rendimiento en el test), las respuestas de los sujetos a un par de tems cualquiera
son estadsticamente independientes. En otras palabras, no existe relacin entre las respuestas
de los sujetos a diferentes tems para un mismo nivel de aptitud. Este supuesto implica que
las puntuaciones en los tems estn relacionadas entre s slo a travs de la variable latente
(Camacho, 1997).
5.2 Unidades de calificacin de comparacin interindividual
resultados de los test en forma de un perfil. Todas las distribuciones de los subtest se
convierten a la misma escala para que el perfil sea ms fcil de interpretar. La misma posicin
relativa en las varias subdistribuciones corresponder siempre al mismo puntaje; el perfil nos
da as una expresin directa de la relacin entre las posiciones del individuo en las
Una norma en singular se usa en la literatura acadmica para referirse al comportamiento que
particular puede especificarse por medio de modificadores como edad, como en norma de
edad. En un contexto psicomtrico, normas son los datos de desempeo en una prueba de un
grupo particular de evaluados, las cuales han sido diseadas para utilizarse como referencia
Algunas de las muchas formas diferentes en que se pueden clasificar las normas son las
a) Normas de Percentil. Son los datos crudos de una muestra de estandarizacin de una
diseadas de manera especfica para servir como referencia en el contexto de la edad del
contexto de grado del que responde la prueba, quien alcanzo una puntuacin particular.
misma variable.
grande.
ACTIVIDADES DE APRENDIZAJE
Actividad 1.
Actividad 2.
comparacin interindividual.
Actividad 3.
Actividad 4.
pruebas.
No olvides que estas actividades te sirven para verificar los conocimientos que has adquirido
Actividad 1.
Para esta actividad tu asesor de contenido deber proporcionarte una prueba o test.
Instrucciones: con el material que te proporcion tu asesor debes analizar las unidades de
calificacin y normas; tambin debes identificar cul es su confiabilidad y validez. Por ltimo,
haz un comentario personal respecto a lo que encontraste y los temas revisados a lo largo del
curso.
Actividad 2.
Instrucciones: realiza en tu cuaderno una monografa donde englobes los temas revisados a lo
largo del curso incluyendo los que revisaste en este apartado. Debers explicarla a tu asesor.
Revisa la seccin de Materiales de Consulta para este tema con el objetivo de profundizar
tus conocimientos.
MATERIALES DE CONSULTA
SOCIALES
Malo, S. D. (2008). La medicin en Psicologa como herramienta y como reflexin tica en el ejercicio
de enero 2013 en
http://portal.unisimonbolivar.edu.co:82/rdigital/psicogente/index.php/psicogente/article/view
File/78/90
Abstract:
Este artculo habla sobre la medicin en psicologa, su relacin con el ejerci profesional y la
organizado para llegar a una impresin diagnstica, pero no se pueden convertir en el nico
medio de informacin. Los resultados obtenidos en las pruebas deben estar acompaados de
tico de los mismos. Mientras no se cumplan estos requerimientos, conceptos como medicin
Gmez, P., Mitre y Reidl. (s/f). Caractersticas psicomtricas de los instrumentos: confiabilidad.
http://www.psicol.unam.mx/Investigacion2/pdf/METO11F.pdf
Abstract:
examinado y del calificador, que tiene que ver con el tema de errores en la confiabilidad.
Tambin, habla sobre las fuentes principales de error, la variacin dentro y entre una prueba,
as como los mtodos experimentales que se utilizan para obtener la confiabilidad como
Por otra parte, nos menciona los mtodos para calcular la consistencia interna de un
instrumento y finalmente, brinda una serie de referencias que puedes utilizar para
Camacho, V. C. et al. (s/f). Psicometra. Sevilla, Espaa. Recuperado el 22 de enero 2013 en:
http://personal.us.es/sangar/psicometria/psicome1.pdf
Abstract:
de una prueba o test, apndice y referencias bibliogrficas que te permitirn reforzar los
contenidos vistos hasta el momento y los que revisars ms adelante. Tambin se presenta
una serie de apndice como ejemplo de los temas a tratar y algunas referencias bibliogrficas
que te pueden servir para consultar otros materiales. Finalmente, respecto al tema de error de
medida encontrars los tipos de errores y sus consecuencias. ste es un subtema del tema
medicin psicolgica el cual es el tercer apartado antes de iniciar con los temas de
confiabilidad y validez.
TEMA 4. VALIDEZ
Referencia: Muiz, J. (2005). La validez desde una ptica psicomtrica. Universidad de Oviedo,
http://ojs.unam.mx/index.php/acom/article/download/14538/13865
Abstract:
En el archivo se ofrece una panormica general del estado actual de la validez desde un
emprende un anlisis de las implicaciones del enfoque psicomtrico de la validez para las
entrada que todo lo dicho sobre el proceso de validacin desde el punto de vista psicomtrico
es en gran medida, sino totalmente, aplicable a cualquier otro enfoque psicolgico que
http://www.iztacala.unam.mx/carreras/psicologia/psiclin/vol7num4/Art3-2005-1.pdf
Abstract:
por una parte, es el primer paso que nos conduce a la planeacin de la intervencin y, por
otra, nos sirve como punto de comparacin para determinar el xito de la terapia.
El objetivo del presente artculo es exponer algunos conceptos clave que caracterizan a la
se hace una diferenciacin entre medir conductas y medir atributos psicolgicos. Se seala la
dos de los requisitos indispensables que deben poseer los instrumentos de evaluacin
psicolgica: confiabilidad y validez. Se explican las diferentes puntuaciones que arrojan las
pruebas y cmo se interpretan, se sealan las partes que debe contener un reporte de
evaluacin psicolgica.
Finalmente, es importante sealar que retoma todos los aspectos que se han visto a lo largo de
este temario y menciona otros que servirn para comprender asignaturas posteriores.
GLOSARIO DE TRMINOS
Anlisis factorial: una clase de procedimientos matemticos que suelen emplearse como
mtodos para la reduccin de datos diseados para identificar variables en las que las
Confiabilidad: el grado al que se considera que las mediciones son consistentes o repetibles;
tambin, el grado al que las mediciones difieren de una ocasin a otra, como una funcin de
o explicar un comportamiento.
Correlacin: una expresin del grado y correspondencia de direccin entre dos cosas cuando
las puntuaciones obtenidas por los sujetos en un test elaborado a tal efecto.
Formas paralelas: existen dos o ms versiones de la misma prueba cuando, para cada forma
de examen, las medias y las varianzas de las puntuaciones de la prueba observada son
iguales.
Medir: asignar un nmero a un objeto o sujeto en funcin del grado en que posea o
habitual.
Percentil: puntuacin en un test, que indica el tanto por ciento de sujetos del grupo
Validez: trmino general que se refiere a un juicio respecto de que tan bien miden una prueba
FUENTES DE INFORMACIN
Bibliografa Bsica:
Bender, L. (1984). Test gestltico visomotor, usos y aplicaciones clnicas. Mxico: Paids.
Manckick, N. (2002). El libro de los tests, usted y los otros. Mxico: Gedisa.
Bibliografa Complementaria:
Pagano, R. (1999). Estadstica para las ciencias sociales y del comportamiento. 7 ed. Mxico:
Thomson.
Referencias Electrnicas:
http://23118.psi.uba.ar/academica/carrerasdegrado/psicologia/informacion_adicional/obligato
rias/059_psicometricas1/tecnicas_psicometricas/archivos/f2.pdf
ANEXOS
SOCIALES
Actividad 1.
selecciona y escribe en las lneas las palabras que completen la oracin, debes seleccionarlas
Actividad 2.
Instrucciones: a continuacin se presentan tres columnas. Del lado derecho menciona los
tipos de variables, del lado izquierdo una caracterstica de cada escala de medicin y en el
centro los tipos de escalas. Debes unir con una lnea (las tres columnas) el tipo de escala con
Actividad 3.
algunos de los procedimientos estadsticos que se relacionan con cada una de ellas. Debers
Ejemplo:
Frecuencia
Escala Nominal X
Nominal X
Ordinal X
Intervalar X
Razn X
TEMA 2. CONFIABILIDAD
Actividad 1.
la columna de la izquierda las caractersticas. Anota dentro del parntesis la letra que
corresponda.
a. Confiabilidad ( g ) Versiones diferentes de una prueba
Actividad 2.
Actividad 3.
Instrucciones: completa el siguiente mapa conceptual utilizando las palabras que se presentan
Actividad 4.
Instrucciones: Menciona y escribe en tu cuaderno los tres aspectos que constituyen a un tem.
Actividad 1 y 2.
Quedan sujetas al criterio del asesor de contenidos, cada actividad equivale a un 50%.
TEMA 4. VALIDEZ
Actividad 1.
Instrucciones: completa las siguientes oraciones con las palabras que se presentan en el
siguiente recuadro.
2. Validez concurrente se dice que es cuando el test y el criterio se miden al mismo tiempo.
3. Constructo es una idea informada, cientfica, desarrollada como una hiptesis para
4. Validez de criterio es un juicio de cun adecuado puede ser utilizada la puntuacin de una
continuo.
6. Validez predictiva a partir de sta, la prueba podr ayudar a predecir alguna medida de
criterio.
que la funcionalidad.
8. Validez de contenido describe un juicio de cun adecuadamente una prueba es una
9. Validez es un juicio de que tan bien una prueba mide lo que pretende medir.
ACTIVIDAD 2, 3 Y 4.
Quedan sujetos al criterio del asesor ya que debe existir una PARTICIPACIN activa y
Slo se realizarn dos actividades de autoevaluacin ya que estas son de anlisis y prctica.
Actividad 1.
El asesor debe proporcionar una copia de un test o prueba de los aspectos generales para que
el alumno pueda desarrollar la actividad, asimismo queda a criterio del asesor la calificacin
de sta.
Actividad 2.
Queda sujeta al criterio del asesor, ya que debe ser expuesta en una de las ltimas sesiones.
NOMBRE DE LA PRCTICA:
Construccin de reactivos
ASIGNATURA: CLAVE:
Psicologa general 2
OBJETIVO:
Que el alumno distinga las caractersticas y usos de los diferentes tipos de reactivos, as
PROCEDIMIENTO:
reactivos.
Dado un tema especfico, los estudiantes elaborarn 5 reactivos de cada uno de los
ASIGNATURA: CLAVE:
Psicologa general 10
OBJETIVO:
PROCEDIMIENTO:
Primera Fase: