Escolar Documentos
Profissional Documentos
Cultura Documentos
CRITERIO DE JUECES
Luis Miguel Escurra M."
El presente estudio eva!ll !.re$ formas de cuantificar la validez de Cmtenido por criterio de Jueces: ellndice de Acuerdo (IA), la Prueba Binomial
(PB) y el ooeficienl.e V de Aikm (V); romprts.dos
en base a to<b.J< hu respuestas posibles uignadas
por 1O jueces a W1 tem. Los rerohru:!Oll permiten
concluir que el coeficiente V de Aiken es el ms
103
Un aspecto relevante en el proceso de construccin de instrumentos psicolgicos es el garantizar su validez, la que ha sido definida como: el gmdo
en que un test mide lo que se propone medir (Anastasi, 1968); lo cual equivaldra a responder a la pregunta qu mide el test?. Las fonnulaciones
propuestas para solucionar esta inquietud, fue en sus inicios algo catico, pueslos autores tendan a defmir desde su propio punto de vista el concepto de
validez; asf por-ejemplo tenemos que Anastasi se refiere a validez emprica
y aparente, Gullisken a validez intrt'nsec.a, Mosicr a validez de definicin y
otros se refieren a validez curricular, factoria4 etc_ (Cortada de Kohan, 1968;
Ebel, 1977). Hasta 1954 en que la Asociacin Psicolgica Americana se propuso unifonnizar la tcnnhlolog1a y formular las reglas bsicas para la estandarizacin de los tests (Anastasi, 1986) adoptando la clasificacin tripartita
que an.-S\IbsiSte y asumi como vigentes los siguientes tipos de validez: de
contenido, de construccin y la de criterio, que se subdividi en prcdiCtiva y
concurrente.
Con relacin a la validez de conte~do. vemos que esta ha sido definida
como el .grado en que los tem que constituyen la prueba
una muestra
representativa del dominio de rontenido. que se mide (Nunnally, 1973;
Mehrens y Lehmann, 1982). Usualmente se ha recomendado que este tipo de
validez sea asignado a las pruebas de rendimiento, espalar (Cronbach, 1972;
Wood, 1975; Magnusson, 1976; Gronlnnd. 1980; Thomdikc, 1986) y en
algunos casos para las pruebas dy adaptacin basadas en observaciones
(Kannel, 1984); aunque tambin se ha sugerido su utilizacin en escalas de
actitudes y otras mediciones de rasgos (Bohmsted, 197~).
son
y que en muchos casos ha sido la estrategia usada por excelencia para evaluar
la validez de contenido (Aiken, 1980).
La modalidad mas comn para realizar la validez de contenido por
Matemticamente este ndice de acuerdo ha sido definido como la. proporcin que exi.sre: en.t::re los juicios que coinciden con la definicin propuesta
por el autor (acuenlo A)' y el total de juicios emitidos (acuerdos A y desacuerdos D); sicndosu frmula lA= N(A+D), tomndose -eomo vlidos los reactivos cuyos valores sean' igualeS" mayores que 0.80 (Guilford. 1954).
Es un anlisis esta:dfslico que estudia la probabildad de obtener x ObJetos en una categora y n-x objetos en la otra (Hocl, 1976).
La frmula de clculo es la siguiente:
p
106
"' n
X
siendo:
p = Proporcin de casos esperados en una de las categoras
q = 1 - p proporcin de casos esperado en la otra categora
Y=
""<n-:-(
c--:--1)"")
siendo:
S = la surna:toria de si
s1= Valor asignado por el juez i,
n = Nmero de jueces
e = Nmero de valores de la escala de valoracin (2. en este caso)
Este coeficiente puede obtener valores entre O y t. a medida que sea ms
elevado el valor computado, el tem Lendr una mayo-r validez de contenido.
El resultado puede evalu~ estadsticamente haciendo uso de la tabla de
probabilidades asociadas de cola derecha. tabuladas por el autor.
Es precisamente esta posibilidad de evaluar su significacin estadstica
lo que hace a este coeficiente uno de los ms apropiados para estudiar este
tipo de validez.
107
Metodologfa
Este estudio es de tipo metodolgico (Kerlinger, 1975), y consiste en la
aplicacin de las fnnulas del Indice de Acuerdo (lA), Prueba Binomial y el
Coeficiente de Validez de Aiken (V), computndose parn el caso hipottico
Resultados y Dlscusi~n
. En la Tabla lt e:I1COII1ilUil. en primer lugar que los valores computados.
parn el lA y el y,do Aiken, arrojan resultados similares, con lo cual comprobamos que para :el caso de los tem dicotmicos ambas frmulas son ecnUvalen!es; y en segundo lugar, que las probabilidades asociadas a la Pll y al V
son parecidas, de tal modo que podemos concluir que estos resultados_ nos
Tabla No. 1
Jueces
Acuerdos
3
4
S
6
S
6
7
6
7
.312
.156
.031
0.60
0.80
1.00
.032
0.67
0.83
1.00
.234
0.67
0.83
1.00
.016
0.71
0.86
1.00
.008
0.7S
0.88
1.00
.004
.094
.016
.164
.054
.008
.109
.031
.004
.070
.in8
0.77
0.89
1.00
o.so
9
10
0.90
1.00
.043
.009
10
0.60
0.80
1.00
0.7S
0.88
1.00
8
9
0.71
0.86
1.00
6
7
8
PB
lA
.002
.000
.03S
0.77
0.89
1.00
.020
0.80
0.90
1.00
.049
.001
.001
.002
vez
profesional en especifico.
109
BIBUOGRAFIA
Aiken, L. (1980). Content Validity and Reliability of Single Items or
Questionnaire. Educalional and Psychological Measurement 40, 955959,
Aiken, L. (1985). Three Coeficients for Analyzing the Reliability and Validity
of Ralings. Educatlonai and Psychologjcal Measurement 45, 131-142.
Anastasi, A. (1968). Tests Psicolgicos. Madrid: Aguilar.
Anastasi, A. (1986). Evolving Concepts of Test Validalion. Ann.ual Review
Psycho/ogy, 37, 1-15.
Andreani; O. (1975). Aptitud Mental y Rendimiento Esco/Q.r. Barcelona:
Herder.
Bohmstedt, G. (1980). Evaluacin de la Confiabilidad y Validez en la medicin de actitudes. En: Sumers G. (Ed.) Medicin de Actitudes. Mxico:
Trillas
Brown, F. (1980). Principios de la Medicin en Psicologfa y Educacidn.
Mxico: El Manual Moderno.
Cortada de Kohan, N. (1968). Manual para la Construccin de Tests Objetivos. Buenos Aires; Piidos.
Cronbach, L.J. (1972). FlliiiUIU1ntos de la Exploracin Psicoigica. Madrid:
Biblioteca Nucv.
Ebel, R.L. (1977). FundamenlOs de la Medicin Educacional. Buenos Aires:
Guadalupe.
Gronlund, N. (1980). Elaboracin de Tests de Aprovechamiento. Mxico:
Trillas.
Guilford, J.P. (1954). Psychometrics Methods. New York: McGraw-Hill.
Hocl, Paul (1976). Introduccin a la Estadistica Matemtica. Barcelona:
Ariel.
Tmsley H.E.A. & Weiss D.J. (1975). lnterrater Reliability and Agreement of
Subjective Judgements. Journal uf Counseling Psychology, 22, 358-376.
Wood. D.A. (1975). Elaboracin de Tests: Desarrollo e fluerpretacln de los
Tests de Aprovechamiento. Mxico: Trillas.
111