Você está na página 1de 5

FIABILIDAD Y VALIDEZ

A)FIABILIDAD
 La APA: describió la fiabilidad: exactitud (consistencia y estabilidad) de la
medición de un test. Es la concordancia entre una medida obtenido mediante
determinado instrumento y la medida precisa o estándar (sin incurrir en error).

 La fiabilidad de la prueba se define como la relación de la varianza real con la


varianza observada o la proporción de la varianza observada que se explica por la
varianza real.

 El coeficiente de fiabilidad es un índice de confianza: indica la razón entre la


varianza de la puntuación verdadera y la varianza total: existen distintos tipos y grados
de fiabilidad.

 La falta de fiabilidad: es el resultado de los errores en la medida que se produce


por estados internos temporales (baja motivación...) o condiciones externas (entorno
incómodo, distractores...)

 Forns y cols:
 Niveles de fiabilidad en los instrumento de evaluación alta (superiores a 90) son
necesarios cuando se han de tomas decisiones que afecten a los individuos.
 Los test de fiabilidad moderada (75-85) pueden ser utilizadas como pruebas
preliminares o de cribado.
 Las pruebas de fiabilidad baja (inferior a 65) han de ser rechazadas por incluir un
exceso de error.

B) FUENTES DE VARIANZA ERROR


 La mayoría de los autores describen las principales fuentes de varianza error
relativas a la construcción , la administración, calificación e interpretación de las
pruebas:

Construcción de pruebas
 En la construcción de una prueba se puede generar una fuente de varianza: En el
muestreo de reactivos o muestro de contenidos.

Administración de pruebas
 Relacionadas con el ambiente de aplicación de la prueba
 Relativas al sujeto evaluado: cansancio, que se encuentra incomodo
 Evaluador: comportamiento y profesionalidad inadecuado.

Calificación e interpretación de las pruebas


 La corrección por ordenador o por lectura óptica elimina la varianza de error al no
cometer fallo.
 En las pruebas individuales donde el psicólogo debe corregir a mano, puede ser
una fuente de error. Por esto, las pruebas deben disponer de criterios de corrección lo
más objetivos posibles.
C) TIPOS DE FIABILIDAD

Coeficiente test – restest o estabilidad del test


 Tiene en cuenta los errores de medida derivados de las posibles diferencias de las
condiciones en las que en dos ocasiones se ha aplicado la misma prueba. No refleja los
errores relativos a distintas muestras de reactivos o elemento de la prueba. Esta
fiabilidad será mayor si el intervalo de tiempo entre las dos administraciones de la
prueba es pequeño.

Coeficiente de formas paralelas / alternas o de equivalencia


 Este coeficiente supera la fuente de error del coeficiente de test – retest ya que al
tener que aplicarse las dos pruebas cercanas en el tiempo el sujeto puede recordar las
respuestas.
 Consiste en aplicar la segunda vez una forma paralela o alterna del test evitando así
dos tipo de errores:
a) Los errores debidos a distintos reactivos
b) Los errores derivados de dos ocasiones diferentes de aplicación
 Aiken: describe el procedimiento correcto: elaborar de dos formas la misma prueba
y en el primera pase aplicar la FORMA A al primer grupo y a la otra mitad la FORMA
B. En la segunda aplicación al revés: tiene en cuenta tanto los errores debidos los
distintos momento de aplicación, como los distintos reactivos de la prueba.

Coeficiente de consistencia interna


 Es mas sencillo que los anteriores y tiene en cuenta los errores de diferentes
muestras de reactivos de una prueba, pero no refleja los errores de medición debidos a
las diferentes condiciones o mementos de la aplicación.
 Puede calcularse pro distintos métodos estadísticos:
 Método de división por mitades
 Método de Kuder- Richardson
 Coeficiente alfa de Crombach.

Coeficiente interjueces o entre evaluadores


 Grado de acuerdo o consistencia que existe entre dos o mas evaluadores.
VALIDEZ

Los instrumentos deben medir la dimensión real que se supone que están midiendo.
 Matizaciones sobre la validez: Silva:
1. Esta relacionada con las inferencias que se hagan a partir de las puntuaciones obtenidas mediante un instrumento en determinadas circunstancias.
2. No se válido el instrumento, sino las interpretaciones que se hagan a partir de sus puntuaciones
3. Es algo estimado, algo que se infiere a partir de un conjunto de informaciones y no algo que se reduce a un coeficiente particular
4. No debe hablase de tipos de validez (en todo caso de clases o tipos de evidencias). El concepto de validez es unitario. No existe limite de datos en
cuanto al tipo de procedimiento para estimar la validez.
Aiken y cols: indican que los métodos mediante los cuales pueden evaluarse la validez son: de contenido; criterial y de constructo. Estos tres
enfoques no son mutuamente excluyentes.
 Comprobación de que los contenidos de la técnica comprendan una muestra representativa del universo de conductas
que se pretende evaluar .
 Se relaciona con el enfoque referido a criterios.
VALIDEZ DE  Lenon: “la validez de contenido se refiere a la respuestas del sujeto y a las preguntas mismas del test, con el fin de enfatizar
CONTENIDO el hecho de que la estimación de la validez de contenido debe tomar en cuenta no solo el contenido de la preguntas sino también
el proceso que presumiblemente empleo el sujeto para llegar a ala respuesta”.
 Se aplica más frecuentemente: pruebas de conocimiento o rendimiento.
 La prueba tendrá validez de contenido cuando los jueces expertos en la materia valoren los reactivos de la prueba y están de
acuerdo en que la prueba funciona como una medida de la habilidad o conocimiento que se supone debe evaluar.

 Grado en que las puntuaciones en una variable predictiva, pueden utilizarse para inferir el rendimiento en una variable
diferente y operacionalmente independiente llamada criterio:
1) Validez concurrente: forma de validez relacionada con un criterio que es un índice del grado en que una puntuación de una
prueba se relaciona con alguna medida criterio obtenida al mismo tiempo.
2) Validez predictiva: forma de validez relacionada con un criterio que es un índice del grado en que una puntuación de una
prueba predice alguna medida criterio.
Factores que pueden a) Diferencias de grupo: variables: edad, sexo... Los coeficientes de validez tienden a ser más
afectar a la validez reducidos en grupos más homogéneos.
criterial b) Extensión de la prueba: las puntuaciones obtenidas en pruebas extensas y que se apliquen a
un mayor número de sujetos que varíen en gran medida en las características a medir tendrán
VALIDEZ varianzas mayores.
CRITERIAL O c) Contaminación de criterios: el criterio se distorsiona, debido al método particular para
PREDICTIVA determinar las calificaciones de criterio. Una forma de controlarla sería por medio del análisis a
ciegas (sin comunicar a quien realiza el diagnóstico ninguna información sobre los sujetos.)
d) Indice de base: proporción de personas en la población que muestran la característica o
comportamiento de interés.

Establece el grado en el cual un instrumento mide o guarda relación con un determinado rasgo o constructo hipotético. Silva
diferencia entre
Constructo: Validez del constructo
 Sinónimo de concepto científico  Sinónimo de validez conceptual
 No debe ser considerado como algo estático  Se refiere tanto al concepto como al método implicado.
VALIDEZ DE  Un constructo no se reduce a sus referentes  Engloba los conceptos de validez criterio y de contenido
CONSTRUCTO empíricos; conserva siempre un excedente de  No existe limite en cuanto a las estrategias, procedimientos
significación instrumentos y tipos de datos potencialmente útiles.
 Su fin potenciar la predicción, no fines  No se expresa sólo en función de uno o algunos coeficientes. Se
especulativos estima en función de toda la información acumulada.
 Su valor se juzga por su utilidad.  Consiste en la aplicación del proceso de formulación y
contrastación de hipótesis científicas al campo de la evaluación
psicológica.
 Es el tipo de validez más general. Comprende un conjunto de
investigaciones y procedimientos diseñados para determinar si un
instrumentos de evaluación que mida cierta variable cumple su
cometido.

Você também pode gostar