Medicion Psicometria

resumen psicometra TEMA 1: EL PROBLEMA DE LA MEDICIN EN PSICOLOGA 1.
INTRODUCCIN: La psicometra se ocupa de la medicin por lo que esta relacionada con el psicodiagnstico y la evaluacin psicolgica. Nos permite construir test estandarizados Se ocupa de establecer las reglas de medicin de caractersticas psicolgicas Para poder medir hay que observar. MEDIR: asignar nmeros a las cantidades e las propiedades de una persona de acuerdo con reglas preestablecidas y que se puede comparar; Es decir, cuantificamos cualidades. En psicologa las caractersticas las inferimos por lo que es importante que los instrumentos de medida constaten que esas inferencias son reales. Los instrumentos son los test psicomtricos que pretenden ser una medida objetiva y tipificada de pequeas muestras de conducta significativas del sujeto. Para que un test tenga valor debe servir para: diagnosticar y describir el estado actual del sujeto predecir el comportamiento futuro La medida en psicologa es algo concreto: Se miden caractersticas psicolgicas en personas, por lo que son aspectos individuales y concretos. 2. ELEMENTOS ESENCIALES EN LA MEDICIN En psicologa medimos para tener datos ms precisos y adems ahorra tiempo, esfuerzo y dinero. Cuanto ms complejo es lo que se pretende analizar la medida simplifica la realidad compleja. Cada tem de un test es una pequea muestra de conducta. Los elementos esenciales para medir en psicologa son: sealar o definir la cualidad o atributo que queremos medir operativizar el atributo en base a las manifestaciones del mismo ver la relacin entre cualidades y cantidades. Traducir e interpretar los datos cuantitativos para darles una cualidad. Es decir, interpretar los datos cuantitativos en base a unas normas de interpretacin. 3. EL PROBLEMA DE LA MEDICION EN PSICOLOGA: Definir claramente la caracterstica a medir. Esto es un problema ya que en psicologa no encontramos una 1
nica definicin de un atributo. Saber cual es la definicin mas til y cuales son los atributos que representan mejor as la persona evaluada. Los datos obtenidos son relativos y son solo una parte de la persona evaluada. Las medidas pretenden llegar a atributos muy complejos e intangibles, por lo que hay una gran diversidad de manifestaciones. Es necesario que los tems estn basados en muestras muy amplias para que los datos sean significativos. 4. CRTICAS A LA MEDICIN EN PSICOLOGA Y A SUS INSTRUMENTOS. VENTAJAS E INCONVENIENTES. VENTAJAS: Ahorro Objetividad Ayuda a pronosticar aunque con una posibilidad de error Ayuda a la comunicacin entre profesionales de forma ms precisa y ms significativa. INCONVENIENTES: No hay consenso, cada uno mide una cosa diferente dependiendo de su modelo de partida. El problema de s los tems son representativos o no Critica social Muchos test tienen una gran carga cultural y verbal Hay que tener en cuanta las condiciones de los sujetos de la muestra para saber la representatividad de los porcentajes Critica tica: hasta que punto se entromete en la vida privada Los test favorecen clasificar y etiquetar y esto en psicologa es un error. 5. MTODOS DE MEDICIN: Mtodo de prueba: Analizar y controlar de forma estricta la situacin; Hay estandarizacin y la tarea es predeterminada. Ej. Prueba objetiva Mtodo observacional: Trata de medir la conducta en situaciones naturales por lo que no hay estandarizacin. Mtodo mixto: Observacin planificada: se estandariza la observacin y el modo de medicin pero hay libertad en cuando a que se realiza en el medio natural. Permite cuantificar de forma natural. En base a los mtodos se derivan las escalas de medicin que son los modos de usar los nmeros. Las escalas de medicin que ms se usan son: rtulos: poner un numero a un objeto
categoras: representan grupos de objetos Escalas ordinales: conllevan un mnimo nivel cuantitativo. Permite ordenar objetos. Sirve para analizar la realidad de forma simple. Escalas de intervalo: los nmeros dan informacin de las diferencias entre un intervalo y otro, del orden. Escalas de razn o proporcin: son un tipo de escalas de intervalo que permite ver las diferencias entre cada persona. Se conoce un punto cero que no es arbitrario y por tanto se puede saber cual es la diferencia. Permite porcentaje. NORMAS DE MEDIDA Y ESCALAS NORMATIVAS: Son necesarias porque lo que medimos no es obvio, medimos de forma indirecta los atributos a travs de sus manifestaciones. Las normas permiten saber como asignar los nmeros a las caractersticas con el propsito de que representen el grado en que se manifiesta el atributo en cada sujeto. La medicin concierne a un atributo particular. Debemos saber que lo que medimos son manifestaciones de atributos y no personas. Generalmente medimos para comparar y hay dos modos de comparar: normas: para comparar grupos criterios: para comparar individuos consigo mismos Las normas deben estar especificadas de antemano y son de diferentes tipos A travs de las reglas hacemos medidas significativas. Las reglas son convenios que pueden ser cambiados si son incorrectos. Las normas bsicas en psicologa son: Normas de edad: se extraen eligiendo una muestra normativa a partir de la que extraemos el promedio de actuacin tpico en las diferentes edades. Normas de grado: se extraen de un grupo normativo, y en base al grado o nivel se extrae un promedio de actuacin. Normas de porcentaje: partimos de un grupo normativo en el que no se realizan comparaciones externas sino solo internas, dentro del mismo grupo. Se extraen los percentiles. Normas estndar o tipificadas: siempre tienen el mismo significado. Permiten comparar diferentes grupos y diferentes caractersticas. Hay diferentes escalas normativas: Coeficiente intelectual: pretenda dar idea de la inteligencia en funcin de la comparacin entre la edad mental y la edad cronolgica. Problemas: se extrae de un grupo normativo y si el sujeto no es del mismo grupo no se har una comparacin adecuada. Ventajas: se ha usado para seleccionar porque es fcil de calcular. 3
Centiles: son escalas ordinales. Se refiere al porcentaje de sujetos que queda por debajo de una puntuacin determinada. Ventaja: fcil de calcular y de interpretar. Tpicas transformadas: transforman la puntuacin bruta en indirectas. Tpicas normalizadas: puntuaciones tpicas no lineales, no hay una transformacin lineal. Suponemos que se aproxima a la normal. Tpicas normalizadas y transformadas: eneatipos: van de 1 a 9. Se basan en la z normalizada. Se parte de una media de 5 y una desviacin tpica de 2. Muy fcil de interpretar, no hay puntuaciones negativas, son equivalentes permitiendo todo tipo de comparaciones. Decatipo: de 1 a 10. Media 6 y desviacin tpica de 3. Coeficientes intelectuales tpicos: siempre se redondea. No hay limite superior. Se puede aplicar a cualquier edad. tipos de comparaciones: intrasujeto: comparar a un sujeto consigo mismo en diferentes momentos. Intersujeto: comparar a un sujeto con otro de su mismo grupo. Intragrupo: comparar a un grupo consigo mismo en diferentes situaciones. Intergrupo: comparar a un grupo con otro grupo; Diferencia de medias de dos muestras. CARACTERSTICAS DE LOS TESTS PSICOMTRICOS COMO INSTRUMENTOS DE MEDIDA Sirven para conocer mejor el comportamiento recogiendo datos. Pretenden ser medidas tipificadas y objetivas de muestras de conducta de un sujeto. Se empezaron a desarrollar para evaluar diferencias individuales y en la actualidad se aplican a diferentes ambitos para medir diferentes personas y diferentes caractersticas. Hay que ver si es realmente significativo. Ventaja: precisin, son voluntarios, no enmascarados y estandarizados Tambin pretenden servir para predecir por lo que estn elaborados en base a procedimientos estadsticos y tienen que haber demostrado su fiabilidad, validez y precisin. Pretenden medir caractersticas no manifiestas en muchas ocasiones. Muchos de ellos aplican anlisis factoriales. Resumen psicometra TEMA 2: INTRODUCCIN AL PROCEDIMIENTO DE ELABORACION Y ANALISIS DE UN INSTRUMENTO PSICOMETRICO INTRODUCCIN: El instrumento psicomtrico tiene que estar validado lo que conlleva saber en primer lugar que evaluar, lo que nos lleva a una definicin lgica del atributo a medir. Tambin hay que definir operativamente como se manifiesta el atributo, luego hay que saber como dar grado al mismo. Un instrumento psicomtrico consta de tres elementos:
Manual, pautas de manejo Protocolo de la prueba(tems y posible hoja de respuestas a parte) Plantilla de correccin Estos tres elementos varan en su forma de presentacin dependiendo de la finalidad del test, de su aplicacin, de su correccin, etc. ... Cuando queremos elaborar un test hay que saber a quien queremos evaluar; la longitud del test tambin ser diferente. Hay que saber el tiempo del que disponemos para: 1. Elaborar el test aplicarlo corregirlo Dependiendo del tiempo haremos un tipo de test u otro. Hay cuatro criterios segn los que diferenciar los tests. 1. Forma de presentar los tems: Estos pueden ser verbales (16PF), grficos (Raven) o manipulativos (un puzzle) Hay instrumentos que combinan diferentes tipos de tems por ejemplo escalas Wechsler de inteligencia que combina los tres tipos de tems. Contenido del test: mnibus: las preguntas miden diferentes operaciones mentales que se combinan en una sola puntuacin final(escalas evolutivas de Binet) Homogneos o de tarea nica: mide solo una habilidad o tarea (Raven) Batera de test: grupo de subtest tipificados y normalizados en una poblacin que dan diferentes caractersticas (test de aptitudes de Thurstone), que forman parte de una misma evaluacin o contexto. Tipo de respuesta que exigiremos al sujeto: Construccin de respuesta: se le presenta un estmulo y el sujeto elabora su propia respuesta de forma libre. Eleccin de respuesta: se le presenta el estimulo y se le dan alternativas de respuesta cerradas de las que el sujeto elige una. Tipo de aplicacin: Colectivos: las cuestiones se presentan en un protocolo impreso. El contacto personal con el evaluador es mnimo. Las tareas a realizar se proponen a todos los sujetos a la vez, hay un tiempo para realizarlo y la tarea suele ser de eleccin de respuesta. Las habilidades lectoras del sujeto pueden influir a la hora de responder. No exigen demasiada preparacin del examinador. Resultan econmicos en tiempo. Individuales: la aplicacin se hace persona a persona. El examinador normalmente presenta oralmente las preguntas. No hay lmite de tiempo. El examinador necesita mas experiencia; permiten tambin que el sujeto responda libremente (construccin de respuesta). El sujeto puede pedir explicaciones sobre la tarea por lo que las influencias de las habilidades lectoras no se dan. El problema es que llevan mucho tiempo. 2. PLANIFICACIN DE LA PRUEBA: La elaboracin completa de un instrumento dura alrededor de dos aos. 5
lo primero que se planifica es el diseo de la prueba asignacin de las personas que redactan los tems, donde entrara el tipo de tems Elegir los expertos(psiclogos, educadores, mdicos...) que analizaran los tems, criticando el contenido, el impacto estimular, etc. ... para que los tems sean representativos del contenido que se pretende evaluar. Hacer un cuaderno de ensayo Ir construyendo las instrucciones de manejo de la prueba. Primer estudio emprico: pequea muestra a la que se le aplica el borrador, se aplican los anlisis estadsticos pertinentes. Seleccionar los tems ms representativos, desechar los que no lo sean y los que pueden servir pero tienen algn problema se rehacen. Desarrollar todos los materiales auxiliares y entregar todo a la imprenta. Aplicar de nuevo el instrumento, pero a una muestra representativa de la poblacin; Es el segundo ensayo normativo. Se barema el test, aqu se hacen las tablas de baremacin y se valida el test. Poner a disposicin de la editorial todo el material. 3.PREPARACIN DEL EJERCICIO: 1 etapa: Enmarcar el instrumento (fundamentacin terica) Qu pretendo medir? Hay que saber que contenido tiene el atributo y como est construido tericamente. Hay que definir el atributo y decir su contenido: definicin lgica y operativa. Estas definiciones hay que posicionarlas tericamente. Qu inferencias quiero hacer a travs del atributo? Qu utilidad le voy a dar al instrumento? Objetivos y utilidad del test. A que poblacin va a dirigirse el instrumento? Decidir a quien voy a evaluar, a que sujetos se destina el test. 2 etapa: Planificacin y delimitacin de la prueba: Objetivos concretos de la prueba delimitar operativamente la prueba, cuantas reas o contenidos concretos va a tener la prueba. Hay que operativizar las reas de contenido, a las que se les pueden dar diferentes pesos, bien de forma emprica o bien por consenso de expertos. De momento se dan los pesos a priori, pero se est trabajando en darlos a posteriori. Se puede dar mas tems a un rea que a otra o se puede hacer una correccin con el mismo nmero de tems en todas las reas. 3 etapa: elaboracin de preguntas, protocolos y normas de aplicacin Darles un contenido real a las reas: Preguntas para cada rea. Hay que ver la proporcin de tems, su nmero y el objetivo de cada rea. Nmero de tems total de la prueba, en funcin del tiempo, del tipo de tems, de la velocidad lectora de los sujetos... hay que pensar en toda la prueba, en quin va a recibir los tems y en que atributo quiero medir: si es muy general muchos tems y si es concreto pocos tems. El que elige l nmero de tems es el autor del test. Los tems se distribuyen en las reas de contenido segn su peso y en cada objetivo. Seleccionar el tipo o tipos de tems ms convenientes: verbales, manipulativos, grficos... Formato del instrumento, presentacin. 6
Se selecciona el tipo de tems segn dos criterios: preguntar a expertos o hacer un banco de tems de los que se elige al azar. Hay que tener en cuenta unas condiciones: el tiempo para construir, aplicar y corregir el test el proceso mental que se exige La aplicacin individual; se adecua el tiempo al sujeto y el nmero de tems es mayor. Condiciones del evaluador que delimita el tipo y nmero de los tems. Dificultades del material. Las personas a las que se va a evaluar. Estas condiciones llevan a unas estrategias y a un protocolo determinado. Hay que conocer nuestra capacidad para redactar los tems. Elaborar el protocolo y elaborar las instrucciones y las normas de aplicacin y de correccin del instrumento. Elaborar el material para aplicar, corregir la prueba para que otro profesional pueda aplicarla. Todo esto es un borrador, un ensayo en el que se tienen mas tems de los que se necesitaran. 4 etapa: Primer estudio emprico: Finalidad: saber si el instrumento sirve realmente. Identificar y seleccionar una muestra de sujetos a la que aplicar el borrador. Aplicar el instrumento. Corregir el instrumento: Hay que tener normas de correccin. Esto nos permite obtener unos resultados. Anlisis estadstico descriptivo de todos los resultados. As conoceremos la tendencia de las puntuaciones. Anlisis de tems: se analiza tem a tem a nivel lgico y a nivel cuantitativo. Reestructuracin de la prueba: se rechazan los tems, se reestructuran o se dejan como estn. 5 etapa: segundo estudio emprico objetivo: determinar las caractersticas tcnicas de la prueba. Demostrar la representatividad cualitativa y cuantitativa de la muestra. Aplicar a la muestra el instrumento y corregirlo igual que en la anterior etapa. Anlisis de tems Estudio de fiabilidad de la prueba Estudio de validez Interpretar las puntuaciones ELABORACIN Y SELECCIN DE LOS TEMS Segn como seleccionamos los tems el test tendr un contenido. Las preguntas y alternativas de respuesta son el protocolo del test. Los tems son verbales, grficos o manipulativos. El tipo de tems tiene que ver con s el sujeto responde de forma libre, estructurada o de forma mixta. Items de respuesta libre: La tarea es organizar sus propias respuestas y responder con sus propias palabras desde su propio punto de referencia ante el estmulo presentado. Hay dos tipos de tems de respuesta libre:
ensayo: lo importante es poder evaluar el desarrollo conceptual o global del sujeto. Permite conocer aspectos muy personales como originalidad o la forma de estructuracin. Problema. subjetividad Respuesta restringida: se da un problema especifico a responder que delimita la libertad de respuesta. Items de respuesta estructurada: la tarea es elegir sobre respuestas dadas por el evaluador. Es ms fcil de cuantificar. Limita la libertad del sujeto. Hay diferentes tipos: Item objetivo de respuesta alterna: se ofrecen dos opciones y se elige una. Influye mucho el azar. Se necesita un gran numero de tems para que represente bien lo que se quiere evaluar. Item objetivo de eleccin de respuesta: tres o ms alternativas de respuesta. Permite mayor flexibilidad y ms informacin. Permite analizar algunas habilidades del sujeto. Items objetivos de emparejamiento: son ms complejos pero siguen siendo objetivos. Hay un encabezado, dos columnas de respuestas, que hay que emparejar. No vale para cualquier edad ni para cualquier nivel socio cultural. Items de completamiento: son semiobjetivos o mixtos: mezclan los tems de respuesta libre y los estructurados. Hay mayor flexibilidad y hay varias respuestas correctas. APLICACIN, CORRECIN Y PROCEDIMIENTOS ESTADSTICOS PERTINENTES: Una vez que hemos llegado aqu hay que aplicar el test y para ello hay que: Delimitar unas normas claras de aplicacin. Tener elegida de forma clara la muestra representativa. Aplicar el test: Recoger datos significativos. Ahora hay que hacer un anlisis de los tems a dos niveles: cualitativo: anlisis lgico racional. Cuantitativo: anlisis emprico de las propiedades estadsticas de cada uno de los tems. TEMA 3: CONFIABILIDAD DEL INSTRUMENTO INTRODUCCIN: La confiabilidad es el hecho de que una medida se mantenga en el test. Para medir la estabilidad es necesario medir y conocer las fluctuaciones (estadsticos de posicin) La estabilidad es relativa al momento. La confiabilidad se mide en dos ncleos: la media y el instrumento. Los instrumentos deben aportar algo significativo del sujeto que estamos evaluando y esta ha de ser lo mas precisa posible. La confiabilidad es la exactitud de la medida en diferentes ocasiones, en un lapso de tiempo. Esto se halla estadsticamente mediante la correlacin. La inconfiabilidad es la noestabilidad o el no acuerdo en la misma medida del mismo sujeto y en las mismas circunstancias. Esto nos lleva a deshacer esta medida por no ser significativa. 8
Empricamente la confiabilidad o la inconfiabilidad se miden por los estadsticos de relacin. Si una medida y otra varan mucho entre s y estn hechos en el mismo sujeto, esas medidas no son significativas. Inconfiabilidad de la medida, lo podemos obtener empricamente a travs de estadsticos de relacin. POSTULADOS BSICOS: Fiabilidad supone consistencia y por lo tanto informacin estable. Si una medida es fiable nos da informacin consistente y estable. razones de tipo externo al instrumento que pertenecen al sujeto (el sujeto madura o cambia de opinin) Razones que se deben al propio instrumento: el tipo de tareas es demasiado fcil o demasiado difcil. los tems no son representativos Influencia del propio evaluador. El propio azar influye en la inconsistencia de la medida. 2 . La confiabilidad debe ir investigada empricamente para cada instrumento y para cada situacin de aplicacin. Cmo comprobar la confiabilidad del instrumento? El grado de variacin de un conjunto de medidas sucesivas si es bajo medida consistente e instrumento confiable. Contrastar la posicin de un sujeto con respecto al grupo. 3. Hay que demostrar empricamente el grado de estabilidad de las puntuaciones a travs de los estadsticos de relaciones. Estadsticamente la fiabilidad es una correlacin. Toda media esta compuesta por dos elementos bsicos: la puntuacin total conlleva una puntuacin verdadera mas la puntuacin del error ( PT=PV2+PE) El modelo lineal de Sperman (teora clsica de la puntuacin verdadera) si a un sujeto le aplicamos un numero infinito de veces un mismo test y suponiendo que las aplicaciones sean independientes entre s, la media de las infinitas puntuaciones sera la puntuacin verdadera del sujeto. Con respecto a esa caracterstica y para puntuaciones arbitrarias al error se anulan entre s. Siguiendo esta premisa: PV = PT PE Elementos fundamentales: (1) El error es independiente a la puntuacin verdadera e incluso a la variable que estoy midiendo. PT = PV + PE (2) No existe correlacin entre las puntuaciones verdaderas y el error. (3) Los errores afectan a las puntuaciones totales pero afectan de forma distinta cada vez que medimos. Un conjunto de errores de un grupo influye en la PT de ese grupo pero no en las puntuaciones verdaderas 9
(PV) de ese grupo. Podemos hallar el error en la puntuacin: cuantos ms errores cometamos y mayor sea el error menos estabilidad tenemos en la puntuacin y viceversa. Qu es el error tpico de medida? Pe = Pt Pv O Xi XT= e Xe Se error tpico de medida .....1 = e1 .....2 = e2 .....3 = e3 Cuanto mayor sea el error tpico de medida menos posibilidades tengo de que mi medida sea significativa. El error de medida se utiliza para ver si las variables son muy amplias(significativas). El error tpico de medida es la desviacin tpica de errores (Se) El error tpico es responsable de que haya variables en la medida. La estabilidad de la medida se define como la proporcin de la r2 verdadera que se explica por la r2 total. S2 observada = Sv2 + Se2 El coeficiente de confiabilidad: S2v R= S2 observada FORMAS DE ESTIMAR LA CONFIABILIDAD: El coeficiente de confiabilidad se halla para cada instrumento y para cada situacin por lo tanto no es absoluto. Si cambiamos de circunstancias, de poblacin, debemos hallar otro coef. De confiabilidad. CUATRO FORMAS DE HALLAR EMPRICAMENTE LA CONFIABILIDAD TEST RETEST TEST PARALELOS O EQUIVALENTES TEST SUBDIVIDIDOS O TEST DE LAS DOS MITADES ESTADISTICOS DE ITEMS. TEST RETEST: Tenemos que tener un test el cual aplicaremos al menos en 2 situaciones diferentes. Pueden ser momentos simultneos (sin intervalo) o en un largo periodo (con intervalo). Podemos saber la consistencia interna del test si la puntuacin es la misma en situaciones diferentes. Ya no controlamos la r al ser la misma tarea la que pretendemos valorar. Si controlamos la maduracin y los cambios del sujeto en las dos aplicaciones correlacionamos las dos 10
medidas obtenidas. Si el test est bien hecho y mide lo que he pretendido medir las medias son muy similares. Medimos pues la consistencia interna del test haciendo este test retest, pero si no es suficiente utilizamos otros test. TEST PARALELOS: Tambin con dos momentos de aplicacin: dos medidas de cada individuo pero elegimos el test y otro equivalente que mide las mismas caractersticas pero desde otro modelo terico. Son dos medidas de la misma caracterstica pero con tareas diferentes. Podemos comparar nuestra medida con la de otros test. Estos test tiene que tener medias y varianzas iguales No sabemos la consistencia interna del instrumento porque no son dos medidas del mismo instrumento pero si nos da informacin de la consistencia externa. Podemos aplicar estos dos test sin intervalo de tiempo o con l si lo que queremos es valorar los cambios madurativos. El nico mtodo que nos permite conocer la consistencia externa del test, el que ms controles realiza en relacin a las varianzas debidas al error. Incluye tambin la varianza de error debida a la diferencia entre las tareas. TEST SUBDIVIDIDO: Es econmicamente muy til respecto al tiempo y al dinero. Solo necesita una aplicacin del test; Solo una medida si es consistente o no de forma interna. Una vez aplicado y corregido el test se divide en dos partes iguales: tems pares (a) 17 30 Items impares (b) Tambin se puede hacer al azar, repartir en dos todos los tems. Correlacionamos una mitad del test con la otra pero esa correlacin no es igual a la correlacin total del test (coef. De correlacin) Por eso para hallar la confiabilidad hay varios mtodos, en este test aplicamos la formula de Spearman Brown. Cuando aplicamos el test lo dividimos suponiendo que a y b tienen varianzas iguales: formulas Si las varianzas fueran diferentes entre las dos mitades utilizaramos la formula de Rulon y Guttman. formulas Este mtodo permite solo una parte de la consistencia interna. Permite aplicar la confiabilidad en test de velocidad(en intervalo de tiempo corto) ESTADSTICA DE TEMS: es tan econmica como la anterior. Una sola medida. Valora la consistencia interna con criterios internos. Comparamos las puntuaciones de cada tem con la puntuacin obtenida en el test completo.
11
Se considera a cada tem como un test individual. Comparacin de cada tem con la puntuacin total del test. Se supone que todos los tems tienen la misma varianza y la misma media utilizamos la formula de Kuder Richardson. Si las varianzas y medias son distintas: Los distintos mtodos nos dan diferentes medidas de confiabilidad, varan en cuanto al grado y en cuanto al contenido 5. CMO SE INTERPRETAN LOS DATOS DE CONFIABILIDAD? No hay confiabilidad mnima, la mxima es 1. A pesar de no haber un nivel satisfactorio nico si se ha llegado a un acuerdo; que no baje de 0,6 la confiabilidad de un instrumento. A veces la prueba que presenta mayor nivel de confiabilidad no es accesible para nosotros bien econmicamente o porque no la podemos aplicar y tenemos que escoger otra. Hay que intentar equilibrar el nivel de confiabilidad con este 2 nivel (s es accesible para nosotros, lo sabemos aplicar) Hay que fijarse en tres niveles cuantitativos: (estos 3 niveles cuantitativos dependen de un 4 nivel que es el mtodo utilizado): nivel de confiabilidad (01) error tpico de medida el ndice de confiabilidad Alto nivel de confiabilidad implica un bajo error tpico de medida y alto ndice de confiabilidad sera lo ideal. Cada mtodo nos da errores tpicos de medida distintos y niveles de confiabilidad distintos. Estos tres niveles cuantitativos estn en funcin del mtodo utilizado. Adems de esto influyen otros aspectos cualitativos en el nivel de confiabilidad: Como es el grupo, la dispersin del mismo (si es homogneo o heterogneo). Sabemos si un grupo es homogneo o no por los estadsticos de dispersin (desviacin tpica). Si un grupo es muy heterogneo (variable) es mas fcil que el instrumento sea fiable. En un grupo homogneo un error influye mucho en la confiabilidad del instrumento. En un grupo heterogneo el mismo error no sera tan grave. Nivel de capacidad del grupo => tiene que decir en el test el nivel de capacidad que tiene el grupo al que se aplic el test. Hay que tener en cuenta esta capacidad del grupo, las distintas variables que influyen en l. Extensin del test => cuantos ms tems ms posibilidades de representar bien lo que queremos medir, pero si son demasiados el sujeto evaluado puede perder la concentracin. La propia tarea => hasta que punto el sujeto puedo o no realizarla. Si es demasiado difcil para su edad o demasiado fcil. Hay que leer la prueba antes de aplicarla. 12
La forma de correccin => si las normas de correccin no estn bien estructuradas o bien aplicadas se `produce una interpretacin subjetiva. La propia situacin de aplicacin => comprobar si la situacin es normal, habitual, cotidiana. para que no se produzcan sesgos. Falta de acuerdo entre las distintas medidas => viene de la falta de acuerdo terico lo que provoca que las medidas no sean fiables. La fiabilidad es la condicin necesaria para que un instrumento sea valido, pero no es condicin suficiente. No puede ser valido si no es fiable. Que el mtodo no sea el adecuado para las personas que estamos evaluando es la cualidad ms negativa. 6. CONFIABILIDAD Y LONGITUD DEL TEST Al aumentar el nmero de tems hay ms probabilidades de que el instrumento sea ms confiable. Hay mtodos que puede que sean poco confiables porque son poco extensos Si cambiamos la longitud variamos tambin la confiabilidad. Hacer una prueba excesivamente larga puede resultar malo y puede bajar la confiabilidad. Hay que tener cuidado. Hay una formula matemtica que nos dice hasta que punto se puede aumentar l numero de tems para aumentar su confiabilidad. En cuanto aumento el test numero de veces que aumento el test. Quiero que la confiabilidad llegue a 0,80: Hay una relacin entre la confiabilidad y la homogeneidad de la muestra. Cuando aplicamos medidas en muestras diferentes obtenemos medidas que varan la muestra Las puntuaciones verdaderas de una muestra no tienen porque coincidir con las puntuaciones verdaderas de otra. La varianza de error puede depender de la incapacidad del test para medir puntuaciones verdaderas. Homognea varianza pequea Heterognea varianza grande => mayor nivel de confiabilidad. En muchas ocasiones nos puede interesar mucho en psicologia comparar medidas entre s y ver la diferencia entre ellas a travs de las puntuaciones. Existen una serie de peculiaridades: Los errores que yo cometo en dos medidas diferentes influyen conjuntamente en la puntuacin de diferencias. Lo que tienen en comn ambas medidas lo anulamos porque buscamos la diferencia. Siempre es ms pequea la confiabilidad de las puntuaciones diferenciales que la confiabilidad por 13
separado. Confiabilidad de la diferencia de puntuacin: TEMA 4: VALIDEZ DEL INSTRUMENTO INTRODUCCIN: El valor de un instrumento reside en que debe demostrar su utilidad. Esto lo consigue mediante la validacin. La utilidad debe ser permanente. VALIDAR es en que medida un instrumento da datos significativos, predice acontecimientos. Un instrumento no tiene un coeficiente de validez fijo, vara y puede tener caducidad. Hay tipos de validez y tipos de coeficientes de validez, segn la utilidad que le damos al instrumento. Todos los coeficientes de validez estn basados en correlaciones. Hay dos cuestiones en la validacin: para quien y para qu es til ese instrumento. La validez est relacionada con la muestra y si sta cambia la validez tambin. Dependiendo de la finalidad del test habr diferentes tipos de validez. Segn lo que se quiere medir, se elige un instrumento u otro. Analizando el contenido (tems) se elige el instrumento ms representativo, el mejor para lo que queremos medir: esto es la validez. Hay que elegir el test que mide realmente lo que queremos medir. CONCEPTO Y DEFINICN: La validez de un instrumento es la exactitud con la que podemos hacer medidas significativas y adecuadas a travs de el. Para esto lo primero es saber de antemano qu es lo que quiero medir. La validez puede ser estimada tanto a nivel cuantitativo como cualitativo. El coeficiente de validez es un coeficiente de correlacin del nivel cuantitativo. Se correlacionan los datos obtenidos en el test con los datos de comparacin, del criterio de validacin, que son datos significativos de lo que queremos evaluar. La validez no es fija, por lo que hay que revisarla cada cinco o seis aos. El aspecto cualitativo del test lo da la representatividad del mismo con respecto al sujeto. EL PROBLEMA DEL CRITERIO DE VALIDACIN Una forma de demostrar que el instrumento es vlido es tener un punto de comparacin externa. Para ello necesitamos un criterio, es decir, algo mensurable y no medible porque se miden cosas que no se ven(inteligencia, sociabilidad). Por esto en psicologa no se pueden medir criterios verdaderos, pero deben ser lo mas verdaderos posible. Hay que elegir los criterios que sean unnimemente estables y confiables. Debe ser el ms adecuado posible e independiente del test y de su autor, por lo que debe ser valorado por personas ajenas al test y su autor: Jueces de validacin. El criterio debe estar exento de prejuicios; a priori todas las personas deben de poder estar evaluadas. Debe estar disponible y debe haber demostrado su validez. A pesar de todo el criterio conlleva un sesgo que hay que controlar. Por eso hay que saber quin evalu el criterio para poder analizar los coeficientes de validez.
14
Sobre la base del tipo de criterio elegido hay que evaluar la validez. DIFERENTES TIPOS DE VALIDEZ VALIDEZ DE APARIENCIA lgica y racional. No tiene datos cualitativos. Es el grado en que un instrumento parece que mide lo que queremos medir. Lo dan los usuarios de la prueba: hasta que punto la prueba es aceptada por quienes la usan. Concierne a juicios del instrumento una vez ya construido. La validez de apariencia no suele tener relacin con la validez real. La imagen suele sesgar la validez predictiva. VALIDEZ DE CONTENIDO: (circular intrnseca) tambin es lgica y racional, no tiene ningn dato cuantitativo. Se analiza tem a tem hasta que puntos estos son muestras de comportamiento representativas de lo que pretendemos medir y de a quien pretendemos medir. Es un anlisis tem a tem en cuanto a su estructura gramatical y su presentacin. Es necesario tener descrito de forma lgica y operativa lo que quiere medir el instrumento. Hay que detallar el procedimiento de los datos obtenidos en esa prueba. Es un anlisis cualitativo. El juez analiza, critica y reestructura los tems. Los tems pasan por los filtros, que son el resto del equipo y un juez externo, para luego ordenarse en base a criterios de ordenacin y se devuelven de nuevo al constructor. VALIDEZ CONCURRENTE (estadstico emprica) el coeficiente se halla teniendo en cuenta un criterio de validacin que se da al mismo tiempo que los datos del instrumento. Se emplea esta validez para saber el estado de una persona en el momento actual, por ello es necesario que el criterio externo se d en el momento presente. Relacionamos los datos del test con los datos externos que se estn dando al mismo tiempo. Sirve para clasificar al sujeto en base a esa medida; Conlleva diagnstico, clasificacin y descripcin. Incluye el error tpico de medida del test como el error de criterio. Si el criterio no es objetivo o significativo el test no es confiable, la validez concurrente no da datos significativos. Si mide lo que se quiere medir este coeficiente de validez se acercar a 1 y significa que el test es vlido para hacer clasificaciones. VALIDEZ PREDITIVA se halla a travs de un coeficiente de validacin por lo que necesitamos un criterio externo. El uso del test es predecir la conducta del sujeto en el futuro por lo que el criterio externo no se va a dar en el presente. Hay que esperar un tiempo para que el criterio se d. Est influido por el error de medida y por el error de criterio. Cuanto ms cerca est del 1 mejor predecir la conducta. Test inferencial: Orientacin vocacional, seleccin de personal, consejo psicolgico... el criterio y el juez deben ser independientes del test. Si tiene buena capacidad predictiva suele tener capacidad diagnstica pero no viceversa. VALIDEZ DE CONSTRUCTO conlleva dos niveles de validez: emprica y racional lgica. Es un proceso continuo. Queremos validar el instrumento y verificar hasta que punto se verifica la teora que est en la base. Nos interesa saber en que grado ese instrumento nos da una medida adecuada del constructo que queremos medir. Hay varios mtodos para hallar la validez de constructo, ya que es el tipo de validez ms complejo al tener dos niveles (cualitativo y cuantitativo): Campbell y Fiske Cronback y Meehl Messick Bentler Cmo se halla la validez de constructo? Para evaluar una teora: 1) definir cual es el atributo a medir. 2) describir con que otros constructos de inters se puede relacionar. Tambin hay que saber cuales son las manifestaciones de ese atributo. Campbell y Fiske emplean un multimtodo multivariable: se aplican 3 mtodos para estudiar las 3 variables y despus se compara cada mtodo con cada variable hallando una matriz de correlacin. El objetivo es demostrar que mi mtodo es el que mejor correlaciona con la variable que pretendo medir; tambin ese mtodo debe mantener una 15
correlacin con las otras dos variables. Cronback y Meehl: hay varios mtodos y varios grupos de personas. La prueba debe demostrar la correlacin mas alta entre el mtodo, la variable y el grupo de personas a las que se le aplica el mtodo. Al trabajar con grupos diferentes de personas el instrumento debe discriminar entre los diferentes grupos. La informacin recogida debe permitir valorar cambios en el sujeto o en el grupo de personas. Otra forma de hallar la validez es mediante la hiptesis alternativa: pensar que el instrumento mide mejor otra variable y demostrar que no es as. Algunos autores hablan de la VALIDEZ FACTORIAL: tipo de validez de constructo que se establece a partir de anlisis factoriales. El anlisis factorial trata de explicar las interrelaciones de un conjunto mediante las variables de ese conjunto que se dan en la realidad y constituyen factores. No hay acuerdo sobre si dentro de los tipos de validez de constructo estn la validez discriminante (permite discriminar; Mide el nivel de discriminacin que posee un instrumento como por ejemplo determinar quienes son los mejores de cada clase; se trata de discriminar entre las variables que mide un instrumento y que el test correlaciona mejor con la variable que quiere medir) y la validez convergente (aquella que se compara con otras medidas hechas al mismo atributo). Un instrumento nunca puede ser ms valido que fiable. La fiabilidad siempre es mejor que la validez. INTERPRETACIN DEL COEFICIENTE DE VALIDEZ: Adquiere valores entre 0 y 1. Es un coeficiente de correlacin que nos permite saber la validez estadstica del test. Se correlacionan los datos del test con un criterio externo. No se explica solo a partir de los resultados sino que hay mas factores: si est cerca de 1 es muy valido el error tpico de medida debe ser bajo para ser mas valido Se interpreta segn un criterio externo que debe aparecer claramente definido. Cuanto ms estricto sea el criterio mayor ser la validez. Si el criterio es inconfiable disminuye la validez. Depende quien sea el juez el criterio ser confiable o no. La confiabilidad bajar ante un juez novato. El criterio no debe tener sesgo, es decir, no debe favorecer a unos sujetos y desfavorecer a otros. Si la fiabilidad es alta y la validez baja, puede que el modo de hallar la fiabilidad sea errneo. No hay un nico coeficiente de validez, es relativo al contexto en el que se va a aplicar el test. Si el instrumento no es confiable, la validez disminuye. El juez debe ser objetivo, experto y estar entrenado. Los datos obtenidos tienen que ser significativos y suficientes para que exista validez. Al valorar cosas insignificantes la validez ser baja. Es til cuando da informacin significativa y novedosa; cuando permite discriminar; cuando nos permite hacer predicciones serias, con cierta seguridad; cuando permite tomar decisiones correctas. TEMA 5: PREDICCIN INTRODUCCIN: Hay que hallar la validez predictiva y todos los dems coeficientes para predecir bien. Predecir es adelantarse. Es una forma de pronstico, a partir de una variable que correlaciona con otra desconocida 16
determinamos esa variable desconocida a travs de una determinada frmula. Cuanto mejor es la correlacin ms posibilidades hay de que esa prediccin sea exacta. La correlacin igual a 1 determina una prediccin exacta. La prediccin es relativa y conlleva un cierto riesgo. Al predecir siempre se comete un error de estimacin que se junta al error cometido en la medicin. La prediccin depende de la correlacin entre las variables, del error tpico de medida, del error tpico de estimacin, del coeficiente de fiabilidad y del coeficiente de validez. La prediccin es ms fcil hacerla en grandes grupos que en pequeos grupos, porque los errores interfieren menos y porque un error en un grupo grande se nota menos. La prediccin es ms fcil en un grupo heterogneo que en un grupo homogneo, porque la variedad de sujetos favorece esa prediccin. Es importante conocer la dispersin y la variabilidad ya que en una gran dispersin no es significativa la media. A nivel cuantitativo hay una serie de coeficientes que determinan el nivel de precisin del instrumento: Coeficiente de alienacin, de valor predictivo y de determinacin. COEFICIENTE DE ALIENACIN (C.A) Viene expresado por la proporcin del error tpico de estimacin que hay en la descripcin del criterio. Es un error relativo que cometemos al hacer predicciones teniendo en cuenta la dispersin de los datos. Tratamos de ver como el error de estimacin influye en la prediccin. Nos impide hacer buenas predicciones cuanto mayor es su valor. Si el CA lo multiplicamos por 100 nos da el % de error que se puede cometer en la prediccin, es decir, hasta que punto est influida la dispersin por el error. Cuanto menos influya en la dispersin mayor ser la precisin de la prediccin. CA = 1 La prediccin es igual que si se realiza al azar. Tenemos muchas probabilidades de que no se d la prediccin. CA = 0 La prediccin tiene grandes probabilidades de xito, la prediccin es ms exacta. El CA nos muestra hasta que punto tenemos incertidumbre en la prediccin. CA = K. COEFICIENTE DE VALOR PREDICTIVO (CVP) Es hasta que punto un instrumento nos permite una seguridad en nuestros pronsticos. Si lo multiplicamos por 100 nos da el valor de seguridad de pronostico. CVP = E = 1 K COEFICIENTE DE DETERMINACIN:
17
Es el cuadrado del coeficiente de correlacin. Expresa la proporcin de la varianza del criterio que es pronosticada a partir del test. Se representa rxy2 = d =. . . Si la puntuacin pronosticada se da en la realidad, entonces las variaciones de la variable criterio pronosticada pueden explicar la varianza total de la variable. VARIANZA RESIDUAL O PARCIAL: es la parte de la varianza que no hemos podido pronosticar. Cuanto ms grande sea mayor ser la incertidumbre en nuestros pronsticos. Si dejamos mucha parte de la varianza al azar, tendremos mayor incertidumbre. El coeficiente de determinacin nos da hasta que punto la varianza pronosticada explica la varianza total del criterio. Si es muy cercana ser 1 => xito Si es mucho ms pequea tendremos menos xito. Cuanto ms grande es el coeficiente de determinacin ms pequea es la variable residual. Su valor mximo es de 1 con lo que el % de acierto ser del 100% con un error y una variable residual nulos. Toda la prediccin en psicologa se basa en la regresin. Con el fin de mejorar nuestras predicciones se utilizan muestras ms heterogneas y se aumenta la longitud del test. Para esto se utilizan bateras de test, se valoran las mismas variables. Hay que saber elegir los tests viendo los que correlacionan mejor. Hay formas matemticas para saber que tests correlacionan mejor para medir una variable. Cuando una variable se valora a partir de un test ( x predice a y) regresin lineal simple. Cuando utilizamos varios tests para predecir una nica variable hiperplano de regresin. Si introduzco todos los datos obtenidos en unos tests pido un hiperplano de regresin y me correlacionan los tests que mejor van a medir la variable. FACTORES QUE INFLUYEN EN LA PREDICCIN: Que haya una correlacin entre el test y la variable que queremos medir. Cuanto ms alta sea la correlacin mas probabilidades de xito. Errores cometidos: standard o tpicos error tpico de medida que cometemos en el test Error tpico de estimacin cometido en la prediccin. Cuanto ms alto sea el error mayor incertidumbre habr. Que el test sea confiable (coeficiente de confiabilidad del test). El mtodo nos va a dar datos sobre la confiabilidad. Indice de fiabilidad: hasta que punto muestra limitacin terica, hasta que punto nuestro instrumento es valido. La validez predictiva del instrumento Variabilidad de las medidas: cuanto mayor es la variabilidad de la distribucin de las medidas del grupo, mayor es la probabilidad de xito en nuestra prediccin. Cuanto ms bajo es el coeficiente de alienacin y ms alto el coeficiente de prediccin mayores sern las probabilidades de xito. 18
Con una varianza residual baja y un coeficiente de determinacin alto ser mayor el nivel de prediccin Longitud del test: Mayor probabilidad de predecir bien cuanto ms largo sea ya que tenemos mas muestras de conducta. Factor de correccin: correccin por inconfiabilidad o por atenuacin. Se intenta corregir tericamente los errores en la medida. Nos permite saber hasta que punto si yo corrigiera la inexactitud del test y del criterio se mejorara nuestra prediccin. correccin del test y del criterio: correccin del criterio: correccin del test Se realiza para saber si merece la pena hacer correcciones en el test que tenemos o hacer otro test. UTILIDAD DE LA PREDICCIN: Hacer una prediccin es muy arriesgado porque hay muchos factores que pueden cambiar las circunstancias internas y externas. Las predicciones son siempre relativas, estn basadas en la ley de la probabilidad. Son imprecisas ya que cometemos errores y podemos caer en el error de etiquetar a una persona. Tambin corremos el riesgo de que s de la profeca autocumplida. Predecimos en situaciones de orientacin, a nivel de orientacin vocacional o laboral, en seleccin de personal, al dar un consejo psicolgico, al dar informacin para la roma de decisiones, al intervenir teraputicamente, al realizar programas de entrenamiento, al investigar... Apoyamos las predicciones en tcnicas evaluativas (test psicomtricos), es decir, en los datos obtenidos. Cada test por separado es un indicador parcial, la prediccin ser ms fiable si est buscada en ms de un test.
19

Medicion Psicometria

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Medicion Psicometria

Enviado por

Direitos autorais:

Formatos disponíveis

resumen psicometra TEMA 1: EL PROBLEMA DE LA MEDICIN EN PSICOLOGA 1.

Você também pode gostar