Escolar Documentos
Profissional Documentos
Cultura Documentos
Medição da definição
Medidas psicológicas
Ø Medidas
§ Respostas a itens corretas/incorretas- Testes
§ Não uso das respostas corretas/ incorretas-
Questionários
Ø Não medidas
§ Entrevistas, observações, etc.
§ Outros questionários
Abordagem cientifica
Pensamento empírico
Os instrumentos psicométricos são constituídos de modos a garantir
que a respetiva medida é rigorosa e replicável.
Teoria da medida
Fundamentos e implicações da utilização do símbolo matemático
(numero) para representar a realidade.
Relação/ correspondência entre um atributo e a sua medida.
Significado dos estados estatísticos.
Cattel
Inaugura a terminologia “teste mental”
Todos os elementos necessários ao surgimento dos primeiros testes
psicológicos verdadeiramente modernos e bem sucedidos
Testes laboratoriais e ferramentas gerad pelos primeiros psicólogos
na Alemanha
Instrumentos e técnicas estatísticas de Galton
Descobertas da psicologia, psiquiatria e neurologia
Binet
Estudo das diferenças individuais em detrimento das leis gerais- a
avaliação não pode ser feita de forma atomista pois ela própria
holistica
Psicologia individual
ü Crítica as abordagens anteriores: os aspetos complexos do
comportamento só podem ser observados em amostras de
situações próximas da vida quotidiana
ü Indicado pelo estado francês para uma comissão encarregada de
criar um método para avaliar crianças com necessidades
educativas especiais devido a um atraso mental.
ü Procurou identificar o que distingue as crianças normais das
crianças com atraso mental e formas de medir essas diferenças
ü Escala de Binet simon (1905)- primeira escala de inteligência
ü 30 tarefas com dificuldade crescente que avaliam o julgamento,
raciocínio e compreensão.
ü Instruções especificas de aplicação e interpretação
ü Amostra standartizada para comparação: 50 crianças com e sem
atraso mental
1ªRevisão em 1908
Conceito de idade mental nas crianças- diferença entre idade
cronológica e a idade atribuída a um determinado nível de
desempenho- IMC =IC era normal, IMC>IC era avançado, IMC<IC era
atrasado.
Terman e Merril
Adaptaram a escala de Binet-Simon para os EUA- teste de inteligência
de stanford- Binet (1916)
Stern- novo índice de medida QI=IM/IC x 100 – usado durante muitos
anos
Os testes popularizaram na primeira guerra mundial
Conceito de amostra estandartizada: grupo de pessoas que possui as
mesmas características dos indivíduos avaliados pelo teste.
Possui indivíduos com características similares às dos que vão ver o
teste.
Numa amostra geral da população, esta deve refletir os segmento da
população na mesma proporção.
Thurstone
Análise fatorial múltipla
Fundou o laboratório psicométrico em Chicago
Fundou a ocidente psiometrica americana e a revista psychometrika
Anastasi
Primeira a enfatizar que diferentes culturas tem conceitos alternativa
do que é uma “pessoa inteligente” e que os testes tradicionais medem
apenas competências valorizadas no meio académico e profissional.
Guru dos testes
Medição da personalidade
Medir aspetos não intelectuais do comportamento (relações sociais,
interesses, atitudes, etc.)
Provas de desempenho típico vs desempenho máximo
Questionários/ Inventários
Woodworth- folha de dados pessoais: protótipo dos questionários de
personalidade/ inventários de auto-descrição
Teste de personalidade
Avaliam as características estáveis ou traços que estariam na bae o
comportamento
Possuem escalas de escolhas múltiplas ou v/f
Podem ser aplicados a grupos de pessoas
Simplificam a recolha de informação clínica
Testes projetivos
Provas constituídas por material não estruturas e cuja estruturação
reflete as formas singulares/idiossincráticas de reposta- o indivíduo
projetará nessas tarefas as suas formas características de resposta
(associação livre).
1921- Rorschach- 10 manchas de tinta- métodos padronizados para
obter e interpretar reações ás pranchas- As respostas do sujeito
refletem o modo simular de perceber o mundo e se relacionar com ele.
Testes pictóricos, verbais e não verbais
Mais subtis que os questionários, interpretações qualitativas
Validade controversa
A Teoria da medida
Tudo o que tem consistência pode ser medido, temo é de conseguir
arranjar forma para tal.
Conceções de medida
Medir = conferir números aos atributos de pessoas, objetos ou eventos
de acordo com alguma regra (Stevens, 1946).
Passar de uma abordagem qualitativa (palavra) para uma quantitativa
(número).
• Número matemático:
o Conceito unívoco (tem apenas uma interpretação), sem a
mínima variabilidade de interpretação.
o Conceito pontual, onde um número apresenta nenhuma
interseção com o próximo.
• Vantagens da medida:
o Quantificação – os números podem ser manipulados;
podem adquirir significado.
o Objetividade – minimiza a subjetividade; permite o teste de
teorias.
o Utilização de análises estatísticas para fazer afirmações
precisas acerca dos padrões de atributos e as suas relações
e observação de efeitos subtis.
o Melhor comunicação – medidas padronizadas facilitam
uma linguagem e um entendimento comum.
“Ao analisarmos, categorizarmos e ao quantificarmos
sistematicamente os fenómenos observáveis, trazemo-los para a
arena científica.” (Urbina, 2006)
• De um modo geral, o progresso da ciência é acompanhado da
invenção de instrumentos de medida e avanços nos seus
procedimentos e técnicas.
• O campo da testagem psicológica também serve o seu avanço
com a invenção de ferramentas bem sucedidas.
Escala ordinal
• Relação de equivalência e relação de ordem
• A magnitude relativa tem importância – os números não são
arbitrários
• A distância entre intervalos sucessivos não é necessariamente da
mesma dimensão
• Não é possível fazer operações aritméticas
• Ex.: classes sociais; níveis sociais; percentis
• Estatística – (para além das anteriores) mediana; coeficiente de
correlação (Spearman)
Escala métrica
• Média contínua
• Acrescenta o significado de distância. Identidade + ordem +
igualdade das unidades (intervalar) + atividade (razão)
• Intervalar: não tem zero absoluto – não sabemos o nível absoluto
do que está a ser medido.
• De razão: tem zero absoluto – a interpretação absoluta é possível.
Raro em fenómenos psicológicos.
• Ex.: intervalar – temperatura; pontuação total de uma escala de
inteligência / de razão – rendimento, tempo de reação.
• Estatística – (para além das anteriores) média, desvio-padrão,
coeficiente de correlação (Pearson)
Teoria da Medida
Como podemos generalizar as medidas para as dimensões psicológicas
representadas/latentes?
Os Modelos de Medida
Modelo Clássico ou do Resultado Verdadeiro (Teoria Clássica dos
Testes – TCT)
• Toda a medida comporta algum erro – o resultado de um teste é
sempre uma estimativa imperfeita da dimensão latente.
• Há um resultado verdadeiro para cada indivíduo, mas esse é
irremediavelmente desconhecido.
• O erro também é desconhecido, mas pode ser estimado.
• Medir = estimar o resultado verdadeiro, com uma
margem de erro conhecida (estudo da precisão).
T=V+E
V=T-E
E=T-V
Modelo da Generalizabilidade (Cronbach)
• A realidade a um item é uma amostra das
observações empíricas possíveis do fenómeno.
• Medir = estimar o resultado no universo de observações de que o
teste constitui uma amostra, com margem de erro conhecida
(estudo da precisão).
Modelo do Traço Latente (Teoria de Resposta ao Item – TRI)
• Estabelecem uma ligação entre o nível do traço latente e a
probabilidade de sucesso num item.
• Os itens são diferentes entre si no nível de dificuldade e as
pessoas são diferentes entre si no nível de competências.
• Medir = estimar o nível de competência no construto latente a
partir da determinação das probabilidades de resposta certa a
cada item, em função do nível da dificuldade dos itens e do nível
de competência da pessoa.
o O nível de dificuldade é previamente conhecido ou
determinado nessa medida
o O nível de competência é determinado em função do
padrão de respostas certas ou erradas a itens de diferente
nível de dificuldade
Traço Latente à Desemprego.
è Probabilidade (P) que um indivíduo dar
a resposta indicativa do traço (“certa”)
a cada item (i)
è Para além da dificuldade, outros
parâmetros podem ser considerados
– discriminação e resposta ao acaso.
è Não se aplica só a itens dicotómicos,
ou seja, ao acertar ou errar.
è Aplica-se a testes de comportamentos típicos ou de
personalidade.
è Método mais preciso para selecionar itens, mas… modelos
matemáticos complexos, grandes amostras, mais para medidas
intelectuais.
AS ETAPAS DA MEDIDA
Um processo de medição implica (Aguinis, Henle & Ostroff, 2001):
• Que o seu objetivo esteja determinado (adquirir a informação,
descrever, prever).
• Que o atributo a ser medido esteja identificado e definido. Se tal
não acontece, podem aplicar-se diversas regras (diversos
números). O objetivo da medida deve orientar esta definição.
• Com base na definição, deve ser determinado um conjunto de
regras para quantificar o atributo.
• Finalmente, as regras são aplicadas, de modo a traduzir o atributo
em termos numéricos.
ESTUDO METROLÓGICO
Análise de Itens
A qualidade de um teste depende a qualidade dos itens que o
compõem.
PRECISÃO
• Fidelidade, fidedignidade, (com)fiabilidade
• Reliability, accuracy
• Medir sem erros
Se há algo com qual podemos sempre contar, para além da morte e dos
impostos, é com a variabilidade dos resultados dos processos de
medição.
Em todas as ciências este fenómeno é conhecido e o uso de medições
repetidas constitui a regra para o enfrentar (Moreira, 2004).
Precisão:
• Consistência dos resultados obtidos pelo mesmo individuo
quando é testado novamente com o mesmo teste ou equivalente.
• Grau em que os dados da observação suportam a inferência de
independência dos resultados observados relativamente aos
erros de medição.
• As medidas de precisão permitem estimar que proporção da
variância total dos resultados do teste é a variância do erro.
• Indica até que ponto as diferenças individuais nos resultados do
teste podem ser atribuídas a diferenças reais nas características
consideradas ou a erros casuais.
o Variância = média do quadrado da diferença entre cada
resultado e a média geral de resultados.
Pressupostos:
• Os erros são totalmente aleatórios
• Tem distribuição simétrica
o Se for feito um nº suficiente de medições, os erros tenderão
a anular-se (a média tenderá para zero – a média dos
resultados observados tenderá a aproximar-se do
resultado verdadeiro).
o A correlação entre o resultado verdadeiro e o erro,
calculada ao longo de uma série de medições para a mesma
pessoa ou para pessoas diferentes, será zero. A correlação
entre duas medidas paralelas da mesma variável
corresponde à proporção entre a variância dos resultados
verdadeiros e dos resultados totais – coeficiente de
precisão.
Teoria moderna da precisão (Cronbach, anos 50)
• Instrumento de medida = amostra representativa de um universo
de condutas que permitem a medição de uma dimensão
psicológica.
• O que está em causa não é a concordância das medidas, mas a sua
generalizabilidade.
• Estudo da precisão = estudo da variância dos resultados
(Variância verdadeira ≠ variância do erro).
Método teste-reteste
• O mesmo teste passado em momentos diferentes – amostragem
por tempos diferentes-
• Correlação entre as pontuações obtidas em duas ocasiões
diferentes.
• Problemas – efeito de memória, aprendizagem; mudanças no
resultado verdadeiro.
• Recomendações: evitar intervalos inferiores a 1 semana e
superiores a 4/5 semanas (pelo menos em variáveis mais
dinâmicas).
• Para aplicar o método do teste-reteste, a amostra deve ter pelo
menos 100 pessoas, o ideal seria 200.
Método da bipartição
• Considerar a primeira metade como uma das formas e a segunda
metade como a segunda forma do teste.
• Correlação entre as duas partes do teste
• Problemas: as duas metades podem não ser formas paralelas;
redução do nº de itens em casa parte; é impossível que os itens de
um questionário sejam inteiramente homogéneos
(multidimensionais); diferentes formas de distribuir os itens pelas
duas metades da escala podem dar origem a resultados bastante
diferentes em termos de coeficientes de precisão.
• Alfa de Cronbach – valor médio de todos os coeficientes de
precisão possíveis do tipo “split-half” (bipartição).
VALIDADE
Propriedade que assegura que os resultados medem corretamente o
que devem medir. A validade é mais importante consideração na
avaliação de um teste. Refere-se à adequação, ao significado e à
utilidade de inferências específicas feitas a partir dos resultados de um
teste. A validação consiste no processo de acumular evidências que
suportam tais inferências (APA, 2014).
Perspetiva Clássica
Validade de Conteúdo, de Critério e de Constructo
Validade de Conteúdo – Grau em que os conteúdos incluídos no teste se
referem de modo adequado ao que se pretende medir. Podem faltar
conteúdos; podem estar conteúdos a mais; à põe em causa esta
validade; há determinados testes que esta validade é importante, como
os testes de conhecimento. Pode-se testar de forma qualitativa e
quantitativa.
Validade de Critério – Exame da associação estatística entre os
resultados do instrumento e uma medida independente/alternativa da
variável que se pretende medir. Este critério que utilizamos para testar
o instrumento deveria ser perfeito; não há medidas perfeitas; a grande
dificuldade neste é termos um bom critério para avaliar o instrumento.
Validade do Constructo (Cronbach & Meehl, 1955) – Testar as diferentes
relações, previstas pela teoria em que a definição do constructo se
baseia, entre a medida em análise e diversas outras medidas, da mesma
ou de outras variáveis.
Mal entendidos…
• Um autor de um novo instrumento deve considerar os 3 tipos de
validade e considerar o que melhor se adequa às características
do seu instrumento
→Diluir as fronteiras entre os conceitos
→Reforçar noção unitária de validade
→Reenquadrar os princípios e procedimentos da validade de conteúdo
e de critério no âmbito da validade de construto – os objetivos são os
mesmos!
• As medidas psicométricas terão mais utilidade se construírem
bons índices de dimensões latentes/não observáveis
• A validade de uma medida será tanto maior quanto maior o grau
em que os seus resultados sejam determinados por uma
dimensão/construto latente, nas suas diferentes facetas, e
quanto maior for o grau em que esses resultados sejam afetados
por fatores que não façam parte desse construto
Validade de Construto
As evidências da validade de construto devem demonstrar que os
resultados do teste se relacionam mais com variáveis teoricamente
relevantes do que com variáveis não incluídas no modelo teórico (APA,
2014).
Estudo da validade à Método científico.
Validade
Várias validades?
• Não! – há várias formas de acumular evidências que suportem as
inferências realizadas a partir dos resultados de um teste. Mas a
validade é um conceito unitário, que se refere sempre ao grau em
que as evidências suportam tais inferências (APA, 2014)
Conceito unificado, mas multifacetado.