Você está na página 1de 23

Psicometria

A psicometria é a especialidade da psicologia que trata dos aspectos


quantitativos dos processos psicológicos e dos modelos estatístico-
matemáticos da análise de dados.
Pode ser definida por várias maneiras:
v Objetivação e quantificação dos processos psicológicos-
medição
v Transformação de processos psicológicos em numero que tem
de ser analisados através de processos estatísticos

“Conjunto de teorias e métodos de medida que enriquecem a


psicologia”- Dickes et al. 1994
“Campo de estudo que se foca na teoria e nas técnicas associadas
primeiramente com a medida de construtor, bem com o
desenvolvimento, a interpretação e a avaliação de testes e medidas”-
hubley & zumbo, 2013

Teorias sobre os processos psicológicos- Visto que são diferentes e


assim dá para desenvolver medidas coerentes com essas teorias.
Teoria da medida- Processo de representar algo por números.
Construto- Construção mental de algo. Os construtos devem ser bem
medidos.

Construto psicológico O conceito em si


• Definição
Concepltual
• Definição
Operacional

Medição da definição

Há uma verdade matemática e uma verdade psicológica. A atribuição


do número é matemática, a interpretação do número é psicológica.

Medida de aspetos psicológicos- comum a todos os domínios da


psicóloga aplicada.
Nem toda a avaliação psicológica é psicométrica- A avaliação
psicológica pode ser qualitativa (entrevistas, etc.)- A avaliação
psicológica é muito mais que testes

A medida psicológica procura a objetividade e standartização na


descrição das pessoas e na compreensão das diferenças individuais
para reduzir a subjetividade.
Testes online de personalidade não são validados e não têm base
científica.

Medidas psicológicas
Ø Medidas
§ Respostas a itens corretas/incorretas- Testes
§ Não uso das respostas corretas/ incorretas-
Questionários
Ø Não medidas
§ Entrevistas, observações, etc.
§ Outros questionários
Abordagem cientifica
Pensamento empírico
Os instrumentos psicométricos são constituídos de modos a garantir
que a respetiva medida é rigorosa e replicável.

Teoria da medida
Fundamentos e implicações da utilização do símbolo matemático
(numero) para representar a realidade.
Relação/ correspondência entre um atributo e a sua medida.
Significado dos estados estatísticos.

Teoria dos testes


Fundamentos e técnicas da medida psicológica. Propriedades e
qualidade de instrumentos de avaliação psicológica (construção,
estudo e utilização). Psicopatologia e ciências do comportamento.

Origem e fundamentos da medição em psicologia


A psicometria surgiu no campo das aptidões humanas.
§ Psicofisica- psicologia experimental- descobrir as leis que
governam as relações entre o mundo físico e psicológico
§ Weber e Fechner (Séc. XIX)
§ Coadunam-se mas com o estudo quantitativo- o
comportamento pode ser contabilizado em termos de acertos ou
erros
§ Aspetos psicológicos- visão, tempo de reação a determinados
estímulos, medidas antropométricas
Galton
Motivado pela busca da eugenia- perfeição da espécie
Avaliação das aptidões humanas através da medida sensorial- a
capacidade intelectual é função de acuidade sensorial.
Objetivo de Galton- Medir o maior número de pessoas no seu
laboratório
Criou os primeiros testes de aptidão mental, foi o primeiro a usar
questionários, salientou a importância de ter grandes amostras para
poder fazer análises estatísticas.
Impacto na orientação mais prática da psicometria bem como na
orientação mais teórica

Cattel
Inaugura a terminologia “teste mental”
Todos os elementos necessários ao surgimento dos primeiros testes
psicológicos verdadeiramente modernos e bem sucedidos
Testes laboratoriais e ferramentas gerad pelos primeiros psicólogos
na Alemanha
Instrumentos e técnicas estatísticas de Galton
Descobertas da psicologia, psiquiatria e neurologia

Binet
Estudo das diferenças individuais em detrimento das leis gerais- a
avaliação não pode ser feita de forma atomista pois ela própria
holistica
Psicologia individual
ü Crítica as abordagens anteriores: os aspetos complexos do
comportamento só podem ser observados em amostras de
situações próximas da vida quotidiana
ü Indicado pelo estado francês para uma comissão encarregada de
criar um método para avaliar crianças com necessidades
educativas especiais devido a um atraso mental.
ü Procurou identificar o que distingue as crianças normais das
crianças com atraso mental e formas de medir essas diferenças
ü Escala de Binet simon (1905)- primeira escala de inteligência
ü 30 tarefas com dificuldade crescente que avaliam o julgamento,
raciocínio e compreensão.
ü Instruções especificas de aplicação e interpretação
ü Amostra standartizada para comparação: 50 crianças com e sem
atraso mental
1ªRevisão em 1908
Conceito de idade mental nas crianças- diferença entre idade
cronológica e a idade atribuída a um determinado nível de
desempenho- IMC =IC era normal, IMC>IC era avançado, IMC<IC era
atrasado.
Terman e Merril
Adaptaram a escala de Binet-Simon para os EUA- teste de inteligência
de stanford- Binet (1916)
Stern- novo índice de medida QI=IM/IC x 100 – usado durante muitos
anos
Os testes popularizaram na primeira guerra mundial
Conceito de amostra estandartizada: grupo de pessoas que possui as
mesmas características dos indivíduos avaliados pelo teste.
Possui indivíduos com características similares às dos que vão ver o
teste.
Numa amostra geral da população, esta deve refletir os segmento da
população na mesma proporção.

Wescler- Avaliação da inteligência em adultos


Crítica as provas anteriores: prova para cultos cridas por extensão das
provas para crianças. Escalas etárias – Arbitrárias
Recurso a provas de desempenho (não verbais)

Thurstone
Análise fatorial múltipla
Fundou o laboratório psicométrico em Chicago
Fundou a ocidente psiometrica americana e a revista psychometrika

Anastasi
Primeira a enfatizar que diferentes culturas tem conceitos alternativa
do que é uma “pessoa inteligente” e que os testes tradicionais medem
apenas competências valorizadas no meio académico e profissional.
Guru dos testes

Medição da personalidade
Medir aspetos não intelectuais do comportamento (relações sociais,
interesses, atitudes, etc.)
Provas de desempenho típico vs desempenho máximo

Questionários/ Inventários
Woodworth- folha de dados pessoais: protótipo dos questionários de
personalidade/ inventários de auto-descrição

Teste de personalidade
Avaliam as características estáveis ou traços que estariam na bae o
comportamento
Possuem escalas de escolhas múltiplas ou v/f
Podem ser aplicados a grupos de pessoas
Simplificam a recolha de informação clínica
Testes projetivos
Provas constituídas por material não estruturas e cuja estruturação
reflete as formas singulares/idiossincráticas de reposta- o indivíduo
projetará nessas tarefas as suas formas características de resposta
(associação livre).
1921- Rorschach- 10 manchas de tinta- métodos padronizados para
obter e interpretar reações ás pranchas- As respostas do sujeito
refletem o modo simular de perceber o mundo e se relacionar com ele.
Testes pictóricos, verbais e não verbais
Mais subtis que os questionários, interpretações qualitativas
Validade controversa

Os novos testes de personalidade


Testes construídos com base em procedimentos estatísticos- analise
fatorial
A partir dos anos 80 surgem os testes específicos de áreas da
psicologia: saúde, forense, clínica, neuropsicologia, organizacional.

A Teoria da medida
Tudo o que tem consistência pode ser medido, temo é de conseguir
arranjar forma para tal.

Conceções de medida
Medir = conferir números aos atributos de pessoas, objetos ou eventos
de acordo com alguma regra (Stevens, 1946).
Passar de uma abordagem qualitativa (palavra) para uma quantitativa
(número).
• Número matemático:
o Conceito unívoco (tem apenas uma interpretação), sem a
mínima variabilidade de interpretação.
o Conceito pontual, onde um número apresenta nenhuma
interseção com o próximo.
• Vantagens da medida:
o Quantificação – os números podem ser manipulados;
podem adquirir significado.
o Objetividade – minimiza a subjetividade; permite o teste de
teorias.
o Utilização de análises estatísticas para fazer afirmações
precisas acerca dos padrões de atributos e as suas relações
e observação de efeitos subtis.
o Melhor comunicação – medidas padronizadas facilitam
uma linguagem e um entendimento comum.
“Ao analisarmos, categorizarmos e ao quantificarmos
sistematicamente os fenómenos observáveis, trazemo-los para a
arena científica.” (Urbina, 2006)
• De um modo geral, o progresso da ciência é acompanhado da
invenção de instrumentos de medida e avanços nos seus
procedimentos e técnicas.
• O campo da testagem psicológica também serve o seu avanço
com a invenção de ferramentas bem sucedidas.

“Os instrumentos e técnicas de medida propiciam a ponte mais útil


entre os mundos do dia a dia do leigo e dos especialistas em ciência.”
(Klein, 1974)
Teorias da medida – Procuram explicar como e em que circunstancias é
possível utilizar os números para representar a informação relativa às
grandezas dos atributos.
• Conceção representacional da medida
o Medir é representar com números (objeto da matemática)
as propriedades dos fenómenos naturais (objeto de
ciências)
o Existe uma realidade empírica que pretendemos observar e
traduzir em números: os números existem numa realidade
simbólica não empírica, puramente conceptual.
o Os números representam atributos latentes.
• As medições nunca são dos objetos, mas das suas propriedades
ou características.
• A natureza da medida implica alguns problemas básicos (Pasquali,
2003):

Representação/Isomorfismo – É justificável designar ou expressar


objetos ou fenómenos naturais através dos números?
• Sim, se se preservarem as propriedades estruturais dos números,
assim como as características próprias dos atributos dos
fenómenos empíricos
• Propriedades dos Números: identidade (cada número é igual a si
mesmo; quando se utiliza o número para representar um
fenómeno tem que se utilizar o seu respetivo número), ordenação
(possibilidade de estabelecer uma ordem entre os números;
aplica-se quando faz sentido fazer ordenação no fenómeno e
quando fizer sentido temos que respeitar a ordenação original) e
aditividade (é possibilidade de se fazer contas com os números;
nem todos os fenómenos se prestam a fazer contas)
A medição só faz sentido no pressuposto do isomorfismo – equivalência
da forma entre as propriedades dos números e os atributos das coisas.
As regras de atribuição dos números – e, portanto, as operações que se
vão poder realizar com esses números – devem respeitar as
características dos fenómenos aos quais vão ser aplicados.
Unicidade da Representação – Será que o número é a única ou a melhor
representação das propriedades dos objetos naturais para que estes
sejam conhecidos pelo Homem?
• Os defensores da medida em ciência dizem que sim, mas
reconhecem que a qualidade ou a precisão da medida por ser
diferente consoante as características dos objetos: peso vs. QI
Erro – A observação dos fenómenos empíricos é sempre sujeita a erros
devido:
• Aos meios da observação (sentidos e instrumentos)
• A diferenças individuais no observador
• A erros aleatórios (sem causas identificáveis)
O número que descreve um fenómeno empírico deverá sempre vir
acompanhado de algum indicador de erro provável, o qual será
analisado no âmbito de teorias estatísticas para determinar se o valor
encontrado e que descreve o atributo empírico está dentro dos limites
de aceitabilidade da medida.
Na medida de fenómenos naturais, um número não é unívoco – torna-
se um intervalo – ou seja, tem variabilidade (i.e., variância) = erro. à
conceito de número matemático vs. estatístico (ponto vs. intervalo).

Níveis de medida ou escalas


Especificam diferentes formas como os números podem ser usados,
bem como os tipos de operações estatísticas que são logicamente
viáveis.
Escala nominal
• Relação de equivalência. Os números servem apenas para
agrupar as respostas em categorias – classificar
• A atribuição dos números é arbitrária. Só a identidade deve ser
preservada.
• Não é possível fazer operações aritméticas.
• Ex.: género/sexo; tipologias psicológicas.
• Estatística – frequências/proporções; moda; coeficientes de
contingência.

Escala ordinal
• Relação de equivalência e relação de ordem
• A magnitude relativa tem importância – os números não são
arbitrários
• A distância entre intervalos sucessivos não é necessariamente da
mesma dimensão
• Não é possível fazer operações aritméticas
• Ex.: classes sociais; níveis sociais; percentis
• Estatística – (para além das anteriores) mediana; coeficiente de
correlação (Spearman)

Escala métrica
• Média contínua
• Acrescenta o significado de distância. Identidade + ordem +
igualdade das unidades (intervalar) + atividade (razão)
• Intervalar: não tem zero absoluto – não sabemos o nível absoluto
do que está a ser medido.
• De razão: tem zero absoluto – a interpretação absoluta é possível.
Raro em fenómenos psicológicos.
• Ex.: intervalar – temperatura; pontuação total de uma escala de
inteligência / de razão – rendimento, tempo de reação.
• Estatística – (para além das anteriores) média, desvio-padrão,
coeficiente de correlação (Pearson)

è Conforme se avança nos níveis tem-se medidas mais fortes.


è A medida realmente acontece quando se salvam, pelo menos, os
axiomas de ordem dos números.
è A maioria dos resultados dos instrumentos psicológicos são
expressos em pontuações, que são números com sentidos
específicos. Se as limitações não forem compreendidas, poderão ser
feitas inferências equivocadas.

As escalas de Medida na prática da Psicometria:


• A medida mais interpretável dos fenómenos psicológicos é
ordinal ou nominal.
• Na utilização individual dos métodos psicométricos, a
quantificação serve para garantir que a interpretação dos casos
é feita com base em indicadores fiáveis e padronizados.
• A quantidade pode ter interesse absoluto em investigação, para
estabelecer relações.
o Para compreender os testes psicológicos é preciso lidar
com números e estatística

Teoria da Medida
Como podemos generalizar as medidas para as dimensões psicológicas
representadas/latentes?
Os Modelos de Medida
Modelo Clássico ou do Resultado Verdadeiro (Teoria Clássica dos
Testes – TCT)
• Toda a medida comporta algum erro – o resultado de um teste é
sempre uma estimativa imperfeita da dimensão latente.
• Há um resultado verdadeiro para cada indivíduo, mas esse é
irremediavelmente desconhecido.
• O erro também é desconhecido, mas pode ser estimado.
• Medir = estimar o resultado verdadeiro, com uma
margem de erro conhecida (estudo da precisão).
T=V+E
V=T-E
E=T-V
Modelo da Generalizabilidade (Cronbach)
• A realidade a um item é uma amostra das
observações empíricas possíveis do fenómeno.
• Medir = estimar o resultado no universo de observações de que o
teste constitui uma amostra, com margem de erro conhecida
(estudo da precisão).
Modelo do Traço Latente (Teoria de Resposta ao Item – TRI)
• Estabelecem uma ligação entre o nível do traço latente e a
probabilidade de sucesso num item.
• Os itens são diferentes entre si no nível de dificuldade e as
pessoas são diferentes entre si no nível de competências.
• Medir = estimar o nível de competência no construto latente a
partir da determinação das probabilidades de resposta certa a
cada item, em função do nível da dificuldade dos itens e do nível
de competência da pessoa.
o O nível de dificuldade é previamente conhecido ou
determinado nessa medida
o O nível de competência é determinado em função do
padrão de respostas certas ou erradas a itens de diferente
nível de dificuldade
Traço Latente à Desemprego.
è Probabilidade (P) que um indivíduo dar
a resposta indicativa do traço (“certa”)
a cada item (i)
è Para além da dificuldade, outros
parâmetros podem ser considerados
– discriminação e resposta ao acaso.
è Não se aplica só a itens dicotómicos,
ou seja, ao acertar ou errar.
è Aplica-se a testes de comportamentos típicos ou de
personalidade.
è Método mais preciso para selecionar itens, mas… modelos
matemáticos complexos, grandes amostras, mais para medidas
intelectuais.

Modelos de Análise Fatorial


• Existem dimensões latentes que são responsáveis pelas
correlações entre variáveis empíricas – modelos estatísticos de
análise e extração.
• Procuram reduzir ao mínimo o número de dimensões latentes
necessárias para descrever e explicar as diferenças individuais.
• Medir = estimar o nível do desempenho no fator latente a partir
da resolução de tarefas que saturam nesse fator.

A TEORIA DOS TESTES


Testes Psicológicos
O teste psicológico é um procedimento sistemático para a obtenção de
amostras de comportamento relevantes para o funcionamento
cognitivo ou afetivo e para a avaliação destas amostras de acordo com
determinados padrões (de resultados que é obtido por pessoas que são
parecidas com as características que estão a ser avaliadas no teste)
(Urbina, 2006).
• Tipos de Comportamentos – Aberto (observável), encoberto
(indireto – emoções), comportamentos presentes,
comportamentos passados, comportamentos futuros
Padronizados
Uniformidade na administração, avaliação e interpretação
• Tornar tão uniforme quanto possíveis todas as variáveis que
estão sob o controlo do avaliador, para que todos se submetem
ao teste o façam da mesma forma
Uso de padrões para avaliação de resultados
• Normas derivadas de um grupo de indivíduos – amostra
normativa ou de padronização – no processo de desenvolvimento
do teste
Capacidade – Avaliam competências como precisão e rapidez ou ambos:
• Realização – Avaliam as aprendizagens prévias
• Aptidões – Avalia o potencial para adquirir uma competência
especifica
• Inteligência – Avalia o potencial para resolver problemas,
adaptação à mudança e impacto da experiência
Personalidade– Avaliam traços, temperamento características
disposicionais
• Estruturados – Objetivos: autorrelato
• Projetivos – Estímulos ambíguos
Desempenho máximo (os testes de capacidade são testes de
desempenho máximo) vs. desempenho típico (quando queremos saber
como é o desempenho normal da pessoa).
Autorrelato (a pessoa responde), desempenho, observação,
heterorrelato (a pessoa não responde diretamente ao instrumento, é o
avaliador que vai responder ao instrumento com a informação que o
indivíduo dá). Individuais, grupo.
Teste/Prova vs. Questionário/Inventário
• Instrumentos de avaliação
• Técnicas de medida psicológica
Avaliados Segundo…
• A qualidade da construção/qualidade técnicas (precisão…).
• Aplicabilidade a um objetivo específico, modo de utilização e
competências do avaliador.
• Padrões de testagem – Standards for Educational and
Psychological Testing – critérios para avaliar testes, práticas de
testagem e efeitos do uso de testes.
Tipos de Itens
Os itens são os “tijolos” dos instrumentos (Penfield, 2013)
• = unidades que compõem os testes e meios pelos quais as
amostras de comportamento dos avaliados são recolhidas;
estímulos elicitadores da manifestação dos conteúdos/processos
psicológicos
Os itens não podem ser constituídos por construtos, mas sim por
comportamentos (Pasquali, 1997).
• = questões ou tarefas individuais que compõem os instrumentos
de medida e aos quais as pessoas examinadas são solicitadas a
dar resposta
As respostas podem ser cotadas ou avaliadas (classificadas, avaliadas
numa escala; contadas/frequência).
Os itens podem diferir em termos de conteúdo e formato, bem como do
meio pelo qual são administrados, a maneira como são avaliados e o
tipo de processamento que requerem por parte dos avaliados (Urbina,
2006).
Formatos de Resposta
Dicotómicos
• Apresenta apenas duas alternativas de resposta –
Verdadeiro/falso; Sim/não
• Simplicidade; fácil de aplicar; fácil de cotar
• Menor precisão
Mais do que Duas Alternativas
• Escolha múltipla (devem possuir 3 a 4 distratores para cada item);
os estudos mostram que 3 opções de resposta funcionam com
bons indicadores de validade e precisão
• Verbal: Sim; Dúvida: Não
Estes dois formatos são muito usados em testes de capacidade, mas
também em inventários de personalidade.
Escalas
• = sucesso de graus definidos ao longo de uma dimensão, de tal
modo que esses graus respeitem pelo menos as propriedades do
nível ordinal, mas, de preferência, também as do nível intervalar
• Escala de Likert (1932):
o Contínuo de pontos classificados de acordo com descritores
bipolares (e.g. discordo fortemente; discordo; neutro;
concordo; concordo plenamente) ou unipolares (e.g. muito
insuficiente, insuficiente, suficiente, bom, muito bom)
o Discussões em torno do nº de pontos ideal, vantagens e
desvantagens dos nº pares e ímpares, classificação do ponto
médio
o Estas escalas podem ser alvo de análise fatorial
o Muito usadas no estudo das atitudes e da personalidade
• Outras escalas ordinais (há um “degrau” entre as respostas)
o Escalas referenciadas
o Diferencial semântico (escalas em que dizem o significado
dos extremos)
o Imagens faciais (com emojis)
• Escalas contínuas
o Gráfica ancorada (Acordo _______________ Desacordo)
Escala em psicometria
• Sistema de resposta a um item
• Conjunto de itens dentro de um teste que diz respeito a uma única
variável (dentro de um instrumento há itens que se agrupam que
medem subconstrutos específicos)
• Conjunto de subtestes que partilham alguma característica
• Instrumento composto de várias partes
• Instrumento composto por itens que avaliam uma única
característica

Bateria de Testes/de Avaliação


• Grupo de vários testes ou subtestes que se aplicam de uma só vez
à mesma pessoa
• Podem ser editados como uma bateria ou escolhidos por um
psicólogo para um caso

AS ETAPAS DA MEDIDA
Um processo de medição implica (Aguinis, Henle & Ostroff, 2001):
• Que o seu objetivo esteja determinado (adquirir a informação,
descrever, prever).
• Que o atributo a ser medido esteja identificado e definido. Se tal
não acontece, podem aplicar-se diversas regras (diversos
números). O objetivo da medida deve orientar esta definição.
• Com base na definição, deve ser determinado um conjunto de
regras para quantificar o atributo.
• Finalmente, as regras são aplicadas, de modo a traduzir o atributo
em termos numéricos.

A medida psicológica supõe:


• Definição conceptual (construto e dimensões latentes)
• Plano de experiência (observação) – temos de selecionar uma
amostra dos vários comportamentos (concordar/discordar de
uma frase; acertar nos testes; responder às questões)
representativos do que seriam os comportamentos possíveis,
visto que não podemos ter acesso à população toda ao mesmo
tempo.
o Amostragem de situações (operacionalização) – a situação
existe, nos temos que escolher os itens para o instrumento
que avalie a dada situação.
o Amostragem de indivíduos
• Transformação das observações em dados (codificação numérica
– regras – isomorfismo) – resultados brutos (primeira
transformação dos resultados das observações dos indivíduos,
em números).
• Transformação dos dados em medidas (interpretação –
generalização – inferência para o construto/dimensão latente)
o Modelos de medida
o Normas (localizar um resultado individual)

A generalização implica ter confiança na medida – propriedades


psicométricas.
2ªFrequência

Construção de instrumentos psicométricos


Construir um teste psicológico – Geralmente ocorre quando se deteta
ausência de instrumento (adequado) para avaliar um certo objetivo.
A. Especificar os constructos a avaliar
B. Tipo de população onde vai ser usado
C. Objetivos dos itens (no teste)
D. Meios concretos de recolha e avaliação das amostras
comportamentais

1. Gerar um conjunto de itens, determinar o método de


administração e avaliação
2. Submeter os itens a revisores para análise qualitativa e fazer os
respetivos ajustamentos
3. Testar os itens resultantes em amostras representativas da
população a que se destina
4. Avaliar os resultados (quantitativa e qualitativamente)
5. Adicionar, alterar, eliminar itens se necessário
6. Aplicações adicionais e validação cruzada, até obter um conjunto
satisfatório de itens.
7. Fixar o tamanho do teste e a sequência dos itens, bem como os
procedimentos de aplicação de avaliação
8. Aplicar novamente o teste, na sua versão final, a uma amostra
representativa – obter dados normativos, critérios de
desempenho, índices psicométricos
9. Publicar (com manual)

è Dimensão teórica (1-2)


• Explicitação da teoria em que o construto se baseia.
• Objeto psicológico que está na base da construção da prova
psicológica.
• Dimensionalidade dos atributos (estrutura interna,
semântica): unidimensional ou multifatorial.
• Operacionalização do construto em itens (ex. definição do
traço extroversão e explicitação dos tipos e categorias de
comportamentos que constituem uma representação do
traço).
o Fontes: Literatura; entrevistas; categorias
comportamentais
• Critica: Muitos testes elaborados carecem desta base na sua
elaboração; promove para alguns investigadores a elaboração
de testes com mera validade facial (olhar para um instrumento
e conseguir perceber através dos seus itens perceber onde o
teste quer chegar, o que avalia).

è Dimensão empírica (experimental) (3-7)


• Definição das etapas e técnicas de aplicação do instrumento
piloto.
• Recolha de dados válida para a elaboração do estudo das
qualidades psicométricas do instrumento.
• Depende de uma aprendizagem e aplicação dos
conhecimentos de pesquisa.
• Definição da amostra:
o Considerar a população de referência: Faixa etária; nível
socioeconómico; escolaridade (a amostra de testagem
deverá ter origem na população meta)
o Definir a dimensão da amostra: 100 pessoas por fator
medido; 5/10 pessoas por cada item (quando não
sabemos o número de dimensões/fatores)

è Dimensão analítica (estatística) (4-8)


• Análise dos itens (e.g., dificuldade, discriminação).
• Consistência interna (precisão do instrumento).
• Análise fatorial (dimensionalidade – validade).
• Grupos critério (estabelecimento de normas).
Quanto custa um teste?

Apesar de dispendiosos, o preço dos testes provém do trabalho que


exige e permite a manutenção dos sistemas informáticos que permitem
chegar à versão final.

Martin (1988) – define 4 abordagens


• Teórico-racional
• Análise fatorial
• Critério empírico
• Projetivas

ESTUDO METROLÓGICO
Análise de Itens
A qualidade de um teste depende a qualidade dos itens que o
compõem.

Análise de Itens – Técnicas usadas para avaliar as características dos


itens do teste e a sua qualidade durante o seu processo de
desenvolvimento. Podem ser qualitativas ou quantitativas.

Análise Qualitativa dos Itens:


• Adequação do conteúdo e do formato aos objetivos e à
população a que se destina
• Clareza
• Correção gramatical
• Respeito por regras básicas de redação

Análise Quantitativa dos Itens:


• Análises estatísticas

Regras para a Boa Redação dos Itens (Pasquali, 1997)


1. Critério Comportamental – Os itens devem expressar um
comportamento não uma abstração/construto
2. Critério da Desejabilidade – Os itens devem cobrir
comportamentos desejáveis ou característicos e permitir que o
avaliado expresse a sua preferência
3. Critério da Simplicidade – Um item deve expressar uma única
ideia
4. Critério da Clareza – O item deve ser inteligível até para um
grupo mais baixo da população alvo; usar para isso frases curtas,
expressões simples e inequívocas
5. Critério da Relevância – A frase deve ser consistente com o
atributo definido e com outras afirmações que avaliam o mesmo
atributo
6. Critério da Precisão – O item deve possuir uma posição definida
no contínuo do atributo e ser distinto dos demais itens
7. Critério da Variedade – Linguagem variada e itens na positiva e
na negativa
8. Critério da Modalidade – Uso de expressões modais não
extremadas (como excelente, miserável)
9. Critério da Tipicidade – Forma frases com expressões adequadas
com o atributo (ex. zanga, irritação, nervos; quando se usa
adjetivos convém que haja coerência, ex. a beleza é pesada)

10.Critério da Credibilidade – Adequação do item ao contexto da


avaliação

11.Critério da Amplitude – Conjunto de itens deve cobrir o contínuo


do atributo

12.Critério do Equilíbrio – Os itens devem cobrir todos os setores do


continuo (ex. dificuldade baixa, mediana ou elevada (aptidões); fracos,
médios, extremos (atitudes))

Análise Quantitativa dos Itens


• TCT e TRI
o TCT: alpha se item eliminado (Alpha if item deleted);
correlações item-total corrigidas; correlações inter-item;
índice de dificuldade do item; índice de discriminação do
item
o TRI: dificuldade (parâmetro b), discriminação (parâmetro d),
guessing (parâmetro c), fidelidade condicional e erro
padrão de medida condicional
• Análise fatorial
o Analisar o contributo/relevância para as dimensões

As técnicas da TCT (e análise fatorial) continuam a ser mais usadas,


mas implicam uma análise do item sempre tendo como referência o
desempenho/a pontuação total.

PRECISÃO
• Fidelidade, fidedignidade, (com)fiabilidade
• Reliability, accuracy
• Medir sem erros

Se há algo com qual podemos sempre contar, para além da morte e dos
impostos, é com a variabilidade dos resultados dos processos de
medição.
Em todas as ciências este fenómeno é conhecido e o uso de medições
repetidas constitui a regra para o enfrentar (Moreira, 2004).

Precisão:
• Consistência dos resultados obtidos pelo mesmo individuo
quando é testado novamente com o mesmo teste ou equivalente.
• Grau em que os dados da observação suportam a inferência de
independência dos resultados observados relativamente aos
erros de medição.
• As medidas de precisão permitem estimar que proporção da
variância total dos resultados do teste é a variância do erro.
• Indica até que ponto as diferenças individuais nos resultados do
teste podem ser atribuídas a diferenças reais nas características
consideradas ou a erros casuais.
o Variância = média do quadrado da diferença entre cada
resultado e a média geral de resultados.

O estudo da precisão baseou-se e continua a basear-se na Teoria


Classica do Erro (Spearman, 1904) – O resultado de qualquer medição é
determinado por 2 fatores: o resultado verdadeiro + erro de medição. O
erro pode ser estimado com um razoável grau de precisão.

Pressupostos:
• Os erros são totalmente aleatórios
• Tem distribuição simétrica
o Se for feito um nº suficiente de medições, os erros tenderão
a anular-se (a média tenderá para zero – a média dos
resultados observados tenderá a aproximar-se do
resultado verdadeiro).
o A correlação entre o resultado verdadeiro e o erro,
calculada ao longo de uma série de medições para a mesma
pessoa ou para pessoas diferentes, será zero. A correlação
entre duas medidas paralelas da mesma variável
corresponde à proporção entre a variância dos resultados
verdadeiros e dos resultados totais – coeficiente de
precisão.
Teoria moderna da precisão (Cronbach, anos 50)
• Instrumento de medida = amostra representativa de um universo
de condutas que permitem a medição de uma dimensão
psicológica.
• O que está em causa não é a concordância das medidas, mas a sua
generalizabilidade.
• Estudo da precisão = estudo da variância dos resultados
(Variância verdadeira ≠ variância do erro).

Método teste-reteste
• O mesmo teste passado em momentos diferentes – amostragem
por tempos diferentes-
• Correlação entre as pontuações obtidas em duas ocasiões
diferentes.
• Problemas – efeito de memória, aprendizagem; mudanças no
resultado verdadeiro.
• Recomendações: evitar intervalos inferiores a 1 semana e
superiores a 4/5 semanas (pelo menos em variáveis mais
dinâmicas).
• Para aplicar o método do teste-reteste, a amostra deve ter pelo
menos 100 pessoas, o ideal seria 200.

Método das formas paralelas (ou alternativas)


• Aplicar duas formas semelhantes do mesmo instrumento (mesmo
nº de itens, de formatos e a mesma variável).
• Correlação entre formas do teste que possui diferentes itens.
• Problemas: necessidade de construir 2 formas alternativas
(duplica o processo de construção e seleção dos itens); podem ser
usados itens tão semelhantes que pareçam os mesmos para o
respondente.
• Recuso útil sempre que o autor se sinta confiante para gerar um
nº suficiente de itens.

Método da bipartição
• Considerar a primeira metade como uma das formas e a segunda
metade como a segunda forma do teste.
• Correlação entre as duas partes do teste
• Problemas: as duas metades podem não ser formas paralelas;
redução do nº de itens em casa parte; é impossível que os itens de
um questionário sejam inteiramente homogéneos
(multidimensionais); diferentes formas de distribuir os itens pelas
duas metades da escala podem dar origem a resultados bastante
diferentes em termos de coeficientes de precisão.
• Alfa de Cronbach – valor médio de todos os coeficientes de
precisão possíveis do tipo “split-half” (bipartição).

Correlações item-total e entre itens (análise de itens).

Método da consistência interna


• O alfa de Cronbach
è Maior que 0,9 – excelente
è Entre 0,8 e 0,9 – bom
è Entre 0,7 e 0,8 – razoável
è Entre 0,6 e 0,7 – fraco
è Abaixo de 0,6 – inaceitável

Acordo entre juízos/avaliadores (interrater)


• Em instrumentos de heterrorelato (o investigador preenche a
folha pelo avaliado).
• Coeficientes de correlação intraclasses.

Fatores que podem influenciar a precisão:


• Número e homogeneidade dos itens (+)
• Heterogeneidade da amostra (+)
• Condições externas: clareza/estandardização das
instruções/itens, pressão do tempo, motivação (…) (+/-).

→ a precisão é uma característica do resultado e não da escala.


→ estudar a precisão numa amostra tão próxima quanto possível
àquela em que se pretende vir a usar o instrumento.
Nenhum método deve ser considerado cimo fornecendo “o” coeficiente
de precisão: usar pelo menos um método que avalie as diferenças entre
os resultados de diferentes conjuntos de itens (ex.: alfa) e em diferentes
momentos (ex.: teste-reteste). Se só puder ser usado um método:
reteste com formas paralelas após um intervalo de tempo.
Coeficiente de generalizabilidade: análise de variância (com medidas
repetidas).

VALIDADE
Propriedade que assegura que os resultados medem corretamente o
que devem medir. A validade é mais importante consideração na
avaliação de um teste. Refere-se à adequação, ao significado e à
utilidade de inferências específicas feitas a partir dos resultados de um
teste. A validação consiste no processo de acumular evidências que
suportam tais inferências (APA, 2014).

Perspetiva Clássica
Validade de Conteúdo, de Critério e de Constructo
Validade de Conteúdo – Grau em que os conteúdos incluídos no teste se
referem de modo adequado ao que se pretende medir. Podem faltar
conteúdos; podem estar conteúdos a mais; à põe em causa esta
validade; há determinados testes que esta validade é importante, como
os testes de conhecimento. Pode-se testar de forma qualitativa e
quantitativa.
Validade de Critério – Exame da associação estatística entre os
resultados do instrumento e uma medida independente/alternativa da
variável que se pretende medir. Este critério que utilizamos para testar
o instrumento deveria ser perfeito; não há medidas perfeitas; a grande
dificuldade neste é termos um bom critério para avaliar o instrumento.
Validade do Constructo (Cronbach & Meehl, 1955) – Testar as diferentes
relações, previstas pela teoria em que a definição do constructo se
baseia, entre a medida em análise e diversas outras medidas, da mesma
ou de outras variáveis.
Mal entendidos…
• Um autor de um novo instrumento deve considerar os 3 tipos de
validade e considerar o que melhor se adequa às características
do seu instrumento
→Diluir as fronteiras entre os conceitos
→Reforçar noção unitária de validade
→Reenquadrar os princípios e procedimentos da validade de conteúdo
e de critério no âmbito da validade de construto – os objetivos são os
mesmos!
• As medidas psicométricas terão mais utilidade se construírem
bons índices de dimensões latentes/não observáveis
• A validade de uma medida será tanto maior quanto maior o grau
em que os seus resultados sejam determinados por uma
dimensão/construto latente, nas suas diferentes facetas, e
quanto maior for o grau em que esses resultados sejam afetados
por fatores que não façam parte desse construto
Validade de Construto
As evidências da validade de construto devem demonstrar que os
resultados do teste se relacionam mais com variáveis teoricamente
relevantes do que com variáveis não incluídas no modelo teórico (APA,
2014).
Estudo da validade à Método científico.

Validade
Várias validades?
• Não! – há várias formas de acumular evidências que suportem as
inferências realizadas a partir dos resultados de um teste. Mas a
validade é um conceito unitário, que se refere sempre ao grau em
que as evidências suportam tais inferências (APA, 2014)
Conceito unificado, mas multifacetado.

Métodos Usados para Avaliar a Validade


Exame dos Conteúdos
• Exame sistemático do conteúdo do teste a fim de verificar se
abrange uma amostra representativa do campo de
comportamento/construto a ser medido.
o Revisão de literatura, escolha de itens apropriados –
análise de itens
o Autor e especialistas
Exame dos Processos de Resposta
• Tipicamente em fase de pré-teste/estudo piloto.
• Entrevista durante e/ou imediatamente após a aplicação dos
testes.
• “Pensar em voz alta”.
• Observação do comportamento
o Tempo de latência de resposta
o Análise dos erros (medida mais quantitativa; faz mais
sentido para testes de capacidade)
o Análise dos movimentos dos olhos
Exame da Estrutura Interna
• Exame das relações entre diferentes partes do instrumento.
• A conceptualização do construto deve ser suficientemente clara
para permitir prever as correlações entre diferentes partes dos
instrumentos (ex. unidimensionais ou multidimensionais; que
itens representam que dimensões; que relação existe entre
dimensões).
• Análise fatorial (exploratória ou confirmatória).
Exame da Relação com Outras Variáveis
Exame da associação estatística entre os resultados do instrumento e
uma medida independente/alternativa da variável que se pretende
medir.
• Validade concorrente, quando se trata de indicadores de
comportamentos presentes
• Validade preditiva (em que medida o meu instrumento é um bom
preditor no futuro), quando se analisam os resultados em relação
a comportamentos futuros
Critérios (exemplos):
• Desempenho, aproveitamento, comportamento
• Diagnóstico
• Outros testes já avaliados
Correlação (procura-se a convergência ou a divergência); comparação
de grupos (interessa só a discriminação).
Convergência e/ou discriminação.

Exame das Consequências da Testagem


• Consequências sociais pretendidas e não pretendidas.
• Maximizar os benefícios e minimizar os danos.
• Ética e deontologia.

Você também pode gostar