Aula - 6 - Escalas de Resposta PDF

AVALIAÇÃO PSICOLÓGICA
AULA 6
12/11/2020
Isabel Santos 1
TESTES/ESCALAS/PROVAS PSICOLÓGICAS
ESCALAS DE RESPOSTA
Isabel Santos 2
PRINCIPAIS TIPOS DE ESCALAS DE
RESPOSTA
– Likert
– Visuo-analógicas
– Thurstone
– Guttman
– De diferencial semântico
– De escolha forçada
– Dicotómicas
Obs.: não confundir com escala de medida de uma variável do sistema de

níveis de Stevens
Isabel Santos 3
ESCALAS DE TIPO LIKERT
• Composta por afirmações, em que os respondentes devem
indicar concordância/discordância, ou frequência, numa escala
de intensidade crescente ou decrescente
• Cada item é medido numa escala de tipo ordinal (sistema de
Stevens)
• Incluem vários itens, que em conjunto (i.e., através do seu
somatório ou média) produzem uma determinada “nota” ou
pontuação (obs.: esta pontuação total é frequentemente tratada como uma variável
intervalar [sistema Stevens])
• Frequentemente usam-se escalas de 5 pontos, como Likert

defendeu (cotadas de 0 a 4 ou de 1 a 5, p.ex), mas poderão conceber-se
escalas de 3, 4, 6, 7, 8, 9… pontos/alternativas de resposta
Isabel Santos 4
Escalas de tipo Likert
Exs.:
1) Concordo totalmente; 2) concordo; 3) indeciso; 4) discordo; 5) discordo

totalmente
1) Nunca 2) Poucas vezes 3) Muitas vezes 4) Sempre ou quase

sempre
1) nada importante; 2) pouco importante; 3) suficientemente importante;

4) importante; 5) muito importante
Isabel Santos 5
Retirado de Cunha, L. M. A. (2007). Modelos Rasch e Escalas de Likert e Thurstone na medição de atitudes. Dissertação de Mestrado. Univ.Lisboa, Lisboa.
Isabel Santos 6
Isabel Santos 7
ESCALA VISUO-ANALÓGICA (EVA ou VAS)
• Idêntica à de Likert, mas pode assumir-se que cada item é uma variável
contínua (e não discreta, como nas escalas de Likert).
• Deve assinalar-se o grau de concordância/discordância com uma

afirmação, ou onde se posiciona, numa escala normalmente colocada na
horizontal = linha, entre dois extremos (e.g., «concordo bastante» e
«discordo bastante»)
Ex. 0 _________________________________________________________ 10
RESULTADO: medição em cm (p.ex., com uma régua), do ponto assinalado

pelo sujeito; ou escala de 0 a 100 (mm).
Uma escala pode ser composta por vários itens assim medidos e a pontuação
total pode obter-se por soma dos itens.
Isabel Santos 8
ESCALA VISUO-ANALÓGICA
exemplos
Isabel Santos 9
ESCALA VISUO-ANALÓGICA
Isabel Santos Avaliação Psicológica 2018/2019 10

ESCALA DE TIPO THURSTONE
• São constituídas por um conjunto de frases (itens) em
relação às quais o sujeito avaliado deve manifestar o seu
acordo ou desacordo.
• Mede-se a atitude do sujeito fazendo a média ponderada

dos itens em que houve acordo.
• Os factores de ponderação são calculados na fase de

construção da escala.
Isabel Santos 11
Isabel Santos 12
No ex. acima, os factores de ponderação encontram-se na coluna da
esquerda (mas não são impressos na escala a administrar)

MÉTODOS DE CONSTRUÇÃO:
1. Método das Comparações Emparelhadas:

Premissa: se existir um nº grande de afirmações sobre atitudes e se se
fizerem comparações emparelhadas dessas afirmações numa dicotomia
favorável-desfavorável, será possível ordenar as informações num
contínuo favorável-desfavorável com base na indicação de qual a
afirmação de cada par mais favorável do que a outra.
Isabel Santos 14
2. Método dos Intervalos Sucessivos ou Julgamento
Categorial
1) Solicita-se a um nº elevado de juízes (50 a 300) que classifiquem de

modo independente cada uma das muitas afirmações em 11 categorias
que variam do “mais favorável” ao “menos favorável”, passando por um
ponto neutro
2) Com base na classificação dos juízes encontra-se uma média para cada
item (factor de ponderação). Os itens com DP muito elevado e que não
tenham distribuição normal são eliminados visto haver grande
discordância entre juízes. Os itens retidos apresentam os diferentes
coeficientes de ponderação encontrados, com base nos quais se calcula
a nota do indivíduo.
Isabel Santos 15
Isabel Santos 16
ESCALA DE TIPO GUTTMAN OU
CUMULATIVA
→ Mede a intensidade da atitude com base num conjunto de itens.
• É composta por um conjunto de frases (itens) organizadas de forma

hierárquica e em relação aos quais se pede ao sujeito avaliado que
manifeste a sua concordância ou não.
• Usa a técnica de escalograma: ordenação dos itens de forma a

garantir um crescendum na atitude, desde a mais desfavorável até á mais
favorável (técnica de classificação hierárquica):
• O pressuposto é de que, se o sujeito concordar com um item,
também tenderá a concordar com os itens de nível inferior
• Objetivo do escalograma é construir uma escala ordinal cumulativa
• A cotação de um sujeito em relação a um determinado grupo

corresponde ao nível mais baixo da escala que ele tiver assinalado.
Isabel Santos 17
Isabel Santos 18
ESCALA DE DIFERENCIAL SEMÂNTICO
• Questionários com listas de adjetivos bipolares como bom-mau;
agradável-desagradável; simpático-antipático.
• Cada par bipolar está ligado por uma escala com 7 pontos (ou mais):
os dois extremos correspondem aos adjetivos contrastantes
• Pode ser usada com qualquer termo/conceito: amor; doença…e
alargada a outros que geram atitudes: política; televisão; desportos…
• Sujeitos têm de colocar um círculo no ponto da escala que indica a
sua atitude.
• Escala intuitiva até para crianças; para quem tem dificuldade a
responder a escalas de Thurstone ou Likert…
• A atitude ou pontuação da pessoa é calculada somando as
pontuações em todos os itens ou calculando a média da pontuação
total ou das dimensões.
Isabel Santos 19
Isabel Santos 20
ESCALAS DE ESCOLHA FORÇADA
• Pede-se ao respondente que escolha entre duas afirmações que sejam
igualmente “apelativas”.
• Uma afirmação representa um dos atributos, enquanto a outra afirmação

representa o oposto ou não representa o atributo em estudo. Se houver mais de
duas alternativas a terceira escolha consiste num item de elevada desejabilidade
social.
EX.: Escala de locus de controlo interno vs. Externo, de Rotter
Escolha a opção que melhor a/o descreve:
□ Muitas das “coisas” más que acontecem às pessoas, acontecem por

azar
□ Os azares que acontecem às pessoas resultam dos seus próprios erros.
Isabel Santos 21
ESCALAS DICOTÓMICAS
Escalas de escolha forçada em que o respondente tem de escolher entre duas
respostas antagónicas, do tipo sim-não; certo-errado; falso-verdadeiro.
Isabel Santos 22
ESCALAS DICOTÓMICAS
Isabel Santos 23
CONSTRUÇÃO DE UM INSTRUMENTO DE
AVALIAÇÃO PSICOLÓGICA
Isabel Santos 24
Retirado de Almeida e Freire (2007)
Isabel Santos 25
Recolha dos itens
• A construção de um teste inicia-se pela recolha de um conjunto de itens
• Esta recolha pressupõe uma definição prévia dos seguintes parâmetros:

1. Âmbito e objetivos do instrumento a construir (ex: diagnosticar traços
internos, avaliar dimensões do comportamento objetivo, ser um teste de
screening, definir intervenções, predizer comportamentos, etc.)
2. População a que se destina o teste (ex., grupo etário, etc.)
3. Característica ou dimensão a avaliar (construto: uni ou multidimensional?)
4. Aspetos comportamentais a integrar que explicitam o construto
• Para a definição destes parâmetros deve-se:

– Fazer uma boa revisão de literatura na área
– Identificar instrumentos anteriores que avaliem o mesmo construto ou
construtos semelhantes
– Identificar especialistas na área
– Definir se o instrumento terá uma ou mais dimensões
Isabel Santos 26
Formulação dos Itens
• Através da operacionalização do construto em termos de comportamento
manifesto, vamos formular um 1º conjunto de itens para a prova
• Este conjunto deve ter aproximadamente o dobro dos itens desejados
para a versão final do instrumento
– Uns vinte itens poderão ser necessários para cumprir um equilíbrio entre
validade e consistência. Tendo este nº em mente, o processo de construção
deve iniciar-se com o dobro dos itens.
• Neste momento deve decidir-se:
1. Nº de itens a incluir na versão final
2. Grau de dificuldade dos itens ou grau de intensidade dos comportamentos
em função dos sujeitos e dos objetivos a que se destina
3. A forma (muito/pouco estruturados, etc.) e o conteúdo dos itens
4. Forma de aplicação do teste (ex., aplicação individual/colectiva, auto-
administrados, etc.)
Isabel Santos 27
Formulação dos Itens
• É importante ter as instruções, os exemplos e os exercícios de treino (se
houver) definidos antes de avançar para qualquer aplicação, para
assegurar a validade dos resultados
• Como recolher a amostra de itens inicial?
– Consulta da população-alvo (ex., “o que é para si uma situação ansiosa?”)
– Consulta de especialistas na área
– Leitura de bibliografia sobre o construto e sobre instrumentos com algumas

semelhanças
• Importante assegurar que os itens representam comportamentalmente o

construto a avaliar, seguindo alguns princípios…
Isabel Santos 28
Princípios relevantes na formulação dos itens
1. Formulação objetiva, ao nível do:
a) conteúdo (evitar impressões e focar-se nas capacidades,
comportamentos e atitudes objectivas do sujeito)
b) escala de resposta (uma escala de Likert de 9 pontos pode fazer
com que seja difícil precisar os vários pontos intermédios)
2. Formulação simples (correspondência um item - uma tarefa/

uma ideia)
– Itens complexos dificultam a interpretação da resposta
3. Itens relevantes para o domínio e objetivo da avaliação

– Imprescindível informação prévia: literatura, especialistas, etc.
Isabel Santos 29
Princípios relevantes na formulação dos itens
4. Itens formulados para a amplitude do domínio que se quer
avaliar
– Captar o grau de variedade específico do domínio: ex., itens fáceis,
médios e difíceis em testes de aptidão; diferentes graus do sintoma
num teste de ansiedade; etc.
5. Itens credíveis (face validity ou validade aparente), para
evitar atitudes desfavoráveis ao teste
– O item não deve parecer ridículo, despropositado ou infantil, no caso
de testes para adultos, por ex.
6. Itens claros e inteligíveis, mesmo para extratos sócio-
demográficos mais baixos da população a que se destinam
– Frases curtas, expressões simples, etc.
– Itens que se reportam a comportamentos e não a abstrações
Isabel Santos 30
Análise e seleção dos itens
• Podem-se conduzir vários estudos exploratórios qualitativos
(1º) e quantitativos (2º), que levem a reformulações,
acrescento ou exclusão de itens, ou parâmetros
comportamentais a examinar.
ANÁLISES QUALITATIVAS
• Análises realizadas para avaliar o conteúdo e a forma dos itens
(clareza, compreensibilidade e adequação aos objetivos da
prova)
• POSSIBILIDADES MAIS COMUNS:
– Consulta de especialistas com experiência prática no domínio
– “Reflexão Falada” (“Thinking Aloud”)
– “Focus Group”
Isabel Santos 31
 Consulta de especialistas
EXEMPLO DE CRITÉRIOS PARA UMA APRECIAÇÃO QUALITATIVA DE ITENS (Angleitner,
John & Lohr, 1986, p. 85, cit. por Alferes, 1997, p. 126)
A) COMPREENSIBILIDADE
1. Compreende imediatamente o item após a primeira leitura
2. Depois da primeira leitura, tem de voltar a ler algumas partes do item
3. Depois da primeira leitura, pelo menos uma parte do item é completamente incompreensível
4. Para compreender o item, tem de aplicar conscientemente regras gramaticais ou lê-lo pelo menos 3
vezes
B) AMBIGUIDADE
1. O item não comporta qualquer ambiguidade
2. Só sendo muito exigente se poderá descobrir uma ligeira ambiguidade, a qual, contudo, não tem
consequências práticas
3. Se lermos cuidadosamente o item e refletirmos sobre as possíveis respostas, torna-se evidente que o
item não pode ser respondido sem ambiguidade
4. O item é obviamente ambíguo
C) ABSTRAÇÃO
1. o item é concreto em todos os seus aspetos
2. Os aspetos mais importantes do item estão redigidos em termos concretos; a impressão global é
concreta;
3. Os aspetos importantes do item estão redigidos em termos abstratos: a impressão global é abstrata;
4. O item não tem qualquer referência concreta
Método da Reflexão Falada
• Método da reflexão falada ou “thinking aloud”

– Aplicação oral e/ou escrita da prova junto de sujeitos representativos
dos futuros destinatários, que devem fornecer feedback relativo a cada
item.
– De um modo simples, encoraja-se o participante a verbalizar tudo o

que lhe ocorra enquanto responde a cada item (incluindo se considera
algum item confuso ou incompreensível)
• Registo das verbalizações do sujeito (importante: não discutir com o
sujeito, mas apenas ouvir, registar e eventualmente pedir para clarificar o
que pensa).
Isabel Santos 33
Método da Reflexão Falada - Vantagens
1. Identificação de ambiguidades associadas ao formato e conteúdos dos

itens
2. Identificação dos processos e estratégias usadas pelos sujeitos nas suas

respostas, e em que medida estão de acordo ou contrariam o sentido da
avaliação em causa
3. Apreciação da eficácia e qualidade das várias alternativas de resposta

formuladas
4. Identificação de alguns aspetos peculiares ou dificuldades acrescidas

apresentadas por algum item
5. Conhecimento das atitudes gerais dos sujeitos face aos itens propostos
ao longo da prova
Isabel Santos 34
Método da Reflexão Falada - Vantagens
6. Deteção de itens mal construídos
7. Primeiro nível de conhecimento das dificuldades sentidas pelos sujeitos

na resposta à prova
8. Primeira perceção da adequação/suficiência das instruções, e uma

estimativa do tempo requerido para a realização da prova
Isabel Santos 35
Método da Reflexão Falada - Desvantagens
1. A nossa capacidade de registo do feedback dos sujeitos é

limitada e equipamento de registo pode provocar
enviesamentos nas verbalizações
2. Técnica depende de boas capacidades de interiorização,
verbalização e expressão por parte dos sujeitos (difícil com
alguns grupos etários ou com baixa escolaridade)
A consulta de especialistas também pode ser efectuada na fase

de análise qualitativa dos itens. Pode também discutir-se
com eles a informação recolhida durante a reflexão falada.
Isabel Santos 36
Focus Group
• Objetivo:
– Avaliar formas alternativas de construir itens ou mesmo,
numa fase inicial, para auxiliar na construção dos itens
• Pode usar-se em simultâneo com a Reflexão Falada,

ou na sequência dela.
Isabel Santos 37
Análise e seleção dos itens
• Após refinamentos/alterações introduzidos na escala/prova
decorrentes das análises qualitativas, vai-se administrar a
versão provisória resultante a uma amostra extraída da
população a quem se destinará a escala final
• De seguida, proceder a ANÁLISES QUANTITATIVAS dos itens.
Isabel Santos 38
ANÁLISES QUANTITATIVAS DOS ITENS:
1) Índice de dificuldade ou dispersão das respostas numa amostra de sujeitos
avaliados – da maior pertinência em testes de desempenho
[análises relacionadas com a “validade interna” do item e com a consistência interna da prova/escala:]
2) Capacidade discriminativa do item:

A. Em que medida o item consegue diferenciar entre grupos que obtêm as
pontuações mais baixas versus elevadas na prova/escala?
B. Correlação item-total corrigido: o resultado num item está relacionado com
o resultado final na prova (depois de retirada a influência desse item no
resultado final)?
3) Contribuição do item para consistência interna da escala/prova: determinação
do coeficiente alfa de Cronbach da prova/escala retirando o item
4) Correlações inter-item: o resultado num item está relacionado com as respostas
aos demais itens?
5) Correlação com critérios externos, e.g., outra prova, notas escolares, diagnósticos
clínicos, etc… (validade “externa” do item)
Isabel Santos 39
1. Índice de Dificuldade (ID)
Muito pertinente em testes de desempenho referenciados a normas
(testes que pretendem efetuar uma comparação inter-individual de
resultados)
Proporção de sujeitos que consegue realizar corretamente o item.
ID = C/N em que: C = nº dos que acertaram; N = amostra global
Nota: a amostra global integra:

os que acertaram/C,
os que falharam/E e
os que omitiram/O (omissão por dificuldade).
 Leque de valores possíveis na escala do índice de dificuldade varia

entre ID=.00 (nenhum sujeito resolveu corretamente) e ID=1.0 (todos
responderam corretamente). (QUANTO ˃ o valor, mais fácil é o item)
Isabel Santos 40
 Através da proporção de acertos e erros a um item, obtemos a sua
variância
 A máxima variância obtém-se com itens de ID = 0.50 → muito

importante nas provas que vão seriar sujeitos/pretendem máxima
comparabilidade interindividual dos resultados.
 Podemos comparar melhor sujeitos entre si recorrendo a itens com

índice médio de dificuldade.
 Uma máxima diferenciação em testes centrados em normas obtém-
se:
 com itens de dificuldade perto de .50 e
 itens que se aproximam dos limites de dificuldades (.00 e 1.0).
Isabel Santos 41
Assim, um teste de desempenho deverá incluir:
 Maioria de itens de dificuldade intermédia: proporcionam

maior variância dos resultados (trata-se de uma probabilidade
estatística).
Então, fará sentido reter mais itens nesse grupo, mas não todos… Com efeito,
num teste também fazem falta:
 Alguns itens particularmente fáceis - servem de incentivo,

aprendizagem e/ou diferenciação para sujeitos com dificuldades
particulares de desempenho nas características avaliadas.
 Alguns itens particularmente difíceis e capazes de diferenciação

dos sujeitos com elevado desempenho nessas características.
Isabel Santos 42
Determinados autores sugerem a proporção de itens de acordo com índices de
dificuldade. Por ex., Garrett (1962) recomenda
50% de itens com IDs entre .25 e .75
25% com ID ˂ .25
25% com ID ˃ .75
(Nota: existem outras propostas para classificar os índices)
Assim:
 ID ˂ 0.25-0.30 → dificuldade elevada
 ID de 0.25-0.30 até 0.75-0.80 → dificuldade média
 ID ˃ 0.75-0.80 → dificuldade baixa

Cuidados a ter!
 Ter em conta as omissões de resposta...
 Quando são omissões intercalares podem traduzir erro ou
dificuldade.
 Mas na parte final da prova podem significar falta de tempo.
(Neste caso, não entrar com as omissões no cálculo do índice).
 Ideal: aplicar testes sem limite de tempo quando se pretende

realizar estas análises.
 O cálculo deste índice em testes de velocidade e de acuidade
percetiva não faz sentido (a dificuldade real depende do pouco tempo
disponível para a realização da tarefa e não dos processos mentais
envolvidos).
Isabel Santos 44
Cuidados a ter!
 No cálculo deste índice há que atender, ainda, às alternativas de
resposta e ao acaso nas respostas.
 É necessário realizar o cálculo, item a item, da percentagem
de respostas atribuídas a cada uma das alternativas, sendo
que:
 Nos itens de dificuldade intermédia nenhuma alternativa
deve apresentar maior número de escolhas que a
alternativa correta.
 Nos itens muito fáceis ou muito difíceis a distribuição dos
sujeitos será em conformidade com o grau de dificuldade;
Isabel Santos 45
Cuidados a ter!
 Respostas ao acaso afetam objetividade da avaliação:
 Não podemos dizer que a nota final é apenas fruto da capacidade
resolutiva do sujeito ou “nota verdadeira”.
 Este problema agrava-se com um número reduzido de alternativas de
resposta a cada item.
=> O formato de item mais problemático é o dicotómico

(V/F ou A/B): 50% de possibilidade de acertar sem conhecimento
efetivo da resposta correta.
Isabel Santos 46
Cuidados a ter!
 Gronlund (1976) calculou nível médio de dificuldade dos itens
dado o nº de alternativas
Valores apontam para as vantagens de itens com mais alternativas de

resposta
 Várias fórmulas de correção do índice de dificuldade dos itens

aparecem nos manuais para atenuar os acertos devidos ao
acaso (e.g. fórmula de Garrett, 1962)
Isabel Santos 47
2. Poder Discriminativo
• Grau em que o item diferencia no mesmo sentido que o teste
global (melhores desempenhos no teste correspondem a melhores
desempenhos no item e vice-versa)
• Em testes de desempenho implica que: sujeitos melhores e

piores realizadores deverão responder de forma diferente
num item como elevado poder discriminativo, acertando e
falhando percentualmente mais, respetivamente.
• Avaliamos as qualidades métricas de um só item, por
referência ao próprio teste ou ao conjunto dos outros itens
(também se fala em validade interna do item)
Isabel Santos 48
• Poder Discriminativo é dado por um coeficiente de
correlação (varia entre -1.0 e +1.0)
– Valor de 0.0 = poder discriminativo nulo (i.e., igual nº de sujeitos
fortes e fracos acertam ou falham o item)
– Coeficiente negativo: sujeitos com pior desempenho no teste global
realizam melhor o item.
– Coeficiente positivo: sujeitos com melhor desempenho no teste global
realizam melhor o item.
• Normalmente não se inclui o item em causa no cálculo de

médias, d.p., totais, etc. para a escala completa, para não
inflacionar os valores obtidos.
Isabel Santos 49
• O poder discriminativo pode ser calculado através de um
coeficiente de correlação bisserial quando a resposta ao
item é de tipo dicotómica (certo ou errado) (fórmula Glass & Stanley,
1970)
• Obtém-se coeficiente item×total corrigido (corrected

item total correlation): um dos outputs disponíveis (SPSS)
quando, com escalas com itens ordinais (Likert), se calcula o
alpha de Cronbach (mais usado)
Isabel Santos 50
Procedimento “grupos constrastantes”:
• Formar um grupo superior (25% que teve melhor resultado
no teste) e um grupo inferior (25% que teve pior resultado no
teste);
• A capacidade discriminativa do item corresponde à diferença
entre os que responderam corretamente ao item nos 25%
superiores e os que respoderam corretamente nos 25%
inferiores.
• Quanto maior o valor, maior a capacidade discriminativa do item.
Isabel Santos 51
Relação entre índice de dificuldade e poder discriminativo
• Itens muito fáceis ou muito difíceis têm menor capacidade de
discriminação dos sujeitos entre si
• Itens de dificuldade média permitem, à partida, níveis mais
elevados de discriminação
• Em termos de poder discriminativo, interessa manter itens
com coeficiente positivo e o mais elevado possível
• Em termos de dificuldade, interessa que a maioria dos itens
tenha um nível intermédio, e que existam alguns muito fáceis
e alguns muito difíceis
• Entre dois itens igualmente úteis em termos de dificuldade,
manteríamos o que tivesse maior poder discriminativo
Valores mais elevados de poder discriminativo associam-se a coeficientes de
fidelidade mais elevados (vão no sentido da maior homogeneidade da prova).
Isabel Santos 52
3. Coeficiente alfa de Cronbach excluindo o item
 O Coeficiente alfa de Cronbach é um dos indicadores de
consistência interna de uma escala. Quanto mais elevado o seu
valor (máximo 1), tanto maior a consistência interna, o que
contribui para a precisão/fiabilidade de uma escala.
 A determinação de coeficientes alfa de Cronbach excluindo um

item de cada vez indica em que medida cada item individual está a
contribuir (ou não) para a consistência interna da escala ou prova:
 Se retirar um item fizer descer (em relação ao valor para a escala
completa) o valor do coeficiente, isso significa que o item contribui
positivamente para a consistência interna do instrumento => deve ser
mantido no conjunto de itens que compõem o instrumento.
 Se retirar um item fizer subir o valor, está a prejudicar a escala e
deverá ser ponderada a sua exclusão definitiva.
Isabel Santos 53
4. Correlações inter-item
 O resultado num item está relacionado com as respostas aos
demais itens?
 Através da determinação de uma matriz de inter-correlações
entre os vários itens de uma escala, pode apreciar-se a
magnitude dos coeficientes encontrados.
 As correlações devem ser moderadas (nem muito elevadas,
nem demasiado baixas)
 Deve ponderar-se excluir:
– Itens nada correlacionados com outros → porque talvez não estejam
relacionados com o constructo medido pelos restantes itens,
colocando em causa a homogeneidade da escala;
– Itens que exibam correlações muito elevadas com algum outro item →
porque são provavelmente redundantes
Isabel Santos 54
5. Correlações com critérios externos
E.g., outra prova, notas escolares, diagnósticos clínicos, etc…
(VALIDADE “EXTERNA” do item) ≠ VALIDADE INTERNA (e.g., poder discrim.)
 Relação entre as respostas dos sujeitos a um item e seu
desempenho numa outra situação que não esse teste (variável
critério).
 Múltiplos critérios externos podem ser usados nestas análises,
dependendo da disponibilidade, do construto avaliado e dos
objetivos de construção da prova:
 Em provas de desempenho usam-se notas escolares ou parâmetros de
realização profissional.
 Em escalas de desenvolvimento recorre-se frequentemente à própria
idade ou progressão nas aprendizagens
 Em testes de personalidade o recurso mais habitual tem sido o
diagnóstico psicopatológico ou diferentes medidas de adaptação
psicossocial dos sujeitos.
Isabel Santos 55
5. Correlações com critérios externos
 Também é possível recorrer a provas similares já existentes e
previamente validadas.
 Os procedimentos de cálculo são diversos.
 Tem de se ter em conta a escala de medida inerente ao formato

do item e o tipo de escala em que se apresenta o critério para
correlacionar.
-----------------------------------
Em rigor, o estudo da correlação com critérios externos já remete
para a validade do próprio teste ou prova, mas neste caso a
análise centra-se ao nível de cada item individual enquanto
amostra ou representante do construto medido pela totalidade do
instrumento.
Isabel Santos 56
Validade interna vs. Validade externa
• Validade interna = consistência ou homogeneidade da prova
• Validade externa = ligação à prática, poder preditivo do
comportamento
• Ambos os indicadores devem ser o mais elevados possível,
mas…
• Nem sempre se verifica esta coincidência…
=> Então por qual optar?
• Ter em consideração os objetivos da prova, a que fim se
destina e o que foi inicialmente definido em termos da
operacionalização do construto:
– Unidimensional = ênfase colocado na validade interna
– Multidimensional = ênfase colocado na validade externa
Isabel Santos 57
Organização dos itens na prova
• Após selecionar os itens que devem constituir a versão final

da prova, com base nas análises qualitativas e quantitativas, é
necessário ter alguns cuidados relativamente à organização
dos itens na prova:
– Em testes de desempenho, e sobretudo nos testes de aptidão
cognitiva, os itens devem aparecer organizados hierarquicamente,
segundo o seu grau crescente de dificuldade (cria-se clima de confiança e
sentimentos de auto-eficácia; evita-se perda de tempo; etc.)
– Nas escalas de personalidade, inventários de atitudes, questionários
de auto-conceito, de sintomas, etc., deve ordenar-se os itens de forma
a evitar o agrupamento dos itens de acordo com especificidades do
seu conteúdo (para minimizar rotinas de resposta, etc.)
Isabel Santos 58
Bibliografia específica
Almeida, L., & Freire, T. (2007). Metodologia da investigação
em psicologia e educação (4ª ed.). Braga: Psiquilibrios.
Alferes, V. R. (1997). Investigação científica em psicologia:
Teoria e prática. Coimbra: Almedina.
[o autor disponibiliza on-line ao livro integral em PDF:
http://www.researchgate.net/publication/259306912_Investigao_cientfica_em_psicologia_
Teoria_e_prtica]. Ver pp. 124-126 sobre a construção de escalas de atitudes
Leitura complementar:
• Pais Ribeiro, J.L. (2010). Investigação e avaliação em
psicologia e saúde (2ª ed.). Lisboa: Climepsi Editores
[Pontos sobre “Como se constrói uma escala” e outros do cap. “Construção de
testes”]. Obs.: é possível aceder ao texto integral PDF, on-line (p.e.x.: http://sp-
ps.pt/uploads/publicacoes/114_c.pdf )
Isabel Santos 59

Aula - 6 - Escalas de Resposta PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Aula - 6 - Escalas de Resposta PDF

Enviado por

Direitos autorais:

Formatos disponíveis

AVALIAÇÃO PSICOLÓGICA

Obs.: não confundir com escala de medida de uma variável do sistema de

• Frequentemente usam-se escalas de 5 pontos, como Likert

1) Concordo totalmente; 2) concordo; 3) indeciso; 4) discordo; 5) discordo

1) Nunca 2) Poucas vezes 3) Muitas vezes 4) Sempre ou quase

1) nada importante; 2) pouco importante; 3) suficientemente importante;

• Deve assinalar-se o grau de concordância/discordância com uma

RESULTADO: medição em cm (p.ex., com uma régua), do ponto assinalado

Isabel Santos Avaliação Psicológica 2018/2019 10

• Mede-se a atitude do sujeito fazendo a média ponderada

• Os factores de ponderação são calculados na fase de

Isabel Santos Avaliação Psicológica 2019/2020 13

1. Método das Comparações Emparelhadas:

1) Solicita-se a um nº elevado de juízes (50 a 300) que classifiquem de

• É composta por um conjunto de frases (itens) organizadas de forma

• Usa a técnica de escalograma: ordenação dos itens de forma a

• Objetivo do escalograma é construir uma escala ordinal cumulativa

• A cotação de um sujeito em relação a um determinado grupo

• Uma afirmação representa um dos atributos, enquanto a outra afirmação

EX.: Escala de locus de controlo interno vs. Externo, de Rotter

Escolha a opção que melhor a/o descreve:

□ Muitas das “coisas” más que acontecem às pessoas, acontecem por

• Esta recolha pressupõe uma definição prévia dos seguintes parâmetros:

• Para a definição destes parâmetros deve-se:

• Como recolher a amostra de itens inicial?

– Consulta da população-alvo (ex., “o que é para si uma situação ansiosa?”)

– Consulta de especialistas na área

– Leitura de bibliografia sobre o construto e sobre instrumentos com algumas

• Importante assegurar que os itens representam comportamentalmente o

2. Formulação simples (correspondência um item - uma tarefa/

3. Itens relevantes para o domínio e objetivo da avaliação

• Método da reflexão falada ou “thinking aloud”

– De um modo simples, encoraja-se o participante a verbalizar tudo o

1. Identificação de ambiguidades associadas ao formato e conteúdos dos

2. Identificação dos processos e estratégias usadas pelos sujeitos nas suas

3. Apreciação da eficácia e qualidade das várias alternativas de resposta

4. Identificação de alguns aspetos peculiares ou dificuldades acrescidas

6. Deteção de itens mal construídos

7. Primeiro nível de conhecimento das dificuldades sentidas pelos sujeitos

8. Primeira perceção da adequação/suficiência das instruções, e uma

1. A nossa capacidade de registo do feedback dos sujeitos é

A consulta de especialistas também pode ser efectuada na fase

• Pode usar-se em simultâneo com a Reflexão Falada,

• De seguida, proceder a ANÁLISES QUANTITATIVAS dos itens.

2) Capacidade discriminativa do item:

Proporção de sujeitos que consegue realizar corretamente o item.

ID = C/N em que: C = nº dos que acertaram; N = amostra global

Nota: a amostra global integra:

 Leque de valores possíveis na escala do índice de dificuldade varia

 A máxima variância obtém-se com itens de ID = 0.50 → muito

 Podemos comparar melhor sujeitos entre si recorrendo a itens com

 Maioria de itens de dificuldade intermédia: proporcionam

 Alguns itens particularmente fáceis - servem de incentivo,

 Alguns itens particularmente difíceis e capazes de diferenciação

 ID de 0.25-0.30 até 0.75-0.80 → dificuldade média

 ID ˃ 0.75-0.80 → dificuldade baixa

Isabel Santos Avaliação Psicológica 2017/2018 43

 Ideal: aplicar testes sem limite de tempo quando se pretende

=> O formato de item mais problemático é o dicotómico

Valores apontam para as vantagens de itens com mais alternativas de

 Várias fórmulas de correção do índice de dificuldade dos itens

• Em testes de desempenho implica que: sujeitos melhores e

• Normalmente não se inclui o item em causa no cálculo de