Você está na página 1de 102

Avaliação Psicológica

A Psicometria pode ser definida como o conjunto de técnicas utilizadas para medir, de forma
adequada, válida e rigorosa, um ou vários processos psicológicos. A estratégia psicométrica utiliza-se para
atribuir um valor ou pontuação a um atributo psicológico de um indivíduo, revelado através da administração
de um teste psicológico (procedimentos sistemáticos e estandardizados de observação e registo de amostras
de comportamentos ou funções cognitivas de indivíduos, com o objetivo de descrever ou mensurar
características e processos psicológicos).
A Avaliação Psicológica é um processo de aquisição e integração de informações relevantes,
recorrendo-se a vários métodos, instrumentos, fontes e dimensões da pessoa/grupo, para uma análise
científica de características e níveis psicológicos.
Segundo Pasquali, a origem da psicometria esta nos trabalhos de Spearman, que aplicou à psicologia
os procedimentos de Francis Galton (1883). 1º laboratório de psicologia experimental - Wundt.

2 movimentos que contribuíram para o desenvolvimento da psicometria:


- Movimento psicopedagógico e psiquiátrico (Esquirol 1838), chamou a atenção para a disponibilização
de um tratamento mais humano aos doentes mentais.
- Movimento experimentalista, pretendiam descobrir uniformidades no comportamento dos indivíduos,
mais do que as diferenças individuais (concebidas como desvios/erros).

Galton - acreditava que as operações intelectuais poderiam ser avaliadas através de medidas
sensoriais, uma vez que toda a informação do homem chega pelos sentidos, quanto melhor o estado destes,
melhores seriam as capacidades intelectuais. Desenvolveu: testes antropométricos para medida de
discriminação sensorial; escalas de pontos e questionários; e métodos estatísticos para analisar
qualitativamente os dados recolhidos. James Mckeen Cattell desenvolveu medidas das diferenças
individuais, seguiu as ideias de Galton.
A Análise Fatorial (Thurstone) é uma técnica utilizada para estudar a validade de construto dos
instrumentos de avaliação psicológica.
Segundo Pasquali, a teoria do traço latente refere-se a um conjunto de modelos matemáticos que
relaciona variáveis observáveis e traços hipotéticos não observáveis. Com base nesta teoria, Cattell distingui
inteligência fluída e cristalizada.
Testes Projetivos - baseiam-se na hipótese projetiva, segundo a qual uma pessoa responde a um
estímulo relativamente ambíguo, isto reflete as suas características pessoais. Estes testes incluem material
ambíguo e pouco estruturado perante os quais o indivíduo é convidado a descrever o que é que as imagens
lhe parecem.

Questionários Psicométricos
- Aditividade - só podemos adicionar os pontos de cada item, para obter uma pontuação total, se se
comprovar que aquela medida tem consistência interna.
- Medida intervalar.
- Poder discriminativo - possibilidade da escala discriminar os diferentes sujeitos no construto em causa.
- Definição - instrumento constituído por um conjunto de itens; a resposta do sujeito por ser traduzida
mediante diferentes graus de intensidade, frequência ou acordo.
- Pressupostos - em cada comportamento/situação espera-se que as variações nas respostas aos itens
traduzam as diferenças existentes entre indivíduos. As diferenças de pontuação decorrem do grau/nível
com que cada indivíduo possui o atributo em avaliação a determinado item.
- Escalas de resposta - cabe ao sujeito a tarefa de ordenar um atributo de acordo com um nível
crescente/decrescente de intensidade, frequência ou acordo. Escala de Likert - os respondestes
especificam o seu nível de concordância com cada item.
1
- Vantagens - económicos, rápidos, fáceis de administrar e cotar, compreendem uma grande diversidade
e amplitude de comportamentos/atitudes/sintomas, pouco suscetíveis a enviesamentos entrevistador-
sujeito, anónimos e permitem comparar indivíduos quantitativamente com as estimativas de
comportamentos dos seus pares da mesma idade e género.
- Desvantagens - menos precisos e método indireto, uma vez que envolvem descrições retrospectivas
relativas ao comportamento.

Estudo Psicométrico

Análises Qualitativas dos Itens - referem-se à usabilidade de um instrumento (ex: apreciação do conteúdo e
formato dos itens e instruções). Detetar itens mal construídos, analisar se as instruções são suficientes,
conhecer as dificuldades sentidas pelos respondentes, apreciar se as várias alternativas de resposta são
adequadas e estimar o tempo requerido para a realização da prova. Método da “reflexão falada” consiste na
aplicação individual da prova e no registo de todas as verbalizações dos indivíduos para auscultação dos seus
comentários acerca da compreensibilidade das instruções e dos itens. Os participantes devem comunicar
impressões em relação a cada item, a forma como o abordam e realizam e as facilidades ou dificuldades que
encontram.

Análises Quantitativas dos Itens


- Dispersão das respostas aos itens numa amostra de participantes avaliados.
- Capacidade Discriminativa - em que medida o resultado num item está relacionado com as respostas aos
demais ou está correlacionado com o resultado final da prova, grau em que o se item diferencia no
mesmo sentido do teste global e é dado por um coeficiente de correlação.
- Validade Externa - grau de relação que existe entre as respostas dos sujeitos a um item e o seu
desempenho numa outra situação que não o próprio teste (variável critério).

Propriedades Psicométricas
- Aferição - identificação das normas de interpretação de uma prova; resultados relativos à discriminação,
fidelidade e validade dos resultados da prova na amostra. Os estudos de aferição devem incluir
informação acerca da interpretação dos resultados, ou seja, como é que, depois de quantificados os
atributos, podemos apreciar em que grau as respostas se afastam/aproximam de um determinado valor
médio.
- Estandardização - refere-se aos cuidados e à preparação necessária que o psicólogo deve ter antes e
durante a administração de um instrumento.
- Distribuição/Normalidade dos Resultados - graus em que os resultados obtidos se distribuem,
diferenciando os sujeitos entre si nos níveis da variável avaliada.
- Fidelidade - informação sobre o grau de confiança ou exatidão que podemos ter na informação obtida;
inclui a consistência interna ou homogeneidade dos itens e a estabilidade temporal ou constância dos
resultados.
- Consistência interna - grau de uniformidade ou coerência existente entre as respostas dos sujeitos a cada
item que compõe a prova.
- Estabilidade Temporal - indicador da constância dos resultados de um teste ao longo do tempo e
examina-se através da correlação entre o teste e o reteste.
- Acordo entre Avaliadores - pretende estimar em que medida as respostas ou registos obtidos são
determinados pelas características do indivíduo observado, e não pelas características dos avaliadores
independentes.

2
Validade (em que medida os resultados no teste estão a medir aquilo que pretendem medir ou o
conhecimentos que possuímos daquilo que o teste está a medir)
- Validade de Conteúdo - avalia-se através de metodologias qualitativas, através da reflexão em grupos
focais de peritos nos construtos a avaliar; procuram apreciar em que medida o conteúdo da prova cobre
os aspetos mais relevantes.
- Validade Facial - baseia-se na perceção dos destinatários; pretende-se analisar se os indivíduos
percebem o teste como estando a avaliar aquilo que pretendem medir, ou seja, se o teste parece medir
aquilo que é suposto. O examinado é um perito capaz de analisar objetivamente o seu comportamento
ou pensamento típico/habitual; está na melhor posição de saber como se sente, o que pensa e o que
faz; e comunica os seus sentimentos, pensamentos, preferências e comportamentos.
- Validade de Critério - analisada através do grau de relacionamento que é possível obter entre os
resultados no instrumento a validar e os resultados em critérios externos. Os coeficientes obtidos vão
depender do tipo de critérios externos usados e com o intervalo que medeiam entre a avaliação no
critério. 2 tipos: validade concorrente (quando o instrumento a validar e o critério são dados no mesmo
momento) e validade preditiva (quando a informação relativa ao critério externo é obtida
posteriormente à administração do instrumento que se pretende validar).
- Validade de Construto - grau em que conhecemos aquilo que a prova está a medir; não se testa
diretamente, é através da análise fatorial (a carga fatorial de um item no fator traduz em que medida
esse representa um dado traço latente e é a percentagem de covariância esse item e o respetivo fator -
análise fatorial exploratória e confirmatória).
- Validade convergente-discriminante - implica a verificação de dois princípios: Validade Convergente (o
teste deve correlacionar-se significativamente com outras variáveis com as quais o construto medido
pelo teste deveria encontrar-se relacionado); Validade Discriminante (o teste não deve correlacionar-se
com outras variáveis com as quais o construto deveria diferir).

Sensibilidade, Especificidade e Valor Preditivo - a sensibilidade consiste no número de doentes com um


teste positivo em função do número total de doentes e a especificidade significa o número de indivíduos não
doentes com teste negativo em função do número total de não doentes. O valor preditivo representa a
probabilidade de se verificar a presença da doença depois do diagnóstico ser conhecido, o valor preditivo
positivo (VPP) é a proporção de pessoas identificadas positivamente pelo teste e que realmente têm a doença
e o VPN constitui s proporção de pessoas identificadas negativamente pelo teste e que realmente não têm a
doença. O aumento da especificidade ou da sensibilidade acarreta sempre a diminuição da outra - podemos
selecionar um ponto de corte (divide a distribuição dos resultados entre normalidade e doença, de modo a
evitar o máximo de falsos positivos e a detetar a maior proporção de verdadeiros positivos) que optimize
uma das características operativas (sensibilidade ou especificidade).

Rastreio (reduz o risco, mas não oferece garantias) vs. Diagnóstico - os instrumentos de rastreio não
permitem fazer o diagnóstico, apenas providenciam um alerta. O rastreio deve ser entendido como um
processo de redução do risco, pesando os benefícios a que acedem aqueles que são corretamente
identificados, em comparação com aqueles que são sujeitos aos eventuais malefícios de um resultado
positivo, quando não têm a doença ou dos que têm um rastreio negativo, quando têm a doença.
Um teste muito sensível é útil quando existe uma penalização importante para o doente por omissão
do diagnóstico; em programas de rastreio; e no início da avaliação de um doente, quando estão a ser
consideradas muitas possibilidades de diagnóstico de modo a pôr de parte alguns diagnósticos e reduzir as
possibilidades de diagnóstico.
Um teste muito específico é útil quando se pretende confirmar um diagnóstico que é sugerido por
testes menos específicos e quando a existência de um resultado falso positivo tem importantes implicações
físicas, emocionais ou financeiras para o doente.

Metodologia das Curvas ROC - são uma ferramenta estatística que facilita a escolha do melhor ponto de
corte para a determinação de caso e, portanto, para a validação de instrumentos de rastreio. A vantagem
3
consiste no facto de permitir a validação do teste de rastreio para diferentes pontos de corte, e não apenas
a avaliação singular da sensibilidade e especificidade de um instrumento; é necessária uma vasta amostra.
Gráfico - sensibilidade em função da taxa de falsos positivos para todas as pontuações possíveis do
instrumento, sendo a união de todos que forma a curva ROC. A acuidade do teste (capacidade para
discriminar doentes e não doentes) é a área abaixo da curva. As curvas que discriminam bem aproximam-se
do canto superior esquerdo do gráfico - o progressivo aumento da sensibilidade acarreta pouca ou nenhuma
perda da especificidade. O índice Y de Youden é uma medida de acuidade -> Y (0-1) = S + E - 1.

Pontos-Chave: a psicometria é a parte da psicologia focada nas técnicas e estratégias utilizadas para medir,
de forma adequada, válida e rigorosa, os processos e atributos psicológicos; os testes psicológicos são úteis
em vários contextos de saúde, tais como diagnóstico e prognóstico, rastreio e investigação; e os testes
psicológicos devem ter fidelidade e validade comprovadas.

Enviesamentos na avaliação psicológica

- Os psicólogos ocupam uma parte do seu tempo em tarefas ou atividades de avaliação psicológica. Mas o
que é a avaliação psicológica?
- Neste contexto, a mecânica da avaliação psicológica pode ser caracterizada do seguinte modo: os
julgamentos clínicos e as tomadas de decisões são sempre arriscados e formulados, frequente e
inevitavelmente, em condições de incerteza, uma vez que não se sabe tudo aquilo que há para saber
acerca do cliente. Talvez por isso haja tendência para obter mais dados do que aqueles que são
necessários.
- Em termos de avaliação psicológica, não é apenas importante conhecer o funcionamento do cliente nem
as características psicométricas dos métodos e instrumentos de avaliação utilizados na aquisição de
dados. Torna-se igualmente necessário um melhor conhecimento acerca do modo como o processamento
da informação, mecânica e economia cognitivas (maneira de reduzir e simplificar os fluxos de informação)
operam, isto é, do modo como o funcionamento psicológico do clínico afeta a avaliação psicológica.

Tipos de Enviesamentos:
- “Enviesamentos confirmatórios” -> tendência geral para codificar, processar e recuperar a informação
que é consistente com um esquema. Ex: efeito das primeiras impressões e Efeito Halo (+) e efeito Horn (-
).
- “Correlações ilusórias” -> correlação vs causalidade. Encontram-se as situações em que os psicólogos
fazem interpretações ou atribuições de correlação ou mesmo de causalidade entre duas classes de
acontecimentos que não estão correlacionados, ou estão correlacionados numa extensão muito reduzida,
ou estão correlacionados na direção oposta à comunicada ou a sua correlação é acidental.
- “Heurística da representatividade” -> quando nos referimos a apreciações relativas à probabilidade de
determinada pessoa pertencer a uma determinada classe (ex: categoria nosológica) ou de determinado
acontecimento poder ser prognosticado a partir de determinada sequência de antecedentes.
- “Heurística da disponibilidade” -> acidente de carro vs acidente de avião. Quando as inferências
formuladas - acerca da frequência ou probabilidade de um acontecimento ou resultado - são
excessivamente influenciadas por outros fatores como a recordação seletiva de acontecimentos
anteriores. Esta recordação deve-se a características como a proximidade sensorial, espacial ou temporal,
a saliência percetiva, a importância ou intensidade do envolvimento emocional com o caso ou
semelhanças na aparência física, etc. Estas características estão assim mais disponíveis e, por isso,
exercem uma influência disproporcionada no processo de julgamento.
- “Erro atribucional fundamental” -> o erro de atribuição fundamental ou as vias de correspondência
fazem-nos enfatizar demais as características pessoais e ignorar os fatores situacionais ao julgar o
comportamento dos outros.

4
- “Heurística do caráter único” -> pressuposto errado que reside na ideia de que a probabilidade lógica não
se aplica a casos individuais. Embora cada cliente seja único em muitas características, há sempre alguma
informação estatística que deve igualmente ser considerada, como dados relativos a grupos ou amostras
mais amplas e representativas da população a qual o sujeito pertence.
- “Enviesamento da previsão a posteriori” -> descreve a tendência para assumir depois do conhecimento
de um acontecimento ou dos seus resultados, que estes são inevitáveis e poderiam ter sido facilmente
prognosticados; ex: antes do exame - sinto que devia estudar esta parte, pode sair no exame; depois do
exame - eu sabia que aquela pergunta vinha no exame, devia ter estudado.
- “Efeito da regressão estatística para a média” -> «tendência» para desempenhos ou acontecimentos
extremos serem seguidos por desempenhos ou acontecimentos menos extremos.

Introdução à Avaliação Psicológica

A psicologia é uma profissão relativamente nova, mas desde os primeiros dias, a avaliação de pessoas
com o objetivo de tomar algum tipo de decisão sobre elas foi umas das suas funções. O fio condutor que une
todos os domínios da Psicologia é a MEDIÇÃO. Através desta tentamos compreender tudo acerca do
indivíduo, quaisquer que sejam as circunstâncias ou contexto (clínico, forense, educacional, aconselhamento,
saúde, ocupacional, investigação, etc.)
A Psicologia preocupa-se em descobrir não apenas que características é que uma pessoa possui, mas
também de que forma é que essas características estão organizadas para tornar esse indivíduo diferente dos
outros. Procura-se utilizar critérios consensuais para definir construtos psicológicos, e, sempre que possível,
medir esses construtos através do uso de escalas e de técnicas estatísticas. São métodos de avaliação mais
objetivos e menos influenciáveis pelas características da pessoa que faz a avaliação.
A avaliação psicológica refere-se à integração de informações de fontes múltiplas para descrever,
prever, explicar, diagnosticar e tomar decisões. A psicometria é o instrumento que mede as características
das pessoas, tendo sido submetido à padronização por meio de escalas que permitem comparar os
valores/resultados. Em qualquer forma de avaliação, as tarefas ou perguntas são chamadas de itens. Quando
um instrumento tem itens certos/errados, é geralmente referido como um teste; enquanto outros são
melhor referidos como questionários ou inventários. É importante que aqueles que fazem uso desses
instrumentos o façam de forma ética e sigam códigos de prática.

O que é a MEDIÇÃO? - “Medição é a atribuição de nºs às propriedades ou atributos das pessoas, objetos ou
eventos, através da utilização de um conjunto de regras” (Stevens, 1968) - PSICOMETRIA. Desta definição
podemos derivar várias características da medição:
- Foca-se nos atributos das pessoas e não nas próprias pessoas;
- Utiliza um conjunto de regras para quantificar os atributos. Essas regras devem ser estandardizadas,
claras, compreensíveis e fáceis de aplicar;
- Consiste no escalonamento e na classificação. O escalonamento lida com a atribuição de nºs de forma a
quantificar, i.e., para determinar quanto de um determinado atributo está presente. A classificação diz
respeito a definir se as pessoas ou os eventos caem na mesma ou diferentes categorias.

- “A medição é um processo empírico, usando um instrumento, efetuando um mapeamento rigoroso e


objetivo de um observável numa categoria num modelo do observável que distingue significativamente a
manifestação de outras manifestações possíveis e distinguíveis”. A medição descreve a relação
observador-contexto-observado, e que o seu resultado expressa a compreensão do que observador
observa sobre o observado - suporte de um modelo que é prévio à avaliação, e a técnica de avaliação é
escolhida e utilizada no âmbito desse modelo, ambas são enquadradas por uma teoria psicológica.
- A ideia básica em Stevens é que a medição envolve a modelação numérica de aspetos do mundo real
(Realismo). Os aspetos modelados diferem em complexidade dando origem a diferentes tipos de escalas.
Assim, modelar uma classificação dá origem a uma escala nominal; modelar uma ordem dá origem a uma
5
escala ordinal; modelar diferenças no nível de um atributo a uma escala intervalar; modelar níveis de
rácios de um atributo dá origem a uma escala de razão. A sua teoria de escalas de medição e a sua
elaboração constituem um recurso inestimável para a psicologia.
- Crítica: Afirma que a “psicologia quantitativa moderna está mais preocupada com a implementação de
programas quantitativos do que com a resposta a questões científicas fundamentais sobre essas
hipotéticas quantidades”

1. O objetivo da medição deve ser pré-determinado, por exemplo, predição, classificação, tomada de
decisão, etc.
2. O atributo deve ser identificado e definido. Tem que se acordar numa definição antes de se iniciar a
medição ou corre-se o risco de aplicar regras diferentes, resultando em medições variáveis. O objetivo
da medição deve guiar a sua definição.
3. Um conjunto de regras, baseadas nessa definição, deve ser determinado para quantificar o atributo.
4. As regras são aplicadas para transformar o atributo em termos numéricos.

Vantagens da medição:

1. Objetividade - minimiza o julgamento subjetivo e permite que se testem teorias;


2. A medição resulta em quantificação - permite que se alcance um maior detalhe do que em julgamentos
pessoais;
3. Conseguem observar-se efeitos mais subtis e utilizar-se análises estatísticas para fazer afirmações
precisas sobre o padrão dos atributos e das suas relações;
4. É possível uma melhor comunicação, porque medidas estandardizadas levam a uma linguagem comum
e à compreensão.

Validade da AP: Dados de diversas meta-análises sobre a validade dos testes mostram que:
1. A validade dos testes psicológicos é forte e convincente;
2. A validade dos testes psicológicos é comparável à validade dos testes médicos;
3. Métodos distintos de avaliação proporcionam fontes únicas de informação;
4. Os clínicos que se baseiam exclusivamente nas entrevistas têm uma elevada probabilidade de não
chegar a uma compreensão completa;

- A validade de todo e qualquer instrumento de avaliação não se expressa por um número: ela requer uma
análise complexa que relacione vários aspetos, nomeadamente, objetivos da avaliação, contexto,
variáveis a avaliar, sujeito ou população avaliada e, essencialmente, os resultados, as consequências da
avaliação.
- A validação exige uma análise extensa de evidência, baseada em afirmações explícitas sobre as
interpretações, e envolve a tomada em consideração de aspetos vários e contraditórios. Aborda-se a
validade como uma hipótese e recorre-se à teoria, à lógica e ao método científico para recolher e juntar
dados que suportem ou recusem as interpretações num dado momento.
- A validade não é uma propriedade do teste ou da avaliação enquanto tal, mas sim do significado das
pontuações do teste ou instrumento. Estas pontuações são função, não apenas dos itens ou estímulos,
mas também das pessoas que respondem e do contexto onde ocorre a avaliação. Essencialmente, o que
necessita ser válido é o significado ou interpretação da pontuação, em paralelo com as implicações para
a ação.

A AVALIAÇÃO PSICOLÓGICA NÃO CONSISTE APENAS NA MEDIÇÃO:

- Medição: itens de resposta correta/incorreta (testes) e sem utilização de itens de resposta


correta/incorreta (questionários/inventários).

6
- Sem Medição: entrevistas, observações; outros questionários, checklists,….

- A avaliação psicológica é um processo dinâmico; um processo de conhecimento do outro; um processo


científico; um trabalho especializado; e a obtenção de amostras do comportamento.
- A avaliação psicológica NÃO É um trabalho mecânico; somente avaliar determinadas características;
sinónimo de aplicação de testes; um processo simples, rápido e fácil; e não é um conhecimento definitivo
sobre o comportamento observado.

Psychological testing vs. psychological assessment:

- Testes e avaliações não são sinónimos. Os testes são uma das ferramentas usadas no processo de
avaliação. Avaliar é muito mais do que aplicar testes, é um processo dinâmico.
- O teste psicológico é um processo simples em que uma escala particular é administrada para obter uma
pontuação específica. Subsequentemente, um significado descritivo pode ser aplicado à pontuação com
base em descobertas normativas nomotéticas. Em contraste, a avaliação psicológica preocupa-se com o
clínico que faz uma variedade de pontuações de teste, geralmente obtidas de vários métodos de teste, e
considera os dados no contexto da história, informações de encaminhamento e comportamento
observado para compreender a pessoa que está a ser avaliada, para responder às perguntas de
encaminhamento e, em seguida, para comunicar os resultados ao paciente, aos familiares e fontes de
encaminhamento.

Testing:
- É o ato de administrar, cotar, e interpretar os resultados de um teste que mede uma de várias funções
psicológicas, tais como capacidade cognitiva, memória, ou traços de personalidade;
- É um processo relativamente simples e objetivo;
- A interpretação dos resultados limita-se à descrição do significado de uma pontuação, e os únicos outros
dados que são relevantes estão relacionados com a validade e a fidelidade, com base nos dados
normativos e no comportamento do sujeito
- No entanto, o resultado de um determinado teste individual, apesar de cuidadosamente selecionado,
administrado, cotado, e interpretado, raramente proporciona informação suficiente na qual basear
decisões significativas ou a compreensão de problemas complexos.

O que é um teste?
- É uma ferramenta ou técnica de medida usada para quantificar o comportamento ou auxiliar na
compreensão e previsão do comportamento;
- Os testes medem apenas amostras de comportamento e existe sempre um erro associado aos processos
de amostragem - portanto os resultados dos testes não são medidas perfeitas do comportamento ou
característica avaliada;
- Um teste é um conjunto de itens. Um item é um estímulo específico ao qual a pessoa responde
abertamente. Essa resposta pode então ser cotada ou avaliada.
- Saber a % de itens corretos pode ser enganador... É necessário enquadrar o resultado em escalas e
relacioná-los com uma distribuição normativa.
- A maioria dos testes psicológicos pode ser classificada em 3 categorias gerais: 1. Testes nos quais o sujeito
realiza alguma tarefa específica, como escrever um texto, responder a itens de escolha múltipla ou girar
mentalmente imagens apresentadas no computador; 2. Testes que envolvem observações do
comportamento do sujeito dentro de um contexto particular; e 3. Medidas de auto-relato, nas quais o
sujeito descreve os seus sentimentos, atitudes, crenças, interesses e afins.

7
(Des)construindo conceitos:
- Teste: instrumento de medida estandardizado que tem como objetivo a obtenção de dados acerca do
sujeito.
- Escala
- Bateria
- Inventário
- Inquérito
- Questionário
- Provas psicológicas

- “When tests are used appropriately and skillfully they can be key components in the practice and science
of psychology”.

Usos das provas psicológicas:


- No processo pragmático de tomar decisões sobre as pessoas, seja como indivíduos ou como grupos;
- Em termos de frequência e longevidade é em pesquisas científicas sobre fenómenos psicológicos e
diferenças individuais;
- O mais recente, e ainda menos desenvolvido, é no processo terapêutico de promoção da auto-
compreensão e ajuste psicológico.

Assessment:
- Ao contrário do testing, o assessment “está relacionado com o facto do clínico pegar num conjunto de
pontuações nos testes, normalmente obtidos a partir de múltiplos métodos de teste, e considerar esses
dados no contexto da história, informação que chega com o pedido, e comportamento observado, para
compreender a pessoa que está a ser avaliada, para responder às questões colocadas no pedido, e para
depois comunicar os resultados ao paciente, aos seus familiares, e às fontes do pedido”.
- É um processo complexo e requer treino e perícia.
- Alguns dos objetivos principais da avaliação são (a) descrever o funcionamento atual, incluindo
habilidades cognitivas, gravidade da perturbação e capacidade para uma vida independente; (b)
confirmar, refutar ou modificar as impressões formadas pelos médicos por meio de suas interações menos
estruturadas com os pacientes; (c) identificar necessidades terapêuticas, destacar questões que podem
surgir no tratamento, recomendar formas de intervenção e oferecer orientação sobre os resultados
prováveis; (d) auxiliar no diagnóstico diferencial de transtornos emocionais, comportamentais e
cognitivos; (e) monitorar o tratamento ao longo do tempo para avaliar o sucesso das intervenções ou para
identificar novos problemas que podem exigir atenção à medida que as preocupações originais são
resolvidas; (f) gerir o risco, incluindo a minimização de potenciais responsabilidades legais e a identificação
de reações de tratamento indesejáveis; e (g) fornecer feedback de avaliação empática e hábil como uma
intervenção terapêutica em si.

- Na prática... Aplicar apenas um teste de memória (ou uma bateria deles) e interpretá-lo sem as
entrevistas, serviria de pouco. Poderá ter depressão, baixo nível de funcionamento cognitivo, uma
perturbação de ansiedade, etc., que afetam a memória e consequentemente os resultados nos testes.
Entrevistas cuidadosas acrescentam profundidade e validade ecológica aos resultados que forem
encontrados, e permitem ao psicólogo efetuar recomendações úteis e com significado.

8
“Um teste psicológico é uma ferramenta muda e passiva, e o valor dessa ferramenta não pode ser separado
da sofisticação do clínico que realiza inferências a partir dela e depois comunica com os pacientes e outros
profissionais”.

Avaliação psicológica (AP) vs. Testagem psicológica (TP)

- Grau de complexidade: mais simples; envolve um procedimento uniforme, frequentemente


unidimensional (TP); mais complexo; cada avaliação envolve vários procedimentos (entrevista,
observação ...) e dimensões (AP).
- Duração: mais curta, de alguns minutos a algumas horas (TP); mais, durando de algumas horas a alguns
dias ou mais (AP).
- Fontes de dados: uma pessoa, o participante do teste (TP); frequentemente, fontes colaterais, como
parentes ou professores, são usadas além do objeto da avaliação (AP).
- Foco: como uma pessoa ou grupo se compara a outros (nomotético) (TP); a singularidade de um
determinado indivíduo, grupo ou situação (ideográfica) (AP).
- Qualificações para uso: conhecimento de testes e procedimentos de teste (TP); conhecimento de testes
e outros métodos de avaliação, bem como da área de especialidade avaliada (transtornos psiquiátricos,
requisitos de trabalho) (AP).
- Base processual: objetividade necessária; a quantificação é crítica (TP); subjetividade, na forma de
julgamento clínico, necessária; quantificação raramente possível (AP).
- Custo: barato, principalmente quando o teste é feito em grupo (TP); muito caro; requer uso intensivo de
profissionais altamente qualificados (AP).
- Objetivo: obter dados para uso na tomada de decisões (TP); chegar a uma decisão sobre o problema de
encaminhamento questão (AP).
- Grau de estrutura: alta estrutura (TP); envolve aspectos estruturados e não estruturados (AP).
- Resultados da avaliação: investigação relativamente simples de confiabilidade e validade com base em
resultados de grupo (TP); muito difícil devido à variabilidade de métodos, avaliadores, natureza da
apresentação das questões .. (AP).

Principais técnicas de AP: entrevistas, observação, testes psicológicos, dinâmicas de grupo, observação
lúcida, provas situacionais e outras.

Obtenção de provas psicológicas:


- Publicadas;
- Não Publicadas;
- Outros (Casos particulares / mistos)***

NÃO ESQUECER: uma das distinções mais básicas entre os testes diz respeito a sua publicação ou não.
- Os testes publicados estão disponíveis comercialmente por meio de editores de teste.
- Testes não publicados devem ser obtidos do investigador individual que os desenvolveu, de bancos de
dados, de diretórios especiais de medidas não publicadas ou da literatura periódica.

Avaliação psicológica: Definição


- Processo de aquisição e integração de informação relevante em que se recorre a vários métodos, técnicas
e instrumentos, ou a vários agentes ou fontes de recolha de informação relativa a diferentes dimensões

9
da pessoa avaliada:junta-se o desenvolvimento, construção e avaliação de meios adequados para juntar
e processar informação apropriada para a avaliação. Integra 2 componentes: Processo (sequência de
passos que o avaliador deverá seguir para responder às questões do cliente) e procedimentos
(instrumentos, testes, e outras técnicas de medida, incluindo métodos qualitativos, de juntar dados).
- Conjunto de práticas que são usadas em diferentes contextos: Educação; Clínica/Saúde; Aconselhamento
Psicológico; Justiça/Forense; Trabalho/Organização; Militar; Investigação;…
- É um ato de prestação de serviços especializados por um profissional de psicologia;
- Levanta problemas éticos e deontológicos que remetem para padrões e normas.
- Objetivos: Despistagem; Descrição; Compreensão; Verificação de hipóteses; Explicação; Diagnóstico;
Prognóstico; Planificação de intervenção; Medida; Investigação.
- A avaliação psicológica avalia construtos que, como refere Kane (2001), são ideias desenvolvidas para
organizar e explicar aspetos do conhecimento existente.

Um Modelo de Avaliação Psicológica

Aplicação prática:

1. Pedido: a Margarida foi enviada pelo seu médico de família, e ele vê bastantes pacientes idosos e
já fez vários outros pedidos ao mesmo psicólogo. Ele quer saber o seguinte: Os resultados dos testes de
memória e de funcionamento cognitivo são consistentes com demência?; Mostram um declínio
relativamente ao funcionamento pré-mórbido?; Se sim, qual o impacto desse declínio na vida quotidiana da
Margarida?; Existe alguma possibilidade de que o aparente declínio se deva a outros fatores, particularmente
a depressão? - No entanto, tudo o que o Dr. disse foi: “Gostaria que testasse a Margarida para avaliar a
hipótese de demência”.

2. O contexto do pedido:
- O Dr. Gouveia fez o pedido porque Pedro, o filho de Margarida, expressou a sua preocupação
relativamente aos problemas de memória da mãe.
- Pedro vai pagar particularmente pela avaliação, mas o relatório irá para o Dr. Gouveia.
- Pedro está preocupado com o funcionamento da mãe no dia-a-dia e com a sua capacidade para viver de
forma independente.
- O Dr. Gouveia quer confirmar um diagnóstico de demência antes de tentar algum tipo de medicação.

10
3. Informação necessária para responder às questões do pedido: Para responder às questões
implícitas e explícitas, o psicólogo precisa de:
- Uma estimativa do funcionamento cognitivo e memória pré-mórbidos;
- A sua história de problemas emocionais e sinais e sintomas de depressão ou ansiedade;
- Resultados em testes de memória e funcionamento cognitivo;
- Conhecimento sobre os comportamentos da Margarida no dia-a-dia, as exigências do seu estilo de vida
presente e a sua capacidade para responder a essas exigências.
- O psicólogo também precisa de ter conhecimentos sobre os efeitos do envelhecimento normal na
cognição, memória, funcionamento emocional e vida diária.

4. Recolher os dados:
- O psicólogo conduz uma entrevista semi-estruturada para obter a história pré- mórbida, avaliar sinais e
sintomas de depressão e ansiedade, e recolher informação sobre a vida diária da Margarida.
- Revê os registos médicos da Margarida e entrevista Margarida e Pedro separadamente e em conjunto.
- Administra o BDI, subtestes da Escala de Memória de Wechsler, e a WAIS à Margarida;
- Certifica-se de que esses testes têm normas que são adequadas à idade da Margarida;
- Usa materiais de referência para garantir que está a interpretar os resultados corretamente e não a
confundir demência com envelhecimento normal.
- Tem também em conta alguma questão de ordem cultural que possa ser relevante, tal como raça ou
etnicidade.

5. Utilizar os dados para responder às questões do pedido: O psicólogo:


- Avalia a informação que obteve sobre o background e a história da paciente, e o que observou sobre o
comportamento da Margarida durante as entrevistas e durante a realização dos testes.
- Decide se os testes são válidos e o que lhe dizem sobre as funções cognitivas e de memória da Margarida.
- Determina se os resultados de todos os domínios que foram avaliados são consistentes e se sabe tudo o
que necessita para poder responder às questões do pedido.
- Depois decide se os resultados são consistentes com demência e, se o forem, como é que isso afeta a vida
diária da Margarida.
- Se não forem, existem outras questões que devam ser abordadas?
- Em qualquer dos casos, deve elaborar recomendações que sejam úteis à Margarida e à sua família.

6. Comunicar os resultados:
- O psicólogo comunica os resultados à Margarida e ao seu filho numa consulta de seguimento, e prepara
um relatório para o Dr. Gouveia.

Algumas considerações... Em alguns contextos (ex.: seleção e recrutamento) muitas vezes o processo de
avaliação é mais limitado e pode passar apenas pela aplicação de testes (ex.: testes de aptidões). Apesar dos
testes psicológicos terem uma precisão limitada, ainda assim foram considerados pela National Academy of
Sciences como o melhor, mais justo e mais económico método de obter a informação necessária para tomar
decisões sensatas sobre os indivíduos.

Características comuns a todos as provas psicológicas:


- Um teste psicológico é uma amostra de comportamento.
- Esta amostra é obtida em condições estandardizadas.
11
- Existem regras estabelecidas para cotar ou para obter informação quantitativa (numérica) dessa amostra
de comportamento.

O que deve um psicólogo saber?


- Teoria da medida e dos testes; psicometria;
- Especificidades sobre administração, cotação e interpretação de vários instrumentos de avaliação;
- Teorias da personalidade, desenvolvimento e psicopatologia;
- Detalhes sobre o contexto em que é realizada a avaliação (e.g., forense, educação);
- Como conduzir uma entrevista e realizar um exame do estado mental; - O que procurar quando avalia um
cliente;
- As obrigações legais e éticas que regulam a sua profissão;
- (...)

- O psicólogo, através da avaliação psicológica, deverá estar apto a identificar e descrever aspetos
psicológicos que são suscetíveis de facilitar ou embaraçar, quer a reação ao diagnóstico quer a reação e
ajustamento à doença, aos tratamentos, a curto ou a longo prazo.
- A propósito da avaliação psicológica Fernández-Ballesteros, et al. (2001) explicam que: 1) O processo de
avaliação implica um processo de tomada de decisão, ou seja, visa a utilização de procedimentos (no
processo) úteis para a tomada de decisão visando a resolução de problemas práticos importantes; 2)
implica resolução de problemas, ou seja, é um processo de constante questionamento, e implica, entre
outros, um conjunto de fases a) de clarificação do problema, b) planificação, c) desenvolvimento, d)
implementação, e) encontrar um resultado e, f) disseminação; e 3) requer a produção de hipóteses,
inerente ao processo clínico.
- A avaliação psicológica deve ter valor preditivo ou diagnóstico e faz-se com recursos a instrumentos
técnicos que, por isso, devem ser utilizados por profissionais com treino no seu uso.

- A utilização adequada de um teste psicológico requer um treino longo: em primeiro lugar porque cada
teste mede um conceito, um construto: os psicólogos devem conhecer profundamente a teoria
subjacente ao instrumento, e os conceitos e construtos que ele avalia. Só assim se pode compreender e
explicar os resultados, conhecer o modo como é aplicado, compreender o modo como o respondente se
comporta, saber cotar e reportar os resultados, e os procedimentos éticos inerentes à utilização do teste,
entre outros.

NOTA: Os princípios éticos da APA determinam que os psicólogos forneçam serviços que atendam aos
melhores interesses dos seus pacientes. Assim, todos os avaliadores devem ser capazes de fornecer uma
justificativa sólida para o seu trabalho e explicar os benefícios esperados de uma avaliação, bem como os
custos previstos. Embora seja valioso entender os benefícios de um teste em relação aos seus custos gerais,
é importante perceber como as relações custo-benefício podem ser determinadas apenas para pacientes
individuais quando se trabalha num contexto clínico.

Operacionalização de construtos psicológicos

Operacionalização em psicologia:
- Edward Thorndike, figura marcante na história da psicologia, referia que se algo existe na natureza, existe
em certa quantidade e, como tal, pode ser mensurável. O conceito de operacionalização é dos mais
importantes em ciência e na psicologia.

12
- De uma maneira simples, a operacionalização diz respeito ao conjunto de operações que permitem
definir um conceito ou construto. Como referem Silva et al. (2008) “uma definição diz-se “operacional”
se indicar as operações que se deverão realizar para detetar a presença do fenómeno a que se refere o
conceito, tipificá-lo e (sempre que possível) quantificá-lo”.
- É imprescindível definir bem o que se pretende avaliar nos mais variados contextos (settings) onde pode
trabalhar o psicólogo: na investigação científica, sendo que um dos passos ou etapas centrais, é
precisamente operacionalizar aquilo que se pretende estudar ou investigar; no contexto da avaliação
quando, por exemplo, pretendemos medir um ou mais comportamentos-alvo e, consequentemente, na
intervenção, dado que será a partir desta avaliação operacional que se vão estabelecer objetivos clínicos
para assim se monitorizarem os eventuais ganhos terapêuticos.
- Em psicologia, estamos muitas das vezes interessados em variáveis que não se observam diretamente
(variáveis manifestas) mas que apenas se podem inferir a partir de indicadores objetivos como itens de
uma escala ou inventário ou observação direta do comportamento - variáveis latentes.
- Neste sentido, é fundamental que essa inferência seja feita da maneira mais rigorosa possível e que os
comportamentos que se querem avaliar possam ser o mais fielmente e validamente representados pelos
nossos indicadores manifestos. De uma maneira simples e operacional, pode por exemplo dizer-se que o
tempo é tudo aquilo que se pode medir com um relógio; por sua vez, um relógio é tudo aquilo que se
repete e espaço é tudo aquilo que se pode medir com uma régua.
- É importante realçar a ideia de que o conceito de operacionalização de um construto psicológico não
esgota todas as características ou propriedades desse mesmo construto, mas que apenas permite defini-
lo o mais objetivamente possível para melhor avaliar.
- Relevância para a investigação e para a prática psicológica.

O caso da psicopatologia:
- O caso do DSM-5
- O fator “p”
- A abordagem de redes
- RDoC
- HiTOP

Construção, adaptação ou adoção de instrumentos de avaliação psicológica

As 3 hipóteses que se colocam quando se pretende utilizar uma técnica, um instrumento de avaliação são: a
construção, a adaptação ou a adoção da técnica.
- Construção - forma mais apropriada se o objetivo principal não for a comparação entre nações ou entre
culturas, devem-se respeitar as exigências técnicas que se apresentaram antes, e que tornam o processo
dispendioso. Deve-se começar por identificar e definir com clareza o objetivo da avaliação que se pretende
realizar, segue-se a explicitação do quadro teórico onde se inclui o conceito a avaliar, a definição clara e a
sua aplicação à população (construto), a escolha e análise das dimensões que compõem o conceito e dos
itens que as integram, a escolha da forma de responder e a definição da escala de resposta, a reflexão
falada (cognitive debriefing), assim como a aplicação dos restantes procedimentos implícitos e explícitos
na rede nomológica.
- Adaptação - tem a vantagem da teoria, o conceito, dimensões e itens já estarem definidos numa qualquer
língua, mas tem como dificuldade, dado o principal objetivo ser que os resultados possam ser comparados
nas línguas/culturas diferentes, garantir que as técnicas ou instrumentos de avaliação forneçam os
mesmos resultados. A adaptação é provavelmente o processo mais complexo. Mesmo que dois países
usem a mesma língua, os instrumentos precisam de ser adaptados por razões lexicais (as palavras não
13
significam o mesmo), gramaticais (as frases não se juntam do mesmo modo e cada língua tem a sua
gramática), culturais (cada cultura dá um significado próprio a conceitos). Por isso é necessário fazer
adaptações. Van de Vijver e Tanzer (2004) salientam que é difícil garantir que as pontuações que se obtêm
numa cultura possam ser comparadas com as obtidas noutras culturas e que essas pontuações podem ter
significados completamente diferentes. Mas as diferenças não dizem respeito somente à língua. A
equivalência linguística pode não ser possível por o conceito/construto não ser idêntico ou não existir na
cultura para onde se está a adaptar o instrumento.
- Há a possibilidade de haver variações na natureza de construtos multidimensionais em diferentes
culturas, pelo que é importante investigar diversos aspetos, como: que domínios são importantes para o
construto na cultura em jogo, e quais as relações entre eles (equivalência conceptual); examinar de modo
crítico os itens utilizados para avaliar esses domínios, e se a relevância desses itens é idêntica nas culturas
(equivalência do item); assegurar que a tradução respeita a equivalência semântica dos itens (equivalência
semântica); assegurar que os métodos de medição utilizados são adequados para a cultura em questão
(equivalência operacional); inspecionar as propriedades psicométricas do instrumento (equivalência de
medida); e examinar o resultado do processo em termos de comportamento do instrumento (equivalência
funcional). Quando a comparação inter-culturas não é importante, pode ser mais relevante e mais fácil
desenvolver um novo instrumento na nova língua.
- Quando se traduz um instrumento há 3 opções: aplicar o instrumento com uma tradução literal; adaptar
partes do instrumento; ou construir um novo instrumento. Cada uma destas ações podem tornar o
instrumento mais adequado para o novo grupo cultural.

Background teórico e testes

Background histórico:

- 1ª“ avaliações psicológicas”:


- China (há mais de 4000 anos) - para seleção de pessoas para determinadas funções laborais (para
avaliar proficiência em aritmética, tiro com arco, música, escrita, poesia, dotes cerimoniais, memória,
etc.).
- Ao longo dos anos, estabeleceram procedimentos formais, tais como ter avaliações independentes de
pelo menos dois observadores, e aplicações dos testes em condições standard.
- Grécia antiga - os filósofos Platão e Aristóteles também discutiram a questão das diferenças individuais
nos seus trabalhos.
- Interesse nas diferenças individuais diminuiu durante a Idade Média, tendo reaparecido na Renascença,
séc. XVI.

- Charles Darwin (1809-1882) - influenciou fortemente as primeiras ideias da psicologia.


- Ideia: Os membros de uma espécie exibem uma variabilidade de características, que resulta em que
alguns sejam mais adequados que outros para determinadas condições ambientais. O significado das
diferenças individuais entre indivíduos da mesma espécie tornou-se um fator chave que influenciou
psicólogos e estatísticos, muitos dos quais contribuíram para o desenvolvimento de uma nova ciência
que visava medir os processos mentais.
- Psicólogos experimentais como Fechner, Wundt ou Ebbinghaus descobriram que os fenómenos
psicológicos podiam ser descritos de forma racional e quantitativa. Daqui derivou a ideia que os testes,
tal como uma experiência, requerem controlo experimental rigoroso.

- Francis Galton (1822 - 1911) - interessado em medir os mais diversos aspetos das pessoas no seu
laboratório:

14
- Aplicou as teorias de Darwin ao estudo dos seres humanos.
- Enfatizou a importância das diferenças individuais - Psicologia Diferencial.
- Criou os primeiros testes de capacidade mental.
- Foi o primeiro a utilizar questionários.
- Descobriu diversos procedimentos estatísticos de análise de dados, muitos dos quais ainda em uso:
- Ex: descobriu que várias medidas da fisiologia e aptidões humanas produziam uma “curva normal”
que pode ser descrita pela sua média e DP, e sugeriu o uso deste indicadores para descrever
medidas dos atributos humanos
- Descobriu o conceito de correlação (que encorajou Karl Pearson a desenvolver), que especifica o
grau de associação entre quaisquer 2 atributos.
- Também inventou as scatter-plots (gráficos de dispersão) para representar dados.

- Alfred Binet (1857 - 1911) - Autor do 1º teste de inteligência:


- Abriu um laboratório em Paris para o estudo das crianças, e foi-lhe pedido pelo ministério que
estudasse crianças com atraso mental, para identificar crianças que precisassem de educação
alternativa.
- Desenvolveu um conjunto de testes, incluindo pequenos problemas sobre a vida diária e testes de
processos cognitivos como a memória. Eram compostos por várias tarefas que se assumiam
representativas das capacidades das crianças em diferentes idades.
- Distinguiu “idade mental” de “idade cronológica”. A idade mental está relacionada com o nível de
desempenho nos testes.
- Em conjunto com Theodore Simon, publicou a 1º escala de avaliação da inteligência (a Escala de Binet-
Simon, 1905 - 1º versão).
- Nos EUA (Univ. de Stanford), Lewis Terman estandardizou a escala de Binet-Simon para a população
americana, passando o instrumento a ser conhecido como Teste de Inteligência de Stanford-Binet
(1916).

- Louis Thurstone (1887 - 1955) - Fundou o Laboratório de Psicometria na Universidade de Chicago:


- Deu um contributo significativo ao desenvolvimento da teoria psicométrica.
- Criou novos métodos de análise fatorial para identificar o número e a natureza de potenciais construtos
subjacentes a um conjunto de variáveis observadas.
- Desenvolveu baterias de testes de aptidão e escalas de atitudes.
- Opunha-se à ideia de uma inteligência geral única, considerando que existiam múltiplas aptidões.
- Desenvolveu a “Lei do julgamento comparativo” - é possível ordenar qualquer conjunto de estímulos
em função de um determinado atributo com base em comparações de todos os itens em combinações
binárias.

- Raymond B. Cattell (1905 - 1998):


- Aplicou técnicas empíricas para compreender a estrutura da personalidade.
- Desenvolveu alguns métodos de análise fatorial já existentes.
- Identificou 16 fatores subjacentes à personalidade humana (modelo de personalidade dos 16 fatores).
- Desenvolveu um instrumento para medir a personalidade com base nesta teoria (Questionário 16PF).

15
- Foi pioneiro na criação de uma teoria unificadora das diferenças individuais, combinando investigação
sobre inteligência e personalidade.
- Teorizou a existência de uma inteligência fluida e uma inteligência cristalizada que compõem a
inteligência geral (g).
- Desenvolveu o “Culture Fair Intelligence Test” para minimizar a influência da linguagem e da cultura na
avaliação da inteligência.

- Anne Anastasi (1908 - 2001):


- Primeira pessoa a enfatizar que diferentes culturas têm conceitos alternativos sobre o que é “uma
pessoa inteligente”, e que os testes tradicionais medem apenas capacidades valorizadas no meio
académico e laboral das sociedades industrializadas.
- Conhecida como “a guru dos testes”.
- Desenvolveu estudos influentes sobre a construção dos testes, má utilização dos testes, erros de
interpretação e enviesamentos culturais.
- Encarava a inteligência como estando em permanente mudança ao longo do tempo.
- Defendeu uma posição anti-hereditariedade, enfatizando o papel e influência da experiência, do
ambiente e da cultura nos resultados em testes de inteligência.
- Enfatizava a necessidade de recolher informação sobre a história do indivíduo para melhor
compreender os resultados dos testes.

- Paul Kline (1937 - 1999):


- Importante psicometrista no Reino Unido.
- Proporcionou análises psicométricas de diversos testes amplamente utilizados.
- Argumentou que se deveriam desenvolver formas verdadeiramente científicas da medida psicológica,
com vista a chegar a uma nova psicometria, que transformaria a psicologia numa de “ciência social”
numa “ciência pura”.

Os testes Alfa e Beta


- Desenvolvidos por um comité da APA para permitir aplicação em massa aquando da entrada dos EUA na
1º Guerra Mundial.
- Testes anteriores apenas permitiam aplicação individual e os candidatos só podiam ter até 17 anos.
- Tinham o objetivo de avaliar as capacidades intelectuais dos soldados, para se poder atribuir-lhes tarefas
e posições adequadas.
- Versão Alfa -> grupos letrados;
- Versão Beta -> iletrados, baixa literacia ou desconhecimento do inglês.

- TESTE ALFA:
- Focava-se no conhecimento da linguagem oral e escrita.
- Vários sub-testes que incluíam: capacidade para seguir direções verbais, resolver problemas aritméticos,
demonstrar capacidade de julgamento prático, usar sinónimos e antónimos, completar séries de números
e identificar analogias.

16
- TESTE BETA:
- Semelhante, mas não sendo afetado pelo conhecimento do inglês.
- Administração realizada através do uso de sinais manuais.
- Tarefas incluíam: Completar problemas tipo labirintos e puzzles; Contar; Emparelhar números e símbolos;
e Construções geométricas.

- Estes testes contribuíram significativamente para o reconhecimento do benefício dos testes, mas a sua
validade tem sido posta em causa...

As escalas de Wechsler
- David Wechsler, aluno de Spearman, desenvolveu aquela que é provavelmente a mais importante,
conhecida e usada escala de avaliação da inteligência para adultos: Wechsler Adult Intelligence Scale
(WAIS).
- Publicada originalmente em 1939 como a Wechsler-Bellevue Scale, e em 1955 como a WAIS, e tendo por
base largas amostras de estandardização, foi substituindo progressivamente a Escala de Stanford-Binet.
- Uma outra versão, para idades entre os 5 e os 16 anos foi posteriormente desenvolvida: Wechsler
Intelligence Scale for Children - WISC. Contêm 2 sub-escalas: verbal e de realização (não-verbal) - Cada
sub-teste inclui questões de todos os níveis (muito fácil a muito difícil).

- ESCALA VERBAL
- Alguns sub-testes medem principalmente a inteligência cristalizada (avaliam compreensão, conhecimento
e vocabulário).
- Desempenho nesta escala influenciado pelo nível de educação e classe social.
- Pontuação correlaciona-se com sucesso académico e profissional.

- ESCALA DE REALIZAÇÃO
- Sub-testes mais relacionados com inteligência fluida.
- Desempenho menos afetado por outros fatores

=> Ambas as escalas, bem como o QI de escala completa têm elevados coeficientes de precisão e fidelidade.
=> É necessário bastante treino para uma adequada administração, cotação e interpretação.

Avaliação clínica de perturbações mentais

- DSM-5 (APA) Diagnostic and Statistical Manual of Mental Disorders.


- Manual que fornece critérios de diagnóstico para a generalidade das perturbações mentais, incluindo
componentes descritivas, de diagnóstico e de tratamento.
- Sistema multi-axial para diagnóstico das perturbações mentais da DSM-IV:
- Eixo I - Síndromes clínicos e outras condições que possam ser foco de atenção médica (depressão,
ansiedade, pert. bipolar, etc.).
- Eixo II - Distúrbios de personalidade e atraso mental.
- Eixo III - Perturbações ou condições físicas.
- Eixo IV - Problemas psicossociais ou do meio social do paciente.
- Eixo V - Avaliação do funcionamento global.
17
- ICD-10 (OMS) International Classification of Diseases. CID - 10: Classificação Internacional de Doenças:
Classifica tanto doenças mentais como físicas; Mais frequentemente utilizado na Europa.

Etapas históricas da AP

1. Até 1900 experimentação da AP;


2. Até 1920 desenvolvimento dos testes de avaliação intelectual individuais e de grupo, e desenvolvimento
da teoria psicométrica;
3. Até 1940 desenvolvimento da análise fatorial, desenvolvimento dos testes produtivos e de inventários
padronizados de avaliação da personalidade;
4. Até 1960 desenvolvimento de medidas de interesse vocacional, e de medidas padronizadas da
psicopatologia;
5. Até 1980 desenvolvimento da teoria de resposta aos itens e da avaliação neuropsicológica;
desenvolvimento de técnicas de AP em pessoas com doenças específicas; desenvolvimento e declínio da
avaliação de inspiração comportamental;
6. De 1980 em diante, adaptação dos testes à aplicação por computador. Adaptação dos testes existentes
a contextos muito diversos, nomeadamente o desenvolvimento de versões reduzidas de testes clássicos,
ou a construção de testes mais pequenos de avaliação da personalidade.

Testing - Conceitos Básicos


- O que é um teste?
- É uma ferramenta ou técnica de medida usada para quantificar o comportamento ou auxiliar na
compreensão e previsão do comportamento.
- Os testes medem apenas amostras de comportamento e existe sempre um erro associado aos
processos de amostragem - portanto os resultados dos testes não são medidas perfeitas do
comportamento ou característica avaliada.
- Um teste é um conjunto de itens. Um item é um estímulo específico ao qual a pessoa responde
abertamente. Os itens são questões ou problemas específicos que constituem um teste. Essa resposta
pode então ser cotada ou avaliada.
- Saber a % de itens corretos pode ser enganador... É necessário enquadrar o resultado em escalas e
relacioná-los com uma distribuição normativa.
- Um teste psicológico ou teste educacional é um conjunto de itens destinados a medir as características
dos seres humanos que dizem respeito ao comportamento. O comportamento manifesto é a atividade
observável de um indivíduo. Os testes psicológicos e educacionais medem, portanto, o comportamento
passado ou atual.

Características estáveis e mutáveis


Os testes podem avaliar TRAÇOS ou ESTADOS

- Os TRAÇOS são definidos como tendências ou características relativamente constantes e duradouras dos
indivíduos, sendo previsíveis e indicando algum potencial subjacente.
- Permanecem relativamente estáveis ao longo do ciclo de vida, particularmente a partir da idade adulta.
- Medem-se comparando a posição da pessoa numa escala de traço com a posição de outras pessoas (grupo
normativo). Ex: sou mais ou menos agressiva do que os outros?

- Os ESTADOS são aspetos transitórios ou temporários da pessoa, tais como estados de humor, felicidade,
raiva, medo, desconforto ou mesmo surpresa.

18
- Tendem a ser demonstrados fisiologicamente.
- Podem resultar dos efeitos de circunstâncias situacionais.
- Alguns estados podem também ser classificados enquanto traços: Motivação e Ansiedade.

- Os traços ajudam-nos a compreender o comportamento a longo prazo, enquanto os estados são mais
relevantes se estamos a tentar prever como a pessoa se vai comportar naquele determinado momento.

Elementos-chave na Psicometria

1. Estandardização
- Na administração, para que os procedimentos e as instruções sejam os mesmos para cada pessoa que
responde ao teste.
- Na interpretação - existe informação normativa sobre como é que diferentes grupos responderam, que
está disponível no manual técnico; os valores obtidos por uma pessoa vão ser comparados com esses.

2. Fidelidade
- Está relacionada com a estabilidade dos resultados.
- Indica-nos o grau de exatidão ou confiança que podemos ter na informação obtida.

3. Validade
- O instrumento deve de facto medir o que é suposto medir.
- É a base para podermos fazer inferências válidas sobre as pessoas a partir dos resultados nos testes.

Como classificar/tipos os/de testes?

De acordo com o tipo de aplicação:


1. Aplicação individual
2. Aplicação de grupo

De acordo com a forma de cotação:


1. Cotação objetiva
2. Cotação não-objetiva

De acordo com os aspetos que avalia:


1. Testes cognitivos (ex. capacidade de raciocínio, aptidões, etc.).
2. Testes afetivos (ex. aspetos da personalidade, interesses, valores, motivos e atitudes).

De acordo com o tipo de comportamento que avalia:


1. Medidas de Achievement - Indicam qual o desempenho da pessoa numa determinada área, no
seguimento de um período de instrução, por ex: exames escolares - olham retrospetivamente para
o conhecimento ou habilidades adquiridas. Achievemente refere-se à aprendizagem anterior. Um
teste que mede ou avalia quantas palavras pode soletrar corretamente é chamado de teste de
desempenho ortográfico.
2. Medidas de Capacidade / Aptidão / Inteligência - Relacionam-se com o nível de desempenho
cognitivo numa área, referindo-se a capacidades mentais que podem predizer o potencial futuro (e
não apenas conhecimento). A aptidão refere-se ao potencial para aprender ou adquirir uma
habilidade específica. E Inteligência refere-se ao potencial geral de uma pessoa para resolver
problemas, adaptar-se às circunstâncias em mudança, pensar abstratamente e lucrar com a
experiência. Os testes de habilidade contêm itens que podem ser avaliados em termos de
19
velocidade, precisão ou ambos. Num teste de habilidade, quanto mais rápidas ou precisas forem as
respostas, melhor será a pontuação numa característica específica.
3. Medidas de Personalidade - Indicam o estilo de comportamento típico do indivíduo; Apesar de
poderem sofrer influências situacionais no momento da aplicação, podem ser uma ferramenta útil
em predizer como é que os indivíduos provavelmente se comportarão a maior parte do tempo.

De acordo com o tipo de medida:


1. Medidas de desempenho máximo
2. Medidas de desempenho típico

1. Medidas de desempenho máximo:


- Incluem testes de capacidade e aptidões.
- Centram-se no quão bem as pessoas são capazes de fazer as coisas, quão bem aprenderam, ou quão
grande é o seu potencial.
- Ex: Raciocínio abstrato, orientação espacial, raciocínio numérico, raciocínio indutivo, fluência ideativa,
sensibilidade musical, destreza manual, etc.
- Existem respostas certas ou erradas.
- Tempo de resposta é normalmente cronometrado, de modo que a velocidade da resposta está
envolvida; podem ter tempo limitado.

2. Medidas de desempenho típico:


- Incluem testes de avaliações de personalidade, crenças, valores e interesses (i.e., o que tipicamente
somos, o que normalmente fazemos).
- São normalmente medidas de auto-relato, tendo várias escalas (e.g., assertividade, ansiedade,
ambição, etc.).
- Não há respostas certas ou erradas. Por este motivo, alguns autores preferem chamar-lhes
“questionários” ou “inventários”, em vez de testes.
- Normalmente não têm tempo limite de resposta.
- Encorajam os indivíduos a serem honestos nas suas respostas (existem formas de identificar a
mentira).

Testes referenciados a normas e a critério

- Norm-referenced tests:
- Tipo de teste que proporciona uma estimativa da posição do indivíduo que foi testado relativamente
ao desempenho/resultado da população à qual pertence (grupo normativo), no traço/característica
que foi avaliada (maioria dos testes psicológicos).

- Criterion-referenced tests:
- O resultado indica se o indivíduo teve um bom ou mau desempenho numa dada tarefa, em termos
absolutos, i.e., se a pessoa atingiu ou não um determinado objetivo, mas não o compara com o seu
grupo de referência (ex: testes escolares - o critério é saber uma determinada matéria).

Resultados absolutos e relativos

- As pessoas diferem em características físicas ou psicológicas, que pretendemos avaliar – VARIÁVEIS.


20
- A precisão da medida depende da escala que utilizamos...
- Características físicas => existem escalas externas que permitem medir a nossa variável (altura, peso,
etc).
- Características psicológicas => utiliza-se uma população de referência ou um grupo normativo, ao qual
o indivíduo se pode comparar.

- Procedimento:
- Obtenção do resultado bruto (que é um valor absoluto, sem qualquer referência a outros).
- Pode ser um valor exato ou uma percentagem.
- Transformação desse valor num resultado relativo: Percentil; Valor z = (x - μ) / σ (dá valores
negativos…); Valor T = (valor z x 10) + 50 (dá valores positivos…); …

Os componentes básicos da avaliação:


OS ITENS

- Os Itens:
- São elementos chave na construção de questionários/inventários;
- Itens bem concebidos são mais adequados para medir o atributo que se pretende e para discriminar
entre pessoas.
- É necessário conceber mais itens do que aqueles que se pensa serem necessários para avaliar um
determinado atributo, pois alguns serão eliminados na fase de análise dos itens, e vão apenas escolher-
se os melhores.
- O nº de itens necessário para medir com precisão uma variável depende da natureza da característica.
- Regra geral, os itens devem ser escritos em linguagem simples e clara, e com um nível de
complexidade adaptado à população alvo. Devem também ser adequados ao tipo de medida que se
pretende (ex: testes de aptidão, inventário de personalidade, etc).

- Onde se usam os diferentes tipos de item...

- Testes de Inteligência
- Geralmente procuram avaliar a capacidade de raciocínio básico e a capacidade para associar e perceber
relações. Ex: Marinheiro está para navegar assim como Piloto está para: 1. correr; 2. voar; 3. nadar; 4.
lutar; 5. ajudar; 6. jogar.
- Outro tipo popular de item é baseado na ideia de qual não se inclui num conjunto. Ex: Qual dos
seguintes não se inclui? 1. Alemanha; 2. Itália; 3. Índia; 4. China; 5. Ásia; 6. Austrália.
- Também são comuns os itens sobre sequências ou séries: 1, 2, 4, 8, 16, 32, ... Que nº vem a seguir?

- Testes de Realização (“performance”)


- É pedido à pessoa que construa algo, ou que demonstre algum tipo de capacidade (ex: perceção
espacial).
- Ex: Inserir objetos com determinada forma nas ranhuras correspondentes; Criar padrões com blocos;
Montar objetos com diferentes elementos (ex: puzzle); Completar histórias a partir de cartões com
imagens (colocar na ordem correta); Identificar detalhes que faltam em imagens; Copiar um padrão a

21
partir de um código de correspondência dígito-símbolo; …

- Testes de Aptidão (“ability and aptitude”)


- Verbal
- Numérica
- Abstrata

- Espacial
- Mecânica
- Velocidade percetiva
- Criatividade

- Itens relacionados com aptidões podem sobrepor-se aos testes de inteligência (ex: analogias para
raciocínio verbal; sequências para raciocínio numérico).
- Ex: Aptidão espacial: [[ + ]] = (i) [ ][[ (ii) ][[ ] (iii) [[[ ] (iv) [[ ][

- Tipo de itens mais comum: itens de escolha múltipla: Aumentar o nº de opções incorretas reduz a
probabilidade de acertar ao acaso; mas raramente há mais de 5 opções; Itens fáceis de cotar e de
administrar, mas morosos de conceber.

Inventários/Questionários de Personalidade, Sintomas, Atitudes, etc.

- Não existem respostas corretas ou incorretas.


- Principais tipos de item:
- Itens “Sim – Não”
- Ex: “Chorei muitas vezes enquanto via filmes tristes”. Sim - Não
- Itens simples de escrever, fáceis de compreender e podem aplicar-se a uma grande variedade de
pensamentos, sentimentos e comportamento.
- Podem ser vistos como demasiado simplistas, não capturando a total complexidade da personalidade
e comportamento, e as pessoas alegarem que “depende”.
- Alternativa: Sim - ? - Não (no entanto, permite que as pessoas sejam mais defensivas, e a categoria
intermédia não dá informação útil sobre a pessoa).

- Itens “Verdadeiro – Falso”


- Frequentemente escritos na 1º pessoa.
- Ex: “Pessoas com autoridade assustam-me”. Verdadeiro – Falso
- Formato utilizado no MMPI (Minnesota Multiphasic Personality Inventory).
- Semelhante ao formato “Sim – Não”, mas com linguagem um pouco diferente.

- Itens “Gosto – Não gosto”


- Ex: “Aranhas”. Gosto – Não gosto
- Itens que consistem frequentemente numa única palavra ou frase.

22
- Podem ser apropriados para a identificação de condições clínicas, como fobias ou obsessões, em que
apenas o termo relevante precisa de ser fornecido.
- A escolha dos itens deve ter uma base teórica.

- Os instrumentos podem por vezes combinar diferentes tipos de itens em secções diferentes. Os tipos de
item vistos até aqui, que podem ser classificados como “de escolha alternativa”, têm a vantagem de se
avaliar os factos de forma rápida e fácil, mas aumentam o risco de se manipular a resposta.

- Itens com escalas de avaliação


- Frequentes na avaliação de atitudes.
- Respostas são vistas num contínuo de opções ordenadas (em contraste com os itens de escolha múltipla,
em que as opções são independentes entre si).
- Existem vários tipos de escala, embora os mais comuns sejam: Concordo fortemente, concordo, não
concordo nem discordo, discordo, discordo fortemente; Nunca, (muito raramente), raramente,
ocasionalmente, com alguma frequência, (muito frequentemente), sempre.
- Permitem respostas mais flexíveis e, talvez, mais precisas que os itens dicotómicos.
- No entanto, podem haver enviesamentos de linguagem na interpretação das diferentes opções, ou as
pessoas podem ter tendência a escolher sempre a mesma opção. Ex. NEO-PI-R (Neuroticism
Extraversion and Openness Personality Inventory - Revised).

- Itens de escolha forçada


- Usados principalmente em questionários de personalidade ou atitudes.
- É necessário escolher uma opção entre um conjunto de frases.
- Ex: “Quando está a trabalhar... a. gosta das alturas em que tem que trabalhar arduamente para cumprir
um prazo; b. não gosta de trabalhar sob stress desnecessário; c. tentar planear com antecedência de forma
a não ter que trabalhar sob pressão.
- O nº de alternativas pode variar.
- Este tipo de itens é utilizado com mais frequência em situações de aconselhamento, desenvolvimento
pessoal, ou outras formas de orientação.

Testes Projetivos de Personalidade


- Testes não estruturados (ao contrário dos anteriores).
- Os materiais de teste (estímulos) são ambíguos (ex., borrões de tinta no Teste de Rorschach).
- Pede-se ao indivíduo que dê uma resposta espontânea.
- O pressuposto é que a interpretação que cada um faz de um estímulo ambíguo reflete as suas
características únicas.
- Teste Projetivo de Personalidade é um teste concebido para revelar emoções escondidas e conflitos
internos através de respostas de um sujeito a estímulos ambíguos. Em vez de ser marcado com um padrão
universal como num teste de personalidade objetivo, o conteúdo de testes projetivos de personalidade
são analisados por significado (Francis Galton).

23
Estandardização e tipos de escalas e itens

Estandardização...
- Na administração - procedimentos e instruções são os mesmos para cada pessoa que responde ao
teste.
- Na interpretação - existe informação normativa sobre como é que diferentes grupos responderam,
que está disponível no manual técnico; os valores obtidos pela pessoa são comparados com essa
informação (está abaixo, na média ou acima).

Administração dos Testes


- Aspetos a considerar -

- Criar um ambiente formal mas agradável (luminosidade, sonoridade e interrupções, ergonomia do


mobiliário, etc.).
- Explicar a natureza e finalidade dos testes (consent. informado).
- Seguir rigorosamente as instruções de aplicação e dar instruções claras e precisas (tarefa a desenvolver,
modo de registo, tempo disponível).
- Realizar e corrigir o exemplo/treino com os sujeitos (quando existem).
- Garantir que não existem dúvidas, antes de iniciar a tarefa.
- Garantir que todos os sujeitos iniciam a prova ao mesmo tempo (se for aplicação coletiva).
- Utilizar um cronómetro para controlar o cumprimento do tempo.
- Algumas características do sujeito:
- Ansiedade bloqueante vs desafiante.
- Relação com demais sujeitos e avaliador.
- Bem-estar físico e psicológico.
- Cansaço e fadiga fisiológica.
- Expectativas face aos objetivos e resultados esperados

Cotação dos Testes


- Aspetos a considerar -

- Os testes de avaliação têm “ferramentas” para contabilizar os resultados obtidos, que devem ser
usados com rigor:
- Grelhas de correção/cotação
- Instruções e/ou critérios de correção/cotação
- Respostas corretas às questões
- É possível obter 2 valores:
- Resultado bruto (RB) - número/valor total de respostas corretas, ou pontuação total, para cada
teste.

24
- Resultado normalizado/padronizado - Comparação do RB com os valores do grupo de referência
(idade, sexo, escolaridade), com base nas normas. Estes valores são apresentados em tabelas.

Análise dos Testes


- Aspetos a considerar -

- Os resultados obtidos nos testes de avaliação devem ser analisados:


- A nível individual (de acordo com o domínio que avaliam).
- Forma integrada/como um todo (o conjunto dos resultados é representativo do funcionamento
global do sujeito).
- Mediante comparação com os restantes elementos de diagnóstico (entrevista, observação direta).
- Para se efetuar a análise de resultados do modo mais correto, deve recorrer-se ao manual do teste
(quando disponível).

Características diferenciadoras de um teste/medida de avaliação psicológica (≠ teste “de revista”):


1. A existência de um racional científico para o que está a ser medido;
2. Um explicação sobre como o teste foi construído;
3. Procedimentos estandardizados de administração;
4. Uso de uma larga amostra para estabelecer normas [que deveria ser, em rigor, representativa];
5. Evidências de fidelidade e de validade;
6. Outros indicadores como sejam a acuidade (quanto é que a medida se aproxima do valor real) e de
precisão (quanto é que a medida é reprodutível);
7. Orientações na interpretação.

TESTES/ESCALAS/PROVAS PSICOLÓGICAS
COMPONENTES BÁSICOS: ESCALAS E ITEMS

Componentes básicos da Avaliação Psicológica: Escalas e Itens


- Tudo começa, em qualquer instrumento, no construto/característica/variável que se quer medir;
- O termo construto é mais vago e refere-se a algo que não é necessariamente observável; o termo
variável diz respeito à realidade observável;
- Determinada característica/variável varia de pessoa para pessoa, mas em cada pessoa assume um
só valor, num dado momento.
- Então os construtos/variáveis existem numa quantidade => são mensuráveis e medimo-
los/avaliamo-los criando itens e usando escalas.
- Variável: característica ou atributo que pode tomar diferentes valores ou categorias. As variáveis
podem ser qualitativas (assumindo apenas valores categoriais) permitindo apenas descrever
sujeitos/situações: dicotómicas (2 categorias); e politómicas (3/+ categorias). Ou quantitativas
(podendo assumir valores numéricos, reportados a uma unidade de medida ou ordem): discretas
(quando as variáveis apenas podem tomar valores inteiros); e contínuas (quando as variáveis podem
tomar um qualquer valor inteiro ou fracionado dentro de um continuum).
- Por medição/uso de escalas (de resposta) entende-se a atribuição de números a observações.
- Os números podem significar que uma observação pertence a uma categoria ou que a observação
tem mais ou quantidade de uma propriedade.
- ESCALAS: permitem transformar as respostas das pessoas em pontuações/números que são a forma
de medir características (qualitativas/quantitativas); existem diferentes tipos de escalas.

25
- ITENS: unidades de medida numa escala; são o motor da medida, ao “provocar” respostas; a sua
quantidade e qualidade são exigências importantes para uma boa medição.

ITENS:
- Exemplo de item (“motor” que provoca uma resposta).
- Exemplo de observação pertencente a uma categoria: se respondi “portuguesa” é-me atribuído o
nº1/categoria 1.

- Exemplo de escala em que a observação tem mais ou menos quantidade de uma propriedade.

ESCALAS:
- ESCALAS DE MEDIDA USADAS NOS ITENS E NOS TESTES PSICOLÓGICOS [Classificação de Stevens
(1940)]

- Escalas nominais / categorial:


- nomeia/descreve objetos/coisas, recorrendo a números, sem existir qualquer relação de
ordem/distância entre eles;
- os números não traduzem grandezas ou quantidades;
- escalas classificativas: as categorias correspondem a diferentes características de um atributo,
mas não possuem ordem;
- refletem diferenças qualitativas em vez de quantitativas;
- fala-se apenas de classificação e não de medida.
- Implicam mútua exclusividade (cada observação só pode caber numa categoria) e exaustividade
(o sistema de categorias deve ter tantas quantas as necessárias).
- Usadas para enumerar, descrever e contar sujeitos por sub-grupos, dentro de uma amostra. Ex:
sexo, nacionalidade, etnia, área de residência… Ex: “sexo”: atribui-se nº1 e 2; nº1 não significa
que o sexo masculino é “mais” que o feminino; atribuição dos nº é aleatória.
- Os números não podem ser usados em qualquer tipo de cálculo.
- Analisam-se frequências absolutas e proporções em cada categoria.
26
- Podem usar-se testes de qui-quadrado; tabelas dei contingência…
- Utilização mais frequente das variáveis nominais: grupos de sujeitos cujas características foram
medidas em escalas superiores de medida são comparadas…
- Escalas ordinais:
- Categorias ordenadas segundo critério definido; pertencer a uma categoria significa ter
mais/menos do que pertencer a outra categoria.
- Definem posição relativa (crescente/decrescente) das pessoas numa característica, sem “ser
preocupar” com a distância entre as posições.
- Assunções de mútua exclusividade e exaustividade aplicam-se.
- Segundo vários autores, os resultados dos instrumentos de avaliação em psicologia são
normalmente expressos em escalas ordinais.
- A ordem assegura comparação de posicionamento mas não determina distâncias entre sujeitos.
Ex: ser o 6º melhor aluno de fluência de inglês, não nos permite dizer quanto é mais fluente que
o 7º, apenas que é mais.
- As diferenças entre os níveis não são iguais. Ex: um atleta que chega em 3º pode diferir do 2º em
frações de seg. e diferir em minutos do 1º e 4º, mas isto não afeta o seu posicionamento.
- Maioria dos investigadores conduz análises paramétricas com variáveis medidas mesta escala
assumindo a natureza intervalar da medida.
- A variável ocupação/profissão é nominal, mas também pode ser ordinal: se a pessoa está na
categoria A, à partida tem mais prestígio social, nível educacional e rendimento económico maior
que o da categoria B. Não conseguimos é determinar as distâncias entre categorias.
- Análises: coeficientes de correção de Spearman e Kendall, testes de significância de diferenças
entre grupos baseados na ordenação dos casos: U Mann Whitney e Kruskal Wallis; Wilcoxon…

- Escalas de intervalo/intervalares
- Muitos autores: nível mínimo do que se pode considerar uma medida;
- Para além do posicionamento (em categorias), as distâncias entre as categorias são conhecidas
e estão estabelecidas. A diferenciação dos sujeitos assume um valor quantitativo constante ao
longo da escala (daí serem escalas de intervalos/pontos).
- A distância dos pontos entre si é igual: a distância entre o ponto 1 e o ponto 3 é duas vezes a
diferença entre o ponto 1 e o ponto 2; num termómetro dois graus de diferença entre os 38 e 40
significa exatamente o mesmo que 2 graus de diferença entre os 10 e os 12 graus.
- Claro que a distância métrica pode não corresponder totalmente à distância subjetiva. Com a
maioria das variáveis em psicologia, uma verdadeira escala intervalar é inalcançável -> se a
maioria das medidas em psicologia supõe a existência de uma escala intervalo, tal trata-se apenas
de uma aproximação; o uso de correlações de Pearson/testes t de student estariam interditos à
maioria dos estudos se não se assumisse esta aproximação.
- Nestas escalas não existe um “ponto zero” (apenas um zero “não absoluto”). Ex: temperatura;
horas, minutos e segundos; etc.
- Em psicologia, os somatórios de escalas compostas por itens ordinais são frequentemente
tratados como correspondendo realmente a escalas intervalares. Ex: determinadas escalas acerca
de nível de ansiedade, inteligência, psicopatia ou outras características de personalidade).

27
- Escalas de razão
- Escalas ideias de medida: existe “zero absoluto” (total ausência do que é medido).
- Escala com características das escalas intervalares, em que a “distância entre as observações” é
dada em relação ao “zero absoluto” (se uma pessoa pesa 120 kgs pesa o dobro de outra que pesa
60 kgf, o que não ocorre se não houver “zero” como no caso da inteligência). Ex: rendimento,
tempo de reação, idade…
- Em psicologia são raras as medidas deste nível: como definir a inexistência de uma característica
(ex: introversão-extroversão; total ausência de conhecimento da escola)?

RESUMO:

Relação entre as escalas de medida dos itens de uma prova psicológica e as análises estatísticas

- Escala nominal: classificação e contagem; modelo estatístico não paramétrico; procedimento:


frequências; % acumuladas; qui-quadrado; r-bisserial.
- Escala ordinal: valores ordenados e diferenças tomando os postos; modelo estatístico não paramétrico;
procedimento: rho de Spearman; t-wilcoxon; teste de sinais; mann-whitney.
- Escala intervalar: intervalos iguais e zero não absoluto; modelo estatístico paramétrico; procedimento:
média; desvio-padrão; frequências; análise de variância; r de Pearson.
- Escala proporcional: intervalos iguais, zero absoluto e razão entre quantidades; modelo estatístico
paramétrico; procedimento: regressão.

28
Escalas de resposta e construção de instrumentos de avaliação psicológica
TESTES/ESCALAS/PROVAS PSICOLÓGICAS

Escalas de resposta:
- As escalas de resposta mais frequentes são as escalas de tipo Likert e as escalas dicotómicas, no
entanto, convém ter noção das outras opções disponíveis.
- Likert; Visuo-analógicas; Thurstone; Guttman; De diferencial semântico; De escolha forçada; e
Dicotómicas.
- Obs: não confundir com escala de medida de uma variável do sistema de níveis de Stevens.

ESCALAS DE TIPO LIKERT


- Composta por afirmações, em que os respondentes devem indicar concordância/discordância, ou
frequência, numa escala de intensidade crescente ou decrescente.
- Cada item é medido numa escala de tipo ordinal (sistema de Stevens).
- Incluem vários itens, que em conjunto (i.e., através do seu somatório ou média) produzem uma
determinada “nota” ou pontuação (esta pontuação total é frequentemente tratada como uma variável
intervalar [sistema Stevens]).
- Frequentemente usam-se escalas de 5 pontos, como Likert defendeu (cotadas de 0 a 4 ou de 1 a 5, p.ex),
mas poderão conceber-se escalas de 3, 4, 6, 7, 8, 9... pontos/alternativas de resposta.
- Exs:
- 1) Concordo totalmente; 2) concordo; 3) indeciso; 4) discordo; 5) discordo totalmente;
- 1) Nunca 2) Poucas vezes 3) Muitas vezes 4) Sempre ou quase sempre;
- 1) nada importante; 2) pouco importante; 3) suficientemente importante; 4) importante; 5) muito
importante.

ESCALA VISUO-ANALÓGICA (EVA ou VAS)


- Idêntica à de Likert, mas pode assumir-se que cada item é uma variável contínua (e não discreta, como
nas escalas de Likert).
- Deve assinalar-se o grau de concordância/discordância com uma afirmação, ou onde se posiciona, numa
escala normalmente colocada na horizontal = linha, entre dois extremos (e.g., «concordo bastante» e
«discordo bastante»).
- Ex: 0 _________________________________________ 10 -> RESULTADO: medição em cm (p.ex., régua),
do ponto assinalado pelo sujeito; ou escala de 0 a 100 (mm). Uma escala pode ser composta por vários
itens assim medidos e a pontuação total pode obter-se por soma dos itens.

ESCALA DE TIPO THURSTONE


- São constituídas por um conjunto de frases (itens) em relação às quais o sujeito avaliado deve manifestar
o seu acordo ou desacordo.
- Mede-se a atitude do sujeito fazendo a média ponderada dos itens em que houve acordo.
- Os factores de ponderação são calculados na fase de construção da escala.

MÉTODOS DE CONSTRUÇÃO:
- 1. Método das Comparações Emparelhadas: Premissa: se existir um nº grande de afirmações sobre
atitudes e se se fizerem comparações emparelhadas dessas afirmações numa dicotomia favorável-
desfavorável, será possível ordenar as informações num contínuo favorável-desfavorável com base na
indicação de qual a afirmação de cada par mais favorável do que a outra.
29
- 2. Método dos Intervalos Sucessivos ou Julgamento Categorial
- 1) Solicita-se a um nº elevado de juízes (50 a 300) que classifiquem de modo independente cada uma
das muitas afirmações em 11 categorias que variam do “mais favorável” ao “menos favorável”,
passando por um ponto neutro.
- 2) Com base na classificação dos juízes encontra-se uma média para cada item (fator de ponderação).
Os itens com DP muito elevado e que não tenham distribuição normal são eliminados visto haver
grande discordância entre juízes. Os itens retidos apresentam os diferentes coeficientes de
ponderação encontrados, com base nos quais se calcula a nota do indivíduo.

ESCALA DE TIPO GUTTMAN OU CUMULATIVA


- Mede a intensidade da atitude com base num conjunto de itens.
- É composta por um conjunto de frases (itens) organizadas de forma hierárquica e em relação aos quais
se pede ao sujeito avaliado que manifeste a sua concordância ou não.
- Usa a técnica de escalograma: ordenação dos itens de forma a garantir um crescendum na atitude, desde
a mais desfavorável até á mais favorável (técnica de classificação hierárquica):
- O pressuposto é de que, se o sujeito concordar com um item, também tenderá a concordar com os
itens de nível inferior.
- Objetivo do escalograma é construir uma escala ordinal cumulativa.
- A cotação de um sujeito em relação a um determinado grupo corresponde ao nível mais baixo da
escala que ele tiver assinalado.

ESCALA DE DIFERENCIAL SEMÂNTICO


- Questionários com listas de adjetivos bipolares como bom-mau; agradável- desagradável; simpático-
antipático.
- Cada par bipolar está ligado por uma escala com 7 pontos (ou mais): os dois extremos correspondem aos
adjetivos contrastantes.
- Pode ser usada com qualquer termo/conceito: amor; doença...e alargada a outros que geram atitudes:
política; televisão; desportos...
- Sujeitos têm de colocar um círculo no ponto da escala que indica a sua atitude.
- Escala intuitiva até para crianças; para quem tem dificuldade a responder a escalas de Thurstone ou
Likert...
- A atitude ou pontuação da pessoa é calculada somando as pontuações em todos os itens ou calculando
a média da pontuação total ou das dimensões.

ESCALAS DE ESCOLHA FORÇADA


- Pede-se ao respondente que escolha entre duas afirmações que sejam igualmente “apelativas”.
- Uma afirmação representa um dos atributos, enquanto a outra afirmação representa o oposto ou não
representa o atributo em estudo. Se houver mais de duas alternativas a terceira escolha consiste num
item de elevada desejabilidade social.
- Ex: Escala de locus de controlo interno vs. Externo, de Rotter
- Escolha a opção que melhor a/o descreve:
- Muitas das “coisas” más que acontecem às pessoas, acontecem por azar.
- Os azares que acontecem às pessoas resultam dos seus próprios erros.

30
ESCALAS DICOTÓMICAS
- Escalas de escolha forçada em que o respondente tem de escolher entre duas respostas antagónicas, do
tipo sim-não; certo-errado; falso-verdadeiro.

- NOTA: sobre inversão de itens: Serve principalmente para atenuar tendências de respostas aleatórias
(itens invertidos deverão ser mencionados no manual da prova!!).
Construção de instrumentos de avaliação psicológica

Recolha dos itens:


- A construção de um teste inicia-se pela recolha de um conjunto de itens • Esta recolha pressupõe uma
definição prévia dos seguintes parâmetros:
1. Âmbito e objetivos do instrumento a construir (ex: diagnosticar traços internos, avaliar dimensões
do comportamento objetivo, ser um teste de screening, definir intervenções, predizer
comportamentos, etc.).
2. População a que se destina o teste (ex., grupo etário, etc.).
3. Característica ou dimensão a avaliar (construto: uni ou multidimensional?).
4. Aspetos comportamentais a integrar que explicitam o construto.

- Para a definição destes parâmetros deve-se:


- Fazer uma boa revisão de literatura na área.
- Identificar instrumentos anteriores que avaliem o mesmo construto ou construtos semelhantes.
- Identificar especialistas na área.
- Definir se o instrumento terá uma ou mais dimensões.

Formulação dos Itens:


- Através da operacionalização do construto em termos de comportamento manifesto, vamos formular um
1º conjunto de itens para a prova.
- Este conjunto deve ter aproximadamente o dobro dos itens desejados para a versão final do instrumento.
- Uns vinte itens poderão ser necessários para cumprir um equilíbrio entre validade e consistência.
Tendo este nº em mente, o processo de construção deve iniciar-se com o dobro dos itens.
- Neste momento deve decidir-se:
1. No de itens a incluir na versão final.
2. Grau de dificuldade dos itens ou grau de intensidade dos comportamentos em função dos sujeitos
e dos objetivos a que se destina.
3. A forma (muito/pouco estruturados, etc.) e o conteúdo dos itens.
4. Forma de aplicação do teste (ex., aplicação individual/colectiva, auto-administrados, etc.).

- É importante ter as instruções, os exemplos e os exercícios de treino (se houver) definidos antes de
avançar para qualquer aplicação, para assegurar a validade dos resultados.
- Como recolher a amostra de itens inicial?
- Consulta da população-alvo (ex., “o que é para si uma situação ansiosa?”).
- Consulta de especialistas na área.
- Leitura de bibliografia sobre o construto e sobre instrumentos com algumas semelhanças.

- Importante assegurar que os itens representam comportamentalmente o construto a avaliar, seguindo


alguns princípios...
31
Princípios relevantes na formulação dos itens:
1. Formulação objetiva, ao nível do: a) conteúdo (evitar impressões e focar-se nas capacidades,
comportamentos e atitudes
objectivas do sujeito); e b) escala de resposta (uma escala de Likert de 9 pontos pode fazer com que
seja difícil precisar os vários pontos intermédios).
2. Formulação simples (correspondência um item - uma tarefa/ uma ideia) -> Itens complexos
dificultam a interpretação da resposta.
3. Itens relevantes para o domínio e objetivo da avaliação -> Imprescindível informação prévia:
literatura, especialistas, etc.
4. Itens formulados para a amplitude do domínio que se quer avaliar -> Captar o grau de variedade
específico do domínio: ex., itens fáceis, médios e difíceis em testes de aptidão; diferentes graus do
sintoma num teste de ansiedade; etc.
5. Itens credíveis (face validity ou validade aparente), para evitar atitudes desfavoráveis ao teste -> O
item não deve parecer ridículo, despropositado ou infantil, no caso de testes para adultos, por ex.
6. Itens claros e inteligíveis, mesmo para extratos sócio-demográficos mais baixos da população a que
se destinam -> Frases curtas, expressões simples, etc; Itens que se reportam a comportamentos e
não a abstrações.

Análise e seleção dos itens:


- Podem-se conduzir vários estudos exploratórios qualitativos (1º) e quantitativos (2º), que levem a
reformulações, acrescento ou exclusão de itens, ou parâmetros comportamentais a examinar.
- ANÁLISES QUALITATIVAS
- Análises realizadas para avaliar o conteúdo e a forma dos itens (clareza, compreensibilidade e
adequação aos objetivos da prova).
- Possibilidades mais comuns: Consulta de especialistas com experiência prática no domínio;
“Reflexão Falada” (“Thinking Aloud”); e “FocusGroup”.

- Consulta de especialistas (EXEMPLO DE CRITÉRIOS PARA UMA APRECIAÇÃO QUALITATIVA DE ITENS


(Angleitner, John & Lohr, 1986, p. 85, cit. por Alferes, 1997, p. 126)):
- COMPREENSIBILIDADE
1. Compreende imediatamente o item após a primeira leitura.
2. Depois da primeira leitura, tem de voltar a ler algumas partes do item.
3. Depois da primeira leitura, pelo menos uma parte do item é completamente incompreensível.
4. Para compreender o item, tem de aplicar conscientemente regras gramaticais ou lê-lo pelo menos 3
vezes.

- AMBIGUIDADE
1. O item não comporta qualquer ambiguidade.
2. Só sendo muito exigente se poderá descobrir uma ligeira ambiguidade, a qual, contudo, não tem
consequências práticas.
3. Se lermos cuidadosamente o item e refletirmos sobre as possíveis respostas, torna-se evidente que o
item não pode ser respondido sem ambiguidade.
4. O item é obviamente ambíguo.

- ABSTRAÇÃO
1. o item é concreto em todos os seus aspetos.
2. Os aspetos mais importantes do item estão redigidos em termos concretos; a impressão global é
concreta.
3. Os aspetos importantes do item estão redigidos em termos abstratos: a impressão global é abstrata.
32
4. O item não tem qualquer referência concreta.

Método da Reflexão Falada:


- Método da reflexão falada ou “thinking aloud”
- Aplicação oral e/ou escrita da prova junto de sujeitos representativos dos futuros destinatários, que
devem fornecer feedback relativo a cada item.
- De um modo simples, encoraja-se o participante a verbalizar tudo o que lhe ocorra enquanto
responde a cada item (incluindo se considera algum item confuso ou incompreensível) -> Registo das
verbalizações do sujeito (importante: não discutir com o sujeito, mas apenas ouvir, registar e
eventualmente pedir para clarificar o que pensa).

- Vantagens
1. Identificação de ambiguidades associadas ao formato e conteúdos dos itens.
2. Identificação dos processos e estratégias usadas pelos sujeitos nas suas respostas, e em que
medida estão de acordo ou contrariam o sentido da avaliação em causa.
3. Apreciação da eficácia e qualidade das várias alternativas de resposta formuladas.
4. Identificação de alguns aspetos peculiares ou dificuldades acrescidas apresentadas por algum
item.
5. Conhecimento das atitudes gerais dos sujeitos face aos itens propostos ao longo da prova.
6. Deteção de itens mal construídos.
7. Primeiro nível de conhecimento das dificuldades sentidas pelos sujeitos na resposta à prova.
8. Primeira perceção da adequação/suficiência das instruções, e uma estimativa do tempo
requerido para a realização da prova.

- Desvantagens
1. A nossa capacidade de registo do feedback dos sujeitos é limitada e equipamento de registo
pode provocar enviesamentos nas verbalizações.
2. Técnica depende de boas capacidades de interiorização, verbalização e expressão por parte
dos sujeitos (difícil com alguns grupos etários ou com baixa escolaridade).

A consulta de especialistas também pode ser efectuada na fase de análise qualitativa dos itens. Pode
também discutir-se com eles a informação recolhida durante a reflexão falada.

Focus Group:
- Objetivo: Avaliar formas alternativas de construir itens ou mesmo, numa fase inicial, para auxiliar na
construção dos itens.
- Pode usar-se em simultâneo com a Reflexão Falada, ou na sequência dela.

Análise e seleção dos itens:


- Após refinamentos/alterações introduzidos na escala/prova decorrentes das análises qualitativas, vai-se
administrar a versão provisória resultante a uma amostra extraída da população a quem se destinará a
escala final.
- De seguida, proceder a ANÁLISES QUANTITATIVAS dos itens.

ANÁLISES QUANTITATIVAS DOS ITENS:

1. Índice de dificuldade ou dispersão das respostas numa amostra de sujeitos avaliados - da maior
pertinência em testes de desempenho [análises relacionadas com a “validade interna” do item e com a
consistência interna da prova/escala:].

33
2. Capacidade discriminativa do item: A. Em que medida o item consegue diferenciar entre grupos que
obtêm as pontuações mais baixas versus elevadas na prova/escala?; B. Correlação item-total corrigido:
o resultado num item está relacionado com o resultado final na prova (depois de retirada a influência
desse item no resultado final)?
3. Contribuição do item para consistência interna da escala/prova: determinação do coeficiente alfa de
Cronbach da prova/escala retirando o item.
4. Correlações inter-item: o resultado num item está relacionado com as respostas aos demais itens?
5. Correlação com critérios externos, e.g., outra prova, notas escolares, diagnósticos clínicos, etc...
(validade “externa” do item)

1. Índice de Dificuldade (ID)


- Muito pertinente em testes de desempenho referenciados a normas (testes que pretendem efetuar uma
comparação inter-individual de resultados).
- Proporção de sujeitos que consegue realizar corretamente o item. -> ID = C/N em que: C = no dos que
acertaram; N = amostra global; Nota: a amostra global integra: os que acertaram/C, os que falharam/E e
os que omitiram/O (omissão por dificuldade).

- Leque de valores possíveis na escala do índice de dificuldade varia entre ID=.00 (nenhum sujeito resolveu
corretamente) e ID=1.0 (todos responderam corretamente). (QUANTO ˃ o valor, mais fácil é o item).
- Através da proporção de acertos e erros a um item, obtemos a sua variância.
- A máxima variância obtém-se com itens de ID = 0.50 muito importante nas provas que vão seriar
sujeitos/pretendem máxima comparabilidade interindividual dos resultados.
- Podemos comparar melhor sujeitos entre si recorrendo a itens com índice médio de dificuldade.
- Uma máxima diferenciação em testes centrados em normas obtém-se: com itens de dificuldade perto de
.50 e itens que se aproximam dos limites de dificuldades (.00 e 1.0).

Assim, um teste de desempenho deverá incluir:


- Maioria de itens de dificuldade intermédia: proporcionam maior variância dos resultados (trata-se de
uma probabilidade estatística). Então, fará sentido reter mais itens nesse grupo, mas não todos... Com
efeito, num teste também fazem falta:
- Alguns itens particularmente fáceis - servem de incentivo, aprendizagem e/ou diferenciação para sujeitos
com dificuldades particulares de desempenho nas características avaliadas.
- Alguns itens particularmente difíceis e capazes de diferenciação dos sujeitos com elevado desempenho
nessas características.

Determinados autores sugerem a proporção de itens de acordo com índices de dificuldade.


- Por ex., Garrett (1962) recomenda: 50% de itens com IDs entre 0.25 e 0.75; 25% com ID < 0.25; 25% com
ID > 0.75.
- Assim:
- ID < 0.25-0.30 -> dificuldade elevada
- ID de 0.25-0.30 até 0.75-0.80 -> dificuldade média
- ID > 0.75-0.80 -> dificuldade baixa

34
Cuidados a ter!
- Ter em conta as omissões de resposta...
- Quando são omissões intercalares podem traduzir erro ou dificuldade.
- Mas na parte final da prova podem significar falta de tempo. (Neste caso, não entrar com as
omissões no cálculo do índice).
- Ideal: aplicar testes sem limite de tempo quando se pretende realizar estas análises.
- O cálculo deste índice em testes de velocidade e de acuidade percetiva não faz sentido (a dificuldade
real depende do pouco tempo disponível para a realização da tarefa e não dos processos mentais
envolvidos).
- No cálculo deste índice há que atender, ainda, às alternativas de resposta e ao acaso nas respostas.
- É necessário realizar o cálculo, item a item, da percentagem de respostas atribuídas a cada
uma das alternativas, sendo que: Nos itens de dificuldade intermédia nenhuma alternativa
deve apresentar maior número de escolhas que a alternativa correta; Nos itens muito fáceis
ou muito difíceis a distribuição dos sujeitos será em conformidade com o grau de dificuldade;
- Respostas ao acaso afetam objetividade da avaliação:
- Não podemos dizer que a nota final é apenas fruto da capacidade resolutiva do sujeito ou “nota
verdadeira”.
-
Este problema agrava-se com um nº reduzido de alternativas de resposta a cada item.
=> O formato de item mais problemático é o dicotómico (V/F ou A/B): 50% de possibilidade de acertar sem
conhecimento efetivo da resposta correta.

- Gronlund (1976) calculou nível médio de dificuldade dos itens dado o nº de alternativas.
- Várias fórmulas de correção do índice de dificuldade dos itens aparecem nos manuais para atenuar
os acertos devidos ao acaso (e.g. fórmula de Garrett, 1962).

2. Poder Discriminativo
- Grau em que o item diferencia no mesmo sentido que o teste global (melhores desempenhos no teste
correspondem a melhores desempenhos no item e vice-versa).
- Em testes de desempenho implica que: sujeitos melhores e piores realizadores deverão responder de
forma diferente num item como elevado poder discriminativo, acertando e falhando percentualmente
mais, respetivamente.
- Avaliamos as qualidades métricas de um só item, por referência ao próprio teste ou ao conjunto dos
outros itens (também se fala em validade interna do item).
- Poder Discriminativo é dado por um coeficiente de correlação (varia entre -1.0 e +1.0):
- Valor de 0.0 = poder discriminativo nulo (i.e., igual no de sujeitos fortes e fracos acertam ou falham
o item).
- Coeficiente negativo: sujeitos com pior desempenho no teste global realizam melhor o item.
- Coeficiente positivo: sujeitos com melhor desempenho no teste global realizam melhor o item.
- Normalmente não se inclui o item em causa no cálculo de médias, d.p., totais, etc. para a escala completa,
para não inflacionar os valores obtidos.
- O poder discriminativo pode ser calculado através de um coeficiente de correlação bisserial quando a
resposta ao item é de tipo dicotómica (certo ou errado) (fórmula Glass & Stanley, 1970).

35
- Obtém-se coeficiente item×total corrigido (corrected item total correlation): um dos outputs disponíveis
(SPSS) quando, com escalas com itens ordinais (Likert), se calcula o alpha de Cronbach (mais usado)

Procedimento “grupos constrastantes”:


- Formar um grupo superior (25% que teve melhor resultado no teste) e um grupo inferior (25% que teve
pior resultado no teste);
- A capacidade discriminativa do item corresponde à diferença entre os que responderam corretamente ao
item nos 25% superiores e os que respoderam corretamente nos 25% inferiores.
- Quanto maior o valor, maior a capacidade discriminativa do item.

Relação entre índice de dificuldade e poder discriminativo:


- Itens muito fáceis ou muito difíceis têm menor capacidade de discriminação dos sujeitos entre si.
- Itens de dificuldade média permitem, à partida, níveis mais elevados de discriminação.
- Em termos de poder discriminativo, interessa manter itens com coeficiente positivo e o mais
elevado possível.
- Em termos de dificuldade, interessa que a maioria dos itens tenha um nível intermédio, e que
existam alguns muito fáceis e alguns muito difíceis.
- Entre dois itens igualmente úteis em termos de dificuldade, manteríamos o que tivesse maior poder
discriminativo.

Valores mais elevados de poder discriminativo associam-se a coeficientes de fidelidade mais elevados (vão
no sentido da maior homogeneidade da prova).

3. Coeficiente alfa de Cronbach excluindo o item


- O Coeficiente alfa de Cronbach é um dos indicadores de consistência interna de uma escala. Quanto mais
elevado o seu valor (máximo 1), tanto maior a consistência interna, o que contribui para a
precisão/fiabilidade de uma escala.
- A determinação de coeficientes alfa de Cronbach excluindo um item de cada vez indica em que medida
cada item individual está a contribuir (ou não) para a consistência interna da escala ou prova:
- Se retirar um item fizer descer (em relação ao valor para a escala completa) o valor do coeficiente,
isso significa que o item contribui positivamente para a consistência interna do instrumento => deve
ser mantido no conjunto de itens que compõem o instrumento.
- Se retirar um item fizer subir o valor, está a prejudicar a escala e deverá ser ponderada a sua exclusão
definitiva.

4. Correlações inter-item
- O resultado num item está relacionado com as respostas aos demais itens?
- Através da determinação de uma matriz de inter-correlações entre os vários itens de uma escala, pode
apreciar-se a magnitude dos coeficientes encontrados.
- As correlações devem ser moderadas (nem muito elevadas, nem demasiado baixas).
- Deve ponderar-se excluir:
- Itens nada correlacionados com outros -> porque talvez não estejam relacionados com o construto
medido pelos restantes itens, colocando em causa a homogeneidade da escala;

36
- Itens que exibam correlações muito elevadas com algum outro item -> porque são provavelmente
redundantes.

5. Correlações com critérios externos


E.g., outra prova, notas escolares, diagnósticos clínicos, etc... (VALIDADE “EXTERNA” do item) ≠ VALIDADE
INTERNA (e.g., poder discrim.)

- Relação entre as respostas dos sujeitos a um item e seu desempenho numa outra situação que não esse
teste (variável critério).
- Múltiplos critérios externos podem ser usados nestas análises, dependendo da disponibilidade, do
construto avaliado e dos objetivos de construção da prova:
- Em provas de desempenho usam-se notas escolares ou parâmetros de realização profissional.
- Em escalas de desenvolvimento recorre-se frequentemente à própria idade ou progressão nas
aprendizagens.
- Em testes de personalidade o recurso mais habitual tem sido o diagnóstico psicopatológico ou
diferentes medidas de adaptação psicossocial dos sujeitos.
- Também é possível recorrer a provas similares já existentes e previamente validadas.
- Os procedimentos de cálculo são diversos.
- Tem de se ter em conta a escala de medida inerente ao formato do item e o tipo de escala em que se
apresenta o critério para correlacionar.

Em rigor, o estudo da correlação com critérios externos já remete para a validade do próprio teste ou prova,
mas neste caso a análise centra-se ao nível de cada item individual enquanto amostra ou representante do
construto medido pela totalidade do instrumento.
Validade interna vs. Validade externa
- Validade interna = consistência ou homogeneidade da prova.
- Validade externa = ligação à prática, poder preditivo do comportamento.
- Ambos os indicadores devem ser o mais elevados possível, mas...
- Nem sempre se verifica esta coincidência... => Então por qual optar?
- Ter em consideração os objetivos da prova, a que fim se destina e o que foi inicialmente definido em
termos da operacionalização do construto:
- Unidimensional = ênfase colocado na validade interna
- Multidimensional = ênfase colocado na validade externa

Organização dos itens na prova:


- Após selecionar os itens que devem constituir a versão final da prova, com base nas análises
qualitativas e quantitativas, é necessário ter alguns cuidados relativamente à organização dos itens
na prova:
- Em testes de desempenho, e sobretudo nos testes de aptidão cognitiva, os itens devem
aparecer organizados hierarquicamente, segundo o seu grau crescente de dificuldade (cria-se
clima de confiança e sentimentos de auto-eficácia; evita-se perda de tempo; etc.).
- Nas escalas de personalidade, inventários de atitudes, questionários de auto-conceito, de
sintomas, etc., deve ordenar-se os itens de forma a evitar o agrupamento dos itens de acordo
com especificidades do seu conteúdo (para minimizar rotinas de resposta, etc.)

37
Sensibilidade, fidelidade e validade

O processo de aferição...
- Implica estudos normativos e o estudo das características metrológicas dos itens e dos resultados.
- Deve incluir toda a informação técnica relevante na análise e apreciação dos resultados:
- Normas ou padrões para interpretação dos resultados brutos
- Sensibilidade
- Fidelidade
- Validade
- É relevante na:
- Construção de um novo instrumento.
- Adaptação de uma prova originalmente construída para um grupo distinto (outro país, faixa etária,
etc.).
- É mais correto reportar os coeficientes de sensibilidade, fidelidade e validade aos resultados de uma
aplicação do teste, e não ao teste em si mesmo -> Um teste pode reunir boas características psicométricas
num dado grupo ou situação, e não noutro.

Sensibilidade dos Resultados:


- Refere-se ao grau em que os resultados de uma prova aparecem distribuídos, diferenciando os
sujeitos entre si nos seus níveis de realização.
- Se as características psicológicas em causa apresentam uma distribuição dos sujeitos próxima da
curva gaussiana, a sensibilidade tem que ver com a adequação dos resultados à distribuição de
acordo com as propriedades dessa curva.
- Consequentemente, os procedimentos de análise estão ligados à análise da normalidade da
distribuição dos resultados.

Procedimentos de análise da sensibilidade:


1. Verificar se o leque de resultados percorre o intervalo entre um no mínimo de itens corretos e o no
máximo de itens da prova;
2. Examinar se a média de resultados se aproxima da mediana e da moda (que se sobrepõem na dist.
normal);
3. Verificar se os resultados se distribuem entre 2.5 e 3 d.p. acima e abaixo da média;
4. Analisar os coeficientes de assimetria e curtose (não devem ultrapassar 1; não se afastam sig da dist.
Normal – Teste KS);
5. Analisar a correspondência entre a distribuição de percentagens observadas em relação às
esperadas, em classes normalizadas (por unidades de DP).

Fatores que afetam o coeficiente de sensibilidade:


1. Reduzido tamanho da amostra e sua representatividade;
2. Itens com enviesamentos particulares (ex: serem muito fáceis ou muito difíceis para o grupo em
causa);
3. Itens ambíguos ou mal hierarquizados;
4. Tempo limite de execução demasiado longo ou demasiado curto, não permitindo a adequada
diferenciação dos desempenhos individuais;
5. Erros na aplicação da prova, falta de envolvimento dos sujeitos na realização da prova, condições
externas ambientais desadequadas, ou instruções mal dadas.

Fidelidade ou Fidedignidade dos Resultados:


38
- Indica-nos o grau de confiança ou de exatidão da informação obtida.
- Duas significações mais habituais:
- O teste avalia o mesmo quando aplicado em 2 momentos diferentes aos mesmo sujeitos
(conceito de estabilidade ou constância dos resultados).
- Os itens que compõem o teste apresentam-se como um todo homogéneo (consistência interna
ou homogeneidade dos itens).
- Os métodos de cálculo da fidelidade assentam em coeficientes de correlação.

Métodos de cálculo da fidelidade:

1. Teste-reteste (mesmo teste)


- A prova é passada duas vezes aos mesmos sujeitos e correlacionam-se os resultados.
- Os coeficientes de correlação a usar dependem da natureza dos resultados (testes paramétricos ou não-
paramétricos de correlação).
- Dificuldades: Custos mais elevados; Justificação aos sujeitos; Manutenção das condições de aplicação;
Intervalo de tempo entre as duas aplicações (Demasiado curto - transferência de aprendizagem ou
informação memorizada da 1ª para a 2ª aplicação; Demasiado longo - alterações nos sujeitos em termos
de desenvolvimento ou aprendizagem).

2. Teste-reteste (formas paralelas)


- Problemas com transferência de aprendizagens mais atenuado;
- Dificuldade em conseguir duas versões equivalentes do mesmo teste (igualdade no conteúdo, dificuldade
e forma);
- As formas paralelas devem ser construídas de forma a poderem ser usadas independentemente e sendo
equivalentes (não é o mesmo teste dividido ao meio);
- Metodologia e procedimentos estatísticos não se afastam do anterior.

3. Acordo entre observadores


- Na observação informal, e na observação sistemática através de listas de comportamento ou grelhas de
observação (com categorias bem definidas, exaustivas e mutuamente exclusivas), utiliza-se o acordo entre
dois ou mais observadores independentes para testar a fidelidade dos resultados numa prova.
- Se 2 observadores independentes produzem registos similares então isso reflete que a observação está a
ser feita de forma objetiva e que a grelha/unidades de observação têm um grau de precisão adequado:
- > 80% de acordo: categoria comportamental forte.s
- Entre 70 e 79%: categoria questionável (necessita de maior precisão).
- < 69% de acordo: categoria fraca, que carece de revisão.
- Necessidade de treino dos observadores
- Fórmula de cálculo: % A = [Na / (Na + Nd)] x 100
- % A = percentagem de acordos
- Na = No de acordos entre observadores -> No de unidades/categorias verificadas em simultâneo
- Nd = No de desacordos entre observadores
- Coeficiente kappa: estatística que mede a concordância entre avaliadores para itens categoriais. É
geralmente considerado uma medida mais robusta do que a simples percentagem de acordo, já que K tem
em conta o no de acordos que ocorrem por acaso (Crosstabs: SPSS).
39
- Quando existem mais de dois avaliadores calcula-se o Kappa de Fleiss (1971). As versões mais recentes do
SPSS já calculam.
- Para avaliações que são feitas numa escala politómica (e.g., Likert) utiliza-se o coeficiente de correlação
intra-classe (ICC). O SPSS calcula este indicador [menu: Reliability].

4. Bipartição do itens
- Aplicação única da prova, realizando-se depois a correlação entre duas metades formadas pela divisão
dos seus itens.
- Não se deve dividir a prova entre 1a metade e 2a metade dos itens (efeitos de fadiga, envolvimento,
dificuldade, etc.). Melhores itens alternados, por ex.
- Aplicação da fórmula de correção de Spearman- Brown para estimar o coeficiente esperado (atenuar o
efeito negativo da menor variabilidade de resultados devida ao menor no de itens em relação à prova
completa):

r est = coeficiente estimado n = no de vezes que o teste é partido


r ii = coeficiente de correlação (duas metades)

- Vantagens e desvantagens
- Método de fácil aplicação à maioria das provas, exceto de velocidade.
- Uso de resultados de uma única aplicação elimina variações devidas a alterações durante o intervalo
de duas aplicações.
- Mas erros ocasionais distribuem-se por ambas as metades podendo inflacionar o coeficiente final
(ainda mais se for um teste com poucos itens).

5. Consistência interna
- Aplicação única da prova.
- Reflete o grau de uniformidade ou de coerência existente entre as respostas dos
sujeitos a cada um dos itens que compõem a prova.
- Avalia a homogeneidade dos itens e a intercorrelação entre os itens e a escala total.
- Itens de resposta dicotómica: coeficiente de Kuder-Richardson.
- Itens com resposta em escala ordinal (tipo Likert): coeficiente alpha de Cronbach.
- É um dos mais utilizados índices de fidelidade.
- Desejável coeficientes > .70.
- Por vezes é necessário aumentar o no de itens para se conseguirem coeficientes de consistência interna
aceitáveis.
- A consistência interna de uma escala depende da homogeneidade dos itens que a compõem.
- Análises de itens típicas em escalas:
- Correlação item-total (no mínimo 0.2, sendo usualmente desejável 0.3);
40
- Em provas de desempenho: índice de dificuldade do item
- Coeficiente alfa de Cronbach excluindo o item
- Poder discriminativo dos itens entre grupos extremos (ex.: definidos através de quartil superior e
inferior, ou M ±2/3DP

- Valores norteadores acerca do coeficiente alfa de Cronbach:


- “Mínimo dos mínimos”: 0.6
- Valor mínimo satisfatório: 0.7
- “Bom” se 0.8, “muito bom” se 0.9 (recomendado em contextos clínicos e de seleção).

- No entanto, a apreciação da adequação do valor de alfa de Cronbach também deve ter em conta:
- Os contextos/finalidades de aplicação do teste (ex.: 0.6 pode aceitar-se para fins de investigação,
ao passo que se exige pelo menos 0.9 para fins de seleção);
- A extensão do teste/escala (i.e, o no de itens): quanto mais extenso o teste, tanto mais elevado
tende a ser o coeficiente alfa de Cronbach, o que não significa que o teste seja melhor.
- Um valor de 0.9 num teste com muitos itens pode parecer ótimo, mas significar apenas que
existem vários itens redundantes/repetidos, ao passo que para um teste com um reduzido no
de itens não redundantes (e.g., 5) um coeficiente alfa de 0.7 poderá ser bastante apropriado.

Erro padrão da medida:


Fontes de erro na observação:
1. Erros de amostragem (representatividade da amostra).
2. Erros instrumentais (qualidade dos instrumentos).
3. Erros pessoais (particularidades de cada sujeito ou procedimentos peculiares de resposta).
4. Erros sistemáticos (associados a um fator sistemático não controlado).

5. Erros aleatórios (causas não conhecidas).

41
EPM = Erro padrão da medida
DP = Desvio-padrão dos resultados na prova
r = Coeficiente de fidelidade calculado
ii

O que é a validade:

Duas significações para validade:


1. O teste mede aquilo que pretende medir (ênfase da psicometria clássica - relacionado com o poder
preditivo dos testes).
2. Relacionada com o conhecimento que possuímos daquilo que o teste está a medir - o construto (maior
preocupação com a significação psicológica dos resultados no teste).

Precauções no uso do termo validade:


I. Diz respeito aos resultados obtidos e não ao teste em si mesmo.
II. Não obedece ao princípio do “tudo ou nada” – pode ser gradual.
III. Os coeficientes obtidos vão depender do tipo de critérios utilizados.

=> Validade de conteúdo; validade por referência a um critério; validade de construto ou conceito.

- O grau em que todas as evidências acumuladas corroboram a interpretação pretendida dos valores de um
teste.
1) Validade é questão de grau.
2) Validade é propriedade dos scores e não do teste per se,

Visão clássica da Validade:

1) Validade de Conteúdo
- Em que medida o teste avalia o construto de interesse;
- Incide sobre questões gramaticais, semânticas, lexicais;
- Adequação do número de itens e dimensões ao construto avaliar;
- Processo importante na construção de instrumentos de avaliação psicológica.
-
Grau de adequação dos itens em relação à dimensão do comportamento avaliada pela prova
(construto), em termos de: Relevância (todas as dimensões do construto estão reunidas nos itens
da prova); Representatividade (dimensões mais importantes correspondem a um maior no de itens).
2) Validade de Construto
- Ligada ao 2º sentido do conceito de validade: grau em que conhecemos aquilo que a prova está a
medir -> ≈ Validade concetual ≈ validade de construção ≈ validade hipotético-dedutiva.
- Noção mais teórica e global de validade.
- Grau de consonância entre os resultados no teste, a teoria e a prática relativa às dimensões a serem
avaliadas.
- Processo de validação dos próprios modelos teóricos subjacentes (ex: estrutura fatorial dos
resultados em grupos de teste).
- Processo inacabado: validade que apela a uma acumulação gradual de informação.

42
3) Validade de Critério
- Muito ligada ao 1º conceito de validade (“o teste mede o que é suposto medir”).
- Avaliada através da relação entre os resultados na prova e o desempenho dos sujeitos em critérios
externos associados à dimensão psicológica que a prova avalia -> ≈ Validade externa ≈ validade
empírica ≈ validade de critério.
- Pode subdividir-se em:
- Validade concomitante ou concorrente - quando se verifica a simultaneidade no tempo entre
a aplicação do teste e a obtenção dos valores reportados ao critério; Permite avaliar os
resultados do teste em comparação com critérios que medem dimensões semelhantes.
- Validade preditiva ou de prognóstico - obtenção não simultânea dos resultados no teste e no
critério; por norma, o critério é obtido posteriormente aos resultados no teste). Interesse deste
tipo de validade: utilização da AP para predizer o comportamento futuro dos sujeitos.

A orientação escolar e profissional, a seleção profissional (adaptação/desempenho do sujeito no


futuro/num cargo/curso...) ou a avaliação de traços de personalidade de um criminoso mostram bem a
importância desta informação “distanciada” no tempo.

- Critérios habituais:
- Critérios mais centrados no desempenho: notas escolares, níveis escolares atingidos, sucesso
profissional, resultados noutras provas psicológicas similares, etc.
- Critérios mais voltados para aspetos de personalidade: diagnóstico clínico, resultados da
observação direta ou entrevistas, auto-avaliações, relatos do sujeito por outros significativos e
resultados noutras provas similares.

Os cálculos deste tipo de validade assentam em estudos correlacionais que vão depender do tipo de escalas
de medida da prova e do “critério”. As análises de regressão complementam o estudo da validade preditiva.

Notas sobre validade facial:


- Perceção da prova como estando a avaliar aquilo que pretende medir (teste parece medir aquilo que
é suposto) (tanto para o investigador como o sujeito).
- Nunnally (1995) refere que a validade facial diz respeito à análise dos itens depois do instrumento
ser construído.
- Já a validade de conteúdo fica garantida pela definição do conteúdo e escolha dos itens antes do
instrumento ser construído.
- IMPORTÂNCIA DA VALIDADE FACIAL:
- A aparência dos itens pode interferir nas respostas: afetar cooperação e envolvimento.
- É através desta validade que obtemos a sensação daquilo que o teste pretende medir: para
certas pessoas esta validade é muito importante: não devemos apresentar itens infantis,
situações que lhes pareçam absurdas para a idade/nível de escolaridade.
- Problema mais frequente em testes de interesses e personalidade.

Visão atual da Validade (2014):


1) Evidências de Validade de Conteúdo
2) Evidências de Validade Baseada na Estrutura Interna
3) Evidências de Validade Baseada nas Relações com Medidas Externas

43
- Validade Convergente
- Avaliam construtos semelhantes (validade convergente positiva) ou opostos (validade convergente
negativa).
- O teste deve correlacionar-se significativamente com outras variáveis com as quais o construto medido
pelo teste deveria encontrar-se relacionado.
- Ex: Ansiedade e Stresse

- Validade Discriminante
- 2 variáveis que teoricamente não se relacionam, empiricamente também não se deverão relacionar.
- O teste não deve correlacionar-se com outras variáveis com as quais o construto deveria, em termos
teóricos, diferir.
- Ex: QI e felicidade

- Validade de Critério (Validade Concorrente e Validade Preditiva)


- Validade Concorrente: Relação forte com medidas que avaliem o mesmo construto; A mesma variável
avaliada por 2 medidas distintas.
- Validade Preditiva: Remete para predição do comportamento futuro; Exige estudos longitudinais.

4) Evidências de Validade Baseada no Padrão de Respostas

- Avaliações teóricas e empíricas sobre a forma como os participantes respondem à escala e seus processos
envolvidos.
- Grupo focal
- Entrevista cognitiva (Think aloud Protocol)
- Rastreio ocular (Eye-tracking)
- Tempos de resposta
- Critérios mais empíricos: TRI

5) Validade Consequencial: Remete para os aspetos éticos da avaliação com provas de avaliação
psicológica.

Validade Baseada na Estrutura Interna:

- Estrutura fatorial

Análise fatorial:
- Permite avaliar o nº de dimensões que estão subjacentes a um conjunto de variáveis (itens).
- Investiga-se a ligação entre o conjunto de variáveis observadas (itens) e variáveis latentes (e.g
ansiedade).
- A partir das inter-correlações entre os itens e entre os itens e os resultados, identificam-se os
componentes que podem explicar a variância comum neles encontrada.

44
- A carga factorial de um item no fator traduz em que medida esse item representa
comportamentalmente um dado traço latente: percentagem de covariância entre o item e o
respetivo fator.

Dois tipos de análise fatorial:


- Análise fatorial Exploratória (AFE): muito usado no início dos estudos para verificar como as
variáveis se inter-relacionam;
- Análise fatorial Confirmatória (AFC): visa testar teorias acerca da estrutura subjacente a um
conjunto de variáveis (itens); mais usada em fases mais avançadas...

- A AFE também se divide em:


- Análise de componentes principais (PCA): as variáveis originais são transformadas em conjuntos de
combinações mais pequenas (fatores/dimensões) e toda a variância das variáveis é usada.
- Análise fatorial: os fatores são estimados com um modelo matemático em que apenas a variância
partilhada é usada no cálculo: controla variabilidade devida ao erro.
Análise Fatorial:
- Na análise de componentes principais (PCA): Começamos por testar a adequabilidade dos dados
para serem submetidos a análise fatorial.
- Alguns requisitos para conduzir a análise:
- Tamanho da amostra: para autores como Nunnally, 10 sujeitos por cada item. Outros
mencionam 2-3 participantes por item da escala ou questionário. Em qualquer caso
recomenda-se um mínimo de pelo menos 100 participantes (preferível 200 ou 300).
- Força das inter-correlações entre os itens: coeficientes maiores de 0.3, mas não demasiado
elevados (não maior do que 0.9).
- Será viável conduzir a análise se:
- Teste de adequação da amostra de Kaiser-Meyer-Olkin (KMO): recomendam-se valores > 0.7.
- Teste de esfericidade de Bartlett (p ˂0.05).

Análise Fatorial (PCA):


- Quantos fatores extrair? Várias possibilidades para decidir o no de fatores:
- Fatores com Eigenvalue > 1.0 são retidos. Interessa a quantidade da variância total explicada
pela dimensão ou conjunto de dimensões.
- Screeplot - Gráfico que representa os eigenvalues – encontrar o ponto a partir do qual o
formato da curva muda de direção e fica quase horizontal.
- A decisão sobre o no de fatores, para além de apoiar-se em critérios mais objetivos, deve ainda
ter em conta a “interpretabilidade” da solução encontrada.
- Saturação fatorial: peso do item em cada fator. Interessa verificar onde é que o item apresenta
a sua maior saturação (saturação principal). Pesos mínimos aceites: 0.35 costuma ser um
mínimo; em geral prefere-se 0.40 (e para autores mais exigentes: 0.45).
- Rotação dos fatores:
- Permite ver os loadings/saturações: em que fator cada item vai “cair”; existem soluções sem
correlação (ortogonais) e com correlação (oblíquas).
- Várias possibilidades, sendo das mais usadas em psicologia as seguintes:

45
- Varimax: quando se esperam fatores independentes, ou quando se pretende maximizar
a independência entre fatores. Ex: apropriada para a escala de Eysenck de 12 itens, 6 de
introversão-extroversão e outros 6 de neuroticismo.
- Oblíqua: quando se trata de fatores teoricamente inter-relacionados. Ex: análise fatorial
da EDAH, uma vez que as sub-escalas de défice de atenção e hiperatividade/impulsividade
supõem-se inter-relacionadas enquanto parte de uma mesma entidade diagnóstica e que
o distúrbio está relacionado frequentemente com problemas de comportamento (outra
das sub-escalas).

Análise Fatorial Exploratória


Análise Fatorial Confirmatória

- Fidelidade

Comparação de grupos (nota importante!):


- Na versão tradicional da validade, por exemplo, a comparação de grupos (e.g., clínico e não clínico)
seria colocada dentro da validade de critério.
- Contudo, de acordo, com o livro dos Standards da APA, esta análise estará contemplada na validade
mas não é diretamente explicitado em que secção da validade.

Análises de concordância inter e intra-avaliadores

Medidas de concordância:
- Visa aferir a calibração dos avaliadores ou dos observadores.
- As análises de concordância baseadas em percentagens não têm em consideração as avaliação
devidas ao acaso.
46
Técnicas estatísticas mais utilizadas:

- Kappa de Cohen;
- Dois observadores OU 1 mesmo observador em dois momentos diferentes;
- Medidas categoriais / qualitativas (nominais e ordinais).

- Kappa de Fleiss;
- Extensão do Kappa de Cohen para três observadores;
- Medidas categoriais / qualitativas (nominais e ordinais).

- Coeficiente de Correlação Intraclasse.


- Dois observadores / 1 mesmo observador em dois momentos diferentes;
- Medidas contínuas.

Interpretação para K e CCI:


- Menos de 0.40 = pobre.
- Entre 0.40 e 0.59 = satisfatório.
- Entre 0.60 e 0.74 = bom.
- Entre 0.75 e 1.00 = excelente.
- Na prática, habitualmente só se considera como valor mínimo aceitável se for ≥ 0.70!

Propriedades operativas dos testes

Sensibilidade e especificidade dos testes:


- Curvas ROC
- Noção de especificidade
- Noção de sensibilidade
- AUC (Area Under the Curve) ou área sob a curva
- VPP = valor preditivo positivo; VPN= valor preditivo negativo

Indicadores muito usados em medicina, onde é frequente pretender-se que um teste ou escala possa
distinguir entre doentes versus não doentes, mediante a definição de determinado ponto de corte (cut-off
score). São cada vez mais usados em psicologia, sobretudo na psicologia clínica e da saúde (cf. Pintea &
Moldovan, 2009).

Curvas ROC:
- ROC = Receiver Operating Characteristics: permite determinar os pontos de corte mais adequados para
distinguir entre grupos distintos (ex: com ou sem perturbação/doença).
- Teoria de deteção de sinal
- Limiar de resposta
- ROC é uma ferramenta de análise usada em telecomunicações e que relaciona o sinal com o ruído para
diferentes ajustamentos do recetor. Nas medições em clínica, o «sinal» é a taxa de verdadeiros

47
positivos (prever que tem risco e ter mesmo) - sensibilidade - e o «ruído» é a taxa dos falsos negativos
(prever que não tem risco e ter) - especificidade. Na abcissa da ROC usa-se 1-especificidade.
- Num gráfico de curva ROC, a sensibilidade é associada à ordenada e a 1-especificidade à abcissa.
- Num sistema perfeito que classificasse corretamente todos os indivíduos, a curva passaria pelo canto
superior esquerdo do gráfico (sensibilidade a 100% e especificidade a 100%, que corresponderia a 1-
especificidade = 0%). Uma curva com área sob a curva (AUC) de 50% é o mesmo que lançar uma moeda
ao ar.
- «De um modo geral, para que um sistema de estratificação de risco ou um instrumento de classificação
de doentes venha a ter interesse clínico, a área sob a curva ROC deverá exceder 80%» (Oliveira, 2009;
pp. 187).

Sensação/perceção - Métodos da Psicofísica:

- Teoria de deteção de sinal - Função Característica Operativa do Recetor ou COR / ROC. Diagonal:
desempenho que seria devido ao acaso, à adivinhação.

- Métodos da Psicofísica:

48
- Transpondo para a medicina ou a psicologia clínica e da saúde:

Sensibilidade e especificidade dos testes

PROPRIEDADES OPERATIVAS DE UM TESTE:


- Sensibilidade de um teste: capacidade de detetar os verdadeiros positivos, i.e., os indivíduos que
possuem o atributo medido pelo teste. = proporção, na população com perturbação/doença/atributo,
de indivíduos com teste positivo = taxa de verdadeiros positivos.
- Especificidade de um teste: capacidade de detetar os verdadeiros negativos, i.e., os inds que de facto
não possuem o atributo medido pelo teste (ex: indivíduos não doentes). = proporção, na população
sem doença/perturbação, de indivíduos com teste negativo = taxa de verdadeiros negativos.
- VPP (Valor Preditivo Positivo): proporção de pessoas identificadas positivamente pelo teste que
realmente têm a doença (probabilidade da perturbação estar presente quando o resultado do teste é
positivo). Ou pessoas que possuem a perturbação/doença/atributo de entre as pessoas com resultado
“positivo” no teste.

49
- VPN (Valor Preditivo Negativo): proporção de pessoas identificadas negativamente pelo teste e que
realmente não têm a doença (probabilidade de não ter perturbação quando o resultado do teste é
negativo). Pessoas sem a perturbação/doença/atributo de entre as pessoas com resultado “negativo”
no teste.

- Sensibilidade: Sensitivity = TP/D+


- Especificidade: Specificity = TN/D-
- Positive likelihood ratio = Sensitivity / (1-Specificity)
- Negative likelihood ratio = (1-Sensitivity) / Specificity
- Valor preditivo positivo (VPP): Positive predictive value = TP/T+
- Valor preditivo negativo (VPN): Negative predictive value = TN/T-
- Precisão/Rigor: Accuracy = (TP+TN)/n

- Através destes parâmetros pode definir-se qual o limite mais adequado para “extrair” o máximo de
potencialidades do mesmo, ou seja, estabelecer “pontos de corte”:
- posição no continuum das pontuações de um instrumento de rastreio que divide a distribuição dos
resultados entre normalidade e doença.

- Curvas ROC: permite determinar pontos de corte adequados:


- A análise ROC envolve:
- Sensibilidade de um teste;
- Especificidade de um teste;
- Valor preditivo positivo;
- Valor preditivo negativo;
- Estudo de pontos de corte (cut-off)
- Determinação da área abaixo da curva / Area Under the Curve = AUC

ANÁLISE DE CURVAS ROC:


- Permite avaliar, definir e comparar a validade diagnóstica de uma medida.
- Possibilita a validação do teste de rastreio para diferentes níveis de morbilidade e para diferentes
pontos de corte e não apenas a avaliação singular da sensibilidade e especificidade de um
instrumento.
- AUC = Área abaixo da curva —> corresponde à probabilidade de um indivíduo aleatoriamente
selecionado da amostra de positivos ter uma pontuação superior a um indivíduo aleatoriamente
selecionado da amostra de negativos.

50
- Pode admitir-se os seguintes valores na apreciação da AUC:
- AUC entre 0.5 e 0.7: não informativa;
- 0.7 < AUC < 0.9: precisão moderada;
- 0.9 < AUC < 1: precisão elevada;
- AUC=1: testes perfeitos

- Ex. concreto curva ROC: versão portuguesa da Perinatal Depression Screening Scale.

3 USOS COMUNS DA ANÁLISE ROC:


- Para determinar a capacidade de um teste para discriminar entre 2 grupos distintos (nomeadamente
através da determinação das AUC).
- Para definir o(s) melhor(es) ponto(s) de corte de um teste em termos de rastreio de determinada
perturbação/doença/síndrome/atributo (NB: rastreio ≠ diagnóstico).
- Para comparar entre 2 ou mais instrumentos e verificar qual o que apresenta melhor performance no
rastreio de determinada perturbação/doença/síndrome/diagnóstico/atributo (NB: rastreio ≠
diagnóstico).

51
Aspetos essenciais em instrumentos de rastreio:
- Fácil administração, curtos, objetivos e eficazes na diferenciação entre indivíduos psicologicamente
saudáveis e doentes.
- Devem ser simples, seguros, aceitáveis e económicos.
- As formas mais graves da doença devem ser diferenciadas de formas mais ligeiras.
- A validação de um instrumento de rastreio visa determinar a sua capacidade de discriminação em
comparação com um gold standard (ex.: entrevista clínica)

Recordar que existem diferenças entre rastreio e diagnóstico:


- Os instrumentos de rastreio não permitem fazer diagnósticos (Gaynes et al., 2005).
- Os instrumentos apenas alertam o clínico para o facto da pessoa poder estar a vivenciar sintomas, que
podem ser indicadores de uma perturbação.
- Oferecem estimativa do nível de sintomas indicando probabilidade de estar perante a perturbação.
- São uma ferramenta que não recorre a julgamento clínico. A grande vantagem que têm em relação às
entrevistas diagnósticas é a economia de tempo, recursos e a facilidade de preenchimento (Pope, 1999).

Qual o melhor ponto de corte num teste? Qual o melhor valor?:


- Na escolha dos PC procuramos escolher um que maximize a sensibilidade e a especificidade, evitando
valores muito extremados de uma ou de outra, para evitar o máximo de falsos positivos e detetar a
maior proporção de verdadeiros positivos.
- O cut-off point ideal seria o que permite a máxima especificidade e sensibilidade. Contudo, em variados
instrumentos, um ponto de corte que maximize um dos aspetos minimiza o outro. Assim, que ponto de
corte definir e/ou utilizar?
- Uma decisão adequada implica considerar o seguinte:
- a prevalência da doença na população alvo - o ponto de corte deverá permitir identificar uma
proporção de casos similar à da prevalência da perturbação.
- as consequências da ocorrência de FN e FP;
- o uso que se pretenda dar ao teste.

VÁRIAS POSSIBILIDADES para o melhor ponto de corte:


- O que melhor equilibra a sensibilidade e a especificidade (ou FP e FN).
- O que magnifica a sensibilidade (capacidade de detetar os VP).
- O que magnifica a especificidade (previne a ocorrência de FP).

- QUAL A MELHOR?
- É PRECISO PONDERAR AS CONSEQUÊNCIAS DE UM ENGANO DO TIPO FP E FN. Contudo, não é
simples. Qual o engano que acarreta mais custos ou danos?
- A resposta pode variar...

- O PC que melhor equilibra a sensibilidade e a especificidade (ou FP e FN):


- Supõe que o impacto de um FP é similar ao de um FN. Nem sempre assim é.
- Ex: no caso da probabilidade de uma dada criança ter ou não ADHD: um engano do tipo falso positivo
pode implicar medicação desnecessária; um engano de tipo falso negativo pode implicar que a
criança continue a sofrer da perturbação sem receber o devido tratamento.
52
- Existem circunstâncias em que não identificar uma doença grave numa pessoa que está doente é
pior do que identificar a doença numa pessoa que não está doente: um falso negativo pode ser mais
grave do que um falso positivo (ex: possibilidade de depressão perinatal). Neste caso, devemos
escolher um PC que maximize a sensibilidade e que resulte no mais elevado VPN (passa por
selecionar um ponto de corte menos exigente).
- Se a situação inversa for mais prejudicial (ex: risco de sobre-diagnóstico; tratamentos com efeitos
secundários relevantes) importa um PC que maximize a especificidade (passa por usar um ponto de
corte mais exigente).

- É fundamental ponderar a finalidade com que se está a utilizar o teste ou instrumento.


- Alguns autores/estudos adotam as seguintes regras:
- caso se use o instrumento para fins de rastreio => sensibilidade de 80% ou mais (mesmo que risco
de menor especificidade);
- caso se use o instrumento para fins de diagnóstico => especificidade de pelo menos 95% (mesmo
se descida de sensibilidade).

- Um indicador mais objetivo para selecionar o ponto de corte é o Índice de Youden (J):
- J = Sensibilidade + Especificidade -1.
- O índice de Youden pode variar entre 0 e 1, sendo que quanto mais próximo de 1 estiver, maior a
acuidade.

Análise Fatorial em Psicologia


Noções básicas

Nota prévia:
- Nesta UC só iremos incidir sobre a Análise Fatorial Exploratória (AFE).
- A Análise Fatorial Exploratória (AFC) é uma técnica mais avançada que requer conhecimento de
modelação por equações estruturais.

ACP e AFE: Que semelhanças e diferenças?:

- Análise de Componentes Principais (ACP)

- Análise Fatorial (AF)

- São ambas técnicas de redução de dados —> visam reduzir um determinado número de itens a um
número menor de variáveis. Ambas assumem que a variância de uma variável é composta por 3 aspetos:
Variância específica; Variância comum; Variância de erro.
- Tanto a ACP quanto a análise fatorial reduzem os conjuntos de dados contendo um nº maior de variáveis
num nº menor de variáveis chamadas componentes ou fatores, respetivamente. A diferença tem a ver
com a maneira como a variância é tratada. Na ACP, toda a variação nos dados é analisada, tanto partilhada
quanto única; pressupõe que não há erro. A ACP transforma as variáveis originais num conjunto menor
de componentes não correlacionados. Com a análise fatorial, apenas a variância partilhada é analisada -
a única é excluída e a variância de erro é assumida.
- A ACP é exploratória por natureza —> realizado para reduzir um grande conjunto de dados a um menor.

53
- A ACP às vezes é realizada para reduzir um grande conjunto de variáveis a um conjunto mais gerenciável
para que a regressão múltipla possa ser realizada. A análise fatorial tem sido normalmente usada quando
os pesquisadores acreditam que há um conjunto menor de "fatores" que causam ou influenciam as
variáveis observadas.
- A análise fatorial foi usada num sentido confirmatório, a fim de testar hipóteses. Na prática usam tanto a
ACP quanto a análise fatorial como meio de explorar os dados e confirmar hipóteses. Ao realizar a análise
fatorial, o conselho é tentar usar pelo menos 100 participantes na análise e ter 5x mais participantes do
que variáveis.

- Análise de Componentes Principais (ACP)

- Principal técnica de redução de dados em psicologia (embora erradamente!).


- Procedimento mais simples, rápido e barato do que a AF (cf. história).
- É um método formativo.
- Gera componentes e não fatores.
- Inclui a variância comum e específica na análise de dados.
- Vai explicar maior % de variância do que a AF.

- Análise de Componentes Principais (ACP)

- São os itens que formam o componente!

- Análise Fatorial (AF)


- É um método reflexivo.
- Gera fatores e não componentes.
- Inclui apenas a variância comum na análise de
dados.
- É o traço latente/fator que gera o comportamento!

54
AFE e AFC:

- Análise Fatorial Exploratória

- Análise Fatorial Confirmatória

55
AFE - Amostra:
- Não há consenso!
- Gorsuch (1983) e Hair et al. (2005) —> N > 100 sujeitos e um número mínimo de cinco respondentes
por item.
- Cattell (1978) —> N < 250, 3 a 6 respondentes por item
- Everitt (1975) —> 10 respostas para cada item avaliado

AFE - Fatorabilidade da matriz:


- Correlações inter-itens maioritariamente > 0.30 e <. 0.80 (multicolinearidade);
- Kaiser-Meyer-Olkin (preferencialmente > 0.70);
- Teste de esfericidade de Barlett (deve ser estatisticamente significativo);
- Determinante (deve ser > 0.00001).

AFE - Retenção fatorial:

- Eigenvalue (representa a proporção de variância explicada por cada fator) —> Valor próprio -
medida de quanta variância nos dados é explicada por um único fator. A análise considera
inicialmente todos os fatores possíveis e aloca o mesmo nº de fatores possíveis e variáveis. Quanto
mais alto o valor do autovalor, mais da variância nos dados é explicada por esse fator. A magnitude
do valor próprio pode ser usada para determinar se um fator explica variância suficiente para ser
considerado um fator útil. O valor padrão para isso no SPSS é 1, mas é possível solicitar ao SPSS para
extrair fatores usando um valor próprio de referência diferente de 1.

- Comunalidade (proporção de variância que os fatores contribuem para explicar uma determinada
variável) —> medida de quanta variação nos dados de uma determinada variável é explicada pela
análise. Os valores podem variar de 0 a 1. Inicialmente, todos os fatores na análise (igual ao nº de
variáveis inseridas) são usados para calcular as comunalidades e toda a variância é contabilizada.
Assim, na análise de componentes principais, as comunalidades iniciais são todas iguais a 1. Após a
extração do fator, as comunidades de extração para cada variável são calculadas com base apenas
nos fatores extraídos. Quanto maior o valor da comunalidade de extração para uma determinada
variável, mais da sua variância foi explicada pelos fatores extraídos. A comunalidade é calculada a
partir de cargas fatoriais.

- Não usar ou, pelo menos evitar —> eigenvalue > 1 e scree plot (gráfico útil dos autovalores de todos
os fatores inicialmente considerados. Pode ser usado para decidir sobre o nº de fatores que devem
ser extraídos).

- Privilegiar o uso de um destes métodos


- Análise paralela; (2 possibilidades): Implementação Clássica: Baseada em eigenvalues; Simulação
Monte Carlo e Implementação Otimizada: Baseada em variância explicada dos fatores;
Permutação aleatória dos valores amostrais.
- Método Hull;

56
- Método BIC

AFE - Rotação fatorial:


- Ortogonal
- Oblíquas

- As rotações Varimax são chamadas de rotações ortogonais porque os eixos que são girados permanecem
em ângulos retos entre si. Às vezes, é possível obter uma estrutura simples melhor divergindo da
perpendicular. Os procedimentos Direct Oblimin e Promax permitem que o pesquisador desvie do
ortogonal para obter uma estrutura simples melhor. Conceitualmente, esse desvio significa que os fatores
não estão mais correlacionados entre si. Isso não é necessariamente perturbador, porque poucos fatores
nas ciências sociais são inteiramente não correlacionados. O uso de rotações oblíquas pode ser bastante
complicado e não deve tentar usá-las a menos que tenha um entendimento claro do que está a fazer.

Cargas de fator / Factor Loadings —> Uma carga fatorial é calculada para cada combinação de variável e
fator extraído, e diz quanto cada variável é carregada em (ou está relacionada a) cada fator. Esses valores
são úteis para ver o padrão de quais variáveis podem ser explicadas por qual fator. A carga fatorial pode ser
pensada como o coeficiente da correlação entre o componente (ou fator) e a variável; portanto, quanto
maior o número, mais provável é que o componente seja a base dessa variável. As cargas podem ser
positivas ou negativas. As cargas fatoriais iniciais podem ser inspecionadas para padrões. Quase sempre uma
rotação será usada, e as cargas do fator de rotação são um indicador de padrões mais útil.

Recomendações:
- Não utilizar o IBM SPSS Statistics para fazer AFE (ainda que seja muito utilizado para esse fim ainda hoje
em dia!*).
- Utilizar o FACTOR, ou nessa impossibilidade, o JASP para fazer AFE.
- Se souber programar, pode utilizar também o R e os seus pacotes dedicados.

Normas

Aferição e normalização de resultados:


- Aferição dos resultados
- Normalização dos resultados
- A interpretação dos resultados
- Quando obtemos um resultado numa prova (pontuação/pontuações) a sua interpretação e a
formulação das conclusões não é fácil/direta.

- A interpretação dos resultados nas provas passa por três fases:


- i) Análise e correção das respostas obtidas item a item e obtenção de uma
nota(s)/pontuação(ões);
- ii) Apreciação das notas obtidas em função de critérios estatísticos ou práticos (comparação com
outros sujeitos, com outros desempenhos, estudos existentes...) => necessidade de normas.
- iii) Consideração de diversos elementos e fontes informativas disponíveis para, através de esforço
de síntese e integração, se chegar a uma informação conclusiva sobre a situação, o indivíduo ou o
problema que justificou a avaliação.

57
- Vamos ver os dois primeiros pontos, sobretudo o segundo, acerca das normas (o 3ª relaciona-se com
a prática da avaliação psicológica).

Aferição dos resultados


i) Correlação dos resultados
- Fase da correção facilitada pela existência de grelhas de correção;
- Importante ter em conta as respostas anuladas pelos sujeitos ou as duplas respostas assinaladas
para um mesmo item…
- Informatização da correção e cotação dos protocolos: a velocidade e acuidade dos meios técnicos
são superiores vs. das pessoas (verificação rápida das respostas e correção, facilidade dei cálculos
estatísticos e conversão dos resultados brutos padronizados).
- A objetividade na cotação de provas, entrevistas ou nalgumas formas de registo e documentação é
também necessária: metodologias mais qualitativas.
- Habitualmente: analise mais holística e individualizada da informação e integração de muitas
dimensões - personalidade, contextos de vida…
- Técnicas qualitativas: estudos de caso, analise de narrativas,; análise de conteúdo permite analise
quantitativa dos dados qualitativos.

Normalização dos resultados


ii) Necessidade de normas
- quando avaliamos, queremos dar um sentido à informação recolhida. Para isso, podemos recorrer
a:
- Dados normativos ou nomotéticos (comparação do sujeito com os seus pares);
- Dados ideográficos ou individualizados (significação referenciada ao próprio indivíduo).
- Portanto… na síntese final da informação importa considerar os referenciais externos (normas) para
apreciar os desempenhos individuais e… a par destes parâmetros, considerar a singularidade do
sujeito e a própria situação de avaliação. Estes dão sentido compreensivo-explicativo à informação
obtida.

Necessidade das normas: como calculá-las


- A normalização das provas ou fixação de padrões externos de realização visando a interpretação dos
desempenhos individuais, acompanha a história dos testes psicológicos desde a sua criação.
- Quando se fala em normas de realização referimo-nos a provas referenciadas a normas (uso da média e
do desvio-padrão dos resultados numa amostra para apreciarmos o desempenho e posicionamento de
cada indivíduo).
- Testes referenciados a normas: proporciona estimativa da posição do sujeito relativamente ao
desempenho/resuktado da população a que pertence (grupo normativo) no traço/característica avaliada.
Maioria dos testes psicológicos.
- Testes referenciados a critério: o resultado indica se o indivíduo teve um bom ou mau desempenho numa
dada tarefa, em termos absolutos (se a pessoa atingiu ou não dado objetivo) mas não o compara com o
seu grupo de referência (e.g. testes escolares - critério é saber dada matéria).
- Em testes referenciados a critério e nas técnicas de avaliação informal, usam-se outras alternativas que
não o recurso às normas.
- O sujeito é comparado com os objetivos inicialmente previstos (níveis de mestria) ou tomado na
singularidade da sua pessoa, processos e contextos.

58
Interpretação de teste referenciado por norma vs. critério
- Os testes referenciados por normas buscam localizar o desempenho de um ou mais indivíduos, no que diz
respeito ao construto que os testes avaliam, num continuum criado pelo desempenho de um grupo de
referência.
- Testes referenciados em critérios procuram avaliar o desempenho dos indivíduos em relação aos padrões
relacionados ao próprio construto.
- Enquanto na interpretação de testes referenciados por normas o quadro de referência é sempre as
pessoas, na interpretação de testes referenciados por critérios o quadro de referência pode ser (a)
conhecimento de um domínio de conteúdo, conforme demonstrado em testes padronizados e objetivos,
ou (b) nível de competência exibido na qualidade de um desempenho ou de um produto.
- O termo teste referenciado por critério às vezes também é aplicado para descrever as interpretações de
teste que usam a relação entre as pontuações e os níveis esperados de desempenho ou baseando-se num
critério como um quadro de referência.
Necessidade das normas: como calculá-las
Então…
- A fixação/uso de normas de grupo para interpretar provas remete para a definição de “teste”: “situação
experimental estandardizada que serve de estímulo a um comportamento. Este comportamento é
avaliado por comparação estatística com o de outros indivíduos, colocados na mesma situação,
permitindo classificar o sujeito examinado”.
- Os resultados brutos numa prova por si só têm pouco sentido. É importante usar um referência externa
quando os apreciamos.

- Nos estudos estatísticos de normalização são seguidos dois princípios estatísticos:


1. Valores (normativos) utilizados para a análise individual ou comparação dos sujeitos entre si foram
recolhidos em amostras representativas das populações, cobrindo logicamente os sujeitos agora
avaliados; esta representação é assegurada usando critérios de estratificação: idade, sexo, nível de
ensino…
2. Os resultados na prova (própria dimensão a avaliar) distribuem-se segundo as “leis da curva
normal”: com a média e o desvio-padrão dos resultados podemos fazer equivaler cada nota bruta
a um determinado desvio em relação à média, assim como converter esse desvio numa % de casos
com classificações superiores ou inferiores (à média).

- Com base nestes critérios, um resultado bruto numa prova pode ser convertido num resultado
ponderado ou normalizado.
- Vários tipos de normas podem ser usados, uns mais familiares e outros mais desconhecidos dos
investigadores e profissionais.

- Normas centradas na média e desvio-padrão


- Conversão dos resultados brutos em resultados numa escala coincidente ou decorrente da curva
gaussiana ou normal.
- Estamos face a transformações lineares dos resultados com base numa determinada média e desvio-
padrão da escala que se pretende usar.
- 2 tipos de conversão mais frequentes:
- Notas Z: escala de conversão dos resultados obtidos para uma distribuição com a média situada
em 0 (zero) e o desvio-padrão fixado em 1.

59
- Notas T: escala similar à anterior, mas onde a média se situa em 50 e o desvio-padrão em 10
pontos (e.g. num teste com notas T uma pontuação de 70 equivale a um resultado 2DPs acima da
média - para o grupo de pessoas da mesma idade que a pessoa).

- Normas centradas na frequência ou notas percentílicas


- Notas brutas transformadas em notas percentílicas que indicam a % de indivíduos do grupo de
referência que se situam abaixo desse valor.
- A amostra global de sujeitos fica dividida em grupos idênticos (escalas retangulares com notas
particulares).
- As notas que delimitam cada um dos grupos permitem-nos, na interpretação dos resultados
individuais, indicar a % de sujeitos que se situam abaixo desse valor.
- As escalas percentílicas/retangulares mais usadas são: quartis (25,50,75%), decís (10,20,30,40,50%…)
e postos percentílicos (1,2,3,4,5…100% —> mais utilizados) (dividem a amostra em partes: 4, 10, 100,
cada uma com uma % de dados aproximadamente igual).
- Vantagens das escalas e postos percentílicos:
- O seu cálculo é relativamente fácil;
- Trata-se de uma noção bastante simples e de fácil compreensão: a sua interpretação decorre do
conceito de %;
- Tipo de normas que se aplica a qualquer tipo de prova/escala;
- Escalas que podem ser interpretáveis mesmo quando os resultados na prova em causa não se
distribuem segundo as leis da curva normal.
- Quando está em causa uma diferenciação mais fina entre sujeitos, os postos percentílicos têm a
vantagem de assegurar uma distribuição por 100 postos, e garantem um bom índice de
discriminação das posições individuais.

- Notas de idade
- Foram a primeira forma de interpretar e comparar os resultados individuais nos testes de inteligência.
- O seu aparecimento data do começo do séc. passado com a Escala de inteligência de Binet-Simon.
- Trata-se de um critério bem popular e objetivo de avaliar o desempenho das crianças (após a
adolescência o critério etário não apresenta a mesma relevância e clareza).
- Nas escalas de inteligência reportadas a Binet, 3 tipos de idades são mencionadas:
- Idade cronológica (idade real do sujeito);
- Idade de base (idade correspondente ao grupo etário mais elevado de itens que o sujeito
consegue realizar na sua globalidade).
- Idade mental (idade de desenvolvimento psicológico calculada com base na idade de base
acrescida das bonificações - em meses - correspondentes à resolução de itens de grupos etários
superiores).
- A idade mental veio a ser tomada nos 1ºs cálculos do QI (QI de razão).
- Idade mental a dividir por idade cronológica e a multiplicar por 100 (Stern) - 100 indicaria o
desenvolvimento normal.

60
- O QI de razão e a idade mental apresentam condicionalismos em termos de cálculo e de significado.
- Como o desenvolvimento mental em função da idade cronológica não é linear: parecem fazer mais
sentido nas idades mais baixas (coincidentes com períodos de maior desenvolvimento psicológico); a
diferença entre a idade mental e a cronológica não tem o mesmo significado ao longo dos diferentes
grupos etários.
- Pequenas diferenças são mais significativas em idades mais precoces: existe um aumento acentuado
durante a infância e uma desaceleração a partir de cerca dos 12 anos.
- Uma diferença, no sentido de um atraso, de um ano tem um significado diferente consoante se verifica
aos 3 anos ou aos 12 anos.

- Segundo Stern, uma criança com 5 anos e idade mental de 10 teria um QI=200, e outra com 7 anos e
idade mental de 14 anos também teria um QI=200. Para Stern, tanto a criança de 5 anos quanto a de
7, quando se tornassem adultas, provavelmente teriam um QI=200. Constatou, no entanto, que quando
essas crianças se tornavam adultas, que havia variações no QI.
- Invariabilidade do QI era uma das premissas em que o modelo teórico de Stern se sustentava. Terman
confirmou em 1528 crianças.

- Algumas críticas às notas de idade:


- Sentido absoluto que a nota de idade mental parece conter quando a sua significação varia
consoante a idade cronológica dos sujeitos;
- Conceito de idade mental em sujeitos adultos poderá significar estabilidade (idade mental atingida)
enquanto alguns autores referem declínio.
- Em alternativa ao QI de razão, Wechster propõe para as suas escalas de inteligência um QI de desvio
(média de 100; depois interpreta-se o resultado em função do desvio em relação a essa média).

Cálculo das normas: atenção a alguns aspetos:

- Vários tipos de normas podem ser mutuamente conversíveis.


- Precauções no uso de normas: assegurar que as normas tiveram na sua origem amostras representativas
da população e que os sujeitos avaliados se encontravam devidamente representados na amostra
tomada (problema mais importante em sujeitos de grupos étnicos ou sócio-culturais minoritários).
61
- Todas as normas são reportadas no tempo. A sua atualidade deveria ser ciclicamente estimada, o que
habitualmente não acontece pelos recursos e custos envolvidos.
- Algumas provas de desempenho cognitivo aproximam-se das tarefas escolares, podendo isso dificultar a
permanência no tempo do valor das normas originalmente fixadas.
- O cálculo das normas estando assente no desempenho das amostras tomadas, não nos permite encarar
os seis valores para estimativas diretas dos constructos ou dimensões avaliadas, nem assumir o resultado
individual sem considerar o erro associado à medida.

TCT (Teoria Clássica dos Testes)

- O modelo da TCT: T = V + E.
- T = score bruto ou empírico do sujeito, que é a soma dos pontos obtidos no
teste.
- V = score verdadeiro, que seria a magnitude real daquilo que o teste quer
medir no sujeito e que seria o próprio T se não houvesse erro de medida.
- E = erro cometido na medida.
- Os erros: defeitos do próprio teste, estereótipos e vieses do sujeito, fatores
históricos e ambientais aleatórios.

- Erro constante: Pouco importante em Psicologia, pois nunca se tem acesso aos valores verdadeiros do
atributo. Se um instrumento avalia sempre um atributo 3 pontos acima de outro instrumento, qual está a
medir corretamente?
- Viés: Um instrumento avalia sistematicamente mais 3 pontos para respondentes do sexo feminino.
- Erro aleatório: Um instrumento é sensível a uma série de fatores que variam de forma não sistemática
(itens selecionados, motivação dos respondentes).

FIXAÇÃO DE NORMAS PARA TESTES PSICOLÓGICOS

- A fixação de normas de grupo para interpretação de provas psicológica envolve:


1. Identificação dos critérios para definir os grupos de referência (sexo, grupos de idade, grupos de
escolaridade, grupos profissionais).
2. A aplicação da prova a um conjunto representativo da população (amostra de aferição). A média
e desvio-padrão dos grupos presentes nesta amostra de aferição irão ser utilizados para obter
os resultados normalizados / padronizados.

- Normas centradas e reduzidas. Os resultados brutos (RB) de cada grupo são padronizados de forma a
serem centrados no valor médio do grupo e a terem uma variância especificada:
- Notas Z: Média = 0, DP = 1 —> Z = (RB – M) / DP
- Notas T: Média = 50, DP = 10 —> T = 50 + 10* (RB – M) / DP = 50 + 10*Z
- Notas QI: Média = 100, DP = 15 —> QI = 100 + 15* (RB – M) / DP = 100 + 15*Z

62
CURVAS ROC

Uma análise de característica do operador recetor tem sido usada por meio século no contexto da
deteção de sinal e teoria de decisão. Geralmente, permite-nos avaliar uma série de regras de decisão que
podemos usar para prever quais dos dois resultados possíveis ou grupos de casos específicos estão
associados. É particularmente adequado para fazer parceria com regressão logística binária.
A análise ROC requer que tenhamos uma medida de resultado quantitativa subjacente e, na
regressão logística binária, é a probabilidade prevista de um caso estar no grupo-alvo. A decisão de classificar
os casos nos grupos de destino e de referência é feita com base nessa probabilidade prevista. Casos
associados com uma probabilidade de 0,5 ou maior de estar no grupo-alvo foram classificados no grupo-alvo,
enquanto os casos associados com menos de 0,5 de probabilidade de estar no grupo-alvo foram classificados
no grupo de referência. No entanto, um corte de classificação de 0,5 pode não ser necessariamente o corte
de decisão mais apropriado, porque diferentes circunstâncias podem fazer-nos favorecer um tipo de
estratégia de decisão em detrimento de outro. Dada uma circunstância particular, podemos usar uma análise
ROC para determinar se um corte mais apropriado deve ser estabelecido.
Numa análise ROC, os resultados da classificação são caracterizados na linguagem de tomada de
decisão. A tabela 2 × 2 mostra as linhas como os resultados observados e as colunas como os resultados
previstos. A 1ª linha e coluna representam o resultado de referência (negativo) (não graduado), e a 2ª linha
e coluna representam o resultado desejado (positivo) (graduado). Lendo da esquerda para a direita na 1ª e
depois na 2ª linha, as células representam o seguinte:
- Verdadeiros negativos (observados, não graduados; Previstos, não graduados) - casos que foram
corretamente previstos como tendo o resultado negativo (não graduados). A proporção de todos os
membros do grupo de referência representada por esses casos é conhecida como especificidade.
- Falsos positivos (observados, não graduados; Previstos, graduados) - casos com o resultado negativo
(não graduados) (membros do grupo de referência) que foram incorretamente previstos como tendo o
resultado positivo. A proporção de todos os membros do grupo de referência representada por esses
casos é conhecida como (1 - especificidade).
- Falsos negativos (observado, graduado; Previsto, não graduado) - membros do grupo-alvo (graduado)
que foi previsto como tendo um resultado negativo (não graduado).
- Verdadeiros positivos (observados, graduados; previstos, graduados) - casos que foram corretamente
previstos como tendo o resultado positivo (graduados). A proporção de todos os membros do grupo-
alvo representada por esses casos é conhecida como sensibilidade.

O sucesso de prever corretamente a associação ao grupo depende da localização do critério de


decisão. Mas a previsão nunca será perfeita, e há compensações envolvidas em qualquer processo de
decisão. Definir uma probabilidade mais alta como critério de decisão (ponto de corte de classificação)
melhorará a taxa de verdadeiros negativos (prever associação no grupo de referência), mas às custas de
gerar mais falsos negativos (prever resultados graduados como resultados não graduados). Por outro lado,
um critério de decisão mais baixo dará uma melhor taxa de verdadeiros positivos, mas aumentará o nº de
falsos positivos.
O critério de decisão acaba por ser uma coordenada numa curva ROC, uma função em forma de arco
com sensibilidade (taxa de V+) no eixo Y e 1 - especificidade (taxa de F+) no eixo X. O valor do arco da curva
(área sob a curva) é um medidor de quão bem o modelo logístico pode diferenciar os grupos; áreas maiores
sob a curva refletem maior diferenciação.
ESTRATÉGIA DE ANÁLISE —> análise em 3 etapas: 1º executamos a análise de regressão logística
binária, exceto que agora salvamos as probabilidades previstas de associação ao grupo-alvo no arquivo de
dados; são essas que o critério de decisão (corte de classificação) se refere. 2º usamos essas probabilidades
previstas como uma variável numa análise ROC. 3º selecionamos um critério de decisão diferente com base
nos resultados da análise ROC e realizamos outra análise de regressão logística binária usando o ponto de
corte de Classificação revisado.

63
Teoria de Resposta ao Item

O que é a TRI?:
- Desenvolvida nos anos 50 e 60 do século XX (trabalhos de Lord nos EUA nos anos 50 e de Rasch na
Dinamarca nos anos 60);
- Modelo matemático que nasce na psicometria;
- “… é um conjunto de modelos matemáticos que descrevem a relação entre a ‘habilidade ’ou ‘traço ’de
um indivíduo e como eles respondem aos itens numa escala”;
- Conhecida como “teoria moderna dos testes”, “psicometria moderna” ou “teoria do traço latente”;
- Serve para complementar e não substituir totalmente o modelo clássico da teoria dos testes;
- Inicialmente aplicava-se a itens dicotómicos (0 = incorreto e 1 = correto; sim/não), mas
progressivamente incorporou modelos para análise de itens politómicos - tipo Likert (anos 80 do séc.
XX);
- Permite economia de testes, só usando itens que se venham a mostrar discriminativos, por exemplo, o
que permite reduzir a extensão das medidas e a carga (burden) dos respondentes;
- Interessa-se pelo item e não pelo score total;
- Diz-se que a TRI é independente da amostra (TCT é dependente da amostra selecionada - Se na TCT
houver uma amostra aleatória, este problema não se coloca —> invariância da dimensão;
- Pontuações dos examinados independentes do teste utilizado (No caso da TCT, há dependência uma
vez que a inteligência, por exemplo, é medida de maneira diferente consoante o teste que se utiliza);
- Ao contrário da TCT que calcula um indicador de fidelidade para a escala (α de Cronbach), a TRI calcula
várias medidas de precisão ao longo do contínuo que representa a dimensão latente.

- "Um instrumento de medida, na sua função de medir, não pode ser seriamente afetado pelo objeto de
medida. Na extensão em que sua função de medir for assim afetada, a validade do instrumento é
prejudicada ou limitada. Se um metro mede diferentemente pelo facto de estar a medir um tapete,
uma pintura ou um pedaço de papel, então nesta mesma extensão, a confiança neste metro como
instrumento de medida é prejudicada. Dentro dos limites de objetos para os quais o instrumento de
medida foi produzido, a sua função deve ser independente da medida do objeto”.

Estratégia do investigador na aplicação da TRI:

- “… se o interesse é selecionar respondentes que têm altos níveis do traço latente, itens que fornecem
mais informações no lado direito da escala podem ser escolhidos para maximizar a precisão das
pontuações na extremidade superior do traço escala”.
- “... em pesquisa, bem como em contextos aplicados, detalhes sobre a área em que os traços latentes
medidos pelo teste estão a fazer uma medição melhor (e quão bem) ajudariam as clínicas,
pesquisadores ou fabricantes de teste a decidir qual teste é mais apropriado para os seus interesses
específicos”.

Diferenças entre teorias e modelos clássicos e de resposta ao item:

Por que é que a TRI é tão pouco utilizada?:


- Falta de formação pré e pós-graduada;
64
- Requer, normalmente, maior nº de efetivos amostrais —> dificuldade em obter amostras (e que sejam

Área Teoria de Teste Clássico Teoria de esposta ao item

Modelo Linear Não linear


Nível Teste Item
Assunções Fraco (ou seja, fácil de encontrar com Forte (ou seja, mais dificuldade para se
dados de teste) encontrar com dados de teste)

Relação habilidade-item Não específico Funções características do item


Habilidade Pontuações de teste ou pontuações Pontuação de habilidade são reportado na
verdadeiras estimadas são relatadas na escala -oo a +oo (ou uma escala
escala de pontuação de teste (ou uma escala transformada)
de pontuação de teste transformada)

Invariância das estatísticas Não - os parâmetros do item e da pessoa Sim - os parâmetros do item e da pessoa
de item e pessoa dependem da amostra são independentes da amostra, se o
modelo se encaixar nos dados de teste

Itens estatísticos p, r b, a e c (para o modelo de três


parâmetros) mais as funções de
informação do item correspondente

Tamanho da amostra (para 200 a 500 (no geral) Depende do modelo TRI, mas amostras
estimativa de parâmetro de maiores, ou seja, acima de 500, no geral,
item) são precisos

representativas);
- Requer conhecimentos estatísticos mais avançados;
- Inexistência de software “user-friendly” (até há relativamente pouco tempo).

Variável ou traço latente: várias designações:


- Theta (Θ)
- Traço latente (latent trait)
- Habilidade (ability)
- Habilidade latente (latent ability)
- A escala é transformada de modo a que a média de Θ = 0 e o desvio-padrão = 1

=> O melhor termo a utilizar depende do contexto da investigação ou do instrumento em causa.

Modelo de 1 parâmetro logístico (1-PL):

- Incorpora apenas um parâmetro: “b” = dificuldade ou localização do item (termos utilizados na literatura:
location, threshold, position);
- Assume que o parâmetro “a” (discriminação) é constante para todos os itens;
- Diz respeito ao valor de Θ quando a probabilidade de acerto é de 50 %;
- O Θ diz respeito à característica a medir ou variável latente. Oscila, habitualmente, entre -3 e +3 e equivale
a um valor z;

65
- Em itens politómicos, para não haver problemas, os valores de “b” deverão estar compreendidos entre -
3 e +3 ou -4 e +4 (cf. estudo de Kobayashi et al., 2018); Ex: -3 = itens fáceis e +3 = itens difíceis;
- Nos modelos com itens politómicos, calculam-se vários “b” uma vez que estes representam o ponto de
interseção/cruzamento entre 2 curvas que determinam o valor de Θ necessário para que o indivíduo deixe
de obter uma pontuação e passe a obter o próximo valor superior.

- “.... descreve onde o item funciona melhor ao longo da escala do traço. No caso binário mais simples, b é
definido como a localização no traço latente onde a probabilidade de endossar um item é de 50%”.
- Quanto maior for o b, maior deve ser o nível de aptidão exigido para que o examinado tenha uma

probabilidade de 50% de acertar no item.

Modelo de 1 parâmetro logístico - Modelos Rasch:

- Os modelos Rasch são também modelos de 1 parâmetro logístico.


- Há autores que consideram os modelos Rasch dentro da TRI e outros que o consideram fora. Muitas vezes
na literatura os modelos Rasch são tratados como “sinónimos” dos modelos TRI 1-PL.
- Existem modelos Rasch para itens dicotómicos e itens politómicos (Rating Scale Models).
- Existem algumas diferenças importantes entre a TRI e os modelos Rasch.

Modelo de 2 parâmetros logísticos (2-PL):

- Incorpora o parâmero “b” + o parâmetro “a” = discriminação ou declive (termos ingleses: slope,
inclination, dispersion);
- “... descreve como um item pode diferenciar bem os examinandos em diferentes níveis de características”;
- Quanto maior o valor de “a” melhor;
- Um bom ajustamento estará compreendido entre 0.5 e 3.0;
- Valores entre 0.6 e 1.8** são considerados adequados;
- Ex: 0 = nenhuma discriminação e 3 = discriminação perfeita.
- O número de thresholds é calculado pela seguinte fórmula: K-1, onde K = nº total de categorias de
resposta.
- Itens com valores de “a” negativos são problemáticos e podem indicar:

66
- Indivíduos com níveis mais altos do traço latente são menos prováveis de endossar as categorias de
resposta mais “severas”.
- Erros na
codificação
dos itens.

Modelo de 3 parâmetros logísticos (3-PL):

- Incorpora o elemento “c” (também designado de “g” em alguns softwares) que diz respeito ao adivinhar
(ao acaso) a resposta ao item (i.e., “guessing”);
- Quanto mais próximo de 0 melhor;
- Amplitude esperada: entre 0.0 e 0.20. A partir de 0.35 é considerado inaceitável;
- Utilizado em escalas que medem aptidões ou habilidades;
- Em escalas de

personalidade, atitudes, etc, este parâmetro não é modelado ou calculado.


67
Modelo de 4 parâmetros logísticos (4-PL):

- Incorpora o elemento “d”: “careless” = desatenção (erros ao acaso).


- Erros nos itens não por falta de traço latente mas por distratores externos como: desatenção, ansiedade,
falta de familiaridade com o computador, etc.
- Pouco utilizado na literatura de TRI.

Modelos para itens politómicos (Likert):

- Graded Response Model;


- Dos modelos mais flexíveis;
- É uma generalização do modelo de 2 parâmetros para itens politómicos;
- O seu uso deverá ser privilegiado em escalas de tipo Likert.

- Generalized Partial Credit Model;


- Usado quando os itens não são espaçados;
- Ex: 0=incerto; 1= crédito parcial; 2= crédito completo;
- Pode indicar que algumas categorias são mais usadas do que outras;
- Muitas vezes quer o Graded Response Model quer o Generalized Partial Credit Model dão resultados
idênticos.

- Partial Credit Model;


- Restringe o poder discriminativo, ou seja, “a” é igual para todos os itens;
- “... estimates separate category response parameters for each item”.

- Rating Scale;
- Restringe o poder discriminativo, ou seja, “a” é igual para todos os itens;
- “... further assumes that the thresholds for category response are also equal across items”; —> =“a”
& =“b”
- É dos modelos mais restritivos dentro da TRI.

- Bock s Nominal Models.


- Utilizado com itens com categorias não-ordenadas, situação que é pouco frequente na prática.

68
RESUMO:

Calibração dos itens:


- Ao cálculo de todos estes (ou pelo menos de alguns) parâmetros dá-se o nome de calibração dos itens;
- Os diferentes modelos são utilizados para calibrar as propriedades dos itens.

Pressupostos da TRI:

- Unidimensionalidade
- Antes de se fazer uma análise de TRI, devemos certificar-nos de que existe unidimensionalidade
fazendo uma análise fatorial exploratória ou confirmatória, consoante o mais adequado;
- Pode utilizar-se também o critério do eigenvalue > 20% ou a análise paralela;
- Se a AF indicar mais do que uma dimensão, então devemos certificar-nos de que o fator dominante
explica pelo menos 20% da variância;
- Caso haja 2 fatores ou 2 dimensões no modelo, devem fazer-se 2 análises, por exemplo, e assim
sucessivamente para mais dimensões;
- Também existem modelos da TRI multidimensionais, porém, são mais complexos de modelar.
Muitas vezes, fazem-se várias análises unidimensionais.

- Independência local
- Assume que os itens são afetados apenas pelo Θ e que não são influenciados por outros fatores
latentes, erros de compreensão dos itens, construção dos itens;
- Avalia-se com o “standardized LD X^2 statistic”:
- Ι 10 Ι = large
- Ι 5 Ι – Ι 10 Ι = moderate
- < Ι 5 Ι = small
- Para se cumprir o pressuposto da independência local os valores deverão ser o mais baixos possível.

69
- Outra maneira de avaliar este pressuposto é:
- Se “a” para algum dos itens for > 4.0, então há violação do pressuposto, ou seja, há evidência
de dependência local.

- Monotonicidade
- “... refere-se ao fenómeno no qual a probabilidade de endossar um item aumentará continuamente
à medida que o nível de característica de um indivíduo aumenta. Por exemplo, um indivíduo com
uma pontuação de característica de 1,9 terá uma probabilidade maior de endossar um item do que
um indivíduo com uma pontuação de característica de 1,7 e, por sua vez, aquele indivíduo com uma
pontuação de característica de 1,7 terá uma probabilidade maior de endossar o mesmo item do que
um indivíduo com uma pontuação de 1,5 no traço.”.

- Invariância dos itens


- “... pode ser descrito como o fenómeno no qual os parâmetros dos itens estimados são constantes
em diferentes populações”.

Amostra para análise da TRI:

- Não existe consenso;


- Para modelos mais simples, de tipo Rasch por exemplo, 100 participantes podem bastar;
- Modelos mais complexos poderão requerer amostras entre 200 e 500 participantes;
- Amostras reduzidas podem ser aceites para estudos preliminares de propriedades psicométricas de
questionários.

Ajustamento dos modelos de TRI:

- Model Absolute Fit


2
- Se o valor de S for significativo, então repetir a análise com a exclusão desse item. O item não é
X
ajustado (H = o item ajusta-se ao modelo);
0
- Quando há amostras grandes e poucos itens pode-se considerar apenas como significativos os
valores de p <.01 e não p <.05;
2
- Dado que o teste S tem limitações importantes, uma alternativa a usar poderá ser a comparação
X
de:
- resultados esperados e observados;
- resíduos esperados e observados (brutos e estandardizados);

- ... que são indicadores mais fiáveis de ajustamento.

70
- Resíduos estandardizados são calculados dividindo os resíduos brutos pelos respetivos erros-
padrão. “Espera-se que um bom modelo de ajuste gere resíduos padronizados (aproximadamente)
normalmente distribuídos”. —> Bom ajustamento estará entre -2 e +2.

- Model Relative Fit


- Comparação de modelos entre si;
- Para comparação de modelos aninhados, comparar os valores de:
- −2*log-likelihood (−2*LL);
- AIC (Akaike Information Criterion);
- BIC (Bayesian Information Criterion);
- RMSEA (Root Mean Square Error of Approximation)

- (quanto mais próximo de 0 melhor. Valores abaixo de 0.05 são desejáveis);


- M Limited Information Goodness-of-Fit
2
- (Estatística recente e incorporado no IRTPRO - mede o quão bem um modelo se ajusta aos
dados da amostra. Espera-se um valor não significativo, embora seja um teste sensível à
dimensão da amostra. Deve apresentar-se sempre o seu valor associado ao RMSEA).

- (Os valores mais baixos são os que indicam melhor ajustamento do modelo).

Curvas e Gráficos na TRI:

- Item Characteristic Curve (ICC) / curva característica do item (Trace Lines)

71
- Item Information Curve / Function (Curva de Informação do Item)

- Total Information Function / Test Information Curve (Curva de Informação do Teste)

A função de informação está inversamente relacionada com o erro-padrão da estimativa. “Portanto,


quanto mais informações fornecidas por um teste num traço latente específico, melhor será a medição e
menores serão os erros de medição neste nível”

72
Funcionamento Diferencial dos Itens (DIF):

- DIF (Differential Item Functioning) DTF (Differential Test Functioning);


- Importância da equivalência das medidas (measurement equivalence);
- A falta de equivalência da medida torna as comparações ambíguas: Será que a diferença é “real”, uma
função do resultado a ser medido, ou será um artefacto de aspetos do processo de medida tal como
diferentes interpretações das questões pelos membros dos diferentes grupos?;
- Existem diversos métodos para detetar DIF (e.g., two-step procedure —> quando não se sabe a priori quais
são os itens âncora);
- Itens âncora = itens que se sabe serem invariantes entre grupos;
- Grupo de referência (por norma, o grupo com maior N) e grupo focal.
- “... ocorre quando participantes com traço latente idêntico fornecem padrões diferentes de respostas
para alguns itens. Este pode ser o caso de itens que favorecem ou desfavorecem) alguns subgrupos da
amostra (e.g., girls and boys, black and white, minorities)”.
- Um item exibe DIF se a resposta a esse item difere entre grupos (e.g., género, raça), quando o construto
a ser medido é controlado. Deve-se estar confiante de que os itens que compreendem a medida operam
de forma equivalente entre os diferentes grupos.
- Se o teste de Mantel-Haenzel for significativo, então há DIF.
- Comparam-se os índices de dificuldade nesses índices por grupo para ver para quem (e.g., sexo) dado item
é mais fácil ou difícil.

Computerized Adaptive Testing (CAT):


- Criar bancos de itens.
- Estes itens serão expostos a cada indivíduo de acordo com o seu nível de habilidade ou theta.
- Pode reduzir o nº de itens a que cada indivíduo tem de responder.

Boas práticas na TRI (mas há exceções!):


- N pelo menos de 250 participantes, embora seja aconselhável amostras com mais de 500
participantes;
- Conduzir sempre AFE;
- Estimar sempre vários modelos de TRI para ver qual se ajusta melhor. Se o modelo não se ajusta a
muitos itens tentar usar um modelo menos restritivo;
- Eliminar itens que discriminam pouco nas bandas de Θ que se querem discriminar;
- Escolher itens que abranjam todo o espectro de Θ;
- Se o N for baixo, então considerar modelos mais restritivos, dado que não exigem a estimação de
tantos parâmetros.

Software para executar análises de TRI:

- IRTPRO
- Gratuita [http://www.ssicentral.com/irt/student.html];
- User-friendly;
73
- Só permite importar alguns formatos de ficheiro;
- Limitada a 25 variáveis, 1000 casos e um máximo de 3 dimensões;
- É o software mais recente para análise da TRI.

- WINSTEPS
- Software pago!
- Existe uma versão gratuita mas com oõções limitadas (Facets).
- Executa análises Rasch (e não TRI clássica).

- JAMOVI
- Software gratuito baseado em linguagem R!
- Executa algumas análises Rasch.

- Linguagem R
- Open source
- https://www.r-project.org/
- https://rstudio.com/
- Inclui pacotes para incontáveis análises estatísticas, inclusivamente diversos pacotes para realizar
TRI (e.g., mIRT, ltm)
- Exige competências de programação —> Curva de aprendizagem elevada
- Não possui GUI.

Conclusão:

- A TRI não deve ser entendida como um método que visa substituir a TCT, mas sim complementá-la.
- Por outro lado, pode ser muito útil que ambas as técnicas sejam aplicadas conjuntamente, o que
possibilita uma avaliação estrutural mais completa do instrumento, além de minimizar as limitações de
cada um dos métodos. Cabe salientar, nesse sentido, que a TCT e a TRI devem ser vistas como abordagens
complementares, podendo fornecer informações úteis em diversas fases da análise.

74
Glossário:

Entrevista e observação

- A entrevista de avaliação (Contexto Clínico)

- Provavelmente o instrumento mais importante de recolha de informação.


- Sem os dados recolhidos durante a entrevista, a maioria dos testes psicológicos perdem significado.

- VANTAGENS DA ENTREVISTA
1. Permite obter informação potencialmente valiosa que não pode ser obtida de outras formas:
Observações comportamentais; Características idiossincráticas do paciente; Reações da pessoa
à sua situação de vida atual.
2. São a principal forma de desenvolver uma relação com o paciente.
3. Pode servir como forma de verificação do significado e validade dos resultados nos testes.
4. Pode promover uma melhor compreensão do problema, tanto para o entrevistador como para
o entrevistado

75
- OBJETIVOS DA ENTREVISTA
1. Avaliar as capacidades do paciente;
2. Avaliar o nível de ajustamento;
3. Avaliar a natureza e a história do problema;
4. Recolher informação importante para o diagnóstico;
5. Elaborar a história pessoal e familiar relevante.

- TIPOS DE ENTREVISTA

ESTRUTURADA NÃO ESTRUTURADA

São mais diretivas e orientadas para objetivos;


Permitem que os participantes divaguem livremente
Utilizam com frequência escalas de avaliação e listas
de uma área/tema para a outra.
de áreas abordadas.

VANTAGENS

- Flexibilidade

- Possibilidade de maior rapport


VANTAGENS
- Possibilidade de avaliar como o paciente organiza
- Boas qualidades psicométricas as suas respostas

- Potencial para utilização em investigação - Maior possibilidade de explorar detalhes únicos da


história do cliente
- Podem ser administradas por pessoal
relativamente menos treinado
DESVANTAGENS

- Menor fidelidade e validade, o que têm levado a


críticas e a uma menor confiança nos seus
resultados.

- EXEMPLOS DE ENTREVISTAS ESTRUTURADAS:


1. Schedule for Affective Disorders and Schizophrenia (SADS)
2. Structured Clinical Interview for DSM Disorders (SCID)
3. Mini-International Neuropsychiatric Interview (MINI)
4. World Health Organisation Composite International Diagnostic Interview (CIDI)
5. Schedules for Clinical Assessment in Neuropsychiatry (SCAN)

76
HISTÓRIA E DESENVOLVIMENTO | O INÍCIO:
- As entrevistas clínicas foram a 1ª forma de obter informação sobre os pacientes.
- No início seguiam o formato médico de pergunta-resposta.
- A influência das teorias psicodinâmicas levou a um formato mais aberto e livre.
- Paralelamente, foi desenvolvido por Adolf Meyer em 1902 o “exame do estado mental”, mais estruturado
e orientado para objetivos. Continua a ser usado principalmente em contexto psiquiátrico ou quando o
tempo é limitado.

- Avalia áreas relevantes do funcionamento do paciente como:


- Aparência global
- Comportamento
- Processos mentais
- Conteúdos do pensamento
- Memória
- Atenção
- Discurso
- Insight e capacidade de julgamento

- Exame do estado mental:


- é o conhecimento da capacidade mental ativa por meio da avaliação de aspeto geral, comportamento,
qualquer crença e perceção incomum ou bizarra (delírios, alucinações), humor e todos os aspetos da
cognição (atenção, orientação, memória).
- é realizado em qualquer indivíduo com alteração do estado mental ou comprometimento da cognição,
seja agudo ou crónico. Há várias ferramentas de triagem disponíveis; as seguintes são especialmente
úteis:
- Montreal Cognitive Assessment (MOCA) para triagem geral porque abrange uma ampla variedade
de funções cognitivas.
- Miniexame do estado mental ao avaliar pacientes para doença de Alzheimer porque focaliza
testes de memória.

- Os resultados basais são registados e o exame é repetido anualmente e sempre que houver suspeita
de alteração do estado mental. Deve-se avisar os pacientes que o registo do estado mental é rotina e
que não devem ficar constrangidos com a realização do exame.
- O exame é realizado numa sala silenciosa, e o examinador deve ter certeza de que o paciente pode
ouvir claramente as perguntas. Os pacientes que não falam português como língua principal devem ser
questionados na língua em que são fluentes.
- Este exame avalia os diferentes parâmetros da função cognitiva. Inicialmente, o examinador deve
constatar que o paciente está atento - p.e., avaliando o seu nível de atenção enquanto a história está a
ser tomada ou solicitando que repita 3 palavras imediatamente. Não é apropriado testar um paciente
desatento.
- Os parâmetros da função cognitiva a serem testados e exemplos de como testá-los incluem:
orientação; MCP; MLP; Cálculos matemáticos; procura de palavras; atenção e concentração;
identificação de objetos; obedecer a comandos; escrita; orientação espacial; raciocínio abstrato;
julgamento.
77
ENTREVISTA CLÍNICA, AVALIAÇÃO DO ESTADO MENTAL E FORMULAÇÃO DE HIPÓTESES

- Para além da ENTREVISTA CLÍNICA, os dados da OBSERVAÇÃO CLÍNICA (ferramenta para avaliar o estado
atual de funcionamento da pessoa) podem ser organizados para realizar a AVALIAÇÃO DO ESTADO
MENTAL.
- Wright (2011, pp. 45-48), FORMULÁRIO DE REGISTO DE DADOS DA AVALIAÇÃO DO ESTADO MENTAL.

- Principais categorias:
1. Aparência
2. Comportamento
3. Discurso
4. Humor e afeto
5. Percepção
6. Pensamento
7. Cognição
8. Consciência
9. Consciência do Eu

- Independentemente do estilo utilizado, todas as entrevistas tinham por objetivos:


1. Obter um retrato psicológico da pessoa;
2. Concetualizar a causa das dificuldades atuais da pessoa;
3. Elaborar um diagnóstico;
4. Formular um plano de tratamento.

Os primeiros testes estandardizados foram desenvolvidos para ultrapassar as limitações das entrevistas não
estruturadas em termos de fidelidade e validade.

DESENVOLVIMENTOS DURANTE OS ANOS 40 E 50

- Muitos estudos foram desenvolvidos com o objetivo de investigar várias dimensões críticas das
entrevistas, entre as quais:

1. Orientação para objetivos vs. elementos expressivos


2. Grau de diretividade e quantidade de estruturação

DESENVOLVIMENTOS DURANTE OS ANOS 60

- Foram surgindo diversos métodos, defendidos por diferentes escolas de pensamento, como por ex:

1. As abordagens centradas na pessoa enfatizavam a importância de encorajar a auto-exploração


do paciente.

78
2. As entrevistas comportamentais enfatizavam os antecedentes e as consequências do
comportamento.
3. A terapia familiar focava-se nos processos interativos grupais.

- Pouco esforço foi feito no sentido de integrar as diferentes ideologias.


- No fim dos anos 60 começaram a surgir as entrevistas estruturadas com crianças, até então não utilizadas
(a avaliação das crianças era realizada maioritariamente através de entrevistas com os pais):
- O diálogo com a criança era considerado apenas para fins terapêuticos.
- O diagnóstico diferencial era pouco usual (as crianças eram na sua maioria não diagnosticadas ou
diagnosticadas com “reações de desajustamento”).

DESENVOLVIMENTOS DURANTE OS ANOS 70

- As tendências dos anos 60 continuaram a ser desenvolvidas, com um ênfase cada vez maior nas entrevista
estruturadas. Este interesse ganhava peso à medida que surgiam cada vez mais críticas sobre a fraca
fidelidade do diagnóstico psiquiátrico não sistematizado.
- O sucesso inicial com as entrevistas estruturadas para adultos encorajou a aposta no desenvolvimento
de entrevistas estruturadas para crianças. Assim, a avaliação de crianças passou a ter em conta não apenas
a informação fornecida pelos pais, mas também a experiência da própria criança.
- Verificou-se uma tendência para:
- Questionamento direto da criança;
- Maior ênfase no diagnóstico diferencial;
- Desenvolvimento de versões paralelas de entrevistas estruturadas para pais e filhos.

- Lazarus (1973) desenvolveu o modelo BASIC-ID, que define que uma avaliação completa através de
entrevista deve envolver:
1. Comportamentos -“ Behaviour” (B)
2. Afeto (A)
3. Sensações (S)
4. Imagética (I)
5. Cognição (C)
6. Relações interpessoais (I)
7. Necessidade de intervenção farmacológica/drogas (D)

- Nos anos 70 começaram também a surgir esforços no sentido de integrar informação biográfica para
prever o comportamento futuro (suicídio, perigosidade, prognóstico de esquizofrenia) e para inferir traços
atuais, bem como integrar esta informação com os resultados em testes.

DESENVOLVIMENTOS DURANTE OS ANOS 80

- Refinamento e adaptação de muitas das tendências, conceitos e instrumentos desenvolvidos durante os


anos 60 e 70.
- Adaptação de muitos instrumentos às categorias de diagnóstico do DSM.
- Melhor delineamento das perturbações da infância, que requeria mais conhecimento sobre diagnóstico
diferencial e maior uso de entrevistas estruturadas como parte da avaliação.

79
- A distinção entre testes e entrevistas tornou-se um pouco menos clara, uma vez que estas se estavam a
tornar cada vez mais estruturadas (incluindo escalas e estratégias de diagnóstico específicas).
- A cotação/interpretação de alguns testes e entrevistas estruturadas começou a ser feita com recurso a
software.

APÓS OS ANOS 90

- Importância crescente dada a:

1. Gestão dos cuidados de saúde: ênfase colocada na relação custo-eficácia dos cuidados prestados;
no caso das entrevistas, significa obter a informação necessária na menor quantidade de tempo:
- Rentabilização das entrevistas com recurso a meios computarizados para obter informação;
- Redução do tempo face-a-face com o paciente.

2. Controvérsia sobre a validade das memórias reprimidas: até que ponto é que a informação obtida
através dos clientes representa a verdade dos factos:
- Investigação mostra de forma consistente que, em muitas situações, os auto-relatos dos
pacientes são reconstruções dos acontecimentos e são particularmente questionáveis no
caso de relatos retrospetivos sobre variáveis psicossociais;
- Os entrevistadores têm que ter particular cuidado para evitar que o seu método e estilo de
questionamento contribua para a distorção da informação obtida dos pacientes;
- Particularmente relevante em situações de alegado abuso sexual de crianças.

FIDELIDADE E VALIDADE

FIDELIDADE
- A fidelidade das entrevistas, avaliada com base no grau de concordância entre entrevistadores, é
bastante variável;
- As entrevistas muito estruturadas revelam níveis de fidelidade superiores. Contudo, um maior grau de
estrutura acaba por enfraquecer a principal vantagem das entrevistas - a sua flexibilidade para obter
certos tipos de informação.

VALIDADE - Enviesamentos do entrevistador

1. Efeitos de halo - tendência para desenvolver uma certa impressão da pessoa e depois inferir outras
características aparentemente relacionadas (ex: pessoas que expressam entusiasmo podem ser vistas
como mais competentes ou mais mentalmente saudáveis do que realmente são; “o que é bonito é bom”).
2. Uma característica particularmente saliente (nível educacional, aparência física, etc.) pode levar o
entrevistador a julgar em concordância outras características que considera relacionadas.
3. Enviesamentos confirmatórios - o entrevistador faz uma inferência sobre o paciente e depois conduz a
entrevista de forma a tentar confirmar a sua inferência.
4. Focalização incorreta em explicações do comportamento que enfatizam traços em vez de determinantes
situacionais.
VALIDADE - Enviesamentos do paciente

1. Distorção das respostas para apresentar uma imagem mais favorável de si próprio (mais comum em
áreas mais sensíveis, como o comportamento sexual).
2. Casos mais extremos de falsificação - mentiras, delírio, confabulação, mentirosos compulsivos.

80
3. Inexatidão relativamente a recordações do passado - mais frequente em relação a informação
psicossocial (ex: conflitos familiares, início de sintomas psiquiátricos, etc.).

- Estudos de revisão sobre a validade das entrevistas (avaliações dos entrevistadores comparadas com
outros critérios externos) mostram também grande variabilidade.
- Validade aumenta à medida que o formato das entrevistas se torna mais estruturado.
- Validade varia de acordo com o tipo de variável que está a ser avaliada (ex: Previsão de
comportamento laboral com maior validade do que avaliação de características psicológicas).

- CONCLUSÃO: Informação proveniente de entrevistas não estruturadas deve ser tratada com cuidado e
como hipóteses que necessitam de ser confirmadas por outros meios.

CONSIDERAÇÕES GERAIS SOBRE AS ENTREVISTAS

- Não existe um método único correto de conduzir uma entrevista não estruturada ou semi-estruturada.
- O estilo do entrevistador é fortemente influenciado pela sua orientação teórica e por considerações
práticas:
- Teorias centradas no paciente - entrevistas não diretivas e que evitam questões muito estruturadas;
objetivo é criar a relação interpessoal mais propícia para gerar uma auto-mudança.
- Teorias comportamentais - entrevistas relativamente mais estruturadas porque visam obter
informação específica que ajude a delinear estratégias que permitam alterar as condições externas
que levarão à mudança comportamental.

- Alguns estilos de entrevista e estratégias podem resultar bem com alguns pacientes e ser ineficazes com
outros.

ENTREVISTA DIAGNÓSTICA

- Objetivo: obter um diagnóstico específico, geralmente com base no modelo multiaxial do DSM.
- Procedimento: seguem-se vários passos, nos quais o clínico:
1. Forma pistas diagnósticas;
2. Considera essas pistas em relação aos critérios de diagnóstico;
3. Elabora a história psiquiátrica;
4. Com base nessa informação, elabora um diagnóstico multiaxial, com estimativa de prognóstico.

- Entrevista diretiva, considerando os critérios de exclusão e inclusão para as várias patologias.


- Mais típica de contextos psiquiátricos ou médicos em geral.

ENTREVISTA EXPLORATÓRIA

- Objetivo: obter informação sobre diversas áreas de funcionamento do paciente, tais como:
1. Estilo de coping
2. Suporte social
3. Dinâmica familiar
4. Natureza do problema
5. Etc.

81
- Entrevista pouco diretiva, e mais flexível relativamente aos temas/áreas a abordar.
- Quando o valor do diagnóstico formal não é considerado tão relevante e como tal não se seguem os
critérios do DSM.

Formato mais comum...


ENTREVISTA SEMI-ESTRUTURADA

- O entrevistador elabora uma lista sequencial de questões que pretende colocar.


- A lista deve ser elaborada em função de áreas relevantes para o paciente em causa (e poderá ser diferente
para cada paciente).
- Cada conjunto de questões não deverá ser seguido de forma rígida, mas sim com algum grau de
flexibilidade que permite explorar áreas únicas relevantes que surjam durante a entrevista.

- Exemplos de questões para explorar a história do problema:


1. O que é que o/a traz aqui? Quais são as suas preocupações?
2. Pode descrever-me a mais importante dessas preocupações?
3. Quando é que essa dificuldade apareceu pela primeira vez?
4. Com que frequência é que ocorre?
5. Têm havido algumas alterações na frequência com que ocorre?
6. O que é que acontece após esse comportamento ter ocorrido?

CHECKLIST PARA ENTREVISTA DE AVALIAÇÃO E HISTÓRIA DE CASO (Segundo Groth-Marnat, 2003, p. 79 :


pontos a considerar)

- História do Problema —> Descrição do problema; Início do problema; Alterações na frequência;


Antecedentes/consequências. (Intensidade e duração; Tratamentos anteriores; Tentativas de resolução;
Tratamento formal).
- Background Familiar —> Nível sócio-económico; Ocupação dos pais; História emocional/médica;
Casado/separado/divorciado; Constelação familiar. (Background cultural; Estado de saúde actual dos pais;
Relações familiares; Educação em meio rural / urbano).
- História Pessoal —> Infância precoce: Marcos de desenvolvimento; Atmosfera familiar; Quantidade de
contacto com os pais. (História médica precoce; Controlo de esfíncteres).

- Infância —> Adaptação à escola; Sucesso académico; Hobbies/atividades/interesses. (Relação com os


pares; Relação com os pais; Alterações de vida importantes)
- Adolescência —> Todas as áreas listadas para a infância; Presença de comportamentos de acting out
(legais, drogas, sexuais). (Namoros precoces; Reações à puberdade).
- Jovem adulto e Adulto —> Carreira / ocupação; Relações interpessoais; Satisfação com as metas da vida;
Hobbies / atividades / interesses. (Casamento; História médica / emocional; Relação com os pais;
Estabilidade económica).
- Meia idade —> História médica; Integridade do ego. (Reação ao declínio das capacidades; Estabilidade
económica).

- Diversos —> Auto-conceito (gosta/não gosta); Memória mais feliz / mais triste; Memória mais precoce;
Medos. (Queixas somáticas (dores de cabeça, dores de estômago, etc.); Acontecimentos de geram
felicidade / tristeza; Sonhos recorrentes / relevantes).

82
COMPONENTES DA ENTREVISTA CLÍNICA
(segundo Wright, 2011, cap. 1, pp. 15 e seguintes)

- (1) Identificação do problema atual (e sua história [i.e., início e desenvolvimento]);


- (2) Avaliação sintomática;
- (3) Avaliação psicossocial.

(1) Problema atual e sua história [início e desenvolvimento]


Amplitude de aspetos a considerar durante a entrevista:

- Fatores de stress atuais;


- Queixas sobre o estado de funcionamento cognitivo (atenção/concentração; memória; linguagem;
resolução de problemas; tomada de decisão; alucinações; ilusões);
- Queixas do domínio emocional (humor – desespero aprendido; desesperança; sentir-se sem valor; choro;
sintomas maníacos; ansiedade; sono; nível de energia; hobbies/passatempos/lazer; líbido);
- Ideação suicida (ideação; intenção; planificação; meios);
- Ideação agressiva/homicida (ideação; intenção; planificação; meios);

- [INÍCIO E DESENVOLVIMENTO: 1ª vez que ocorreu (e quando); como foi evoluindo; tentativas de lidar
com o problema; procurou ajuda alguma vez?].

(2) Avaliação sintomática


Amplitude de aspetos a considerar durante a entrevista:

- História de desenvolvimento (problemas durante a gravidez; nascimento e parto; marcos de


desenvolvimento, e.g. sentar-se, levantar-se, andar, deixar fraldas, falar, socialização;
- História psiquiátrica (qualquer história de diagnóstico psiquiátrico; história de tratamento psiquiátrico;
história de medicação psiquiátrica);
- História de consumo de álcool/substâncias (álcool – quantidade e frequência no passado; quantidade e
frequência no presente; impacto na sua vida; outras substâncias, incluindo substâncias de prescrição
médica - quantidade e frequência no passado; quantidade e frequência no presente; impacto na sua vida);
- História médica (doenças actuais: início, curso, tratamento e medicações; doenças significativas no
passado: início, curso, tratamento e medicações; história de perda de consciência/desmaios);
- História médica e psiquiátrica familiar.

(3) Avaliação psicossocial


Amplitude de aspetos a considerar durante a entrevista:

- História familiar (e.g., estrutura familiar atual [estado civil, relação romântica? crianças? eventos
familiares significativos] e passada, i.e., da família de origem [nº de irmãos, idades e qualidade das
relações, cuidador principal e qualidade da relação; eventos familiares significativos);
- História escolar (habilitações literárias - nível de escolaridade concluído, anos, grau, área; história escolar
- dificuldades de aprendizagem, educação especial, repetição de ano, problemas atencionais na escola,
hiperatividade na escola, problemas emocionais e/ou comportamentais na escola; desempenho
académico em geral);

83
- História vocacional/laboral (trabalho atual - desde quando, qualidade do desempenho, satisfação com o
trabalho atual; trabalhos passados - períodos de tempo, qualidade do desempenho, satisfação com esses
trabalhos; aspirações de carreira);
- História (antecedentes) legal/criminal (situações legais/criminais atuais e no passado - em ambos
averiguar: liberdade condicional; ações judiciais; impacto na vida diária);
- História de socialização (cobre aspetos como o nº de amigos, duração e qualidade das relações, as redes
sociais e atividades sociais em que o ind. participa/ou; sistema social de apoio atual - melhor(es) amigo(s)
e relações românticas atuais, caso não tenham sido indicadas na hist. familiar; história social - história de
dificuldades interpessoais; história de relacionamentos românticos);
- História psicossexual (atividade sexual atual: frequência, parceiro(s), grau de satisfação; passada: início
da puberdade, história de atividade sexual, história de abuso, trauma ou violência sexuais);
- Avaliação multicultural (língua; história de imigração - quando imigrou, questões de aculturação;
identidade cultural, racial e étnica; história e identidade espiritual e religiosa; identidade sexual).

ENTREVISTA CLÍNICA, AVALIAÇÃO DO ESTADO MENTAL E FORMULAÇÃO DE HIPÓTESES

- Com base na ENTREVISTA CLÍNICA e na AVALIAÇÃO DO ESTADO MENTAL deverá ser possível formular
hipóteses acerca do funcionamento psicológico do indivíduo, objetivo da entrevista de avaliação
(qualquer que seja a orientação teórica do psicólogo).
- Tal requer conhecimentos aprofundados de psicodiagnóstico (saber que problemas de atenção
podem ser um dos sintomas de depressão), assim como de personalidade, funcionamento emocional
e cognitivo.
- Pode ser útil considerar as classificações principais de perturbações mentais (CID; DSM), mas isto
não basta a um psicólogo. É necessário, consoante a orientação do psicólogo, um diagnóstico
psicodinâmico, um diagnóstico ou formulação cognitivo-comportamental;
- Ex: no âmbito de uma abordagem cognitivo-comportamental, é habitual formular-se o caso através
da identificação de prováveis fatores predisponentes, precipitantes e de manutenção (para explicar
a origem do problema, o seu desenvolvimento e fatores perpetuadores atuais), antecedentes e
consequentes, procurando-se detetar reforçadores, crenças e esquemas cognitivos mal-
adaptativos responsáveis pelas dificuldades do indivíduo.

- A formulação de hipóteses guiará a seleção das estratégias de intervenção psicológica.

OUTROS FACTORES RELEVANTES

Atitude do entrevistador
- Relação estabelecida é essencial (confiança);
- Expressão de sinceridade, aceitação, compreensão, interesse genuíno, consideração pelo valor da
pessoa;
- Compreender as emoções do paciente e detetar as mensagens emocionais que são apenas
parcialmente expressadas, particularmente através de pistas não-verbais (expressão facial, tom de
voz, postura, movimentos inconscientes, etc.)

Tomar notas
- É recomendado que se tirem algumas notas durante a entrevista (não em demasia, para não
prejudicar o estabelecimento da relação e para não aumentar a ansiedade do paciente);

84
- Vantagens: registam-se mais detalhes e evitam-se distorções de memória relativamente a fazer o
registo apenas após a entrevista;
- Se a entrevista for gravada em áudio/vídeo, as razões devem ser explicadas, deve garantir-se a
confidencialidade e pedir uma autorização escrita.

TÁTICAS PARA ENTREVISTA


[O treino mais importante passa por assistir a entrevistas ou rever entrevistas gravadas!]

Preliminares
- Deve ter-se em conta os seguintes aspetos:

1. Características físicas do local: sala organizada, boa iluminação, disposição das cadeiras de forma a que
o paciente e o entrevistador não estejam demasiado perto ou longe; altura do olhar deve ser
aproximadamente igual;
2. O entrevistador deve apresentar-se e clarificar como o paciente prefere ser tratado;
3. Indicar o objetivo da entrevista e verificar se o paciente compreende a situação;
4. Explicar como é que a informação obtida será utilizada;
5. Descrever a natureza confidencial da informação, os limites a essa confidencialidade e qualquer aspeto
relacionado que seja relevante (ex: como é que a informação poderá ser obtida e usada pelo sistema
judicial). Explicar que o paciente/cliente tem o direito de não discutir informação que não queira revelar.
6. Explicar o que é que o paciente terá que fazer, quais os instrumentos que serão utilizados durante a
avaliação, e uma estimativa do tempo total necessário.
7. Se for o caso, certificar-se que está tudo claro relativamente a pagamentos, preço por hora, etc.

Entrevistas Diretivas vs Não Diretivas


- A opção depende de considerações teóricas e práticas:

1. Se o tempo for limitado, a entrevista deverá ser diretiva e dirigida ao objetivo;


2. A abordagem será diferente para um paciente que chega referido por uma outra pessoa para avaliação
e que voltará a essa pessoa, em relação a alguém que vem com o objetivo de ser seguido em terapia;
3. Para pessoas muito ansiosas, uma abordagem não estruturada poderá aumentar ainda mais o nível de
ansiedade; para um paciente desmotivado e apático, também poderá ser mais adequada uma
abordagem diretiva;
4. Entrevistas comportamentais: mais estruturadas e dirigidas à obtenção de uma descrição compreensiva
dos comportamentos atuais, e cognições, atitudes e crenças relevantes;
5. Entrevistas de orientação mais psicodinâmica: menos estruturadas, que procuram investigar
motivações e dinâmicas subjacentes ao problema, e avaliar informação que poderá não estar a um nível
consciente;
6. As 2 abordagens não são mutuamente exclusivas, e utilizar um pouco de ambas poderá aumentar a
validade e eficácia da entrevista.

Sequência da Entrevista

1. A maioria dos autores recomenda que a entrevista comece por algumas questões abertas -
requerem que os pacientes se organizem e expressem na ausência de muita estrutura; será uma
oportunidade para evidenciarem características menos usuais mas significativas sobre si próprios.
Notar: fluência verbal, nível de assertividade, tom de voz, nível de energia, hesitações, áreas de
ansiedade, etc. Destas observações podem gerar-se hipóteses, que podem ser testadas através de
mais questões abertas ou mais diretivas.
2. Respostas/questões de grau de estrutura intermédio. Técnicas: Facilitação -“ Conte-me mais/Por
favor continue”/Contacto visual, etc; Clarificação - Pedir para ser mais específico ou dar exemplos

85
concretos; Empatia -“ Deve ter sido difícil para si…”; Confronto - Comentar ou mostrar
inconsistências na informação/comportamento; utilizar com cuidado, pois pode gerar ansiedade,
uma postura defensiva e deteriorar a relação….
3. Questões diretivas - devem ser utilizadas sempre que necessário; para testar hipóteses,
proporcionar alguma estrutura ao paciente, etc.

Exaustividade
- Pode ser importante utilizar uma checklist, para certificar que se cobrem as áreas mais relevantes;
- Nesse caso, pode começar-se por uma questão geral, como “Porque é que o enviaram para aqui?”
ou “Quais são os problemas que o/a preocupam?”;
- Aqui será importante tomar notas sobre a forma como o paciente organiza a sua resposta, o que diz
e como diz;
- Depois, poderão utilizar-se técnicas de facilitação, clarificação ou confronto para obter mais
informação;
- Finalmente, o entrevistador deverá rever a checklist e verificar se alguma da informação relevante
não foi obtida, colocando então questões diretas, como “Qual era a ocupação do seu pai?” ou
“Quando é que os seus pais se divorciaram?”;
- Para situações específicas (ex, abuso de menores, suicídio, TCE, etc.) poderão ter que se incluir
questões adicionais ou utilizar em conjunto com entrevistas estruturadas para estas situações
particulares.

Evitamento das Questões “Porquê”


- Podem contribuir para uma postura mais defensiva (pois podem parecer acusatórias ou críticas);
- Podem levar a respostas “intelectuais”, em que os pacientes se separam das suas emoções;
- Alternativas:
1. O que é que pensa de...?
2. Como é que isso ocorreu?

Comportamentos Não-Verbais
- É importante ter atenção ao comportamento não verbal do paciente, mas também do próprio
entrevistador;
- Expressar interesse através de contacto visual, ser facialmente recetivo, mostrar interesse/atenção
inclinando-se para a frente, etc..

Conclusão de Entrevista
- O entrevistador pode alertar o paciente a 5 ou 10 minutos do fim do tempo acordado, permitindo a
obtenção de alguma informação final relevante;
- O paciente deverá ter a oportunidade de colocar questões ou fazer comentários;
- No final, o entrevistador deverá fazer um sumário dos principais aspetos/temas abordados na
entrevista;
- Se for adequado, deverá ainda fazer algumas recomendações.

INTERPRETAÇÃO DOS DADOS DA ENTREVISTA

- Mesmo no caso de entrevistas estruturadas, a interpretação dos dados envolve julgamento clínico e a
experiência é um fator relevante.

86
- Interpretação influenciada pela perspetiva teórica, conhecimento da perturbação em causa, experiência
passada, objetivo da entrevista, etc.
- Material/informação que não esteja diretamente relacionado com o objetivo do pedido de avaliação
não deve ser incluído.

- Um dos principais OBJETIVOS é a elaboração de uma HISTÓRIA CLÍNICA/DE VIDA do paciente:


1. Nesse sentido, os factos podem ser organizados por ordem cronológica, de forma a desenvolver
uma narrativa coerente. As áreas problemáticas e temas relevantes para explicar o problema devem
ser abordadas em maior detalhe.
2. Alternativamente pode organizar-se a informação por domínios, tais como: afeto e estado de
humor, cognições, padrão de sintomas, estilo de coping, etc.

- A entrevista deve servir para gerar hipóteses que devem depois ser confirmadas por outros meios. Dados
das entrevistas que são apoiados por resultados noutros testes devem receber mais ênfase.

OBSERVAÇÃO COMPORTAMENTAL

- Métodos de avaliação indiretos


- Inventários, testes, etc —> Fazem referência a variáveis psicológicas que são avaliadas
retrospetivamente e implicam que os dados acerca do comportamento obtidos num tempo e local são
diferentes do tempo e local onde o comportamento se manifestou.

- Métodos de avaliação diretos


- Observação direta —> Registo da avaliação de comportamentos relevantes no momento ou local de
ocorrência habitual; A observação direta em meio natural é considerada o núcleo central do modelo de
avaliação comportamental.

- Observação Comportamental
- Designa um método para obter amostras de comportamentos e determinar situações que sejam
clinicamente importantes (em relação à avaliação, diagnóstico, ao prognóstico e ao planeamento e
medida da intervenção), numa situação natural ou numa situação análoga (que é estruturada de
maneira a proporcionar informação acerca de comportamentos e situações comparáveis às que
poderiam ter sido obtidas “in situ”).
- Limita-se a comportamentos objetivos, desde comportamentos relativamente discretos (e.g., tiques)
até interações sociais complexas (e.g., de natureza familiar);
- Regista o comportamento quando este ocorre;
- Implica o recurso a observadores imparciais treinados;
- Supõe a existência de regras e sistemas específicos de registo;
- Requer o uso de definições operacionais do comportamento previamente definidas e que envolvam
um grau mínimo de inferência.
- Requer procedimentos que avaliem a fiabilidade do sistema.
- Depois do uso das entrevistas e escalas de avaliação, o psicólogo fica com uma ideia acerca da natureza
do problema —> serve para pormenorizar o foco das observações diretas posteriores;
- Registo narrativo com referência à relação A-B-C (antecedente —> comportamento —> consequência);
87
- Desenvolvimento de definições operacionais do comportamento-alvo que possibilitem que qualquer
observador com treino possa conseguir detetar a ausência/presença do comportamento e distinguí-lo
de outros:
1. Deve referir-se a características observáveis;
2. Definir critérios de inclusão (saber o que faz parte do comportamento);
3. Definir critérios de exclusão (saber que características estão associadas ao comportamento
mas não fazem parte dele)

- Uma definição diz-se “operacional” se indicar (ou sugerir claramente) as operações que se deverão
realizar para detetar a presença do fenómeno a que se refere o conceito, tipificá-lo e (sempre que
possível) quantificá-lo.
- N.B: Uma definição operacional não esgota um conceito, visa tão-somente permitir a avaliação
objetiva e a intervenção monitorizável e eficaz.

- Tipos:

- Observação direta naturalista (e.g., em casa, sala de aula, etc);


a) Proporciona uma amostra do comportamento, tal como ele acontece, no tempo e lugar da sua
ocorrência habitual. É o método de observação mais direto e menos inferencial (embora não esteja isento
de influências);
b) Recurso a este método é reduzido porque exige um treino substancial e múltiplos observadores;
c) As observações centram-se muitas vezes nas interações pais-crianças o que implica o recurso a
unidades de observação mais globais e não tão moleculares.

-Observação direta análoga/laboratorial/clínica (e.g., sala de consulta, laboratório)


a) Recriação de uma situação análoga à situação real para suscitar os comportamentos;
b) Cenários/estímulos físicos devem ser o mais próximos possíveis dos do meio natural (e.g.,
mobiliário semelhante);
c) “Role-playing” - o psicólogo após a entrevista de identificação do problema adota o papel de uma
pessoa que esteja na situação problemática para detetar como o indivíduo reage;
d) As interações deverão ser o mais idênticas possível das que se passam em casa ou na escola —>
Quanto maior for a similitude do local e das condições, maiores serão as semelhanças das interações.

Vantagens da Observação direta análoga/laboratorial/clínica:


- Muito útil quando há restrições físicas naturalistas (i.e., impossibilidade de observar o indivíduo em casa);
- Redução de tempo e custos relativamente à observação direta naturalista;
- Maximiza a probabilidade do comportamento se manifestar;
- Possibilita um maior controlo de variáveis e estandardização das variáveis relativas à situação ou tarefas.

- Parâmetros psicométricos:

1. Precisão, fidelidade, garantia, fiabilidade


a) Acordo entre observadores
b) Teste-Reteste

88
a) Acordo entre observadores
- Maneira mais comum de medir a qualidade dos dados;
- Depois de uma comunicação prévia (familiarização com o registo, itens, etc) comparação de 2 registos,
feitos por 2 observadores diferentes, acerca do mesmo comportamento;
- Com o decorrer do tempo, os observadores transcrevem de forma diferente os comportamentos que
observam, sofrem flutuações (mesmo inconscientes), mesmo com grelhas pré-determinadas e com muito
treino.

b) Teste-Reteste
- Pode ser medida de 2 maneiras:
- 1. Correlacionando os primeiros dias de um período de registo (e.g., linha de base) com o registo dos
dias finais;
- 2. Correlacionar os registo obtidos nesse período em dias pares com os registos em dias ímpares.

2. Validade
a) Convergente
b) Preditiva
c) Conteúdo

a) Convergente
- Medida em que as observações do comportamento se correlacionam com outros métodos de medida da
mesma variável.

b) Preditiva
- Medida em que os comportamentos observados ajudam a prognosticar níveis posteriores de
comportamento do indivíduo.

c) Conteúdo
- Medida em que os comportamentos observados são representativos do comportamento atual.

- Efeito da reatividade
- A presença do observador afeta e modifica os comportamentos das pessoas observadas em direções
socialmente desejáveis;
- O próprio observador modifica o seu comportamento quando pressente que a pessoa observada sabe
que está nessa situação.

- Vantagens da observação:

- Muito úteis quando as queixas são demasiado vagas;


- Permite confirmar hipóteses fornecidas por outros métodos e identificar outros comportamentos
relevantes;
- Permite obter medidas de frequência e duração do comportamento, possibilitando a quantificação do
problema e a medição da eficácia das intervenções;
- Ajuda a fazer uma análise funcional;

89
- Apresenta elevada validade ecológica (observa os comportamentos numa atmosfera naturalista ou
muito próxima das condições reais).

- Limitações da observação:

- As exigências da consulta diferem das exigências da “vida real”;


- Os comportamentos observados mesmo em situações da maior validade ecológica podem não ser
generalizáveis a outras situações e momentos, principalmente quando a observação é limitada a um
curto intervalo (e.g., 20 min);
- Dificuldade de redução do efeito da reatividade;
- Ausência de normas;
- As observações estão limitadas a comportamentos manifestos, não podem avaliar componentes
afetivos, cognitivos e motivacionais do funcionamento do indivíduo.

- Como atenuar estas limitações?:

- Para redução das deformações, não deve ser dada ao observador nenhuma sugestão acerca de um
plano de intervenção;
- Planear observações prolongadas —> habituação e probabilidade de redução dos efeitos reativos;
- Recrutamento e treino de pais e professores já presentes no meio natural —> familiarização com as
definições operacionais e sistemas de registo, monitorização e feedback frequentes (processo moroso);
- O próprio observador deve “habituar-se” ao contexto antes de observar (e.g., passar algum tempo na
sala de aula);
- Envolver dois ou mais observadores, para se poder estabelecer o acordo entre observadores;
- Conduzir observações nos diferente locais onde o comportamento se tenha manifestado, de modo a
obter medidas da generalidade dos dados de observação.

- Técnicas de registo mais utilizadas:

- Registo de duração (quantidade de tempo ocupado com determinado comportamento);


- Registo de frequência (nº de vezes que um determinado comportamento ocorre, num intervalo
predeterminado, ou na totalidade da observação);
- Registo por intervalos (ocorrência ou não ocorrência de um determinado comportamento em séries
iguais de intervalos de tempo sucessivos. Os intervalos de tempo são geralmente de 60 minutos ou
menos).

90
Relatórios Psicológicos

DEFINIÇÃO:

- “Comunicação (…) de resultados de avaliação psicológica.”


- “Caracterização objetiva e síntese integradora e significativa de aspetos importantes do funcionamento
psicológico (cognitivo, emocional, comportamental).”
- “Aponta estratégias de intervenção adequadas.” (Simões, 2008)
- Ou seja, um relatório psicológico escrito será um documento com o qual se pretende comunicar os
resultados da AP, apresentando uma caracterização objetiva e uma síntese integradora e
significativa de aspetos relevantes do funcionamento psicológico de uma pessoa, e que orienta para
estratégias de intervenção adequadas.

- Para a sua credibilidade e valor, um RP deve mencionar os seus objetivos, responder às questões
(explícitas/implícitas) subjacentes ao pedido, justificar opiniões e especificar recomendações sobre a
intervenção.
- A “relevância” e “legibilidade” devem orientar a redação do RP, respeitando as necessidades de
informação e nível de conhecimento/formação do “leitor/utilizador” (que tem de compreender os
termos empregues) —> Linguagem compreensível e adequada aos destinatários.

- Nem toda a informação disponível deve ser incluída no RP. Apenas a que aumente a compreensão. Inclui
informação confidencial (não confundir com “anónimo”).
- O RP deve oferecer uma representação específica e realista sobre a pessoa, através de uma caracterização
clara dos seus desempenhos/comportamentos e resultados em testes ou provas.
- Deve responder de forma tão explícita e completa quanto possível às questões colocadas aquando do
pedido de avaliação/consulta psicológica.
- Toda a informação inserida num RP deve ser credível (devidamente fundamentada), convincente e válida.
- É essencial ter em conta quadros de referência normativos.

91
- O RP constitui um registo de avaliação que poderá, mais tarde, servir para outros usos (para além do
pedido que o motivou).
- O RP deve articular devidamente os dados da avaliação e com propostas de intervenção ou
recomendações.
- O RP não contém apenas elementos de avaliação. Decorrente da avaliação, é suposto conter uma alusão
(pelo menos básica) a recomendações, para fins de prevenção e/ou de intervenção, assim como para
facilitar eventual encaminhamento para outros profissionais ou especialistas.
- A informação proporcionada por um RP também facilitará a monitorização da evolução ou progressos
subsequentes.
- Deve ter-se em consideração que vai haver um “leitor principal” mas que poderão existir “leitores
secundários”.

- Destinatários possíveis:
- Pais / cuidadores
- Educadores / professores
- Criança/adolescente/adulto
- Médicos (e.g., psiquiatras, neurologistas, pediatras)
- Juízes, advogados
- Psicólogos
- Outros (e.g., terapeuta da fala, nutricionista)

- Cuidados a observar / princípios a respeitar:


1. Legibilidade
2. Utilidade
3. Especificidade
4. Credibilidade

1. Legibilidade do relatório
- Ir ao encontro das necessidades de informação solicitadas.
- Ter em conta escolaridade e formação dos destinatários.
- Incluir (somente) informação relevante.
- Excluir terminologia complexa e ter cuidado com a linguagem técnica (ex.: coordenação visuo-motora
pode ser algo que não se percebe).
- Se necessário, colocar definições dos conceitos/noções usados.
- Idealmente, entrevista de devolução de informação, antes do envio de relatório escrito.
- Pode revelar-se conveniente elaborar diferentes relatórios conforme o destinatário.

2. Utilidade do relatório
- Clarificar/descrever comportamentos e desempenhos observados.
- Apontar possibilidades de intervenção: sugerir soluções ou recomendações para as dificuldades
identificadas.

92
3. Especificidade do relatório
- Responder diretamente às questões concretas colocadas pela avaliação.
- Incluir uma descrição idiossincrática da pessoa em particular examinada.
- Formular conclusões e recomendações detalhadas considerando as circunstâncias de vida específicas da
pessoa avaliada.

4. Credibilidade do relatório
- Referir claramente os objetivos do RP (os quais têm a ver com o pedido).
- Dar resposta às questões (explícitas e implícitas) que motivaram o pedido de avaliação.
- Realizar uma escolha fundamentada dos instrumentos.
- Justificar as recomendações (p.ex., articulando-as com os dados da avaliação).
- Apresentação de afirmações credíveis e persuasivas (convincentes).

Relatórios Psicológicos | SECÇÕES HABITUAIS

Obs. prévia: grande variedade conforme contextos e finalidades de cada relatório. Apresenta-se aqui apenas
um modelo norteador, com alguma exaustividade.

- Identificação e informação geral do cliente/paciente/utente (ex: dados sócio-demográficos).


- Elementos relativos ao profissional (e.g., nome, cédula profissional, local em que está realizar o ato
profissional).
- Motivo da consulta / pedido de avaliação.
- História relevante / informação contextual.
- Testes aplicados ou outros procedimentos de avaliação (e.g., entrevistas psicológicas).
- Observações do comportamento.
- Avaliação do funcionamento atual através dos resultados obtidos.
- Formulação do caso (interpretações, impressões e conclusões).
- Recomendações.

Secções habituais | Motivo da consulta

- Breve descrição do motivo genérico, porque é solicitada a consulta/avaliação psicológica.


- Exs: avaliação da inteligência (rotina, deficiência mental, sobredotação); diagnóstico de possível
perturbação; diagnóstico diferencial; natureza e extensão de um problema; recomendações para
aconselhamento e psicoterapia (carácter apropriado, possíveis dificuldades); problemas nas relações
interpessoais; colocação num programa ou posto de trabalho (…)
- As afirmações devem ser baseadas em dados sobre a razão do pedido e conter afirmações orientadas
para resposta a esse pedido.

Secções habituais | História relevantes / informação contextual

- História resumida e relevante para a interpretação dos resultados —> Nesta secção faz sentido referir:
descrição do problema atual; história pessoal e social; percurso escolar e/ou laboral; problemas com

93
justiça (se aplicável: relevante em relatórios forenses); ambiente e história familiar; dados médicos
relevantes.

Secções habituais | Testes aplicadas/outros procedimentos

- Listar os testes ou outros instrumentos de avaliação (ex: entrevista) usados, providenciando informação
completa para a sua devida identificação (e.g., designação integral, ano, edição, versão).
- Incluir detalhes sobre a aplicação, p.ex. datas e tempo necessário para administração dos instrumentos.
- Fundamentar a pertinência/relevância do recurso específico a provas psicológicas sobretudo quando o
destinatário do RP não estiver minimamente familiarizado com os objetivos (e alcance) da AP.
- N.B.: Nenhum resultado de um teste deve ser referenciado sem explicação sobre o que pretende medir e
significado desse resultado (facultar informação técnica facilmente compreensível).
- Apresentar resultados com detalhe em relatórios legais (contexto forense, judicial) ou quando os
destinatários do RP são outros profissionais com conhecimentos sobre os testes (e.g. QIv, QI, nas escalas
de Wechsler; resultados T nas escalas do MMPI).
- Noutros contextos, a indicação dos resultados em detalhe pode não ser necessária - e.g.a, tomando o
caso da inteligência medida através das escalas de Wechsler, pode bastar uma afirmação do género: “os
resultados globais da WAIS sugerem que o A. apresenta provavelmente um funcionamento intelectual
geral acima da média”.

Secções habituais | Observações do Comportamento

Incluem:
- Descrição resumida de comportamentos específicos e relevantes (sem inferências clínicas de natureza
diagnóstica).
- Caracterização da aparência física - comportamentos motores.
- Comportamento e atitudes relativamente a si próprio, às tarefas e ao examinador.
- Comportamento durante a situação de teste, bem como métodos/estratégias de abordagem das tarefas
(e.g. testes de inteligência).
- (…) Pode ser feita referência a comportamentos em casa, na sala de aula, recreio…

Secções habituais | Avaliação do funcionamento atual através dos resultados obtidos


(i.e: nos testes/provas ou outros instrumentos + durante a observação do comportamento)

Como redigir - exs (1)


- (-) Os resultados nos testes mostram que o João pode ser uma pessoa moderadamente perturbada.
- (+) Os resultados nos testes sugerem que o João pode encontrar-se apenas Moderadamente perturbado.
- “A segunda afirmação preserva o grau de incerteza que pode ser apropriado quando os resultados dos
testes não permitem ser mais afirmativo” (Simões, 2008)
- Usar termos como “sugere”, “pode indicar”, “funcionamento provável” sempre que os dados não podem
ser interpretados com mais certeza.

Como redigir - exs (2)


- (-) O Sr. António encontra-se no nível médio de aptidão intelectual.
- (+) Os resultados do Sr. António situam o seu desempenho na tarefa no nível médio de aptidão intelectual.
94
- Diferença entre o sujeito e os resultados do sujeito nos testes; os resultados nos testes descrevem
aspetos do funcionamento psicológico do sujeito, mas não definem o sujeito como pessoa (além de que
se preserva o grau de incerteza inerente à avaliação - em rigor apenas temos acesso às respostas da pessoa
aquele teste…)

Secções habituais | Formulação/Concetualização do caso

- Secção fundamental do relatório! - Supõe clarificar e fundamentar a relação entre os dados da avaliação
psicológica e as interpretações/inferências.
- O estilo e conteúdo dependem da orientação teórica do psicólogo.
- Exs. de tópicos habitualmente referidos (conforme a “escola” em questão): aspetos intelectuais, relações
interpessoais, dificuldades/controlo emocional, áreas de conflito, mecanismos de defesa,
sentimentos/pensamentos relevantes, comportamentos adaptados/inadaptados, grau de compreensão
do problema por parte do sujeito, recursos pessoais mobilizáveis, aptidões sociais e objetivos vocacionais.
- As inferências formuladas, incluindo de natureza diagnóstica, devem basear-se na integração ou
articulação dos dados dos testes/provas, observações do comportamento, história relevante e outros
dados adicionais disponíveis.

Diferenciar claramente entre:

- Fontes de informação (respostas do sujeito relativamente a si próprio ou a testes psicométricos,


informações facultadas por outras pessoas, dados provenientes de relatórios anteriores).
- Inferências e interpretação do profissional.
- A especificação de um diagnóstico é controversa (vantagens e limites).
- A descrição dos fatores subjacentes ao problema (terminologia preferível a “causas”) deve ser feita
salvaguardando várias possibilidades. Embora dependendo da “escola do psicólogo”, revela-se útil
considerar:
- Fatores predisponentes
- Fatores precipitantes
- Fatores de manutenção

—> Identificados durante a avaliação, que ajudem a explicar dificuldades atuais e a selecionar
recomendações oportunas na secção seguinte do relatório.

- Especificar também aspetos positivos ou áreas fortes, para além das limitações em termos
comportamentais.

- Outros aspetos a referir:


- [quando aplicável: indicação das dificuldades que permanecem após a intervenção (incluindo aquelas
que foram encontradas na sua implementação)].
- Incluir informação sobre prognóstico? Necessidade de precaução acrescida na formulação de
considerações prognósticas quando não há certezas bem fundamentadas.

- Se incluir informação sobre prognóstico —> O prognóstico para este sujeito é A (resultado) e B
(descritor de prognóstico).
95
A. Resultado
- Melhoria, recuperação parcial
- Empregabilidade, regresso ao trabalho inicial
- Colocação em trabalho/atividade alternativa
- Apoio familiar, comunitário, institucional, estruturado…

B. Descritor prognóstico
- Excelente
- Bom
- Incerto porque…
- Pobre/precário/negativo/grave/terminal
- Desconhecido

- Intensidade: Problema crónico; sem alterações com a intervenção (aconselhamento, psicoterapia);


declínio rápido.

- Descritores da evolução:
1. Flutuante com remissões
2. Agudo
3. Benigno
4. Positiva
5. Negativa

- Descritores relativos ao sujeito:


1. A recuperar, convalescer, a fazer bons progressos
2. Difícil de modificar, refratário à intervenção
3. Manifesta dificuldades apesar da intervenção/tratamento

- Outras afirmações:
1. A gravidade e cronicidade dos seus sintomas sugere um prognóstico negativo.
2. A duração provável do tratamento é ___ com os seguintes objetivos terapêuticos (especificar).

Secções habituais | Sumário/Resumo + Recomendações

- Introduzir parágrafo (resumo/sumário final) que indique as impressões e interpretações mais importantes
(…).
- Neste reafirma-se o objetivo do RP, métodos de avaliação, resultados, formulação e recomendações.
- Explicitar a eventual necessidade de clarificar a formulação do problema, e consequentemente a
necessidade de continuar/prolongar a AP.
- Ter em conta a possibilidade do RP vir a ser usado no futuro com objetivos distintos das finalidades que
motivaram a sua redação atual. É fundamental que todas as informações e conclusões sejam formuladas
de forma clara e explicitar condições de validade (referir cenários alternativos, abordar a possibilidade
de, com o tempo, ocorrerem mudanças nos comportamentos, situações e resultados da AP).
- As recomendações devem estar logicamente relacionadas com os conteúdos das secções precedentes do
RP, ou seja:
96
- As recomendações devem estar relacionadas com o objetivo do RP e com a natureza do problema
(clarificada na secção da formulação do caso, decorrente dos resultados dos testes/outros e da
avaliação do funcionamento atual).

- Formular recomendações de forma:


- Clara
- Relevante, incluindo mencionar informação relevante que pode não ter sido solicitada.
- Prática (que possa ajudar aqueles que vão trabalhar com a pessoa, que permita formular/determinar
planos de ação e que sejam concretizáveis).
- Devem ser escolhidas entre aquelas que se sabem serem mais eficazes (com base na literatura e
experiência empírica) e atendendo aos recursos disponíveis.
- As recomendações/sugestões devem ser formuladas num formato onde se faça referência a
objetivos específicos (que comportamentos-alvo trabalhar nas sessões de aconselhamento/terapia,
exercícios e respetivos horários…).
- Indicar eventual necessidade de continuar/prolongar a AP.
- O RP deve influenciar a maneira como o leitor do relatório trabalha com o cliente/paciente/utente.
- O contacto entre o psicólogo e o destinatário do relatório deve/pode ser mantido

ESPECIFICAR, CONFORME FOR APLICÁVEL:

- Necessidade de Intervenção (aconselhamento ou psicoterapia) —> Justificações, indicações, nível atual


de funcionamento, estimativa de resultados; motivação, obstáculos previsíveis, probabilidade de aderir e
permanecer em aconselhamento ou psicoterapia, natureza “trabalhável” do problema.
- Recomendações gerais —> Opções globais, e.g., continuar a intervenção atual; intervenções adicionais;
mudança de programa; hospitalização… - Avaliações, estudos diagnósticos adicionais (ex.: médicos;
inteligência; personalidade; neuropsicologia; linguagem; vocacional; audiologia).
- Recomendações específicas —> Alterações das atividades sociais / tempos livres, e.g., aumentar
atividades fora de casa/família (...); iniciar atividades de voluntariado…
- Aconselhamento/psicoterapia: com que técnico(s); local; frequência e duração; tipo de terapia e técnicas
recomendadas.
- Objetivos do aconselhamento /psicoterapia
- Redução de sintomas
- Melhoria da autoestima
- Proporcionar um contexto de apoio para a exploração de sentimentos
- Trabalhar comportamentos defensivos e impedir descompensações adicionais
- Desenvolver insight
- Aumentar comportamentos de controlo
- Aumentar competências para lidar com situações de stress
- Tipos de intervenção - p.ex., se recomendações em contexto clínico:
- Terapia Cognitivo-Comportamental
- Terapia Familiar, Psicanálise, Grupos de Encontro, Análise Transacional.
97
- Terapia Expressiva (Arte, música, dança/movimento, escrita);
- Biblioterapia.
- Desenvolvimento da Consciência: Meditação Transcendental, Yoga, Zen.
- Grupos de Apoio Comunitários Especializados: Alcoólicos Anónimos
- Familiares de Doentes com Alzheimer,.…

Relatórios Psicológicos | problemas comuns nos RP

1. Fracasso em responder às questões colocadas no âmbito do pedido da consulta ou avaliação. Não


proporcionar a informação desejada/necessária.
2. Muito longo/reduzido. Deve-se encontrar equilíbrio brevidade/extensão. Um RP deve ser a forma mais
curta de comunicar a informação essencial.
3. Comunicar o que o leitor já sabe.
4. Contradições no RP.
5. Relutância em proporcionar conclusões realistas ou facultar informações negativas.
6. Fracasso em elaborar recomendações ou planos fundamentados em factos e razões.
7. Facultar apenas dados “puros”… resultados sem interpretações, juízos ou impressões.
8. Formular planos irrealistas para a pessoa.
9. Fracasso em considerar alternativas nas recomendações, nos cursos de ação e nos objetivos.
10. Facultar um resumo ou sumário que não o é: falha em integrar a informação, em elaborar um “retrato
compósito”.

Relatórios Psicológicos | mais recomendações sobre a redação de RP

- Colocar as afirmações numa forma positiva (ex.: “ser mais pontual” em vez de “não se atrasar”).
- Após nome completo na parte superior da 1ª página, pode usar-se o 1º nome (no caso das crianças) ou
último nome (no caso do adultos) nas referências subsequentes ao sujeito (confidencialidade).
- Para prevenir perda de páginas, numerar págs. na modalidade: 1/6; 2/6;…
- Certificar-se que as afirmações são consistentes.
- Escrita clara e legível, como já referido; uso de programa de processamento de texto com verificação
ortográfica e gramatical.
- Preferir afirmações específicas, definitivas e concretas, em vez de afirmações gerais, vagas, e abstratas.
- Evitar maneiras mais rápidas de dizer as coisas à custa da clareza das afirmações; palavras fantasiosas,
afetuosas; uso de qualificativos como “bastante”, “muito”, “pouco”, “simpático”.
- Evitar, quer omitir afirmações, quer usar palavras desnecessárias.
- Exprimir ideias de forma ordenada. “É o conteúdo e não o estilo que deve proteger o relatório da
monotonia” (in Simões, 2008).
- Não relatar com exagero, evitar generalizações ou interpretações excessivas.
- Minimizar o uso de linguagem técnica (definir termos, se necessário, como já mencionado).
- Recordar: adaptar o relatório às necessidades de informação dos leitores.
- Se citar uma outra pessoa (figura de autoridade..) ter a certeza de que essa pessoa é qualificada e neutra.
- Não interpretar para além dos dados disponíveis/obtidos.
- Identificar fundamentos que justificam conclusões causa-efeito (usar de máxima prudência ao tirar este
tipo de conclusões).

98
- Usar cabeçalhos, números, letras, itálicos, sublinhados, palavras a negro, etc…para aumentar a clareza do
texto, para evitar um formato exclusivamente narrativo.

- Incluir dados específicos em termos dos Tipos de intervenção


- Terapia do comportamento, psicanálise, grupos de apoio comunitários, intervenção em crise…
- Educação especial, aconselhamento, psicoterapia.

- Reafirmar a importância da confidencialidade: “este relatório é para ser utilizado por”…”uso restrito a….
Relatórios Psicológicos | Mais alguns exemplos concretos

- (-) O cliente estava no nível médio de aptidão.


- (+) O resultado do cliente situa-se no nível médio de aptidão.
- (diferença entre o cliente e os resultados do cliente no teste; os resultados descrevem aspetos do
funcionamento do cliente mas não definem o cliente como pessoa).

EXEMPLOS CONCRETOS - dos resultados à formulação:

- O João obteve um resultado de QI de 116; um resultado de QI de 116 encontra-se acima da média (“normal
brilhante”, nas Escalas de Wechsler). O João obteve um resultado QI de 116 mostrando que funciona
provavelmente acima da média no que diz respeito à capacidade intelectual geral.
- (-) Os deficientes mentais exigem frequentemente uma supervisão estreita
- (+) Pessoas com níveis reduzidos de aptidão intelectual geral e défice do comportamento adaptativo
exigem frequentemente uma maior supervisão.

- Distinção entre um diagnóstico e a pessoa com uma dado diagnóstico; uma formulação mais explícita,
com exemplos concretos ajuda a pensar o cliente como sujeito único com problemas de vida específicos.
- (-) O cliente pareceu nervoso durante a aplicação dos testes
- (+) O comportamento do cliente - como risos nervosos, tremor das mãos e uma abordagem hesitante
das tarefas - sugere que estava ansioso durante a avaliação.

- Informação adicional pode ajudar a clarificar as afirmações


- (-) Parece possível que o cliente possa desenvolver um distúrbio potencialmente mais grave.
- (+) É possível que o cliente possa desenvolver um distúrbio mais grave.

- Evitar linguagem vaga com vários condicionalismos; 2º exemplo preserva a intenção de assinalar a
possibilidade de distúrbio…que merece preocupação.
- (-) Estes resultados nos testes mostram que o cliente pode ser apenas moderadamente perturbado.
- (+) Estes resultados nos testes sugerem a possibilidade que o cliente possa ser apenas moderadamente
perturbado.

- Recordar: a 2ª afirmação preserva grau de incerteza recomendável quando os resultados dos testes não
permitem ser mais afirmativo; qualificar afirmações com expressões como “sugere”, “pode indicar”,
“pode mostrar”, “funcionamento provável”, quando os dados não podem ser interpretados com mais
certeza.

99
Exemplos concretos | dos resultados à formulação:

Combinação de ideias num parágrafo:


- 1º A Ana tem 28 anos e foi enviada para exame devido a uma aparente depressão: 1. os resultados da Ana
no MMPI (Minnesota Multiphasic Personality Inventory) são significativamente elevados nas escalas 2
(Depressão) e 7 (agitação ansiosa); 2. as respostas da Ana às questões formuladas foram breves e tendem
a exprimir desespero; 3. o resultado da Ana no Inventário de depressão de Beck (IDB) foi de 35, sendo
habitualmente interpretado como representativo de depressão “grave”; 4. os movimentos da Ana foram
lentos.
- Os resultados desta avaliação sugerem que a Ana está gravemente deprimida. Os resultados no MMPI
indicam que ela experiencia provavelmente sentimentos de tristeza e desespero. O seu resultado no
Inventário de Depressão de Beck é habitualmente interpretado como refletindo depressão grave. A
observação da Ana durante a situação de teste confirma esta impressão. Os seus movimentos foram lentos
e as suas respostas às questões foram breves, exprimiram tristeza e desespero. Globalmente, a
combinação destes dados aponta claramente para (a muito provável) presença de depressão grave.

- 2º O Pedro tem 12 anos e 1. evidencia erros impulsivos no reconhecimento de palavras; 2. os resultados


na WISC são os seguintes nos sub-testes da Memória de Dígitos (6); Código (4) e Aritmética (6). 3. As
informações dos professores relativamente ao comportamento do Pedro na sala de aula referem uma
maior impulsividade e atividade do que a manifestada pelos seus companheiros; 4. há igualmente a
informação que o pedro desafia a autoridade; 5. Os professores do Pedro comunicam que ele
frequentemente não responde às suas solicitações; 6. Os resultados do Pedro numa escala de avaliação
de comportamentos indicam que ele manifesta uma quantidade não habitual de comportamentos
incontrolados de hostilidade.
- Dados presentes nas afirmações 1,2 e 3 podem ser usados para inferir (o construto de nível intermédio
de) “défice na capacidade de atenção”, que pode conduzir à conclusão relativa de presença de “Défice de
Atenção”. Esta conclusão permite formular recomendações de intervenção no âmbito do modelo
cognitivo-comportamental (treino de auto-instrução), exame médico para averiguar o possível emprego
de medicação estimulante e, eventualmente, apoio especializado na atividade de leitura. Dados presentes
nas afirmações 4,5 e 6 ajudam a formular a inferência de “problemas no controlo dos impulsos” os quais
podem acarretar recomendações para uma intervenção comportamental. Parece poder-se inferir a
presença de Distúrbio do Comportamento - conclusão que pode conduzir à recomendação de gestão do
comportamento na sala de aula (estruturação), aconselhamento familiar ou colocação numa classe
especial.

Relatórios Psicológicos | Breves notas sobre RP em contextos específicos

- RP em contextos escolares:
- Tratam-se de RP sobre sujeitos que não funcionam bem na escola. Incluem:
1. Explicação para os padrões de comportamento e de aprendizagem que influenciam o (in)sucesso na
escola;
2. Análise pormenorizada dos padrões de aprendizagem sua interação com a aquisição de
competências escolares (inf acerca do rendimento/realização escolar é fundamental);
3. Descrição do estado sócio-emocional e comportamental ou de medidas de aptidão geral
(inteligência) cujos resultados são comparados com resultados obtidos em medidas de realização
escolar.

- NOTA: necessidade do conhecimento do vocabulário/linguagem dos professores e gestores escolares.

100
- Bagnato sugere outras recomendações:
1. Os RP devem ser organizados por domínio de aptidão mais do que em função dos testes
utilizados;
2. Os RP devem descrever áreas fortes e fracas em termos comportamentais;
3. Os RP devem enfatizar variáveis processuais, como as estratégias de aprendizagem;
4. Os RP devem ligar de forma estreita as tarefas de avaliação aos objetivos curriculares com o
objetivo de facilitar o desenvolvimento de planos educativos;
5. Os RP devem facultar aos professors recomendações para a implementação de técnicas de
controlo do comportamento.

- Dados presentes nos RP tem potencial para afetar as perceções e as expectativas dos professores acerca
do desempenho dos alunos.

- RP em contextos clínicos:
- O trabalho dos psicólogos com psiquiatras e assistentes sociais levanta o problema destes não estar,
familiarizados com a informação proveniente dos testes psicológicos e de não compreenderem
conceitos estatísticos cruciais para a interpretação dos testes.
- É necessário introduzir nos RP informação técnica pormenorizada a este nível.
- A avaliação dos distúrbios do comportamento ou da personalidade e avaliação da psicoterapia são os
objetivos mãos frequentes nos RP neste contexto.
- As diferentes orientações técnicas utilizadas pelo psicólogo influenciam a elaboração do RP: e.g.
discussão do significado da avaliação projetiva e objetiva da personalidade; uso dos conceitos instintos,
conflitos e mecanismos de defesa…

MAPA DE CONCEITOS

Um mapa conceitual é uma representação gráfica do conhecimento organizada hierarquicamente


que reflete o conteúdo da memória semântica de longo prazo de um indivíduo. Existe a técnica básica de
mapeamento; uma série de variações sobre esta; como os membros do corpo docente podem usar mapas
conceituais como um complemento às técnicas tradicionais de avaliação; e como meio de avaliar os mapas
dos alunos. A técnica básica de mapeamento é eficaz para avaliar o conhecimento.
A avaliação pré-teste-pós-teste desta técnica fornece suporte para a noção de que os mapas
conceituais são um meio válido de avaliar a mudança no conhecimento. Embora houvesse diferenças no nº
de conceitos representados no conteúdo dos mapas, não houve diferenças significativas no nº de níveis
hierárquicos ou ligações cruzadas. A experiência com a técnica sugere que pode ser eficaz na avaliação do
conhecimento numa variedade de cursos, com alunos em qualquer nível de formação.
Um dos principais pontos fortes dos mapas conceituais é sua flexibilidade. Podem ser usados para
avaliar o conhecimento de um indivíduo ou de um grupo sobre um tópico; podem ser usados como um
projeto em sala de aula ou entregues aos alunos como uma tarefa para levar para casa. Os mapas podem ser
amplos ou restritos, dependendo da natureza do conceito central selecionado. A criação de mapas
conceituais exige que os alunos explorem ativamente a sua compreensão das relações entre os conceitos.
Leva ao refinamento e síntese das estruturas de conhecimento de alguém; assim, o processo de mapeamento
é uma experiência de aprendizagem.
Uso de mapas conceituais como meio de avaliação; no entanto, a técnica e as suas variantes são
apropriadas para uma variedade de aplicações instrucionais. Os alunos podem usar mapas conceituais para
criar guias de estudo ou para delinear um trabalho. Um mapa bem especificado fornece uma estrutura
organizacional que pode melhorar a compreensão. Os alunos podem criar mapas conceituais das suas leituras
semanais ou desenvolver um mapa sobre um tópico específico. Independentemente de como os mapas
conceituais são usados - auxílio de estudo, tarefa de aula ou meio formal de avaliação - é uma forma criativa
e intuitivamente atraente de demonstrar o seu conhecimento relacionado ao curso.
101
A ferramenta de mapa conceitual evoluiu como forma de representar tanto os significados
específicos do conceito mantidos pelos alunos antes e depois da instrução, quanto as mudanças na estrutura
cognitiva que ocorreram ao longo de alguns anos.

102

Você também pode gostar