Você está na página 1de 30

FUNDAMENTOS DE MENSURAÇÃO

EM SAÚDE MENTAL
Clarice Gorenstein, Yuan-Pang Wang
[1]
A descoberta dos psicofármacos, na década de validar uma escala antes de aplicá-la a um idioma/
1960, impulsionou a elaboração e a aplicação de ambiente diferente do original. Porém, a maneira
instrumentos de avaliação. A psicometria como de fazer isso na prática não é tão evidente. Como
ciência remonta ao fim do século XIX, com vários se traduz um instrumento? Qual metodologia deve
estudos experimentais em psicologia. No entanto, ser utilizada na validação? A população-alvo, o
foi a necessidade de mensurar a eficácia dos medi- número de pessoas e testes estatísticos são ques-
camentos que ajudou a incorporar essa disciplina tões relevantes nesse processo. Resumidamente, a
na prática clínica. Os ensaios clínicos demandaram pergunta é: como validar um instrumento?
o desenvolvimento de instrumentos capazes de Mais ainda, perguntas comuns são difíceis de
detectar mudanças na sintomatologia em função responder: Qual instrumento deve-se usar para
da intervenção terapêutica e de uma metodologia uma determinada finalidade? Como escolhê-lo? O
específica para selecionar pacientes. A psicometria que determina a qualidade de um instrumento? A
passou a ser uma disciplina própria de estudo, que que tipos de cuidados os pesquisadores devem estar
utiliza técnicas estatísticas complexas, tornando atentos na sua aplicação e interpretação? Resumi-
sofisticada a efetividade da mensuração. damente, como escolher e utilizar um instrumento?
Pensou-se inicialmente que usar escalas de Essas são algumas das perguntas que os orga-
avaliação em todas as pesquisas garantiria o rigor nizadores e os autores tentam abordar neste livro.
científico, tanto na área de psicofarmacologia como
na área de epidemiologia/saúde pública, e sanaria  UTILIDADE DOS INSTRUMENTOS
vários problemas na pesquisa clínica e na avaliação DE AVALIAÇÃO
de grandes amostras populacionais. No entanto, Em primeiro lugar, é preciso ter em mente que uma
após mais de meio século da introdução dos pri- escala de avaliação em saúde mental é um instru-
meiros instrumentos, ainda há a necessidade de mento padronizado composto por um conjunto
uma ampla disseminação do conhecimento, tanto de itens que permite quantificar características
teórico como prático, para sua correta utilização.1 psíquicas, psicológicas ou comportamentais que
nem sempre são observáveis. Determinar a pre-
 INDO ALÉM DO VOCABULÁRIO sença de um sintoma passa, necessariamente, pela
DA PSICOMETRIA subjetividade do paciente e/ou do avaliador. As
“Escalas”, “questionários”, “inventários”, “entre- escalas de avaliação são apropriadas para estimar
vistas” e “instrumentos” de avaliação são termos a intensidade, a frequência ou mudanças de sinto-
presentes há um bom tempo no vocabulário de clí- mas, porém não servem para fazer um diagnóstico
nicos e pesquisadores brasileiros de diversas áreas. clínico, que é função das entrevistas diagnósticas.
Enquanto muitos acreditam que os instrumentos O uso sistemático de escalas padronizadas
de avaliação são úteis, nem tantos saberiam respon- pode auxiliar no rastreamento dos indivíduos que
der precisamente para que e em quais condições necessitam de tratamento, acompanhamento ou
se utilizam instrumentos de avaliação. Quais os intervenção. Além de complementar o diagnóstico
benefícios e desvantagens para o clínico, para o clínico, uma escala serve para avaliar as carac-
pesquisador e para o paciente? Resumidamente, terísticas clínicas de uma determinada doença,
as perguntas são: por que, para que e como usar documentar a gravidade e o nível necessário de
instrumentos de avaliação? cuidado. Durante o tratamento, o emprego de
“Validação” é também um termo frequente- es­calas sensíveis a mudanças ajuda a monitorar
mente usado. Dita-se que “é preciso validar uma a melhora e os efeitos adversos da intervenção.
escala antes de usá-la numa pesquisa”. Muitos Es­sas avaliações também são importantes para
pesquisadores reconhecem que, além da mera determinar o prognóstico e definir a decisão de
tradução de um instrumento, deve-se também tratamento ou conduta administrativa.
2  INSTRUMENTOS DE AVALIAÇÃO EM SAÚDE MENTAL

Os pacientes, por sua vez, também se benefi- Um instrumento que apresenta boas evidências
ciam do uso de escalas padronizadas, uma vez que de qualidades psicométricas em sua língua original
elas asseguram a cobertura de sinais e sintomas pode ter suas propriedades alteradas e prejudica-
e evitam sua omissão associados ao problema. das ao ser traduzido para outro idioma. A maioria
Quando os sintomas são quantificados e acoplados das escalas utilizadas no Brasil foi construída em
de acordo com um sistema de consenso (p. ex., língua inglesa. As primeiras escalas de avaliação
o Manual diagnóstico e estatístico de transtornos aqui adotadas eram traduzidas e aplicadas em pes-
men­tais – DSM ou a Classificação internacional de quisa sem estudos formais sobre suas qualidades.
doenças e problemas relacionados à saúde – CID), Provavelmente, a necessidade de atuar de forma
há melhora na consistência das avaliações, seja competitiva no âmbito internacional no campo da
ao longo do tempo, seja entre os examinadores. psicofarmacologia fez pesquisadores brasileiros
A uniformização da linguagem é fundamental optarem pela utilização de instrumentos ainda não
para melhorar a comunicação entre profissionais validados em nosso meio. Por exemplo, a Escala
e pacientes. de Depressão de Hamilton, de uso disseminado
As escalas padronizadas, no entanto, não desde a década de 1980, só recentemente (em 2014)
são desprovidas de desvantagens. Um aspecto a recebeu sua merecida validação no País. 3
considerar são os custos implicados no seu uso, A simples tradução do instrumento mostra-se
o tempo do paciente e do clínico, a necessidade muitas vezes inapropriada ou insuficiente para
de treinamento, os gastos com a aquisição do ins- começar a usá-lo. Expressões idiomáticas sem equi-
trumento, material e equipamentos associados. O valência linguística e cultural devem ser adaptadas
uso indiscriminado de um instrumento pode, por para o idioma português-brasileiro, assim como
sua vez, levar à detecção inadequada de muitos para a cultura local e para comportamentos sancio-
casos sem demanda real de tratamento. Portanto, nados socialmente. Além disso, as manifestações
é preciso ponderar sobre os custos e benefícios clínicas, a evolução e o prognóstico de muitos
da aplicação de determinada escala considerando transtornos mentais podem sofrer a influência de
todos os participantes de uma pesquisa.2 fatores socioculturais. O instrumento final, após os
processos de tradução e adaptação transcultural,
 QUALIDADES DE UMA ESCALA precisa ainda de estudos adicionais de validação
Uma escala sem validação é válida? E sem confiabi- no novo ambiente para que sua equivalência na
lidade, é confiável? O que atesta a qualidade de um população-alvo seja estabelecida. A exigência
instrumento? Em primeiro lugar, sua elaboração de validação transcultural de um instrumento
deve seguir os princípios teóricos considerados envolve processo demorado e trabalhoso, porém
adequados, e o instrumento resultante deve ter necessário.
propriedades psicométricas robustas. Entre as
propriedades atribuídas às escalas de avaliação,  COMO ESCOLHER
destacam-se a confiabilidade e a validade. A ESCALA A SER USADA
A confiabilidade refere-se à qualidade da Nas últimas décadas, vários instrumentos de ava-
medida em relação a sua precisão, ou seja, um liação foram traduzidos, reformulados, validados
instrumento é mais confiável quanto menor forem e publica­dos na literatura científica nacional. Um
os erros por viés ou acaso. “Confiabilidade”, “fide- número crescente dessas escalas foi incorporado
dignidade”, “reprodutibilidade” e “estabilidade” de ao uso clínico e em pesquisa no Brasil. Esse apa-
uma escala são termos equivalentes que garantem rente cenário favorável reflete a necessidade de
que o efeito de uma intervenção seja documentado estabelecer critérios que direcionem a escolha do
com exatidão. Essas propriedades são principal- instrumento mais adequado para cada finalidade.
mente importantes no caso de ensaios clínicos A existência de informações psicométricas
cujas conclusões dependam da credibilidade das apropriadas e o objetivo da pesquisa direcionado
medidas repetidas. ao contexto da escala são fundamentais para esco-
A validade refere-se à capacidade de um lha. Não seria sensato utilizar uma longa entrevista
instrumento de medir aquilo que ele se propõe a estruturada, que requer treinamento especializa-
avaliar. Os pesquisadores devem certificar que a do, para avaliar um aspecto específico da patologia,
escala realmente consegue mensurar o efeito de como, por exemplo, uma fobia específica.
interesse, isto é, o construto medido pela escala. É importante também saber exatamente como
Ambas, confiabilidade e validade, são determina- utilizar, interpretar os resultados e evitar os erros
das com diferentes metodologias. oriundos de fatores que interferem na medida. Preo­
fundamentos de mensuração em saúde mental [1]  3

cupados com esses aspectos, procuramos incluir de e as abordagens estatísticas para sua avaliação.
nesta obra autores que tivessem experiência para Descreve as principais etapas envolvidas na cons-
compartilhar quanto ao bom uso do instrumento, trução e validação de um instrumento desenvolvido
isto é, apontar seus pontos fortes, os fatores que originalmente em outro idioma, bem como sua
afetam as pontuações, os cuidados necessários adaptação transcultural.
na aplicação e interpretação dos resultados, bem Em seguida, a seção Entrevistas Diagnósticas
como emitir críticas e descrever as limitações do e Instrumentos de Triagem examina os principais
instrumento. instrumentos estruturados para diagnóstico e
rastreamento de transtornos mentais.
 LIMITES As seções seguintes abordam as principais
A dificuldade em objetivar e quantificar a psicopa- es­c alas de avaliação dos principais grupos de
tologia tem sido um dos grandes obstáculos para o trans­tornos psiquiátricos. Cada seção inicia-se
progresso da pesquisa em saúde mental. Escalas de com um capítulo de conceitos gerais para fornecer
avaliação não são instrumentos de fácil utilização. o embasamento teórico do construto em questão
Para o professor Márcio Versiani,4 “[...] a não ob- e uma visão geral dos instrumentos disponíveis.
servação dos limites e as dificuldades da utilização Os subcapítulos de cada seção são destinados à
e da análise de resultados das escalas de avaliação descrição dos aspectos teóricos e práticos de cada
psiquiátrica foram o maior demolidor do otimismo instrumento. Os teóricos consistem nos estudos
inicial quanto ao potencial desses instrumentos”. O de validação realizados no Brasil. Os aspectos
demolidor ao qual o professor se refere é principal- práticos visam responder às perguntas: Para quem
mente o mau uso das escalas. Um escore total de a medida se destina? Como é administrada? Como
uma escala é uma quantificação aproximada, que é interpretada? É de livre acesso ou tem direito
nem sempre traduz a complexidade do fenômeno autoral? Onde pode ser obtida? Os capítulos são
psíquico. Por exemplo, um indivíduo com escore acompanhados de formulários completos dos
global no Inventário de Depressão de Beck com- instrumentos de domínio público ou, para aqueles
patível com depressão leve pode ser clinicamente protegidos por direitos autorais, exemplos de itens
grave caso tenha pontuação alta em pensamento do instrumento no formato parcial.
suicida. O contrário, uma pontuação alta, nem
sempre indica um caso grave de depressão. O uso  SELEÇÃO DOS INSTRUMENTOS
da escala de avaliação, portanto, não dispensa a ESPECÍFICOS
avaliação e a interpretação clínicas. A imensa e crescente gama de medidas utilizadas
Em cada um dos capítulos desta obra, o leitor em saúde mental torna impossível abranger em
encontrará a experiência dos colaboradores e uma obra impressa todas as medidas disponíveis
evidências das propriedades psicométricas dos para todas as áreas relevantes. A seleção dos ins-
instrumentos, os quais contribuem para o uso trumentos incluídos mostrou-se uma tarefa extre-
eficaz e a interpretação correta de suas avaliações. mamente difícil, e, para diminuir a subjetividade e
A expectativa dos organizadores deste livro é a de o desequilíbrio das áreas cobertas, alguns critérios
que ele auxilie os profissionais da saúde mental, de inclusão foram adotados na escolha.
clínicos e pesquisadores a fazer bom uso dos ins- Os princípios gerais que nortearam a seleção
trumentos de avaliação. foram: 1) o instrumento está traduzido para o
português; 2) as evidências de confiabilidade e
 ESTRUTURA DO LIVRO validade das escalas já foram publicadas, isto é, o
O livro, em formato de manual, contém as princi­ material foi revisado por especialistas, e há dispo-
pais escalas utilizadas na área de saúde mental nibilidade suficiente de informações para avaliar a
e psicofarmacologia. Além de incluir aspectos qualidade psicométrica do instrumento; 3) os dados
teóricos sobre as escalas de avaliação, reúne os dessas escalas podem ser obtidos diretamente do
instru­mentos de interesse para a prática clínica e a paciente ou informante; e 4) as escalas são de fácil
pesquisa, por meio de uma abordagem direta, sem aplicação, sem a necessidade de equipamentos
perder o rigor científico da psicometria. sofisticados suplementares. Nos casos em que vá-
A primeira seção do livro, Fundamentos de rias escalas para a mesma finalidade preencherem
Mensuração em Saúde Mental, tem por objetivo esses critérios, terão primazia as mais utilizadas de
familiarizar o leitor com os fundamentos teóricos acordo com a literatura científica.
e metodológicos da mensuração em transtornos Privilegiamos a inclusão de instrumentos bem
mentais. Introduz os temas validade e confiabilida- estabelecidos em âmbito internacional para permi-
4  INSTRUMENTOS DE AVALIAÇÃO EM SAÚDE MENTAL

tir comparações transculturais. Instrumentos cuja Esta obra, no entanto, não é definitiva. O pro-
aplicabilidade se restringe a uma população ou cesso de introdução e validação de novas escalas é
finalidade específica (p. ex., escala de hipocondria contínuo. A recente mudança de conceitos de saúde
para pacientes geriátricos institucionalizados) não mental e a aplicação de avanços em neurociências
foram incluídos. enfatizam o caráter dinâmico desse tema. Acredi-
tamos que a próxima atualização será necessária
 PASSADO, PRESENTE E FUTURO em bem antes que 15 anos!
A publicação do livro Escalas de avaliação clínica
em psiquiatria e psicofarmacologia, em 2000, foi  REFERÊNCIAS
a primeira iniciativa de reunir em uma obra o 1. McDowell I. Measuring health: a guide to rating scales and question-
conhecimento existente sobre a aplicação desses naires. 3rd ed. New York: Oxford University; 2006.
2. Rush JA, Pincus HA, First MB, editors. Handbook of psychiatric
instrumentos no Brasil. 5 Por muitos anos, essa
measures. Washington: APA; 2005.
compilação preencheu uma lacuna editorial ante 3. Freire MA, Figueiredo VLM, Gomide A, Jansen K, Silva RA, Maga-
a demanda acadêmica em nosso meio. Entretanto, lhães PVS, et al. Escala Hamilton: estudo das características psicométri-
e felizmente, vários instrumentos psicométricos fo- cas em uma amostra do sul do Brasil. J Bras Psiquiatr. 2014;63(4):281-9.
ram validados e publicados na literatura científica 4. Versiani M. Prefácio. In: Gorenstein C, Andrade LHSG, Zuardi AW,
ao longo dos últimos 15 anos. O entusiasmo desse organizadores. Escalas de avaliação clínica em psiquiatria e psicofar-
macologia. São Paulo: Lemos; 2000.
cenário crescente nos impulsionou a ampliar a
5. Gorenstein C, Andrade LHSG, Zuardi AW, organizadores. Escalas de
iniciativa anterior, desenvolvendo uma obra atua­ avaliação clínica em psiquiatria e psicofarmacologia. São Paulo: Lemos;
lizada que fosse abrangente e de fácil consulta. 2000.

PRINCÍPIOS DE ELABORAÇÃO DE ESCALAS [ 1.1 ]


Luiz Pasquali

A teoria e o modelo de elaboração de instrumental pendendo, portanto, da literatura existente sobre o


psicológico baseiam-se em três polos: procedimen- construto-alvo. Muitas vezes, o próprio pesquisador
tos teóricos, empíricos (experimentais) e analíticos deve desenvolver uma pequena teoria sobre o cons-
(estatísticos).1 truto para elaborar um novo instrumento de medida.
O polo teórico enfoca o construto ou objeto
psicológico para o qual se quer desenvolver um  O SISTEMA PSICOLÓGICO
ins­trumento de medida, bem como sua operacio- Qualquer sistema ou objeto que possa ser expresso
nalização em itens. Esse polo utiliza a teoria do em termos observáveis é suscetível de mensuração.
traço latente para explicitar os tipos e as categorias Entretanto, o que pode ser efetivamente medido
de comportamentos que representam o mesmo são as propriedades ou os atributos de um objeto,
traço. O polo empírico, ou experimental, define desde que apresentem magnitudes, isto é, diferen-
as etapas e as técnicas de aplicação do instrumen- ças individuais, como intensidade, peso, altura,
to-piloto e da coleta válida de informação para distância, etc. Tais atributos são em geral chamados
proceder à avaliação psicométrica do instrumento. de variáveis.
O polo analítico estabelece os procedimentos de O objeto específico da psicometria são as es-
análises estatísticas a serem efetuadas sobre os truturas latentes, os traços psíquicos ou processos
da­dos para obter um instrumento válido, preciso mentais. Por exemplo, a inteligência pode ser con-
e normatizado. siderada um subsistema dos processos cognitivos, e
Esse modelo de elaboração de instrumentos estes, da estrutura latente geral. A inteligência, por
está ilustrado na Figura 1.1.1, que apresenta as eta- sua vez, pode ser considerada um sistema quando
pas da elaboração de um instrumento de medida. for o interesse imediato, e nela vários aspectos
Os métodos e os produtos a serem obtidos em cada são considerados, como a compreensão verbal e
etapa estão detalhados em suas respectivas “fases”. a fluência verbal.
Os procedimentos teóricos devem ser elabo- O pesquisador que pretende construir um
rados para cada escala de medida psicológica, de- instrumento de medida e pesquisa deve ter uma
fundamentos de mensuração em saúde mental [1]  5

Procedimentos TEÓRICOS

Fase TEORIA CONSTRUÇÃO DO INSTRUMENTO

Categ. Comport.
Literatura Análise
Método Reflexão / Interesses / Índices Literatura / Peritos / Experiência / Experiência - teórica
Análise de conteúdo Entrevista - semântica

1 Sistema 2 3 4 5 6 Análise
Passo Propriedade Dimensionalidade Definições Operacionalização
dos itens
psicológico
Objeto Fatores - Constitutiva Instrumento-
Produto psicológico Atributo (dimensões) - Operacional Itens -piloto

FIGURA 1.1.1  PROCEDIMENTOS TEÓRICOS NA ELABORAÇÃO DA MEDIDA PSICOLÓGICA.

ideia, por mais vaga que seja, do que quer investigar  DIMENSIONALIDADE
e para que tema da psicologia está interessado em DO ATRIBUTO
construí-lo. Para descobrir o seu objeto psicológi­ A dimensionalidade do atributo diz respeito à sua
co, o pesquisador pode consultar os livros ou estrutura semântica interna. O atributo constitui
tratados em que estão elencados os trabalhos em uma unidade semântica única ou é uma síntese de
psicologia. Sugerimos o Psychological Abstracts, 2 componentes distintos ou até independentes? Deve
para a área psicossocial; o Educational Index, 3 para ser concebido como uma dimensão homogênea ou
a psicologia aplicada à educação; o Index Medicus,4 deve-se nele distinguir aspectos diferenciados?
para a psicologia clínica; e o Sociological Index, 5 A resposta a esse problema deve vir da teoria
para a psicologia social. sobre o construto e/ou dos dados empíricos dispo-
níveis sobre ele, sobretudo dados de pesquisas que
 A PROPRIEDADE DO utilizaram a análise fatorial na análise dos dados,
SISTEMA PSICOLÓGICO pois é fundamental decidir se o construto é uni- ou
Entretanto, o sistema ou o objeto psicológico não multifatorial. Os fatores que compõem o construto
constitui o objeto direto de mensuração, mas sim (o atributo) são o produto desse passo.
suas propriedades ou os atributos que o caracteri­ Por exemplo, considerando a inteligência ver-
zam. Por exemplo, o sistema físico apresenta os bal como objeto psicológico (o processo cognitivo
atributos massa, comprimento, etc. Similarmente, de interesse) e suas propriedades, pergunta-se: é a
a psicometria concebe seus sistemas como tendo inteligência verbal um construto único ou deve-se
propriedades/atributos que os definem, sendo tais distinguir nele componentes diferentes? Os dados
atributos o foco imediato de observação/medida. empíricos disponíveis mostram que a inteligência
Assim, a estrutura psicológica apresenta atributos verbal é composta por, pelo menos, dois fatores
do tipo processos cognitivos, emotivos, motores, bem distintos e independentes, a saber: compreen­
etc. A inteligência, como subsistema, pode apresen- são verbal e fluência verbal. Para construir um
tar atributos de tipo raciocínio verbal, raciocínio instrumento de medida para a inteligência verbal,
numérico, etc. O sistema se constitui como objeto o pesquisador não poderá prescindir de reconhecer
hipotético que é abordado (conhecido) por meio e considerar que essa inteligência apresenta dois
da pesquisa de seus atributos. Dessa forma, o pro- fatores distintos, cuja medida exige instrumentos
blema específico desse passo consiste em se passar diferentes.
de um objeto psicológico para delimitar os seus Entretanto, ele pode escolher somente a inte-
aspectos específicos, os quais se deseja estudar e ligência verbal compreendida sob seu aspecto de
para os quais se quer construir um instrumento compreensão verbal para investigação e prescindir
de medida. de se preocupar com a fluência verbal. Nesse caso,
Para decidir por este ou aquele aspecto, o o atributo de interesse não é mais a inteligência
pes­quisador recorre ao seu interesse, à ajuda dos verbal e sim a compreensão verbal. Assim, o pes-
livros e aos peritos (ao seu orientador, se for aluno). quisador deve justificar tal decisão e demonstrá-la
6  INSTRUMENTOS DE AVALIAÇÃO EM SAÚDE MENTAL

na exposição teórica sobre o construto inteligência mento de medida. Pode-se fazer isso com qualquer
verbal a partir da elaboração de uma miniteoria tema para o qual se queira construir um instrumen-
sobre o que entende pelo construto que pretende to de mensuração.
medir, baseando-se na existência de dados empíri-
cos para guiar a construção e a consistência do seu  DEFINIÇÃO DOS CONSTRUTOS
instrumento de medida. Essa lógica visa confirmar Estabelecida a propriedade e suas dimensões, é
ou rejeitar a validade de sua teoria. pre­ciso conceituar detalhadamente esses constru­
Supondo que o pesquisar deseja construir um tos. A conceituação clara e precisa dos fatores
instrumento para medir o raciocínio verbal, as pa­ra os quais se deseja construir o instrumento
seguintes considerações devem ser ponderadas: de medida deve obter dois produtos: as definições
cons­titutivas e as definições operacionais dos
[1] O raciocínio verbal não é o objeto psicológico, construtos.
porque a ciência não mede objetos, mas as suas
propriedades. Assim, o raciocínio verbal é um DEFINIÇÃO CONSTITUTIVA
atributo; Um construto definido por meio de outros cons-
[2] Se o raciocínio verbal é um atributo, conse- trutos representa uma definição constitutiva.
quentemente é atributo de algum objeto. Dessa Nesse caso, o construto é concebido em termos
forma, deve-se pesquisar qual é esse objeto do de conceitos próprios da teoria em que se insere.
qual o raciocínio verbal é propriedade; Definição constitutiva aparece como definição de
[3] Se o raciocínio verbal é um atributo de algum termos em dicionários e enciclopédias: os conceitos
objeto, é de se supor que tal objeto tenha mais são definidos em termos de outros conceitos; isto
do que um atributo. Isto é, além de raciocínio é, são definidos em termos de realidades abstratas.
verbal, ele tem outros atributos. Esses outros Por exemplo, inteligência verbal é definida como a
atributos devem diferenciar o atributo de capacidade de compreender a linguagem (definição
interesse – o raciocínio verbal – dos demais constitutiva), porque a capacidade de compreender
atributos do objeto em questão. constitui uma realidade abstrata, um construto,
um conceito.
Com base na literatura, em peritos e na refle­ As definições constitutivas situam o ­construto
xão clínica, temos que: o raciocínio verbal é atribu- exata e precisamente dentro da teoria desse
to do processo cognitivo chamado raciocínio. Por construto, delimitando as suas fronteiras. Essas
sua vez, raciocínio tem como atributos, além de definições caracterizam o construto no espaço
raciocínio verbal, raciocínio numérico, raciocínio semântico da teoria em que está incluído, indi-
abstrato, raciocínio espacial, raciocínio mecânico cando as dimensões que ele deve assumir. Assim,
e, talvez, outros. Mas a literatura na área distingue se se define assertividade como a capacidade de
esses cinco atributos de raciocínio: dizer não, a capacidade de expressar livremente
sentimentos positivos e negativos, a capacidade
Raciocínio – Raciocínio verbal de expor ideias sem receio, etc., está-se dando os
– Raciocínio numérico limites semânticos que o conceito deve respeitar
– Raciocínio abstrato dentro da teoria de assertividade.
– Raciocínio espacial Definições dessa natureza põem limitações
– Raciocínio mecânico definidas sobre o que se deve explorar ao medir o
Pesquisando um pouco mais, verifica-se que construto, em termos de fronteiras que não podem
raciocínio verbal não é unidimensional. De fato, a ser ultrapassadas ou que devem ser atingidas. De
literatura distingue dois tipos de raciocínio verbal, fato, um instrumento que mede um construto pode
a saber, compreensão verbal e fluência verbal. não conseguir cobrir toda a amplitude semântica
de um conceito. Assim, boas definições constitu-
Compreensão verbal tivas permitem avaliar a qualidade do instrumento
Raciocínio – Raciocínio verbal
Fluência verbal que mede o construto, em termos de cobertura da
– Raciocínio numérico
extensão semântica do instrumento, que é delimi-
– Raciocínio abstrato
tada por sua definição constitutiva.
– Raciocínio espacial
– Raciocínio mecânico
DEFINIÇÃO OPERACIONAL
Em seguida, deve-se definir ­diferencialmente As definições constitutivas se situam ainda no
todos esses atributos para a elaboração do instru- campo da teoria, do abstrato. Um instrumento de
fundamentos de mensuração em saúde mental [1]  7

medida, por sua vez, já é uma operação concreta, definições operacionais mais ou menos abrangen-
empírica. Essa passagem do abstrato para o concre- tes de um mesmo construto podem ser produzidas.
to é viabilizada pelas definições operacionais dos A cobertura de uma definição operacional pode ser
construtos. Fundamenta-se, nesse momento crítico adequada, equivocada ou errada sobre o espaço
na construção de medidas psicológicas, a validade semântico do construto, repercutindo sobre a qua-
dos instrumentos e a legitimidade da representação lidade do instrumento de medida do construto. Por
empírica (comportamental) dos traços latentes (os exemplo, a inteligência verbal é como desenhar cír-
construtos). Isto é, a aterrissagem do abstrato para culos na areia, isto é, sua definição é perfeitamente
o concreto. Duas preocupações são decisivas: 1) as operacional, pois todo mundo entende quando se
definições operacionais dos construtos devem ser manda desenhar círculos na areia. Contudo, apesar
realmente operacionais e 2) elas devem ser o mais de operacional, é uma definição perfeitamente
abrangentes possível dos construtos. equivocada de inteligência verbal, pois o comporta-
Uma definição de um construto é operacional mento de desenhar círculos na areia não tem nada
quando tal construto é definido em termos de ope- a ver com o construto em questão.
rações concretas, isto é, de comportamentos físicos Assim, as definições operacionais podem re-
pelos quais se expressa. A definição da inteligência presentar um construto em uma escala que expres-
verbal como a capacidade de compreen­der uma fra- sa uma proporção de coincidência entre construto
se ou, mesmo, compreender uma frase, refere-se a e definição operacional que vai de 0 a 1; sendo 0
uma definição constitutiva e não operacional. Isso quando a definição não cobre nada do construto
porque compreender não é um comportamento, e 1 quando ela cobre 100% do espaço semântico
mas um construto, na medida em que não indica do construto. Nenhuma definição operacional
nenhum comportamento concreto. Seria uma será capaz de cobrir 100% do construto, mas,
definição operacional de compreensão da frase quanto maior covariância existir entre construto
reproduzir a frase com outras palavras. e definição operacional, maior a qualidade do
Mager6 oferece uma fórmula para decidir se a instrumento. A Figura 1.1.2 indica a problemática
definição é ou não operacional. Ela é operacional da qualidade de representação comportamental
se você puder dizer ao sujeito: “vá e faça...”. Portan- de diferentes definições operacionais do construto
to, dizer “vá e reproduza a frase” indica claramente compreensão verbal.
o que o sujeito deve fazer, como deve se comportar, Para garantir melhor cobertura do construto,
definindo operacionalmente a ocorrência dos as definições operacionais deverão especificar e
comportamentos. elencar aquelas categorias de comportamentos
Posto que nenhuma definição operacional que seriam a representação comportamental do
esgota a amplitude semântica de um construto; as construto. A garantia de validade e utilidade do

Definição Operacional Compreensão Verbal

Extensão semântica total

Desenhar círculos

Dizer que compreendeu

Escrever a frase

Reproduzir a frase

FIGURA 1.1.2  EXTENSÃO SEMÂNTICA DE DEFINIÇÕES OPERACIONAIS DE COMPREENSÃO VERBAL.


8  INSTRUMENTOS DE AVALIAÇÃO EM SAÚDE MENTAL

ins­trumento depende da completude dessa especi­ REGRAS PARA A CONSTRUÇÃO DE ITENS


fi­cação. Por exemplo, quais seriam as categorias de Após a construção dos itens, é preciso seguir al-
comportamentos que expressariam comportamen- guns critérios para a sua elaboração. Estas regras
talmente a compreensão verbal? Seriam tais como: se aplicam à construção de cada item individual­
reproduzir texto, dar sinônimos e antônimos, expli- mente e ao conjunto dos itens que medem um
car o texto, sublinhar alternativas, etc. Quanto mais mesmo construto.
completa a listagem de categorias comportamen-
tais, melhor o pesquisador conseguirá expressar [A] Critérios para a construção dos itens indivi­
essas categorias em tarefas unitárias e específicas duais:
(os itens) e o instrumento-piloto estará construído. 1. Critério comportamental: o item deve ex­­
Os métodos a serem utilizados para resolver o pressar um comportamento, não uma
problema de construção de medidas psicológicas se abstração ou construto. Segundo Mager,6
apoiam na literatura pertinente sobre o construto, a o item deve poder permitir ao sujeito uma
opinião de peritos na área, a experiência do próprio ação clara e precisa, de sorte que se possa
pesquisador, bem como a análise de conteúdo do dizer a ele “vá e faça”. Assim, “reproduzir
construto. Portanto, o conhecimento aprofundado um texto” é um item comportamental (“vá
da literatura sobre o construto e as técnicas de e reproduza...”), ao passo que “compreen-
análise de conteúdo são indispensáveis. der um texto” não o é, pois o sujeito não
sabe o que fazer com “vá e compreenda...”.
 OPERACIONALIZAÇÃO 2. Critério de objetividade ou de desejabilidade:
DO CONSTRUTO para o caso de escalas de aptidão, os itens
Esse é o passo da construção dos itens que expressa devem cobrir comportamentos de fato,
a representação comportamental do construto, a permitindo uma resposta certa ou errada.
saber, as tarefas que os sujeitos terão de executar O respondente deve mostrar se conhece a
para que se possa avaliar a magnitude de presença resposta ou se é capaz de executar a tarefa
do construto (atributo). proposta. Por exemplo, se o pesquisador
deseja saber se o sujeito entende o que seja
FONTES DOS ITENS “abstêmio”, faz mais sentido pedir a ele que
Diante das categorias comportamentais que ex- dê um sinônimo do que pedir que diga se
pressam o construto de interesse, focamos agora entendeu ou não. Ao contrário, para o caso
para outras duas fontes de itens: a entrevista e das atitudes e de personalidade em geral,
outros testes que medem o mesmo construto. A os itens devem cobrir comportamentos de­
entrevista consiste em pedir a sujeitos representan­ sejáveis (atitude) ou característicos (per­so­
tes da população para a qual se deseja construir o na­lidade). Nesse caso, o respondente pode
instrumento que opinem em que tipo de compor- concordar, discordar ou opinar sobre se tal
tamentos tal construto se manifesta. Por exemplo, comportamento convém ou não para ele.
se o desejo é construir um instrumento sobre as­ Isto é, os itens devem expressar desejabi-
ser­tividade, é possível dirigir-se a representantes lidade ou preferência. Não existem, nesse
da população e perguntar “como é para você caso, respostas certas ou erradas; existem
uma pessoa assertiva?”. De uma pesquisa dessa sim diferentes gostos, preferências, senti-
natureza pode surgir uma grande riqueza de com- mentos e modos de ser.
portamentos que expressam assertividade e que 3. Critério da simplicidade: um item deve
podem ser aproveitados como itens do instrumento. expressar uma única ideia. Itens que intro-
Ademais, aproveitam-se os itens que compõem duzem explicações de termos ou oferecem
outros instrumentos disponíveis no mercado e razões ou justificativas são normalmente
que medem o mesmo construto em que se está confusos porque introduzem ideias varia-
interessado. Assim, há três fontes valiosas para a das e atrapalham o respondente. Por exem-
construção dos itens: plo: “gosto de feijão porque é saudável”.
O sujeito pode de fato gostar de feijão, mas
 literatura: outros testes que medem o ­construto; não porque seja saudável; assim, ele não
 entrevista: levantamento junto à população- saberia como reagir a tal item: se porque
-meta; e o feijão é gostoso ou porque é saudável.
 categorias comportamentais: definidas no pas­ O item exprime duas ideias. O mesmo vale
so das definições operacionais. para “a maçã é gostosa e saudável”.
fundamentos de mensuração em saúde mental [1]  9

4. Critério da clareza: o item deve ser inteligí- – Reproduzir a frase com as próprias
vel até para o estrato mais baixo da popu- palavras → pertinente
lação-meta; daí, utilizar frases curtas, com – Decorar uma sentença → pouco perti-
expressões simples e inequívocas. Frases nente
longas e negativas incorrem facilmente na – Falar em voz alta → impertinente
falta de clareza. Com referência às frases 6. Critério da precisão: o item deve ter uma
negativas: normalmente são mais confusas posição definida no contínuo do atributo
que as positivas; consequentemente, é me- e ser distinto dos demais itens que cobrem
lhor afirmar a negatividade do que negar o mesmo contínuo. Este critério supõe que
uma afirmação. Por exemplo: fica mais o item possa ser localizado em uma escala
inteligível dizer “detesto ser interrompido” de estímulos; em termos de Thurstone,
do que “não gosto de ser interrompido”, ou diríamos que o item deve ter uma posição
é melhor dizer “sinto-me infeliz” em vez escalar modal definida e um desvio padrão
de “não me sinto feliz”. Nesse contexto, reduzido. Em termos da teoria de resposta
é preciso evitar uso de gírias que não são ao item (TRI), este critério representa
inteligíveis para todos os membros de uma os parâmetros “b” (dificuldade) e “a”
população-meta do instrumento, podendo (discriminação) e pode ser avaliado defi-
ofender o estrato mais sofisticado dessa nitivamente somente após coleta de dados
população em contrapartida. Preocupa-se empíricos sobre os itens. Por exemplo, na
aqui com a compreensão das frases (tarefas escala de Thurstone (Fig. 1.1.3), o item E1 é
a serem entendidas e, se possível, resolvi- muito preciso, enquanto o E2 é impreciso.
das), não sua elegância artística. 7. Critério da variedade: dois aspectos espe-
5. Critério da relevância (pertinência, satura- cificam este critério:
ção, unidimensionalidade, correspondên- – variar a linguagem: o uso dos mesmos
cia): a expressão (frase) deve ser consisten- termos em todos os itens confunde as
te com o traço (atributo, fator, propriedade frases e dificulta diferenciá-las, além
psicológica) definido e com as outras frases de provocar monotonia, cansaço e
que cobrem o atributo. Isto é, o item não aborrecimento. Exemplo: o Edwards
deve insinuar atributo diferente do defini- Per­sonal Preference Schedule (EPPS)
do. O critério diz respeito à saturação que em inglês começa quase todas as suas
o item tem com o construto, representada 500 frases com a expressão “I like...”.
pela carga fatorial na análise fatorial e que Depois de tantos “I like”, qualquer
constitui a covariância (correlação) entre sujeito deve se sentir saturado!
o item e o fator (traço). Veja este exemplo: – no caso de escalas de preferências:
seja o construto “compreensão verbal” formular a metade dos itens em termos
definido como compreender o significado favoráveis e metade em termos desfa-
de palavras e frases. Dos três itens a seguir, voráveis, para evitar erro da resposta
um é pertinente, outro mais ou menos e o estereotipada à esquerda ou à direita
último impertinente: da escala de resposta.7

1 2 3 4 5 6 7 8 9 10

E1 E2

FIGURA 1.1.3  ILUSTRAÇÃO DA PRECISÃO DOS ITENS NA ESCALA DE THURSTONE.


10  INSTRUMENTOS DE AVALIAÇÃO EM SAÚDE MENTAL

8. Critério da modalidade: formular frases um traço alto quanto entre os que têm um
com expressões de reação modal, isto é, traço pequeno, e não somente entre os de
não utilizar expressões extremadas, como traço alto e baixo.
“excelente”, “miserável”, etc. Assim, nin- 12. Critério do equilíbrio: os itens do mesmo
guém é infinitamente inteligente, mas a continuum devem cobrir igual ou propor-
maioria é bastante inteligente. A intensi- cionalmente todos os segmentos (setores)
dade da reação do sujeito é dada na escala do continuum, devendo haver, portanto,
de resposta. Se o próprio item já vem apre- itens fáceis, difíceis e médios (para apti-
sentado em forma extremada, a resposta na dões) ou fracos, moderados e extremos
escala de respostas já está viciada. Quando (no caso das atitudes). De fato, os itens
pergunto ao sujeito se está pouco ou muito devem se dispor sobre o continuum em
de acordo (em uma escala, p. ex., de 7 uma distribuição que se assemelha à da
pontos que vai de desacordo total a acordo curva normal: maior parte dos itens de
total), um item formulado extremado tal dificuldade mediana e diminuindo pro-
como “meus pais são a melhor coisa do gressivamente em direção às caudas (itens
mundo” dificilmente receberia resposta fáceis e itens difíceis em número menor).
7 (totalmente de acordo) por parte da A maioria dos traços latentes se distribui
maioria dos sujeitos da população-meta, mais ou menos dentro da curva normal
simplesmente porque a formulação é exa- na população-alvo, isto é, a maioria dos
gerada. Se, em lugar dela, se usasse uma sujeitos tem naturalmente magnitudes
expressão mais modal, como “eu gosto dos medianas dos traços latentes, sendo que
meus pais”, as chances de respostas mais uns poucos têm magnitudes grandes e ou-
variadas e inclusive extremadas (resposta tros, magnitudes pequenas. Assim, como
7) seriam maiores. mostrado na Figura 1.1.4, cerca de 10% dos
9. Critério da tipicidade: formar frases com itens apresentam dificuldade mínima ou
expressões condizentes (típicas, próprias, máxima e 40%, dificuldade mediana, etc.
inerentes) com o atributo. Assim, a beleza
não é pesada, nem grossa, nem nojenta. Na técnica de construção de instrumentos
10. Critério da credibilidade (face validity): o baseada na teoria dos traços latentes, para se
item deve ser formulado de modo a que salvarem cerca de 20 itens no final da elaboração
não apareça sendo ridículo, despropo- e validação do instrumento, recomenda-se iniciar
sitado ou infantil. Itens com esta última com mais do que 10% de itens além dos 20 reque-
caracterização fazem o adulto se sentir ridos no instrumento final. Os itens incluídos no
ofendido, irritado ou coisa similar. Enfim, instrumento-piloto devem ter validade teórica real
a formulação do item pode contribuir para e não simplesmente parecer ter validade.
uma atitude desfavorável para com o teste
e assim aumentar os erros (vieses) de res-  ANÁLISE TEÓRICA DOS ITENS
posta.8,9 Esse tema, às vezes, é discutido Operacionalizado o construto por intermédio
sob o que se chama de validade “aparente” dos itens, é importante avaliar a hipótese contra
(face validity), que não tem nada a ver com a a opinião de outros para se assegurar de que ela
validade objetiva do teste, mas pode afetar apresenta garantias de validade. Essa avaliação
negativamente a resposta ao teste ao afetar dos itens ou análise da hipótese é teórica porque
o respondente. consiste em pedir opiniões sobre a hipótese. Essa
[B] Critérios referentes ao conjunto dos itens (o análise teórica é feita por juízes e comporta dois
instrumento todo): tipos distintos de avaliadores antes da validação
11. Critério da amplitude: este critério afirma final do instrumento-piloto: sobre a compreensão
que o conjunto dos itens referentes ao dos itens (análise semântica) ou sobre a pertinência
mesmo atributo deve cobrir toda a extensão dos itens ao construto que representam (propria-
de magnitude do contínuo desse atributo. mente chamada de análise dos juízes).
Esse critério pode ser analisado pela dis-
tribuição do parâmetro “b” da TRI. Um ANÁLISE SEMÂNTICA DOS ITENS
instrumento deve poder discriminar entre A análise semântica tem como objetivo verificar
sujeitos de diferentes níveis de magnitude se todos os itens são compreensíveis para todos
do traço latente, inclusive entre os que têm os membros da população à qual o instrumento
fundamentos de mensuração em saúde mental [ 1 ]  11

se destina. Deve-se verificar se os itens são inteli­ Quantos grupos são necessários para proceder
gíveis para o estrato mais baixo (de habilidade) da a essa análise semântica? Itens que não ofereceram
população-meta e, por isso, a amostra para essa nenhuma dificuldade de compreensão necessitam
análise deve ser feita com esse estrato. Para evitar de uma sessão, no máximo duas, sem checagem
deselegância na formulação dos itens, a análise ulterior. Itens que continuam apresentando difi-
semântica deverá ser feita também com uma culdades após cinco sessões merecem ser simples-
amostra mais sofisticada (de maior habilidade) da mente descartados. A checagem dos itens com um
população-meta (para garantir a chamada “vali- grupo de sujeitos mais sofisticados consiste em
dade aparente” do teste). Assim, por exemplo, se evitar que os itens se apresentem demasiadamente
o teste se destina a uma população que congrega primitivos para esses sujeitos e assim percam a
sujeitos do ensino fundamental até universitários, validade “aparente”. Os itens devem também dar
o estrato mais baixo nesse contexto são os sujeitos a impressão de seriedade, como diz o ditado: “a
do ensino fundamental e o mais sofisticado será mulher de César não somente deve ser honesta,
representado pelos sujeitos de nível universitário. deve também parecer honesta” (critério 10 de
Há várias maneiras eficientes de fazer a análise construção de itens).
semântica dos itens. Por exemplo, pode-se aplicar
o instrumento a uma amostra de uns 30 sujeitos da ANÁLISE DOS JUÍZES
população-meta e, em seguida, discutir com eles as Essa análise é, às vezes, chamada de análise de
dúvidas que os itens suscitarem. Entretanto, uma conteúdo, mas propriamente deve ser chamada de
técnica eficaz na avaliação da compreensão dos análise de construto, dado que procura verificar a
itens consiste em checá-los com pequenos grupos adequação da representação comportamental do(s)
de sujeitos (3 ou 4) em uma situação de brainstor- atributo(s) latente(s). Os juízes devem ser peritos
ming. Essa técnica requer um grupo de sujeitos do na área do construto e uma concordância de 80%,
estrato baixo da população-meta, porque se supõe pelo menos, seria desejável para decidir sobre a
que, se tal estrato compreende os itens, a fortiori o pertinência do item ao traço a que teoricamente se
estrato mais sofisticado também os ­compreenderá. refere. Uma tabela de dupla entrada, com os itens
Se a reprodução do item não deixar nenhuma arrolados na margem esquerda e os traços no cabe-
dúvida, o item é corretamente compreendido. Se çalho, serve para coletar a informação (Tab. 1.1.1).
surgirem divergências na reprodução do item ou A técnica exige que se dê aos juízes duas ferra-
se o pesquisador perceber que ele está sendo en- mentas: uma lista com as definições constitutivas
tendido diferentemente do que deveria, o item tem dos construtos/fatores para os quais se criaram os
problemas. Após o pesquisador explicar ao grupo o itens e outra tabela de dupla entrada com os fatores
que pretendia dizer com tal item, os próprios sujei- e os itens, como a seguir, em que são avaliados
tos do grupo irão sugerir como se deveria formular os itens que medem os dois fatores de raciocínio
o item para expressar o que o pesquisador queria verbal: compreensão verbal e fluência verbal. Em
dizer com ele. Com isso, o item ficaria reformulado geral, é necessária uma terceira tabela que elenca
como deveria ser. os itens, uma vez que nem sempre a tabela de

20% 40% 20%


10% 10%

Faixa: I II III IV V

FIGURA 1.1.4  DISTRIBUIÇÃO PERCENTUAL DOS ITENS EM 5 FAIXAS DE DIFICULDADE.


12  INSTRUMENTOS DE AVALIAÇÃO EM SAÚDE MENTAL

TABELA 1.1.1  TABELAS PARA A ANÁLISE DOS ITENS PELOS JUÍZES

FATORES DEFINIÇÃO ITENS COMPREENSÃO VERBAL FLUÊNCIA VERBAL

Compreensão verbal É a capacidade de... 1 X


Fluência verbal É a capacidade de... 2 X
3 X
...
N X

dupla entrada comporta a expressão completa do  REFERÊNCIAS


conteúdo dos itens. 1. Pasquali L. Testes referentes a construto: teoria e modelo de construção.
Com base nessas tabelas, a função dos juízes In: Pasquali L, organizador. Instrumentação psicológica: fundamentos
consiste em pontuar (marcar com um X) para o e práticas. Porto Alegre: Artmed; 2010. p. 165-98.
2. Psychology Abstracts [Internet]. PsyResearch; c2015 [capturado em 07
item debaixo do fator ao qual julgam que o item
ago. 2015]. Disponível em: http://psyresearch.org/abstracts/.
se refere. Uma meia dúzia de juízes será suficiente 3. Education Index [Internet]. New York: UNDP; c2015 [capturado em 07
pa­ra realizar a tarefa. Itens que não atingirem uma ago. 2015]. Disponível em: http://hdr.undp.org/en/content/education-index.
concordância de aplicação aos fatores (cerca de 4. Index Medicus: abbreviations of journal titles [Internet]. Poznań: Poznan
80%) apresentam problemas e seria o caso de University of Medical Sciences; c2015 [capturado em 07 ago. 2015].
descartá-los do instrumento-piloto. Disponível em: http://www2.bg.am.poznan.pl/czasopisma/medicus.
php?lang=eng.
Com o trabalho dos juízes ficam completa-
5. SocIndex [Internet]. Ipswich: EBSCO; c2015 [capturado em 07 ago. 2015].
dos os procedimentos teóricos na construção do Disponível em: https://www.ebscohost.com/academic/socindex-with-full-text.
instrumento de medida: a explicitação da teoria 6. Mager RF. Medindo os objetivos de ensino ou “conseguiu um par
do(s) construto(s) envolvido(s) e a elaboração do adequado”. Porto Alegre: Globo; 1981.
ins­trumento-piloto. Em seguida, os procedimentos 7. Likert R. A technique for the measurement of attitudes. ArchPsychol.
experimentais e analíticos testam empiricamente 1932;22(140):1-55.
8. Nevo B. Face validity revisited. J Educ Meas. 1985;22(4):287-93.
o instrumento, ou a validação da hipótese do ins­
9. Nevo B, Sfez J. Examinees’ feedback questionnaires. Assess Eval Higher
tru­mento. Educ. 1985;10(3):236-49.

ASPECTOS TRANSCULTURAIS NA ADAPTAÇÃO


DE INSTRUMENTOS [ 1.2 ]
Ines Hungerbühler, Yuan-Pang Wang

Para a maioria de condições médicas, independen- ou “normal” de acordo com a cultura local ou o
temente do país ou da cultura, há um consenso em contexto sócio-histórico.
relação à experiência de adoecimento físico. Por Na área de saúde mental, a cultura é um de-
exemplo, as manifestações clínicas do sarampo ou terminante crítico e complexo, exercendo influên­
da asma apresentam sinais e sintomas semelhantes cia na avaliação clínica, na pesquisa científica,
em diversas partes do mundo. Entretanto, essa na linguagem utilizada, na técnica da coleta de
concordância pode não se aplicar igualmente para dados, nas normas e nos conceitos investigados.1
alterações psíquicas ou mentais entre indivíduos Essa variação torna os resultados difíceis de serem
que falam diferentes línguas ou vivem em áreas comparados.
geograficamente distintas. Assim, a experiência Ante a crescente globalização da ciência e das
de ouvir vozes de seus ancestrais mortos pode sociedades, a importância da pesquisa transcultu-
ser considerada um comportamento “anormal” ral aumentou consideravelmente nos últimos anos.
fundamentos de mensuração em saúde mental [ 1 ]  13

Quando não há um instrumento específico à cultu- construtos teóricos), 2) semântica, idiomática, ex­
ra ou universalmente válido se recomenda adaptar perimental e do conteúdo (mesmo significado das
um instrumento de avaliação existente para uma palavras, frases e itens), 3) técnica ou operacional
nova cultura. Construir um novo instrumento (mesma forma de coleta), e 4) de critério ou de
aplicável para os indivíduos na cultura-alvo é um mensuração (mesma interpretação normativa).
processo bastante trabalhoso, além disso, pode Nesse contexto, a adaptação transcultural re-
impedir a comparabilidade dos resultados com quer planejamento cuidadoso e rigor quanto à ma-
as pesquisas sobre a mesma temática no exterior.2 nutenção do construto avaliado pelo i­ nstrumento,
Estudos transculturais contemplam duas di- das características psicométricas e da validade
ferentes perspectivas sob o paradigma emic-etic. para a população-alvo. Na literatura existe um
A abordagem emic explora como pessoas locais con­senso de que a mera tradução é incapaz de
pensam: como percebem e categorizam o mundo, oferecer parâmetros aceitáveis para avaliar os
suas regras de comportamento, o que tem signifi­ resultados obtidos em um estudo transcultural: as
cado para elas, e como imaginam e explicam as diferenças ou similaridades podem ser decorrentes
coisas. 3 Enquanto a perspectiva emic é baseada de variações culturais ou ser causadas por erros
nas interpretações existentes dentro de uma cultu­ de tradução.8 Recomenda-se que o processo seja
ra, a abordagem (mais científica) etic refere-se a uma combinação entre o componente de tradução
ge­neralizações de comportamentos humanos que literal de palavras e frases de um idioma ao outro
são consideradas universalmente válidas por um e um processo meticuloso de harmonização que
antropólogo. Em outras palavras, a perspectiva contemple o contexto cultural e o estilo de vida da
etic está direcionada a deduzir, das especificidades população-alvo.9 Portanto, o termo “adaptação”
locais, categorias mais gerais, com o objetivo de compreende todos os processos concernentes à
identificar e comparar fenômenos equivalentes em adequação cultural de um instrumento, sendo a
contextos culturais diferentes.1 tradução do instrumento apenas o primeiro passo
O desafio na pesquisa transcultural é desen- desse processo.10
volver uma metodologia que integre a perspectiva Neste capítulo, apresentamos uma proposta
global (etic) e seja culturalmente válida (emic), prática para o processo da tradução e adaptação
permitindo avaliar os conceitos relevantes de forma de instrumentos de avaliação em saúde mental.
equivalente em diferentes culturas. A ausência
de equivalência inviabiliza a comparação dos  FASES DO PROCESSO DE
re­sultados obtidos entre indivíduos de países ou TRADUÇÃO E ADAPTAÇÃO
culturas distintas. Não há consenso sobre as estratégias de execução
O termo “equivalência” foi usado em uma da adaptação transcultural de um instrumento de
ampla variedade de disciplinas (antropologia, avaliação na saúde mental. 5 Em geral, os especia-
eco­nomia, ciência política, psicologia, sociologia, listas operacionalizam o processo de adaptação em
etc.) representando diferentes conceitos e significa­ seis etapas consecutivas (Fig. 1.2.1):
dos.4 No contexto de adaptação transcultural de
escalas de avaliação, a equivalência implica que as [1] definições conceituais;
diferenças efetivamente observadas entre amostras [2] tradução do instrumento (do idioma original para
de diferentes culturas são o resultado de diferenças o idioma-alvo) e síntese das versões traduzidas;
culturais, as quais não são causadas pela forma ou a [3] retrotradução para o idioma de origem (back-
avaliação dos construtos de interesse. Idealmente, -translation), comparação da versão retrotra-
o processo de adaptação transcultural de um ins- duzida com a versão original;
trumento deve alcançar o máximo de equivalência [4] revisão por especialistas e elaboração de uma
entre o instrumento original e sua versão adaptada. versão “pré-final”;
A equivalência é dividida em várias categorias. Na [5] estudo-piloto e elaboração de uma versão final;
literatura não existe consenso sobre as categorias e [6] testes psicométricos e validação do i­ nstrumento.
suas nomeações, porém, em geral estão incluídas
equivalências associadas a definições conceituais, Uma autorização para sua utilização deve ser
a tradução do instrumento, a aplicação e as pro- obtida junto ao autor do instrumento original ­antes
priedades psicométricas. de iniciar o processo de tradução e adaptação.
Baseado na literatura, 5-7 o conceito de equiva- Além disso, o projeto deve ser submetido a um
lência pode ser: 1) conceitual e de itens (mesmos comitê de ética.
14  INSTRUMENTOS DE AVALIAÇÃO EM SAÚDE MENTAL

Esclarecimento dos
FASE I: conceitos-chave na
Definições cultura-alvo
conceituais

Síntese das traduções


FASE II: (versão de consenso)
Tradução

Síntese das
FASE III: retrotraduções
Retrotradução

FASE IV: Versão pré-final do


Revisão por instrumento adaptado
especialistas

Versão final do
FASE V: instrumento adaptado
Estudo-piloto

Propriedades
FASE VI: psicométricas do
Testes psicométricos instrumento adaptado
e validação

Publicação sobre o
FASE VII: instrumento adaptado
Publicação e validado
FIGURA 1.2.1  PROCESSO DE ADAPTAÇÃO CULTURAL DE UM
INSTRUMENTO DE AVALIAÇÃO.

DEFINIÇÕES CONCEITUAIS instrumento original e discuti-los em equipe e


Cada cultura representa uma constelação singular com especialistas; e
de vários fatores, processos e atributos. A mesma [3] Verificação dos conceitos-chave na população-
série de perguntas ou atributos pode ter diferentes -alvo por meio de discussão com especialistas
significados para pessoas de diferentes culturas: e população-alvo.
por exemplo, a mesma pergunta pode avaliar de
forma diferente um mesmo construto em cada TRADUÇÃO (FORWARD TRANSLATION)
cultura. A maioria dos autores exige estabelecer Uma vez que os conceitos principais foram iden-
a equivalência conceitual como o primeiro ­passo tificados, há duas estratégias de tradução de
do processo de adaptação. Nesse contexto, a instrumentos: a) tradução (forward translation) e
equivalência conceitual refere-se “[...] à relevância retrotradução (back-translation) independentes, e
e ao significado, noutra cultura, de um conceito b) duas ou mais traduções independentes e com-
ou dimensão tidos por relevantes na cultura ori- paração por um terceiro. Geralmente, as duas es-
ginal”.11 Para alcançar equivalência conceitual, tratégias são combinadas em uma etapa posterior:
recomenda-se seguir três passos:7
[1] tradução do instrumento por dois tradutores
[1] Revisão bibliográfica envolvendo publicações independentes,
da cultura do instrumento original e da popu- [2] comparação e criação de uma versão de con-
lação-alvo; senso por um terceiro (comitê de especialistas),
[2] Identificação, análise, definição e operaciona- [3] retrotradução por dois tradutores independen-
lização dos conceitos-chave para cada item do tes,
fundamentos de mensuração em saúde mental [ 1 ]  15

[4] comparação e elaboração de uma versão de uma comparação das versões do instrumento que
con­senso, e foram traduzidas na língua-alvo por um grupo de
[5] elaboração da versão final pelo comitê de es­ especialistas e tradutores. Como a retrotradução
pe­cialistas. corresponde a uma verificação adicional de con-
trole de qualidade, essa etapa é recomendada pela
Independentemente da estratégia, o primeiro maioria dos especialistas.
passo é a tradução em si (forward) do i­ nstrumento
original para o idioma-alvo. Trata-se de uma ati­ REVISÃO POR ESPECIALISTAS
vi­d ade bastante complexa e deve ser realizada (EXPERT PANEL)
por pelo menos dois tradutores independentes, A síntese e a revisão final do instrumento traduzi-
bi­língues e experientes na área de saúde mental. do, baseadas na comparação de todas as versões do
Ao traduzir um instrumento, deve-se considerar instrumento (original, traduzida e retrotraduzida),
diferenças gramaticais e variações semânticas de devem ser feitas para cada item em particular e
cada idioma, expressões idiomáticas e símbolos com o objetivo de alcançar equivalência entre
culturais, pois todos esses aspectos influenciam o instrumento original e a versão traduzida em
os significados latentes de palavras e expressões.12 qua­tros áreas:6
A qualificação dos tradutores envolve os se­
guintes aspectos: formação na língua do instru­ [1] equivalência semântica: as palavras significam
mento original (p. ex., diploma universitário, a mesma coisa? Existem múltiplos significados
cursos, proficiência na língua-alvo, etc.), licença para um determinado item? Existem inconsis-
de tradutor, experiências prévias com traduções, tências gramaticais na tradução?
publicações de trabalhos traduzidos, antecedentes [2] equivalência idiomática: expressões coloquiais
bilíngues, tempo de moradia em países onde se ou idiomáticas são difíceis de traduzir. O
fala a língua original do instrumento, cursos e comitê de especialistas deve formular uma
formação universitária na cultura do instrumento expressão aproximada para a versão traduzida
original.13 Idealmente, pelo menos um dos tradu- do instrumento. Por exemplo, “feeling blue” não
tores deve ter experiência profissional na área de deve ser traduzido literalmente como “sentir-se
saúde mental e conhecer os conceitos avaliados azul”, mas como “sentir-se para baixo”; ou
com o instrumento.7 “butterflies in the stomach” não deve ser tra-
Em seguida, duas ou mais versões traduzidas duzido como “borboletas no estômago”, mas
do instrumento devem ser comparadas e sinteti- como “frio na barriga”;
zadas por um terceiro tradutor, geralmente um [3] equivalência experimental: às vezes, itens des-
membro da equipe. Comunicação permanente crevem experiências da vida diária. No entanto,
entre todas as pessoas envolvidas e documentação algumas vezes, em um país ou uma cultura
minuciosa de todo o processo são recomendadas. diferente, uma determinada tarefa cotidiana
simplesmente não existe. Nesse caso, o item
RETROTRADUÇÃO (BACK-TRANSLATION) teria de ser substituído por uma experiência
No seguinte passo, a síntese das traduções está semelhante e conhecida na cultura-alvo.
sen­do retrotraduzida (back-translation) para a [4] equivalência conceitual e de itens: muitas ve-
língua original por tradutores independentes e zes, palavras ou seu significado conceitual va­
não aqueles que realizaram a primeira tradução. riam entre as culturas. Por exemplo, o conceito
Idealmente, os tradutores que realizam a retro- de “família” depende fortemente da cultura e
tradução não conhecem o instrumento original. pode ser um círculo familiar mais ou menos
A similaridade da versão original do instrumento amplo.
à versão retrotraduzida representa um critério re-
levante da qualidade da tradução, mas não indica Na maioria das adaptações transculturais,
a qualidade da adaptação cultural. Uma tradução po­de ser necessário modificar os itens, excluir al­
consistente nem sempre corresponde a uma adap- guns e incluir outros em seu lugar. Assim sendo,
tação adequada. Assim, a retrotradução funciona uma das tarefas centrais do processo de adaptação
como uma verificação da validade da tradução, cultural de um instrumento é decidir se tem de ser
identificando eventuais inconsistências e erros criado um item novo em vez de incluído um item
conceituais.7 Em vez de proceder a uma retrotra- traduzido.13
dução formal, alguns pesquisadores que executam A composição e a expertise do comitê de es-
a adaptação transcultural realizam simplesmente pecialistas são fundamentais para garantir essa
16  INSTRUMENTOS DE AVALIAÇÃO EM SAÚDE MENTAL

equivalência transcultural. Diante disso, o comitê Um estudo-piloto bem desenhado e conduzido


deve incluir pelo menos psicometristas, profissio- fornece indicações sobre o melhor procedimento
nais da saúde, linguistas e tradutores (da tradução de testes psicométricos e validações do instrumen-
e retrotradução). to e, ocasionalmente, também alguns resultados
prováveis.
ESTUDO-PILOTO
Após o processo de tradução e com o objetivo de TESTES PSICOMÉTRICOS E VALIDAÇÃO
verificar se os itens, as instruções e as escalas de Embora os métodos qualitativos para alcançar a
respostas são compreensível para o público-alvo, equivalência conceitual e idiomática (semântica)
o instrumento traduzido deve ser aplicado em uma no processo de adaptação sejam imprescindíveis,
amostra pequena (10 a 20 pessoas) e representativa eles não fornecem informações sobre as proprieda-
da população a que o instrumento se destina. des psicométricas do instrumento adaptado. Nesse
Trata-se de uma avaliação qualitativa da ade- sentido, a última etapa da adaptação transcultural
quação dos itens e da estrutura do instrumento de um instrumento é sua validação com base em
em geral, 5 ainda que uma análise estatística nem análises estatísticas. O objetivo é avaliar em que
sempre seja necessária. medida o instrumento pode ser considerado válido
Na realização de um estudo-piloto, é impor- para o contexto em que foi adaptado. No caso ideal,
tante: os construtos do instrumento adaptado devem ter
propriedades psicométricas comparáveis ou simi-
 aplicar o instrumento exatamente na mesma lares às do instrumento original.
forma como será aplicado depois no estudo de As análises psicométricas mais comuns são:7
validação; 1) consistência interna e confiabilidade; 2) estabili-
 registrar o tempo para completar o ­questionário dade teste-reteste; 3) validade de construto (análise
e avaliar se é razoável; fatorial); 4) validade de critério; 5) sensibilidade
 avaliar se cada pergunta oferece opções sufi- à mudança.
cientes de respostas; O tamanho da amostra depende das ­abordagens
 verificar a familiaridade dos sujeitos com os psicométricas a serem usadas. Geralmente, é re-
termos e conceitos traduzidos, com o formato comendado usar pelo menos 10 sujeitos por item,7
do instrumento e da coleta de dados; ou seja, 170 pessoas para um instrumento com 17
 avaliar se as respostas contêm as informações perguntas. Remetemos o leitor ao Capítulo 1.4
exigidas; deste livro, em que as análises psicométricas sobre
 pedir para os sujeitos um feedback para identi­ a validação de um instrumento de avaliação são
fi­c ar ambiguidades e questões difíceis ou descritas com mais detalhes.
desnecessárias ou discutir a experiência depois Existem vários vieses no processo de adaptação
da aplicação em grupo. Alguns linguistas da transcultural que afetam os dados psicométricos.
tradução denominam esse processo de cogni- Van de Vijver e Leung14 classificam-nos em três
tive debriefing; e grupos: 1) de construto, 2) de método e 3) de item.
 reformular itens que não foram entendidos e/ O viés de construto ocorre quando um construto
ou não foram respondidos conforme esperado. estudado varia em um grau substancial entre duas
culturas distintas. Nesse caso podem ocorrer pro-
A verificação da familiaridade pode ser reali- blemas de equivalência conceitual. O viés de méto­
zada em um próprio teste-piloto, utilizando técni- do, por sua vez, pode assumir três formas: a) viés
cas como pedir para os respondentes lerem os itens de amostra (falta de comparabilidade das amostras
em voz alta ou explicar alguns termos específicos. em diferentes países, p. ex., devido a diferenças de
Com base nos resultados do teste-piloto, uma renda ou nível educacional), b) viés de instrumento
versão final deve ser elaborada pelo comitê de (diferenças na interpretação do instrumento de
especialistas. Durante essa fase, os autores do coleta de dados pelos respondentes), e c) viés de
instrumento original também devem ser envolvi- administração (dificuldade de comunicação entre
dos na discussão quanto a ajustes e modificações o pesquisador e o respondente). Finalmente, o viés
cabíveis.6 Se necessário, um segundo estudo-piloto de item ocorre quando indivíduos com a mesma
(ou quantos bastarem) deve ser realizado com “quantidade” de uma característica ou um cons-
o instrumento modificado para avaliar se ele truto, porém pertencentes a diferentes grupos
realmente está pronto para ser utilizado na nova cul­turais, exibem diferentes probabilidades de
população e língua. 5 resposta a itens.15
fundamentos de mensuração em saúde mental [ 1 ]  17

Adaptar e validar um instrumento ­psicométrico 2. Cassepp-Borges V, Balbinotti MAA, Teodoro MLM. Tradução e vali-
são passos distintos, porém complementares, do dação de conteúdo: uma proposta para a adaptação de instrumentos.
In: Pasquali L, organizador. Instrumentação psicológica: fundamentos
processo de utilização de um novo instrumento
e práticas. Porto Alegre: Artmed; 2010. p. 506-20.
em uma nova população. Geralmente, as revistas 3. Kottak C. Mirror for humanity. New York: McGraw-Hill; 2006. p. 47.
científicas exigem que as publicações de instrumen- 4. Kankaraš M, Moors G. Researching measurement equivalence in
tos adaptados incluam a descrição tanto dos pro- cross-cultural studies. Psihologija. 2010;43(2):121-36.
cedimentos de adaptação como dos de validação. 5. Borsa JC, Damásio BF, Bandeira DR. Adaptação e validação de ins-
trumentos psicológicos entre culturas: algumas considerações. Paidéia.
 CONSIDERAÇÕES FINAIS 2012;22(53):423-32.
6. Beaton DE, Bombardier C, Guillemin F, Ferraz MB. Guidelines for
O uso de um instrumento desenvolvido em outra the process of cross-cultural adaptation of self-report measures. Spine.
cultura requer um processo abrangente de tradu- 2000;25(24):3186-91.
ção e adaptação, buscando a equivalência cultural 7. Antunes B. The Palliative care Outcome Scale (POS): manual for
que não pode ser alcançada simplesmente por cross-cultural adaptation and psychometric validation [Internet].
meio de tradução e retrotradução do instrumento. London: POS Development Team; 2012 [capturado em 20 fev. 2014].
As etapas dos procedimentos recomendados de Disponível em: http://pos-pal.org/doct/Manual_for_crosscultural_adap-
tation_and_psychometric_validation_of_the_POS.pdf.
adaptação transcultural de um instrumento de
8. Maneesriwongul W, Dixon JK. Instrument translation process: a me-
avaliação devem ser cumpridas e registradas com thods review. J Adv Nurs. 2004;48(2):175-86.
diligência, sob o risco de ser necessário reiniciar 9. Reichenheim ME, Moraes CL. Operationalizing the cross-cultural
discussões fundamentais sobre o construto que se adaptation of epidemiological measurement instruments. Rev Saúde
deseja operacionalizar para uso na nova população. Publica. 2007;41(4):665-73.
Avaliações transculturais devem estar basea- 10. Hambleton RK. Issues, designs, and technical guidelines for adapting
tests into multiple languages and cultures. In: Hambleton RK, Merenda
das em instrumentos que foram adaptados e valida­
PF, Spielberger CD, editors. Adapting educational and psychological
dos na nova população, com atenção específica à tests for cross-cultural assessment. Mahwah: LEA; 2005. p. 3-38.
detecção de doenças mentais na cultura-alvo, à 11. Ferreira P, Marques F. Avaliação psicométrica e adaptação cultural e
viabilidade e aceitação do formato, ao treinamento linguística de instrumentos de medição em saúde: princípios metodo-
de entrevistadores, bem como às propriedades lógicos gerais. Coimbra: Centro de Estudos e Investigação em Saúde;
psicométricas (confiabilidade e validade). De for- 1998.
12. Bhui K, Mohamud S, Warfa N, Craig TJ, Stansfeld SA. Cultural adapta-
ma geral, o processo de adaptação transcultural
tion of mental health measures: improving the quality of clinical practice
abarca várias etapas de validação e comparação, and research. Br J Psychiatry. 2003;183:184-6.
envolvendo esforço de investigadores de várias 13. Gundmundsson E. Guidelines for translating and adapting psychological
especialidades, até os pesquisadores obterem uma instruments. Nordic Psychology. 2009;61(2):29-45.
versão final do instrumento capaz de refletir o 14. Van de Vijver F, Leung K. Methods and data analysis for cross-cultural
construto original no novo contexto. research. Newbury Park: Sage; 1997.
15. Van de Vijver F, Poortinga YH. Conceptual and methodological issues
in adapting tests. In: Hambleton RK, Merenda PF, Spielberger CD,
 REFERÊNCIAS
editors. Adapting educational and psychological tests for cross-cultural
1. Jorge MR. Adaptação transcultural de instrumentos de pesquisa em
assessment. Mahwah: LEA; 2005. p. 39-63.
saúde mental. Rev Psiquiatr Clín. 1998;25:233-9.

TIPOS E ESTRATÉGIAS DE AVALIAÇÃO [ 1.3 ]


Lucas de Francisco Carvalho, Fabián Javier Marín Rueda

A avaliação em saúde mental depende do uso Para decidir sobre a avaliação apropriada, o
conjunto de técnicas e instrumentos de diferentes profissional deve considerar diversos elementos
naturezas. Essa característica visa possibilitar ao que caracterizam os instrumentos disponíveis.
profissional o acesso a um grupo de variáveis e, Entre elas, aponta-se o construto e a faixa que se
além disso, a coleta de informações acerca dos destina avaliar, o contexto, o propósito e o públi-
construtos a partir de perspectivas distintas.1 co-alvo. Além disso, deve-se considerar a natureza
O profissional deve ser capaz de tomar decisões do instrumento, o método de avaliação e o formato
adequadas no que se refere à escolha dos instru- de resposta. Neste capítulo, são discutidos os
mentos que serão utilizados no processo avaliativo. principais atributos que caracterizam a avaliação
18  INSTRUMENTOS DE AVALIAÇÃO EM SAÚDE MENTAL

realizada pelos instrumentos psicométricos, assim é compreendida em um continuum, variando entre


como os aspectos que caracterizam seu formato. níveis mais saudáveis de funcionamento até níveis
Ao fim do capítulo, é apresentado um instrumento mais patológicos. 3 No Brasil, existe um conjunto
de avaliação desenvolvido no Brasil para a área de expressivo de instrumentos que avaliam a persona-
saúde mental. lidade disponibilizados para uso profissional.* De
acordo com a Resolução nº 02/2003 do Conselho
 ESTRATÉGIAS DE AVALIAÇÃO Federal de Psicologia (CFP),4 o uso profissional de
EM SAÚDE MENTAL testes para avaliação da personalidade no Brasil é
Ao profissional em saúde mental é oferecida uma restritivo aos psicólogos, ainda que há algum tempo
ampla gama de ferramentas para avaliação dos a possibilidade de flexibilização dessa realidade
construtos de interesse. Se, por um lado, a ava- venha sendo discutida. Já no caso de ferramentas
liação nesse contexto não é definida pelo uso de pa­ra avaliação de características patológicas da
instrumentos, por outro, o não uso de ferramentas per­s onalidade e instrumentos diagnósticos de
de levantamento/mapeamento de perfil, triagem e trans­tornos da personalidade, há uma lacuna evi­
diagnóstico pode ter como consequência a perda de dente no País. 5 Considerando o continuum da per­
informações essenciais, tanto no contexto prático so­nalidade, para o caso em que se necessita realizar
da profissão quanto no âmbito da pesquisa. uma avaliação de funcionamentos mais saudáveis
Os instrumentos de avaliação se diferenciam da personalidade, o profissional tem em mãos
a partir de um conjunto amplo de atributos, que um grupo de instrumentos, como, por exemplo, a
devem ser considerados pelo clínico e/ou pesquisa- versão brasileira do Inventário NEO de Personali­
dor no momento de decisão acerca da ferramenta dade Revisado (NEO-PI-R) e a Bateria Fatorial de
que será utilizada.1,2 O primeiro atributo a ser Per­sonalidade (BFP). Já para casos em que seja
considerado refere-se ao construto que se pretende necessário realizar avaliações de características
avaliar. Isto é, para a tomada de decisão, deve-se patológicas da personalidade ou diagnóstico de
ter clareza de qual construto pretende-se avaliar transtornos da personalidade, a realidade nacional
e, mais que isso, se ele é relevante para avaliação é mais limitada: o Inventário Dimensional Clínico
naquele contexto e/ou caso específico. da Personalidade (IDCP)5 e a versão para o Eixo II
Por exemplo, um clínico pode suspeitar de da SCID,6 respectivamente. Os estudos nacionais
um quadro de transtorno depressivo maior em sobre as manifestações saudáveis do construto
determinado paciente, com base em uma anamnese são mais expressivos do que os sobre os aspectos
inicial. A fim de confirmar a suspeita, pode decidir patológicos da personalidade.
utilizar escalas sintomáticas, como a segunda ver- Com o objetivo de ponderar o intervalo de
são do Inventário de Depressão de Beck (BDI-II), abrangência do construto latente que se pretende
ou entrevistas diagnósticas, como a Entrevista avaliar, o profissional deve buscar, na literatura,
Clínica Estruturada para Transtornos do Eixo I incluindo o manual do instrumento, informações
do DSM-IV (SCID-I), entre outras possibilidades que delimitem direta ou indiretamente a amplitude
de avaliação. O uso combinado de instrumentos de avaliação da ferramenta que será utilizada. De
com o levantamento clínico de informações visa outro modo, e ainda usando o exemplo, a verifi-
auxiliar o profissional na melhor escolha para cação do nível de gravidade de um paciente (p.
fu­turas intervenções. Contudo, a falta de clareza ex., baixo, médio e alto) muitas vezes perde sua
so­bre os construtos relevantes para determinado função. Um paciente pode apresentar um nível alto
contexto e casos específicos pode resultar em perda na dimensão “conscienciosidade” do NEO-PI-R
de informação importante ou no levantamento de e apresentar um funcionamento saudável quanto
elementos desnecessários que pouco auxiliam na à necessidade de organização e perfeccionismo.
compreensão do caso. Diferentemente, um nível alto na dimensão cons-
Tão importante quanto o conteúdo avaliado cienciosidade do IDCP já sugere a presença de
pelo construto é o intervalo da abrangência do funcionamento mais patológico quanto a tais carac-
cons­truto que se pretende avaliar. Dificilmente um terísticas. Nesse sentido, a interpretação realizada
só instrumento de avaliação é capaz de represen- acerca dos resultados obtidos deve ser ponderada
tar todo o continuum dos construtos tipicamente diante do intervalo avaliado pelo instrumento.
avalia­dos em saúde mental, e, por isso, o profissio-
nal deve atentar para a delimitação em ter­mos de
intensidade ou gravidade a que o instrumento se
destina. Por exemplo, atualmente, a personalidade * Disponível em: satepsi.cfp.org.br.
fundamentos de mensuração em saúde mental [ 1 ]  19

O profissional deve também considerar o con­ a eventual falta de informação sobre o instrumento
texto no qual determinada ferramenta será utiliza- de avaliação, é de responsabilidade do usuário
da, analisando a extensão do instrumento (tempo levantar estudos realizados com os testes, a fim
de aplicação) e o formato do procedimento (como de inferir, tanto quanto necessário, informações
instrumentos verbais vs. não verbais). Em situações relevantes não apresentadas.
em que o profissional tem menos de 1 hora para uti-
lizar determinado instrumento, o uso da SCID-II  TIPOS DE AVALIAÇÃO
pode ficar comprometido. Já em situações em que EM SAÚDE MENTAL
o tempo disponível é mais longo, mas o paciente é Os instrumentos em saúde mental podem também
analfabeto, os instrumentos de autorrelato, como ser agrupados de acordo com a natureza de sua
o NEO-PI-R, a BFP e o IDCP, são inadequados. avaliação, incluindo o método de avaliação e o
Quando o instrumento possibilita a aplicação assis- formato de resposta (ver Cap. 2). No que respeita
tida, o profissional deve fazer a leitura em voz alta à natureza da avaliação, os instrumentos se distin-
para o paciente. De modo similar, é de relevância guem em razão do nível de padronização, variando
inequívoca a clareza em relação ao público-alvo entre aqueles prioritariamente desestruturados ou
a que o instrumento se destina em contraste a não estruturados até aqueles mais estruturados. Os
quem será avaliado. Por exemplo, em âmbito na- procedimentos não estruturados se referem, geral-
cional e internacional, há maior disponibilidade mente, às entrevistas abertas realizadas na clínica.
de instrumentos para avaliação do transtorno de Nesse caso, não há um roteiro para formular as
déficit de atenção/hiperatividade em crianças em perguntas para a pessoa de que se deseja coletar
comparação ao número de instrumentos disponí- informações; o profissional conduz o procedimento
veis para adultos.7 de acordo com as respostas da pessoa que está
Muito relacionado ao contexto de aplicação, sendo avaliada. Contudo, também as entrevistas
deve-se ponderar também sobre o propósito podem se distinguir pelo nível de estruturação,
da avaliação. Basicamente, em saúde mental, a de modo que estão disponíveis no meio científico
ava­liação destina-se à triagem (ver o Capítulo 2, entrevistas semiestruturadas e estruturadas. As
so­bre entrevistas diagnósticas e instrumentos de entrevistas semiestruturadas contêm perguntas
triagem), com vistas a determinar o encaminha- abertas, às quais o avaliado pode atribuir uma
mento que será feito com determinado paciente. resposta tal qual desejar, e fechadas, nas quais
Os instrumentos de saúde mental que se destinam existem respostas a serem escolhidas pelo avalia-
à triagem ou ao diagnóstico apresentam diferenças do. Em saúde mental, é prática comum o uso de
expressivas quanto à capacidade e à amplitude de entrevistas semiestruturadas, como é o caso da
avaliação. Ainda, ressalta-se que alguns dos ins- família da Entrevista Clínica Estruturada para
trumentos disponíveis não se inserem no campo Transtornos dos Eixos I e II do DSM (SCID). Nesse
da triagem, pois não visam o encaminhamento, e caso, as entrevistas são utilizadas para diagnóstico
também não se enquadram no campo do diagnósti­ de transtornos psiquiátricos. Em outros casos,
co, por não permitir evidenciar a presença ou não são usadas para compreensão do funcionamento
de determinado transtorno. Exemplo disso é o do indivíduo ou mesmo de grupos de indivíduos,
NEO-PI-R e o IDCP, que avaliam níveis distintos como é o caso da Entrevista Familiar Estruturada.8
da personalidade, permitindo somente mapear o O nível de estruturação dos instrumentos é
perfil da personalidade do paciente. determinado por sua natureza (mais ou menos
Em relação ao escopo e à delimitação dos ins­ flexível), o que tem impacto direto na composição
tru­mentos em saúde mental, o usuário deve estar dos estímulos que compreendem o instrumento e
atento às características levantadas. Essas infor- nas possibilidades de resposta que o avaliado pode
mações devem estar claras nos manuais e demais atribuir. Nesse sentido, os instrumentos menos
publicações que dão base a esses instrumentos. estruturados se referem àqueles cujos estímulos são
Contudo, nem sempre essa é a realidade. Uma prioritariamente não estruturados, ambíguos. Um
grande parte dos manuais de testes em saúde men- exemplo é o Teste de Rorschach,9 ferramenta de
tal no Brasil não apresenta informações suficientes avaliação composta por 10 pranchas em que uma
acerca do propósito da avaliação com o teste espe- mancha de tinta é apresentada em cada prancha.
cífico. Mais do que esclarecer a informação sobre o As manchas de tinta são borrões monocromáticos
propósito, os manuais devem informar se existem ou cromáticos nos quais, de fato, não há um con-
ou não estudos com aquele instrumento em deter- torno estruturado o suficiente para determinar
minada área e contexto de atuação. Considerando uma resposta possível ou correta. Por isso, o Teste
20  INSTRUMENTOS DE AVALIAÇÃO EM SAÚDE MENTAL

de Rorschach é um dos instrumentos de avaliação as pessoas ao meu redor” e “as ­pessoas costumam
expressiva ou projetiva que está disponível para o dizer que tenho dificuldade para prestar atenção
profissional em saúde mental. O levantamento de nas coisas” poderiam ser dois itens apresentados
informações é realizado com base nos conteúdos simultaneamente de modo que o avaliado deve
expressos ou comunicados pelo avaliado ante os escolher aquele que mais se aproxima de si. Esse
estímulos (manchas) desestruturados das pranchas. procedimento é utilizado, sobretudo, para lidar
Assume-se que o modo como o avaliado estrutura com o fenômeno da desejabilidade social, que
esses estímulos, que é verificado por suas respostas, tem impacto principalmente nos instrumentos de
é determinado por seu funcionamento mental. autoavaliação.
Diferentemente, os instrumentos estruturados Diversos atributos caracterizam os instrumen-
de avaliação referem-se aos testes denominados de tos em saúde mental, portanto, o profissional deve
autorrelato. Essas ferramentas são caracterizadas conhecer profundamente a ferramenta que preten-
pela autoaplicação, ou seja, em geral, o avaliado de utilizar, para evitar a aplicação equivocada de
tem todas as informações necessárias para respon- instrumentos pouco relevantes para determinada
der ao teste nas próprias instruções apresentadas situação. Na seção seguinte, é apresentado um
em uma folha inicial. Além disso, há sempre um instrumento desenvolvido especificamente para
número limitado de respostas possíveis que o ava- uso na área de saúde mental, utilizado para exem-
liado pode atribuir a cada questão. Basicamente, plificar os pontos abordados neste capítulo.
alguns testes de autorrelato utilizam escalas de
graduação como formato de resposta, largamente  INSTRUMENTO ILUSTRATIVO
no­meadas de escalas tipo Likert, que variam ­en­tre – INVENTÁRIO DIMENSIONAL
três categorias de resposta (p. ex., “nunca”, “às CLÍNICO DA PERSONALIDADE
vezes” e “sempre”) até um número maior de ca­ Apresentamos como exemplo o Inventário Di-
tego­rias, como 7 ou 10.1 ­Rigorosamente, uma escala mensional Clínico da Personalidade,4 um teste
Likert deve ter 5 pontos; qualquer outro número desenvolvido em âmbito nacional para uso no
de categorias deve ser referido como “tipo Likert”. contexto de saúde mental. Trata-se de um instru-
A ideia é que o avaliado escolha uma das categorias mento para avaliação de características clínicas da
de resposta para cada questão apresentada. Entre­ personalidade destinado a adultos que permite que
tanto, alguns instrumentos são desenvolvidos para o profissional faça um mapeamento do perfil do
serem respondidos em um formato distinto do gra­ paciente. O IDCP foi desenvolvido com base nas
dual – no formato dicotômico: o respondente tem características patológicas apresentadas na teoria
somente duas opções de resposta (p. ex., “sim” e de Theodore Millon para transtornos da perso-
“não”). Também no for­mato de relato, são encontra­ nalidade3 e nos critérios diagnósticos do Eixo II
dos na literatura testes que devem ser respondidos do DSM-IV-TR.6 Foi construído especificamente
por uma pessoa que tenha contato próximo (p. ex., para avaliar níveis patológicos das características
um familiar, um professor ou um amigo) com aquele da personalidade (delimitação), e, por isso, as
que está sendo avaliado. Esses testes são chamados interpretações realizadas devem se focar nas pon-
de instrumentos de heterorrelato e vêm demonstran­ tuações altas obtidas em suas dimensões. Apesar
do relevância no levantamento de informações para disso, não é possível uma conclusão diagnóstica a
diversos transtornos.7 partir da aplicação isolada do IDCP.
Ainda no que se refere ao formato de resposta No que diz respeito à natureza do inventário,
dos instrumentos em saúde mental, na literatura in- o IDCP é um instrumento estruturado, com pouca
ternacional são encontrados testes que utilizam um subjetividade na leitura dos estímulos (itens) que o
procedimento denominado escolha forçada (forced- compõem. É aplicado na forma de autorrelato, isto
-choice).10 Os instrumentos com esse f­ ormato são é, a pessoa deve informar o quanto os itens apresen-
praticamente inexistentes na área de saúde mental tados têm ou não a ver com ela. Para responder ao
no Brasil. Eles apresentam, geralmente, duas instrumento, as pontuações são anotadas em uma
ou mais frases que o respondente deve pontuar escala tipo Likert que varia entre 1 (“não tem nada
indicando quanto são verdadeiras ou não para ele a ver comigo”) e 4 (“tem muito a ver comigo”).
(como é o caso de testes de personalidade). Contu- Do ponto de vista psicométrico, estudos têm
do, o respondente é obrigado a escolher uma entre demonstrado adequação das 12 dimensões que
todas as opções apresentadas simultaneamente compõem o instrumento.11 As dimensões e suas
que, segundo ele, se aproxima mais de seu funcio- respectivas definições estão apresentadas na
namento. Por exemplo, “costumo ser agressivo com Tabela 1.3.1.
fundamentos de mensuração em saúde mental [ 1 ]  21

TABELA 1.3.1  DIMENSÕES DO INVENTÁRIO DIMENSIONAL CLÍNICO DA PERSONALIDADE

DIMENSÃO DESCRIÇÃO

Dependência Incapacidade de confiar em si para tomada de decisão, crença na posse de uma


performance inadequada e dependência do outro para a tomada de decisão
Agressividade Desconsideração do outro para se conseguir o que deseja, inconsequência e atos violentos
Instabilidade de humor Posse de humor triste e irritável, oscilações de humor, reações impulsivas e culpa
Excentricidade Ausência de prazer de estar com os outros, desconfiança, crença de ser diferente dos
demais, comportamentos excêntricos e idiossincráticos
Necessidade de atenção Necessidade exagerada de atenção alheia, sedução, reações exageradas e busca intensa por
amizades
Desconfiança Incapacidade de confiar nos outros, preferência pelo que é conhecido, rigidez nos
relacionamentos e persecutoriedade
Grandiosidade Necessidade exagerada de reconhecimento e admiração alheia, assim como crenças de
merecimento e superioridade
Isolamento Diminuição no prazer com relacionamentos e preferência por ficar sozinho
Evitação a críticas Posse de crenças generalizadas de incapacidade, humilhação e críticas pelos outros
Autossacrifício Desconsideração do eu (self) e consideração do outro, reações de ajuda e sacrifícios pelos
outros em detrimento de si
Conscienciosidade Necessidade de se fazer as coisas de maneira organizada e ordenada, assim como um foco
excessivo nas obrigações e preocupações, posse de perfeccionismo e regras rígidas nos
relacionamentos
Impulsividade Inconsequência, gosto por atividades violentas e envolvimento em problemas
Fonte: Abela.11

As dimensões do IDCP devem ser utilizadas Contudo, o leitor deve ter clareza de que nem todos
para avaliação clínica, de modo a compor um perfil os pontos levantados aqui abarcam toda a literatura
para o indivíduo avaliado. Não se deve interpretar da temática. Por exemplo, há uma tendência atual
o funcionamento do indivíduo a partir de uma bastante relevante para um formato específico
única dimensão; todas as dimensões devem ser de instrumentos, inclusive em saúde mental, o
consideradas. Enquanto o formato de autorrelato Computerized Adaptive Testing (CAT). Trata-se
é suscetível ao viés da desejabilidade social, pois de instrumentos em formato informatizado para
depende do quanto a pessoa está disposta a infor- testagem, permitindo a criação de ferramentas de
mar o profissional, espera-se que sua aplicação no avaliação adaptadas para o indivíduo de acordo
ambiente e contexto clínico favoreça a resposta sin- com seu nível no construto latente a ser avaliado.
cera pela pessoa avaliada. Além disso, estudos vêm Não há, ainda, um instrumento disponível nesse
sendo realizados empiricamente para verificar a formato para uso no contexto de saúde mental
proximidade dos perfis patológicos observados dos no Brasil.
pacientes avaliados com as pontuações do IDCP.11 Nesse sentido, o leitor é incentivado a buscar a
literatura recente para a permanente atualização
 CONSIDERAÇÕES FINAIS do que vem sendo adotado. Além disso, os tópicos
Este capítulo teve como objetivo amplo a­ presentar aqui levantados devem ser tratados como funda-
os aspectos importantes que caracterizam os ins­ mentais para compreender os diferentes tipos de
trumentos em saúde mental: escopo e delimita­ção, instrumentos que podem ser utilizados em saúde
natureza, método avaliativo e formato de resposta. mental, auxiliando na tomada de decisão acerca
22  INSTRUMENTOS DE AVALIAÇÃO EM SAÚDE MENTAL

dos instrumentos mais adequados para cada tipo 6. First MB, Spitzer RL, Gibbon M, Williams JBW. The structured cli-
de investigação. nical interview for DSM-III-R personality disorders (SCID-II). Part I:
Description. J Pers Disord. 1995;9(2):83-91.
7. Barkley RA. Attention deficit hyperactivity disorder in adults: the latest
 REFERÊNCIAS assessment and treatment strategies. Massachusets: Jones and Bartlett;
1. Urbina S. Fundamentos da testagem psicológica. Porto Alegre: Artmed;
2010.
2007.
8 . Féres-Carneiro T. Entrevista familiar estruturada – EFE: um método
2. Cunha JÁ, organizadora. Psicodiagnóstico-V. 5. ed. Porto Alegre:
de avaliação das relações familiares. Temas Psicol. 1997;5(3):63-94.
Artmed; 2000.
9. Meyer GJ, Kurtz J E. Advancing personality assessment terminology:
3. Millon T. Disorders of personality: introducing a DSM/ICD spectrum
time to retire “objective” and “projective” as personality test descriptors.
from normal to abnormal. New Jersey: Wiley; 2011.
J Pers Assess. 2006;87(3):223-5.
4. Conselho Federal de Psicologia. Resolução CFP nº 002, de 24 de março
10. Christiansen ND, Burns GN, Montgomery GE. Reconsidering
de 2003. Define e regulamenta o uso, a elaboração e a comercialização
­forced-choice item formats for applicant personality assessment. Hum
de testes psicológicos e revoga a Resolução CFP n° 025/2001. Brasília:
Perf. 2005;18(3):267-307.
CFP; 2003.
11. Abela RK. Evidências de validade para o Inventário Dimensional
5. Carvalho LF, Primi R. Development and internal structure investigation
Clínico da Personalidade (IDCP) com base nos perfis de participantes
of the dimensional clinical personality inventory. Psicol Reflex Crit.
com diagnóstico psiquiátrico [dissertação]. São Paulo: Universidade
2015;28(2):322-30.
Federal de São Paulo; 2013.

PROPRIEDADES PSICOMÉTRICAS [ 1.4 ]


Walberto S. Santos, Viviany Silva Pessoa, Rafaella de C. R. Araújo

Uma preocupação fundamental no campo da da constatação de validade, a avaliação de preci-


avaliação é a construção de instrumentos que são é um elemento básico, sobretudo porque, no
possibilitem uma análise fiel dos construtos de campo da saúde, deve-se promover a confiança
interesse. Nesse contexto, os aspectos mais rele- do profissional que utiliza os instrumentos como
vantes para a avaliação da qualidade das medidas ferramenta básica para traçar suas ações, sua
são identificados na literatura como indicadores triagem e o diagnóstico. Ao longo do capítulo, os
de validade e confiabilidade.1,2 A validade pode ser termos instrumento, medida e escala são utilizados
compreendida como o elemento básico de qualquer como sinônimos.
medida e está associada, contextualmente, ao pro-
cesso de elaboração, ao uso e, consequentemente,  PRINCIPAIS INDICADORES
à garantia de qualidade na mensuração, atestando DE CONFIABILIDADE
que o instrumento mede o que se propõe a medir. A confiabilidade, por vezes nomeada de precisão
A precisão diz respeito à medição sem erros ou ou fidedignidade, busca verificar o quanto a pon­
à capacidade de avaliar o quão consistente uma tuação do indivíduo se aproxima de sua realidade
pessoa é em suas respostas. Tais parâmetros são e o quanto ela se mantém estatisticamente idêntica
intrinsicamente relacionados, podendo a confia- em situações diferentes, se há variações decorren-
bilidade ser considerada um pré-requisito para tes do tempo e/ou intercorrelações entre os itens da
a validade, uma vez que não é possível medir um medida. Desse modo, para atestar a confiabilidade,
fenômeno se o instrumento utilizado apresenta existem três maneiras mais comuns: o teste-reteste,
re­s ultados inconsistentes. 3 Este capítulo tem as formas paralelas ou alternativas e a consistência
co­mo propósito apresentar tais parâmetros e os interna, que pode ser representada por meio de
principais indicadores utilizados para atestá-los técnicas como o split-half (ou duas metades), o alfa
nos instrumentos de avaliação em saúde mental. de Cronbach e o Kuder-Richardson.1
No campo da saúde mental, as escalas de
avaliação são essenciais para pesquisa, triagem e TESTE-RETESTE. O teste-reteste implica, basicamente,
diagnóstico. Contudo, para que sejam utilizadas de a administração do mesmo teste, sendo respondido
forma eficaz, é necessário que haja um processo pelos mesmos sujeitos, em duas ocasiões temporais
de construção e aprimoramento, em que se avalia diferentes. Depois de serem realizadas as duas apli-
desde a definição do construto até a adequabili- cações, calcula-se a correlação entre as pontuações
dade empírica do instrumento em questão. Além obtidas.4 A principal vantagem da utilização dessa
fundamentos de mensuração em saúde mental [ 1 ]  23

técnica está na possibilidade de avaliar a invaria- simbolizado pela letra grega α e definido como a
bilidade das respostas, dado que é a única que principal forma de confiabilidade de um teste,1,6
permite observar a estabilidade temporal. Porém, devendo ser interpretado como uma estimativa
ela também carrega consigo algumas dificuldades: es­tatística que avalia a proporção de variância
como os participantes respondem ao mesmo teste en­c ontrada nos escores do teste que pode ser
duas vezes, podem memorizar algumas de suas res- atribuída ao escore verdadeiro de variância.4 De
postas, gerando a “testagem”, quando a primeira maneira geral, assume-se que o valor do alfa deva
avaliação compromete os resultados da segunda; ao ser igual ou superior a 0,70 (podendo variar de 0 a
mesmo tempo, entre as duas aplicações, o partici- 1) para que seja considerado adequado. 5 Contudo,
pante pode passar por eventos pessoais que podem deve-se atentar que valores inferiores podem ser
enviesar suas respostas na última aplicação.1 igualmente relevantes em se tratando de pesqui-
sas exploratórias ou de acordo com a natureza do
FORMA PARALELA OU ALTERNATIVA. Nessa técnica, construto estudado.1
administram-se duas formas diferentes de um Basicamente, essa estatística verifica o quanto
mesmo teste, que contenham itens com conteúdo uma medida é confiável para medir um determina­
semelhante, sendo também os mesmos participan- do construto, avaliando-se a variância dos itens
tes a responder às duas versões. Nesse caso, tem-se individualmente e em grupo. Desse modo, quanto
a condição necessária de equivalência dos testes, menor for a variância específica de cada item e
tanto no que diz respeito à dificuldade como à dis- maior for a variância dos itens em conjunto, maior
criminação. Assim como no teste-reteste, o cálculo será o alfa de Cronbach. Nesse caso, a medida
realizado para verificar a precisão é o da correlação estará indicando que cada item mede consisten-
entre as duas distribuições das pontuações.4 As temente o construto de interesse, e o conjunto
formas paralelas e o teste-reteste são considerados desses é sensível para perceber diferentes níveis de
maneiras mais adequadas quando a intenção do pontuação. Ou seja, se todos os itens fossem iguais,
pesquisador é avaliar, acima de tudo, se a variação o valor do alfa seria igual a 1. Porém, a elaboração
temporal implica alguma alteração nas respostas de um teste com muitos itens semelhantes pode
dos participantes, dado que a primeira ocorre si- ocasionar a maximização do valor do alfa, pois a
multaneamente, e a segunda, em períodos diferen- tendência é que esse valor aproxime-se erronea­
tes. No entanto, se o principal interesse for avaliar mente de 1 em função da intercorrelação entre
os erros influenciados ou associados ao uso de itens os itens. Do mesmo modo, a quantidade de itens
diferentes, então as estimativas de consistência presente na escala pode causar um efeito notável
interna apresentam-se mais adequadas. Segundo no valor do alfa; frequentemente, instrumentos
Nunnally, 5 entre as maneiras mais comuns de se mais longos apresentam índices maiores. Além
avaliar a consistência interna, podemos apontar disso, alguns aspectos devem ser ponderados para
o split-half (ou duas metades), o alfa de Cronbach uma boa interpretação do alfa. Entre eles, pode-se
e o Kuder-Richardson. Entretanto, esses não são citar a natureza do construto, uma vez que aqueles
as únicas, ainda se pode mencionar indicadores mais mutáveis, como atitudes e valores humanos,
como o Spearman-Brown, o Guttman-Flannagan costumam apresentar índices mais baixos do que
e o Rulon, que são menos utilizados. aqueles mais resistentes à mudança, como per-
sonalidade. Em suma, observando a literatura,
CONSISTÊNCIA INTERNA. Tendo em vista o fato de que existirão, basicamente, três fatores primordiais
aplicar várias vezes um mesmo teste poderia causar que podem afetar o valor do alfa de Cronbach, a
erros, como o da aprendizagem ou memorização, saber: o valor mínimo aceito (se o teste tem fins de
nos quais os participantes poderiam pontuar dife- diagnóstico, faz-se necessário que o alfa alcance
rencialmente na segunda vez que o respondessem, um índice de 0,70; no caso de pesquisa, pode variar
Spearman e Brown definiram o método split-half até 0,60); a quantidade de itens do instrumento; e
como a correlação entre duas metades equivalentes a variabilidade inter-sujeitos.
de um único teste, sendo este respondido em uma Segundo Carmines e Zeller,6 o alfa de Cronbach
única ocasião pelos mesmos sujeitos, diferentemen- foi uma generalização dos achados de Kuder e
te das formas paralelas, em que são elaborados dois Richardson,7 que haviam sido direcionados a um
testes equivalentes.6 coeficiente que avaliasse a consistência interna de
instrumentos com itens dicotômicos. Conhecido
O índice de consistência interna mais conheci- como o coeficiente de Kuder-Richardson, ele
do e utilizado é, sem dúvida, o alfa de Cronbach, apresenta duas fórmulas diferentes, KR 20 e KR 21,
24  INSTRUMENTOS DE AVALIAÇÃO EM SAÚDE MENTAL

em que a segunda se diferencia por supor que, além Pas­q uali,1 por exemplo, apresenta mais de 20
de dicotômicos, os itens têm o mesmo nível de difi- tipos distintos de validade e ainda abre espaço
culdade. Em outras palavras, enquanto o Kuder-Ri- para a inserção de mais opções, mostrando, de
chardson é aplicável exclusivamente em situações forma crítica, que a visão moderna do conceito de
com itens dicotômicos, o alfa de ­Cronbach se aplica validade, mesmo sendo baseada no Standards for
a um número mais variado de tipos de escalas. Educacional and Psychological Testing,10 vem ga­
Porém, a fórmula KR 20 do Kuder-­R ichardson, nhando em confusão e perdendo em significa­do.
mesmo sendo mais limitada do que a fórmula Acerca desse tema, deve-se destacar que a literatu-
apresentada pelo alfa de Cronbach, também pro- ra especializada apresenta evidências de validade
duz uma estimativa acerca da confiabilidade que baseadas, por exemplo, no processo de resposta,
pode ser considerada significativa em estudos com nas consequências da testagem, na estrutura
mais de 200 participantes. Foi verificado que, em in­terna do teste, no conteúdo do teste e nas rela-
amostras dessa magnitude, a utilização das duas ções com outras variáveis. Contudo, a American
estatísticas produz resultados idênticos. A variação Psychological Association11 considera três grandes
é encontrada na fórmula KR 21, uma vez que parte classes de técnicas: validade de conteúdo, validade
de um pressuposto específico. de critério e validade de construto.
Desse modo, cabe salientar que, mesmo o alfa
de Cronbach sendo o mais conhecido e comumente VALIDADE DE CONTEÚDO. Está presente sempre que os
utilizado entre os indicadores, não significa que itens do instrumento representam adequadamente
seja adequado para uso em todas as situações, o universo de conteúdos referentes ao construto
devendo-se atentar para as suas limitações e reais que se pretende avaliar.8 Restringe-se ao estabe-
utilidades. Ademais, é necessário que se tenha lecimento, a priori, dos comportamentos (itens)
clareza dos pontos principais e detalhamentos do que operacionalizam o construto. Normalmente,
instrumento que se pretende utilizar para poder para a análise da validade de conteúdo, recorre-se
conduzir as análises estatísticas de parâmetros à opinião de especialistas que verificam se o con-
psicométricos de maneira adequada.8 Além disso, teúdo proposto representa, de fato, o construto
deve-se lembrar que um instrumento preciso pode que se pretende avaliar e em que nível essa repre-
não ser válido; como já foi dito, esses parâmetros sentação acontece. Como regra, na elaboração da
são complementares, devendo o profissional medida, procura-se abranger toda a magnitude
também ficar atento aos indicadores de validade do construto. 3
(Fig. 1.4.1).
VALIDADE DE CRITÉRIO. Refere-se à capacidade que um
 VALIDADE: CONCEITOS teste tem de predizer um comportamento futuro,
GERAIS E APLICABILIDADE relacionando as respostas do instrumento ao com-
Atualmente, admite-se a existência de distintas portamento do indivíduo em atividades específicas.
téc­nicas para atestar a validade de uma medida. Tal validade pode ser concorrente, quando as in-

Alvo A Alvo B Alvo C


confiabilidade baixa confiabilidade alta confiabilidade alta
validade média validade alta validade baixa

FIGURA 1.4.1  RELAÇÃO ENTRE CONFIABILIDADE E VALIDADE DE ESCALA DE AVALIAÇÃO.


Fonte: Babbie.9
fundamentos de mensuração em saúde mental [ 1 ]  25

formações do teste e do critério são levantadas em e as intenções de uso da medida. Por exemplo,
um espaço de tempo curto ou simultaneamente; e quando se utilizam testes escolares, foca-se na
preditiva, quando as informações sobre o critério validade de conteúdo, dado que os itens devem
são reunidas depois da coleta das informações nos abranger todo o conteúdo do conhecimento posto
testes.8 Como se observa, ambas as formas se dife- em avaliação; se o objetivo está na avaliação da per-
renciam com base na temporalidade entre o critério sonalidade, busca-se a validade de construto, já que
e o teste.2 A validade de critério está presen­te, prin- se espera verificar de forma direta a representação
cipalmente, em situações de orientação e seleção comportamental do traço psicológico; se a análise
de pessoal nos contextos empresarial, escolar, mi- envolve taxonomias diagnósticas, enfatiza-se a
litar, hospitalar, entre outros. Como exemplificam validade de critério, pois, geralmente, pretende-se
Engel e Schutt, 3 em saúde, pode-se utilizar como predizer comportamentos. Nessa d ­ ireção, indepen-
critério para validar escalas que avaliam o consumo dentemente do tipo de instrumento, as evidências
de álcool, a concentração de álcool no sangue. No de validade se configuram como uma condição
entanto, deve-se reconhecer que a observação de sine qua non para sua utilização, para que se possa
um comportamento a posteriori, como ocorre na afirmar que as características psicológicas verifi-
avaliação da validade preditiva, pode inviabilizar cadas sejam, de fato, próprias do sujeito avaliado.
a realização da validação dada à natureza do pro- Como se constata, as evidências de validade são
cedimento, o que demanda a observação de outros essenciais e, em muitos casos, é possível atestá-las
indicadores de validade. por meio de um conjunto amplo de possibilidades.
No entanto, apenas essa constatação não basta
VALIDADE DE CONSTRUTO OU DE CONCEITO. Busca ve­ para qualificar o instrumento. De forma com-
ri­ficar, de forma direta, se os traços latentes es­ plementar, e igualmente importante, o critério
tão sendo representados legitimamente por sua de confiabilidade vai oferecer o suporte sobre a
re­p resentação comportamental (itens). Desse precisão da medida.
mo­do, o principal objetivo é descobrir se os itens
do instrumento constituem uma representação  CONSIDERAÇÕES FINAIS
legítima, adequada, do construto. A validade de Este capítulo destacou a importância dos parâ-
construto também é identificada como validade metros psicométricos (validade e precisão) para a
fatorial, visto que, na maioria dos casos, se utiliza avaliação e o diagnóstico em saúde mental. Como
estatísticas multivariadas como a análise fatorial, foi possível observar, ainda que o conjunto de
cujo principal objetivo é verificar quantos fatores indicadores citados possa apresentar limitações,
comuns são suficientes para representar o cons- sem eles, pesquisadores e profissionais não têm
truto.12 O que se busca é avaliar se os itens do qualquer garantia de que o instrumento está aferin-
instrumento, elaborados para medir um ou mais do adequadamente o construto de interesse. Esses
fatores específicos, apresentam-se relacionados, aspectos interferem diretamente na qualidade do
justificando seu agrupamento para representar as serviço, promovendo problemas sérios nos campos
dimensões do construto. 3 da pesquisa, da triagem e, principalmente, do
diagnóstico, dado que orientam as ações do pro-
Por sua vez, a legitimidade da representação fissional da saúde. De fato, a validade é o alicerce
comportamental do construto ainda pode ser ob- da medida, sem sua comprovação, toda e qualquer
servada por meio da análise de hipóteses. Para isso, avaliação é inútil; se não há base teórica e empírica
recorre-se à análise da validade convergente, que de que o instrumento utilizado, efetivamente, ope-
indica o grau de semelhança (convergência) que racionaliza o objeto que se busca medir, e faz isso
a medida tem com outras medidas que avaliam o com precisão, seus resultados não são confiáveis. 3
mesmo construto; à validade discriminante, cuja Ao mesmo tempo, ainda que se verifiquem
ênfase está na diferença entre a medida de um dado indicadores satisfatórios de validade e precisão, é
construto em comparação com medidas de outros fundamental que o profissional analise o contexto
construtos;13 e à validade nomológica, que avalia a e a população-meta a que se destina o instrumento
relação do construto em questão com outros cons- original, dado que esses aspectos também podem
trutos, de acordo com alguns argumentos teóricos. influenciar a interpretação de resultados. Nesse
A observação das evidências de validade, seja sentido, mesmo que o instrumento apresente pa-
com ênfase no conteúdo, no critério ou no constru- râmetros psicométricos satisfatórios, sempre que
to, em termos práticos, se pauta em aspectos como possível, deve-se voltar a analisá-los. Em síntese, a
a natureza do construto, o contexto de aplicação escolha do instrumento é um elemento primordial
26  INSTRUMENTOS DE AVALIAÇÃO EM SAÚDE MENTAL

para a qualidade da pesquisa, da triagem e do 6. Carmines EG, Zeller RA. Measurement in the social sciences: the link
diagnóstico em saúde mental. A adequação dos between theory and data. New York: Cambridge University; 1980.
7. Kuder GF, Richardson MW. The theory of estimation of test reliability.
resultados passa pela verificação dos parâmetros
Psychometrika. 1937;2(3):151-60.
psicométricos, pela reunião de evidências apresen- 8. Cohen RJ, Swerdlik ME, Sturman ED. Testagem e avaliação psicológica:
tadas por estudos prévios, em contextos variados, introdução a testes e medidas. 8. ed. Porto Alegre: AMGH; 2014.
e pelo treinamento do aplicador. 9. Babbie E. Practice of social research. 9th ed. Belmont: Wadsworth/
Thomson Learning; 2001.
 REFERÊNCIAS 10. American Educational Research Association, American Psychological
1. Pasquali L, organizador. Instrumentação psicológica: fundamentos e Association, National Council on Measurement in Education. Standards
práticas. Porto Alegre: Artmed; 2010. for educational and psychological testing. Washington: American Edu-
2. Urbina S. Fundamentos da testagem psicológica. Porto Alegre: Artmed; cational Research Association; 1999.
2007. 11. American Psychological Association. Technical recommendations for
3. Engel RJ, Schutt RK. The practice of research in social work. Thousand psychological tests and diagnostic techniques. Washington: APA; 1954.
Oaks: Sage; 2012. 12. Hair JF, Black WC, Babin BJ, Anderson RE, Tatham RL. Análise
4. Brown JD. The Cronbach alpha reliability estimate. Shiken. 2002;6(1):7-18. multivariada dos dados. Porto Alegre: Bookman; 2009.
5. Nunnally JC. Introduction to psychological measurement. New York: 13. Campbell DT, Fiske DW. Convergent and discriminant validation by
McGraw-Hill; 1970. the multitrait-multimethod matrix. Psychol Bull. 1959;56(2):81-105.

INTRODUÇÃO ESTATÍSTICA À AVALIAÇÃO DAS ESCALAS [ 1.5 ]


Rinaldo Artes, Lúcia Pereira Barroso

 O PROCESSO DE MENSURAÇÃO [B] Ordinal: as respostas têm uma ordenação, sem


Uma medida define-se como o processo de atribuir que as distâncias entre categorias sejam neces-
um número, ou rótulo, a um aspecto relacionado a sariamente iguais. Por exemplo, a distância que
um objeto (pessoa, serviço, etc.) segundo determi­ separa um desempenho excepcional de um
nadas regras. bom em um teste pode não ser a mesma que
separa um desempenho suficiente de um ruim.
EXEMPLO 1: Para avaliar a temperatura corporal há [C] Intervalar: é uma variável numérica, na qual
três alternativas: diferenças iguais entre as respostas têm o
mesmo significado quantitativo, permitindo
 Regra 1: Por meio de uma escala Celsius. soma e subtração dos valores. Como o ponto
 Regra 2: Magnitude baixa, normal ou alta. zero da escala é arbitrário, as operações de
 Regra 3: Estado febril – sim ou não. multiplicação e divisão não são permitidas.
Por exemplo, a diferença entre temperaturas
Cada regra pode ser adequada de acordo com de 10 oC e 30 oC é de 20 oC, mas não significa
os objetivos do avaliador. Por exemplo, aferir o que 30 oC seja três vezes mais quente que 10 oC.
desempenho de um aluno por meio de um conceito [D] Razão ou proporcional: tem maior poder de
(A, B, C) pode ser adequado para saber seu grau discriminação. Nessa escala, todas as opera-
de domínio do conteúdo, mas pode não ser capaz ções matemáticas fazem sentido. Por exemplo,
de identificar os melhores alunos para concessão uma régua de 30 cm tem o dobro do tamanho
de um prêmio. de uma régua de 15 cm, o que se mantém em
outras unidades métricas (p. ex., polegadas).
NÍVEIS DE MENSURAÇÃO
Basicamente, as variáveis são classificadas em A NATUREZA DA MEDIDA
quatro níveis de mensuração: Muitas vezes, em ciências naturais, a variável
(conceito de interesse) é diretamente observável
[A] Nominal: quando os valores não têm uma or- (p. ex., peso). Nesses casos, os problemas de mensu­
denação natural. Por exemplo, se a variável de ração referem-se principalmente à qualidade dos
interesse for sexo, a única afirmação possível instrumentos de medida (balança). Quando o
sobre as respostas é que uma exclui a outra. conceito é abstrato (p. ex., construto de ansiedade,
fundamentos de mensuração em saúde mental [ 1 ]  27

de­pressão), deve-se observar diferentes caracte- do construto. Ele só pode ser avaliado quando as
rísticas e utilizar alguma regra para mensurá-lo. variáveis são analisadas conjuntamente.
A intensidade do conceito pode ser medida por
meio da pontuação de uma escala. EXEMPLO 3: A partir do conhecimento teórico do
Em geral, o profissional de saúde mental ne- construto busca-se estabelecer uma lista de carac-
cessita avaliar construtos complexos. Perguntar terísticas observáveis que permitam sua caracteri-
ao paciente se ele está deprimido não é suficiente zação. Por exemplo, os 20 itens da escala IDATE-T
para saber o grau da depressão, ou mesmo se esse (Inventário de Ansiedade Traço-Estado forma
é o diagnóstico correto. Nesses casos, é necessário Traço)1 descrevem diferentes comportamentos que
observar uma série de evidências para se chegar buscam operacionalizar toda a complexidade do
a um diagnóstico mais preciso. A construção de construto traço de ansiedade (Tab. 1.5.1). Espera-se
uma escala de mensuração pode ser feita a partir que uma pessoa altamente ansiosa tenda a discordar
da operacionalização de construto (ver Cap. 1.1). dos itens positivos e a concordar com os negativos.
Para a construção das frases, recomenda-se
OPERACIONALIZAÇÃO que elas sejam curtas, formuladas em linguagem
DE CONSTRUTO simples, direta e sem ambiguidades, e que consi-
Operacionalizar um construto significa encontrar dere o nível cultural do respondente. Cada frase
variáveis diretamente mensuráveis ou observáveis deve tratar de um único aspecto (p. ex., “Sinto-me
– itens – que individualmente ou em conjunto ex- seguro”, “Sinto-me feliz”, e não “Sinto-me seguro e
pressem a intensidade com que o construto incide feliz”). Além disso, sugere-se o uso de itens positi-
sobre o objeto que está sendo avaliado. vos e negativos para evitar que o respondente adote
o mesmo padrão de resposta. Os itens redundantes
EXEMPLO 2: Deseja-se medir o potencial de cresci­ ou pouco relacionados ao construto após a primeira
mento de um funcionário em uma empresa (con- etapa da operacionalização podem ser excluídos.
ceito abstrato). Inicialmente é necessário encontrar Em seguida, deve-se definir a forma de medir
variáveis (itens) que estejam ligadas ao construto, as características identificadas. Os itens da Ta-
como experiência anterior, escolaridade, profissão, bela 1.5.1 podem ser avaliados por uma resposta
entre outros. A hipótese subjacente à escolha das dicotômica (sim/não) ou uma nota de 0 a 10 (0 =
variáveis é que o construto seja uma parte comum ausência total; 10 = presença total). Por fim, as
a todas elas (Fig. 1.5.1). O construto está repre- respostas obtidas para todas as variáveis podem
sentado pelo círculo e as variáveis diretamente ob- ser agregadas de modo a criar uma medida única
serváveis por retângulos que mensurem boa parte do construto, ou seja, uma escala.

Experiência

Escolaridade

Profissão

Construto: Potencial de Variáveis diretamente


crescimento na empresa observáveis

ABSTRATO CONCRETO

FIGURA 1.5.1  OPERACIONALIZAÇÃO DO CONSTRUTO POTENCIAL DE CRESCIMENTO NA EMPRESA.


28  INSTRUMENTOS DE AVALIAÇÃO EM SAÚDE MENTAL

TABELA 1.5.1  ITENS DA ESCALA IDATE1

ITEM DESCRIÇÃO TIPO DE ITEM

1 Sinto-me bem Positivo


2 Canso-me facilmente Negativo
3 Tenho vontade de chorar Negativo
4 Gostaria de ser tão feliz como as outras pessoas parecem ser Negativo
5 Perco oportunidades porque não consigo tomar decisões rápidas Negativo
6 Sinto-me descansado Positivo
7 Sinto-me calmo, ponderado e senhor de mim mesmo Positivo
8 Sinto que as dificuldades estão se acumulando de tal forma que não as consigo resolver Negativo
9 Preocupo-me demais com coisas sem importância Negativo
10 Sou feliz Positivo
11 Deixo-me afetar muito pelas coisas Negativo
12 Não tenho confiança em mim mesmo Negativo
13 Sinto-me seguro Positivo
14 Evito ter que enfrentar crises e problemas Negativo
15 Sinto-me deprimido Negativo
16 Estou satisfeito Positivo
17 Às vezes ideias sem importância me entram na cabeça e ficam me preocupando Negativo
18 Levo as coisas tão a sério que não consigo tirá-las da cabeça Negativo
19 Sou uma pessoa estável Positivo
20 Fico tenso e perturbado quando penso em problemas do momento Negativo

ESCALAS Potencialmente, há várias maneiras de resumir


Na escala IDATE, o respondente avalia cada item a configuração de respostas:
de acordo com o que geralmente sente, segundo a
regra: 1 – Quase nunca; 2 – Às vezes; 3 – Frequen- [A] Q1 = X1 + ... + X20 , escala aditiva, que assume
temente; 4 – Quase sempre. valores entre 20 e 80. Quanto maior o valor da
Por convenção, na construção do escore dessa escala, maior a presença do traço de ansiedade
escala as respostas aos itens positivos são inverti- no respondente.
das, desse modo, se Ri é a resposta dada ao item i, [B] Q2 = Q1/20 , assumindo valores entre 1 e 4. É
para a construção da escala utiliza-se: uma escala similar à Q1, mas agora com um
valor médio como resposta.
Xi =
{ Ri, se o item i for negativo
5 – Ri, se o item i for positivo [C] Q3 = 4 –
20
20
∏ i=1 (4 – Xi) que varia de 0 a 4.
Note que esta escala pode ser vista como sendo
Assim, quanto maior a intensidade do constru- mais rigorosa do que as anteriores, na medida
to, maior o valor de Xi. A partir desse ponto, sempre em que um respondente atribuir escore 4 a
que falarmos sobre as respostas aos itens da escala pelo menos um item, a escala receberá o valor
IDATE, estaremos nos referindo às variáveis Xi. máximo.
fundamentos de mensuração em saúde mental [ 1 ]  29

[D] Q4 = número de itens que tiveram respostas 3 Escalas aditivas formadas por itens ordinais
ou 4. Nesse caso, teríamos uma escala razão, são denominadas escalas de Likert. Usualmente,
assumindo valores entre 0 e 20, que representa esse tipo de escala é formado por itens com cinco
o número de itens percebidos com alta frequên­ possibilidades de respostas ordinais (p. ex., aprovo
cia pelo respondente. fortemente, aprovo, indeciso, desaprovo e desapro-
vo fortemente).
A questão é saber quais dessas alternativas
são adequadas para avaliar o construto. Pode-se  AVALIAÇÃO DE UMA ESCALA
ar­gumentar que não faz sentido somar Quase nun­ca A etapa seguinte visa determinar a qualidade de
e Frequentemente, pois, como mensuração ordi- uma escala de acordo com duas propriedades: vali-
nal, em princípio, invalidaria qualquer ­operação dade – se a escala, de fato, consegue medir o cons-
aritmética. truto de interesse (escala válida) – e confiabilida­de,
De modo pragmático, pode-se contra-argu- ou fidedignidade, com pouco ou livre de erro.
mentar dizendo que se uma pessoa tem alta ava- Alguns autores consideram a confiabilidade uma
liação em boa parte dos itens, ela terá uma soma condição necessária para a validade. A Figura 1.5.2
alta, evidência de que o construto está presente apresenta quatro diferentes escalas (retângulos
com certa intensidade. Raciocínio análogo pode ou variáveis observáveis) criadas para medir um
ser feito em relação a quem tem avaliações baixas construto (elipses).
à maioria dos itens.
O interesse em uma escala aditiva não estaria [A] Escala 1: retângulo formado por linhas contí-
em cada item separadamente, mas no conjunto das nuas – válida e confiável (pouco erro).
20 respostas. Algumas propriedades que justificam [B] Escala 2: retângulo formado por linhas ponti-
a construção de uma escala como a Q1 são:2 lhadas – válida, mas com baixa confiabilidade
(muito erro).
[A] Uma escala deve conter muitos itens cujas [C] Escala 3: retângulo formado por linhas trace-
respostas serão somadas. jadas – não válida, mas confiável (pouco erro).
[B] Cada item deve expressar uma característica [D] Escala 4: retângulo formado por linhas duplas
que pode variar de forma quantitativa e contí- – não válida nem confiável.
nua. No item 2 da escala IDATE, pode-se supor
a existência de uma variável contínua Z que ERROS DE MEDIDA
expressa o nível de cansaço do respondente.  Erros não sistemáticos: ocorrem de maneira
Ao atribuir um valor a um item não observável, aleatória, são imprevisíveis. O valor mostrado
expressa-se de maneira imprecisa o real valor em uma balança calibrada se desvia do real por
dessa variável. Do ponto de vista matemático, algum erro aleatório que dependerá apenas da
poderíamos modelar essa situação como precisão do instrumento. Tendo uma medida

{
em mãos, é impossível saber se o valor obser-
1, se Z < z1,
vado está acima ou abaixo do real. Esse erro
2, se z1 ≤ Z < z2,
X2 = pode ser representado pelo modelo
3, se z2 ≤ Z < z3,
4, se Z ≥ z3, , com z1 ≤ z2 ≤ z3. y = µ + ε, (1)
[C] Os itens não formam um teste de múltipla
escolha, em que sempre existe uma resposta y é o valor observado, μ é o valor livre de erro
certa. (verdadeiro valor da medida) e ε é o erro não
[D] Cada item é uma afirmação para a qual são sistemático de medida. Assume-se que ε tenha
oferecidas várias possibilidades de avaliação média zero e variância σ2.
(em geral, entre 4 e 7) e os respondentes devem
escolher aquela que melhor representa sua  Erros sistemáticos: previsíveis, ligados a vieses
resposta. de medida. Em uma balança descalibrada, o
valor registrado tende a desviar do real sempre
A escala IDATE coincide com Q1 e uma pos- na mesma direção e intensidade – erro siste-
sível categorização de seus resultados seria que mático – e pode ser modelado por
valores entre: a) 20 e 34 indicam baixa ansiedade;
b) 35 e 49 ansiedade moderada; c) 50 e 64 alta an- y = µ + δ + ε, (2)
siedade; d) 65 e 80 ansiedade muito alta.
30  INSTRUMENTOS DE AVALIAÇÃO EM SAÚDE MENTAL

Escala 2 Escala 3

Outro construto

Escala 1
Escala 4

Construto de
interesse

FIGURA 1.5.2  PROPRIEDADES DE UMA ESCALA.

sendo δ o viés de medida e y, μ e ε como defi- valores próximos. Uma maneira equivalente de
nidos em (1). definir esse conceito é utilizar o componente de
erro não sistemático (ε) de (1) e (2). Quando a
No exemplo da balança, uma maneira de ava- mag­nitude desse erro é pequena, tem-se um ins-
liar a qualidade das medidas é observar várias vezes trumento confiável.
o valor registrado pelo instrumento para objetos Uma maneira eficiente de avaliar o erro não sis-
de pesos conhecidos. Caso haja sobre-estimativa temático é repetir o procedimento de mensuração e
ou subestimativa da medida, estaremos diante de avaliar as diferenças observadas nos resultados. O
um erro sistemático. Tais erros estão mais ligados desvio-padrão das repetições pode ser uma medida
a problemas de validação do instrumento, podendo de confiabilidade. Quanto menor o desvio-padrão,
ser avaliados por meio de medidas de tendência mais parecidos são os resultados, indicando alta
central (diferença entre as médias das observações confiabilidade (reprodutibilidade).
e o peso real do objeto).
Uma fonte de viés importante ao se avaliar REPETIÇÃO
comportamentos e opiniões é a tendência a res- Repetir significa realizar a mensuração sob as
ponder buscando ser politicamente correto, ou mesmas condições, garantindo que o construto
atendendo a alguma pressão de grupo, ou, ainda, de interesse não se altere entre mensurações su-
buscando fornecer uma resposta mais agradável cessivas. Ao aplicar repetidamente uma escala à
ao interlocutor. Por exemplo, ao avaliar uma frase mesma pessoa, estaremos sujeitos a dois riscos: a)
como “a maconha deve ser liberada”, algumas aprendizado e b) alteração do construto.
pessoas podem manifestar alta concordância ou O sujeito pode ter maior facilidade na execução
discordância de acordo com o contexto. É possível da tarefa na segunda vez em que a realiza, por ter
uma pessoa minimizar (ou exagerar) a presença de aprendido a executá-la na primeira vez. A repetição
ideação suicida para, por exemplo, ocultar a real traria embutido um erro não sistemático devido ao
gravidade de sua psicopatologia. aprendizado.
Pode acontecer de o construto ter realmente se
 CONFIABILIDADE alterado na segunda vez em que a escala é aplicada.
OU FIDEDIGNIDADE Quando são feitas duas mensurações, é comum de-
Uma escala (medida/instrumento) é confiável nominar a primeira de teste e a segunda de reteste.
(fidedigna) quando, ao ser aplicada em indivíduos O intervalo de tempo entre as duas aplicações pode
com o mesmo nível de um construto, resulta em influenciar a confiabilidade.