21-Texto Por Que Controlar o Uso Dos Testes Psicológicos

METODOLOGIA DE TÉCNICAS DE EXAME PSICOLÓGICO 1
Prof. Álvaro José LELÉ
POR QUE
CONTROLAR
O USO DE
TESTES
PSICOLÓGICOS?
ANASTASI, Anne; URBINA, Susana. Testagem Psicológica. Tradução Maria Adriana

Veríssimo Veronese 7. Ed. Porto Alegre: Artmed, 2000. 575 p. Original inglês. (pp. 23-36)
(p.23)
POR QUE CONTROLAR O USO DE TESTES PSICOLÓGICOS?
 "Você poderia me dar um formulário do Stanford-Binet? Meu sobrinho vai fazê-lo na
próxima semana para ser admitido na escola X e eu gostaria que ele praticasse um
pouco para ser aprovado."
 "Para melhorar o programa de leitura na nossa escola, nós precisamos de um teste de
QI independente da cultura, que meça o potencial inato de cada criança."
 "Ontem à noite eu respondi às perguntas de um teste de inteligência publicado em uma
revista e consegui um QI de 80 — eu acho que os testes de inteligência são uma
bobagem"
 "Minha colega de quarto está estudando psicologia. Ela me aplicou um teste de
personalidade e eu fui classificada como neurótica. Desde então, fiquei perturbada
demais para ir à aula."
 "No ano passado, vocês aplicaram um novo teste de personalidade em nossos
empregados para fins de pesquisa. Eu gostaria de ter os escores para colocar em suas
fichas pessoais."
Estes comentários não são imaginários. Cada um deles está baseado em um incidente real, e a
lista poderia facilmente ser aumentada por qualquer psicólogo. Tais comentários ilustram os
potenciais usos inadequados ou as interpretações erronias dos testes psicológicos que os
tornam sem valor ou magoam o indivíduo. Como qualquer instrumento científico ou ferramenta
de precisão, os testes psicológicos precisam ser usados apropriadamente para serem efetivos.
Nas mãos de usuários inescrupulosos ou nas mãos de pessoas bem-intencionadas porém
desinformadas, eles podem causar sérios danos. Aqui estão duas razões principais para
controlarmos o uso dos testes psicológicos: (a) para garantir que o teste será aplicado por um
examinador qualificado e que os escores serão adequadamente utilizados; e (b) para evitar
uma familiaridade geral com o conteúdo do teste, o que o invalidaria.
Examinador Qualificado. A necessidade de um examinador qualificado está evidente nos três

aspectos principais da situação de testagem: seleção do teste, aplicação e pontuação, e
interpretação dos escores. Os testes não podem ser escolhidos como cortadores de grama, a
partir de um catálogo recebido pelo correio, Eles não podem ser avaliados pelo nome, pelo
autor ou por outras marcas fáceis de identificação. Evidentemente não ê necessário nenhum
treinamento psicológico para considerar fatores como custo, volume e facilidade de transportar
os materiais de teste, o tempo de testagem necessário e a facilidade e a rapidez da pontuação.
Informações sobre estes aspectos práticos normalmente podem ser obtidas em um catálogo de
testes, e devem ser levadas em conta quando planejamos um programa de testagem. No
entanto, para que o teste cumpra a sua função, é essencial uma avaliação de seus méritos
técnicos em termos de características como validade, fidedignidade, nível de dificuldade e
normas. Só assim os usuários de testes podem determinar a adequação de algum teste para
seus objetivos específicos e sua conveniência para o tipo de pessoas com as quais planejam
usá-lo.
A discussão introdutória da padronização dos testes neste capítulo já sugeriu a importância de

um examinador treinado. Uma percepção adequada da necessidade de seguir exatamente as
instruções, assim como a familiaridade com as instruções-padrão são necessárias para que os
escores obtidos por diferentes examinadores sejam comparáveis, ou para que o escore de um
indivíduo seja avaliado em termos das normas publicadas. O controle cuidadoso das condições
de testagem também é essencial. Da mesma forma, uma pontuação incorreta ou inexata pode
anular o valor dos escores de teste. Na ausência de procedimentos adequados de verificação,
os erros de pontuação são mais comuns do que geralmente se imagina.
A interpretação apropriada dos escores de teste requer um entendimento completo do teste, do

testando e das condições de testagem. O que está sendo medido só pode ser objetivamente
estabelecido com referência aos procedimentos específicos através dos quais aquele
determinado teste foi validado. Outras informações — referentes à fidedignidade, natureza do
grupo para o qual as normas foram estabelecidas e assim por diante — também são relevantes.
Alguns dados de background relativos ao indivíduo que está sendo testado são essenciais na
interpretação de qualquer escore de teste. O mesmo escore pode ser obtido por pessoas
diferentes por causa de razões muito diferentes. As conclusões a serem tiradas a partir desses
escores seriam, portanto, muito diferentes. Finalmente, também devemos considerar fatores
especiais que podem ter influenciado um determinado escore, como condições incomuns de
testagem, o estado emocional ou físico temporário do testando e a extensão da experiência
anterior do examinando com testes.
Papel do Usuário de Testes. Um desenvolvimento significativo na testagem psicológica nas

décadas de oitenta e noventa foi o crescente reconhecimento do papel-chave do usuário de
testes (Anastasi, 1990b). Neste contexto, o usuário de testes é qualquer pessoa que usa os
escores de teste como uma fonte de informação para chegar a decisões práticas. O usuário de
testes pode ser ou não o examinador que aplica e avalia o teste. Exemplos de usuários de
testes são professores, orientadores, administradores de escolas e funcionários do
departamento de pessoal na indústria ou no governo. A maioria das críticas aos testes não é
dirigida às suas características intrínsecas, mas a usos inadequados dos resultados de testes
por usuários inadequadamente qualificados. Alguns usos indevidos originam-se de um desejo
de encontrar atalhos, respostas rápidas e soluções rotineiras simples para problemas de vida
real. A pressão de tempo, quando existe sobrecarga de trabalho, pode encorajar o emprego
desses expedientes. Mas a causa mais freqüente de usos inadequados de testes
provavelmente é um conhecimento insuficiente ou falho a respeito da testagem (Eyde,
Moreland, Robertson, Primoff & Most, 1988; Moreland, Eyde, Robertson, Primoff & Most, 1995;
Tyler & Miller, 1986).
Comitês especiais de organizações profissionais nacionais, trabalhando em conjunto com

editores de testes, têm dado crescente atenção à prevenção do uso inadequado dos testes. Um
exemplo notável é o projeto conduzido pelo Test User Qualifications Working Group,
familiarmente conhecido pelo acrônimo de TUQWoG (Eyde et al., 1988). O principal objetivo do
TUQWoG era o de desenvolver um conjunto empírico, baseado em dados, das qualificações
essenciais para os usuários de diferentes tipos de teste que os editores de testes pudessem
incorporar aos seus formulários de qualificação de compradores de testes. Em cinco anos de
uma pesquisa intensiva, no país inteiro, o projeto TUQWoG desenvolveu um grande banco de
dados. Alguns editores já começaram a usar os resultados em seus formulários de qualificação
para os compradores. Um segundo grupo de trabalho foi formado subseqüentemente, com o
objetivo de usar o banco de dados disponível do TUQWoG para criar orientações e materiais de
treinamento para os usuários de testes. Conhecido pelo acrônimo modificado de TUTWoG (em
que o T significa treinamento), ele tem como seu primeiro produto um manual com ilustrações
de usos inadequados comuns a serem evitados (Eyde et al.., 1993). Os casos baseiam-se em
exemplos específicos de usos inadequados realmente observados em uma variedade de
ambientes avaliados no amplo levantamento do projeto. Um resumo posterior é apresentado
por Moreland et al. (1995).
Segurança do Conteúdo do Teste e Comunicação das Informações do Teste.

Obviamente, se alguém memorizar as respostas corretas em um teste de cegueira para a cor,
esse teste já não seria uma medida da visão de cores para esta pessoa. Nestas condições, o
teste seria totalmente invalidado. O conteúdo do teste, claramente, tem de ser restrito, a fim de
impedir tentativas deliberadas de falsificar escores. Em outros casos, entretanto, o efeito da
familiaridade pode ser menos óbvio, ou o teste pode ser invalidado de boa fé por pessoas mal-
informadas. Uma professora, por exemplo, pode dar a uma turma problemas especiais muito
parecidos com os de um teste de inteligência, "para que as crianças estejam bem preparadas
para fazer o teste." Esta atitude é simplesmente uma generalização do procedimento habitual
de preparar a turma para um exame escolar. Quando aplicado a um teste de inteligência,
todavia, é provável que tal treinamento específico eleve os escores sem afetar apreciavelmente
a área mais ampla de comportamento que o teste tenta verificar. Nestas condições, a validade
do teste como um instrumento preditivo ou diagnóstico é reduzida.
Garantir a segurança do conteúdo de um teste específico não precisa — e não deve — interferir
com a comunicação efetiva das informações sobre a testagem dirigida a testandos,
profissionais envolvidos e ao público em geral. Essa comunicação tem vários objetivos.
Primeiro, ela tende a desfazer qualquer mistério que possa ter sido associado à testagem e,
portanto, ajuda a corrigir concepções errôneas predominantes sobre o que os testes são
planejados para fazer e o que significam seus escores. Várias publicações claramente escritas
distribuídas por alguns dos maiores editores de testes foram planejadas por esta razão. Um
segundo tipo de comunicação refere-se aos procedimentos técnicos por meio dos quais
determinados testes foram construídos e avaliados; ela apresenta os dados relevantes sobre
fidedignidade, validade e outras propriedades psicométricas dos testes. Esse tipo de
informação costuma ser incluído no manual técnico preparado para cada teste e está disponível
para qualquer pessoa interessada.
Um terceiro objetivo da comunicação a respeito dos testes é o de familiarizar os testandos com

os procedimentos de testagem, desfazer a ansiedade e assegurar que cada um terá um
desempenho de acordo com sua habilidade máxima. Vários panfletos explicativos foram
preparados para este objetivo, alguns de natureza geral e outros para testes específicos como
o Scholastic Assessment Test do College Board. Esses materiais serão discutidos mais tarde
em uma seção posterior deste capítulo. Um quarto tipo de comunicação, altamente significativo,
é o feedback oferecido aos testandos em relação ao seu desempenho em qualquer teste que
tenham feito. Os psicólogos deram considerável atenção às maneiras mais úteis e significativas
de transmitir estas informações em diferentes contextos. Procedimentos apropriados são

examinados nos Capítulos 17 e 18.
A disseminação de informações sobre testagem é de importância fundamental. Há maneiras

benéficas, e também prejudiciais, de se fazer isso. Um exemplo das últimas é oferecido por
algumas tentativas legislativas precipitadas de introduzir controles governamentais em nível
estadual e federal (Bersoff, 1981, 1983; B. Lerner, 1980b). Leis estaduais regulando a
revelação de informações de testagem foram promulgadas na década de 70, na Califórnia e em
Nova York. A lei de Nova York, a mais extrema das duas, exigia a revelação ilimitada das
perguntas e das respostas de teste em todos os programas de testagem em grande escala para
admissão em instituições de educação superior.
Uma vez que a exigência de revelação requer a preparação de uma nova forma de teste para
cada nova aplicação, isso pode ter vários efeitos adversos. Eles incluem, entre outros, menos
datas de testagem disponíveis durante o ano, aumento na taxa de inscrição para os candidatos
e redução dos procedimentos de controle de qualidade que devem ser seguidos na construção
do teste e na equiparação dos escores de testes aplicados em momentos diferentes. Também
convém observar que muito poucos testandos aproveitam a oportunidade de revelação do
teste, e que o desempenho no releste em uma outra forma não é significativamente melhorado
por essa revelação (Stricker, 1984). Os objetivos desejáveis que motivaram a proposta das leis
de revelação dos testes podem ser atingidos mais efetivamente e sem efeitos colaterais
negativos reforçando-se os procedimentos existentes de comunicação de informações sobre
os testes.
APLICAÇÃO DE TESTES
Os princípios básicos da testagem envolvem a generalização da amostra comportamental
observada na situação de testagem para o comportamento manifestado em outras situações,
de não-teste. Um escore de teste deve nos ajudar a predizer quão bem o cliente irá sentir-se e
agir fora da clínica, como o aluno irá sair-se nos cursos universitários, e que desempenho o
candidato irá apresentar na função. Quaisquer influências que são específicas da situação de
teste constituem variância de erro e reduzem a validade do teste. Conseqüentemente, é
importante identificar qualquer influência relacionada ao teste que possa limitar ou prejudicar a
generalização dos resultados de teste.
Um livro inteiro poderia ser dedicado a uma discussão dos procedimentos desejáveis de
aplicação de testes. Mas tal exame foge ao alcance deste livro. Além disso, é mais prático obter
essas técnicas em ambientes específicos, porque nenhuma pessoa normalmente estaria
preocupada com todas as formas de testagem, do exame de bebês à testagem clínica de
pacientes psicóticos ou à aplicação de um programa de testagem em massa para o contingente
militar. Apresente discussão, portanto, tratará principalmente dos princípios comuns da
aplicação de teste, e não de questões específicas de implementação. Um exemplo excelente de
implementação pode ser encontrado na discussão ampla da avaliação individual de crianças
apresentada por Sattler (1988, Capítulo 5).
Preparação Antecipada dos Examinadores. A exigência mais importante para um bom

procedimento de testagem é a preparação antecipada. Não pode haver emergências na
testagem. Portanto, devem ser empenhados esforços especiais para prever e antecipar
emergências. Somente desta maneira a uniformidade dos procedimentos pode ser garantida.
A preparação antecipada para a sessão de testagem assume muitas formas. Memorizar as

instruções verbais exatas é essencial em quase todas as testagens individuais. Mesmo em
testes de grupo em que as instruções são lidas para os testandos, alguma familiaridade prévia
com as instruções a serem lidas evita a leitura errada e a hesitação e permite uma conduta
mais natural e informal durante a aplicação do teste. A preparação dos materiais de teste é um
outro passo preliminar importante. Na testagem individual, e especialmente na aplicação de
testes de desempenho, essa preparação envolve o arranjo dos materiais necessários para
facilitar o uso posterior com um mínimo de procura e manuseio desajeitado. Os materiais
geralmente deveriam ser colocados em uma mesa próxima à mesa de testagem, de modo a
serem facilmente alcançados pelo examinador, mas sem distraírem o testando. Quando for
empregado um aparato complexo, podem ser necessárias verificação e calibração periódicas.
Na testagem grupal, todos os formulários de teste, folhas de resposta, lápis especiais e outros
materiais necessários devem ser cuidadosamente contados, verificados e arranjados antes do
dia da testagem.
Uma familiaridade completa com os procedimentos específicos de testagem é um outro pré-

requisito importante tanto na testagem individual quanto na grupal. Para a testagem individual,
geralmente é essencial um treinamento supervisionado na aplicação do teste específico.
Dependendo da natureza do teste e dos tipos de pessoas a serem examinadas, esse
treinamento pode exigir desde algumas sessões de demonstração e prática até mais de um ano
de instrução. Para a testagem grupal, e especialmente em projetos de grande escala, a
preparação pode incluir instruções antecipadas para examinadores e auxiliares, de modo que
todos estejam inteiramente informados sobre as funções que devem desempenhar. Em geral, o
examinador lê as instruções, controla o tempo e é responsável pelo grupo de uma sala de
testagem. Os auxiliares entregam e recolhem os materiais de teste, garantem que as instruções
sejam seguidas, respondem às perguntas individuais dos testandos dentro das limitações
especificadas no manual e impedem a "cola".
Condições de Testagem. Os procedimentos padronizados não se aplicam apenas às

instruções verbais, ao tempo, aos materiais e a outros aspectos dos testes em si, mas também
ao ambiente da testagem. Deve ser dada certa atenção à seleção de uma sala de testagem
adequada. Essa sala deve estar livre de ruídos e distrações indevidos, e deve ter iluminação,
ventilação, cadeiras e espaço de trabalho adequados para os testandos. Devem ser tomadas
medidas para impedir interrupções durante o teste. Colocar um aviso na porta para indicar que
uma testagem está em progresso é efetivo, desde que todas as pessoas saibam que esse aviso
significa que ninguém pode entrar, em nenhuma circunstância. Na testagem de grandes grupos
pode ser necessário chavear as portas ou colocar um funcionário do lado de fora da porta para
impedir a entrada de retardatários.
É importante que se perceba a extensão em que as condições de testagem podem influenciar

os escores. Mesmo aspectos aparentemente mínimos da situação de testagem podem alterar
notavelmente os desempenhos. Por exemplo, uma condição como o uso de mesinhas ou de
cadeiras em que o braço tem um apoio que serve de mesa se mostrou significativa em um
projeto de testagem de grupo com alunos de ensino médio: os grupos que usavam mesinhas
tendiam a obter escores mais elevados (T.L. Kelley, 1943; Traxler & Hilkert, 1942). Também há
evidências demonstrando que o tipo de folha de resposta empregado pode afetar os escores de
teste (F.O. Bell, Hoff & Hoyt, 1964). Em virtude do estabelecimento de agências independentes
de pontuação de testes e processamento de dados, que oferecem suas próprias folhas de
respostas pontuáveis por máquinas, os examinadores as vezes aplicam testes grupais com
folhas de resposta diferentes das usadas na amostra de padronização. Na ausência de
verificação empírica, a equivalência dessas folhas de resposta não pode ser tomada como
certa. Na testagem de crianças abaixo da quinta série, o uso de qualquer folha separada de
resposta pode baixar significativamente os escores de teste (Cashen & Ramseyer, 1969;
Ramseyer & Cashen, 1971). Nessas séries escolares, geralmente é preferível fazer com que a
criança assinale as respostas no próprio caderno de teste.
Ainda mais significativas, em qualquer idade, são as possíveis diferenças entre a aplicação de
lápis-e-papel e por computador dos mesmos testes. Uma atenção considerável tem sido
dedicada ao efeito dessa diferença de aplicação sobre as normas, a fidedignidade e a validade,
com relação à natureza do teste e à população de testandos. Foram criadas orientações
profissionais especiais para ajudar os usuários de testes a avaliar a comparabilidade dos
escores obtidos nos dois tipos de aplicação (Butcher, 1987; Hofer & Green, 1985).
Muitas outras condições de testagem, mais sutis, demonstraram afetar o desempenho em

testes de habilidade e também de personalidade. O fato de o examinador ser um estranho ou
alguém conhecido para os testandos pode provocar uma diferença significativa nos escores de
teste (Sacks, 1952; Tsudzuki, Hata & Kuze, 1957). Em um outro estudo, foi demonstrado que a
conduta e o comportamento geral do examinador, como sorrisos, aprovação com a cabeça e
comentários como "bom", "ótimo", têm um claro efeito sobre os resultados de teste (Wickes,
1956). Em um teste projetivo que exigia que o respondente escrevesse histórias que
combinassem com determinadas figuras, a presença do examinador na sala tendia a inibir a
inclusão de conteúdo emocional intenso nas histórias (Bernstein, 1956). Na aplicação de um
teste de datilografia, os candidatos à função datilografavam em um ritmo significativamente
mais rápido quando testados sozinhos do que quando testados em grupos de dois ou mais
(Kirchner, 1966).
Os exemplos podem facilmente ser multiplicados. As implicações são triplas. Primeiro, siga os
procedimentos padronizados nos mínimos detalhes. É responsabilidade do autor e do editor do
teste descrever esses procedimentos de forma completa e clara no manual do teste. Segundo,
registre qualquer condição incomum de testagem, mesmo que mínima. Terceiro, leve em conta
as condições de testagem quando interpretar os resultados do teste. Na avaliação extensiva de
uma pessoa através da testagem individual, um examinador experiente pode ocasionalmente
afastar-se do procedimento padronizado para obter informações adicionais por razões
especiais. Neste caso, os resultados do teste já não podem ser interpretados em termos das
normas do teste. Nestas circunstâncias, os estímulos do teste são usados apenas para uma
exploração qualitativa, e as respostas devem ser tratadas da mesma maneira que são tratadas
quaisquer outras observações comportamentais informais ou dados de entrevista.
Apresentando o Teste: Rapport e Orientação do Testando. Na aplicação de testes, o rapport

se refere aos esforços do examinador para despertar o interesse dos testandos pelo teste, obter
sua cooperação e encorajá-los a responder de maneira adequada aos objetivos do teste. Em
testes de habilidade, o objetivo exige uma cuidadosa concentração nas tarefas dadas e o
esforço máximo para apresentar um bom desempenho. Em inventários de personalidade de
auto-relato, o objetivo exige respostas francas e honestas às perguntas sobre o comportamento
habitual da pessoa; em alguns testes projetivos, ele exige o relato completo das associações
evocadas pelos estímulos, sem qualquer censura ou seleção do conteúdo. Outros tipos de
testes podem exigir outras abordagens. Mas em todos os casos, o examinador tenta motivar os
respondentes a seguir as instruções tão completa e conscienciosamente quanto possível.
O treinamento dos examinadores abrange técnicas para o estabelecimento do rapport e

também aquelas mais diretamente relacionadas à aplicação do teste. Ao estabelecer o rapport,
como em outros procedimentos de testagem, a uniformidade das condições é essencial para a
comparabilidade dos resultados. Se uma criança recebe um prêmio ambicionado sempre que
resolver corretamente um problema do teste, seu desempenho não pode ser diretamente
comparado às normas ou com o de outras crianças que estão motivadas apenas pelo
encorajamento ou pelo elogio verbal padronizado. Qualquer desvio das condições-padrão de
motivação em um determinado teste deve ser percebido e levado em conta quando
interpretamos o desempenho.
Embora o rapport possa ser estabelecido mais completamente na testagem individual, na

testagem de grupo também podem ser tomadas medidas para motivar os testandos e aliviar
sua ansiedade. Técnicas específicas para o estabelecimento do rapport variam segundo a
natureza do teste e a idade e outras características das pessoas testadas. Na testagem de
crianças pré-escolares, os fatores especiais a serem considerados incluem timidez com
estranhos, possibilidade de distração e negativismo. Uma conduta amigável, alegre e tranqüila
por parte do examinador ajuda a acalmar a criança. A criança tímida e retraída precisa de um
tempo preliminar maior para familiarizar-se com o ambiente. Por esta razão, é melhor que o
examinador não seja inicialmente muito demonstrativo, mas espere até que a criança esteja
pronta para fazer o primeiro contato. Os períodos de teste devem ser breves, e as tarefas
devem ser variadas e intrinsecamente interessantes para a criança. A testagem deve ser
apresentada para a criança como um jogo, e sua curiosidade deve ser despertada antes da
introdução de cada nova tarefa. Uma certa flexibilidade de procedimento é necessária nesta
idade, em virtude de possíveis recusas, perda do interesse e outras manifestações de
negativismo.
As crianças das primeiras duas ou três séries do ensino fundamental apresentam muitos dos
problemas de testagem da criança pré-escolar. A abordagem do jogo ainda é a maneira mais
efetiva de despertar o interesse pelo teste. A criança escolar mais velha normalmente pode ser
motivada através do apelo a um espírito competitivo e do desejo de sair-se bem nos testes. Mas
quando se testa crianças de backgrounds com desvantagens educacionais ou de culturas
diferentes, o examinador não pode presumir que elas estarão motivadas a sair-se bem em
tarefas acadêmicas da mesma forma que as crianças da amostra de padronização. Este e
outros problemas relativos à testagem de pessoas com backgrounds experienciais diferentes
são considerados com detalhes nos Capítulos 9,12 e 18.
Problemas motivacionais especiais podem ser encontrados na testagem de pessoas

emocionalmente perturbadas, prisioneiros ou delinqüentes juvenis. Especialmente quando
examinados em um ambiente institucional, essas pessoas tendem a manifestar algumas
atitudes desfavoráveis, como desconfiança, insegurança, medo ou indiferença cínica. As
condições especiais de seu passado provavelmente também influenciarão adversamente seu
desempenho nos testes. Devido a fracassos e frustrações anteriores na escola, por exemplo,
elas podem ter desenvolvido sentimentos de hostilidade e inferioridade em relação às tarefas
acadêmicas, às quais os testes se assemelham. O examinador experiente faz esforços
especiais para estabelecer o rapport nestas condições. De qualquer forma, ele deve ser
sensível a estas dificuldades especiais e levá-las em conta ao interpretar e explicar o
desempenho nos testes.
Ao testar uma criança em idade escolar ou um adulto, devemos lembrar que qualquer teste
apresenta uma ameaça implícita ao prestígio do indivíduo. Portanto, certa garantia deve ser
dada inicialmente. Convém explicar, por exemplo, que não se espera que ninguém termine ou
faça todos os itens corretamente. De outra forma, o testando poderia experienciar uma
sensação crescente de fracasso uma vez que avançasse para os itens mais difíceis ou fosse
incapaz de terminar algum sub-teste no tempo permitido.
Também é desejável eliminar tanto quanto possível os elementos de surpresa da situação de

teste, porque o inesperado e o desconhecido tendem a produzir ansiedade. Muitos testes
grupais incluem uma explicação preliminar que é lida ao grupo pelo examinador. Um
procedimento ainda melhor é fornecer antecipadamente a cada testando materiais explicando a
finalidade e a natureza dos testes, com sugestões gerais e alguns itens de amostra. Estes
cadernos explicativos estão regularmente disponíveis para os participantes de muitos
programas de testagem em grande escala, como os realizados pelo College Board.
A testagem de adultos apresenta alguns problemas adicionais. Diferentemente da criança em

idade escolar, o adulto não tende a trabalhar arduamente em uma tarefa apenas porque ela lhe
foi designada. Portanto, torna-se mais importante "vender" a finalidade dos testes para o adulto,
embora alunos de ensino médio e universidade também respondam a este apelo. A cooperação
dos testandos geralmente pode ser assegurada convencendo-os de que é de seu interesse
obter um escore válido - isto é, um escore que indique corretamente aquilo que eles podem
fazer e que não superestime nem subestime suas habilidades. A maioria das pessoas vai
compreender que uma decisão incorreta, que poderia resultar de escores de teste inválidos,
significaria um subseqüente fracasso, perda de tempo e frustração para elas. Esta abordagem
pode servir não apenas para motivar os testandos a dar o máximo de si mesmos em testes de
habilidade, como também para reduzir as fraudes e encorajar o relato franco nos inventários de
personalidade, pois os respondentes percebem que de outra forma eles é que sairiam
perdendo. Certamente não é do interesse do indivíduo ser admitido em um curso para o qual
ele não possui as habilidades e os conhecimentos necessários, ou ser designado para uma
função que não é capaz de realizar ou que consideraria desagradável.
VARIÁVEIS SITUACIONAIS E DO EXAMINADOR

Estudos completos dos efeitos das variáveis do examinador e das variáveis situacionais sobre
os escores de teste têm sido publicados periodicamente (Lutey & Copeland, 1982; Masling,
1960; S.B. Sarason, 1954; Sattler, 1970, 1988; Sattler & Theye, 1967). Embora alguns efeitos
tenham sido demonstrados com testes grupais objetivos, a maioria dos dados foi obtida com
técnicas projetivas ou com testes individuais de inteligência. Estes fatores externos tendem a
operar mais com estímulos não-estruturados e estímulos ambíguos, e também com tarefas
difíceis e novas, do que com funções claramente definidas e bem-aprendidas. Em geral, as
crianças são mais suscetíveis ao examinador e às influências situacionais do que os adultos; no
exame de crianças pré-escolares, o papel do examinador é especialmente crucial. Pessoas
emocionalmente perturbadas e inseguras, de qualquer idade, também tendem a ser mais
afetadas por estas condições do que as pessoas bem-ajustadas.
O desempenho em testes de inteligência aplicados individualmente e em técnicas projetivas foi

investigado em relação a muitas variáveis do examinador, incluindo idade, sexo, etnia, status
profissional ou socioeconômico, treinamento e experiência, características de personalidade e
aparência. Embora tenham sido encontradas várias relações significativas, os resultados
geralmente são inconclusivos ou enganadores, porque o delineamento experimental não
conseguiu controlar ou isolar a influência de diferentes características do examinador ou do
examinando. Portanto, o efeito de duas ou mais variáveis pode ter sido confundido.
A influência do comportamento do examinador imediatamente precedente ou durante a

aplicação do teste sobre os resultados foi demonstrada mais claramente. Por exemplo,
investigações controladas revelaram diferenças significativas no desempenho em testes de
inteligência em função de um relacionamento interpessoal "amigável" versus "frio" entre o
examinador e o examinando, ou uma conduta rígida e distante versus uma conduta natural por
parte do examinador (Exner, 1966; Masling, 1959). Além disso, pode haver interações
significativas entre as características do examinador e do examinando, no sentido de que as
características ou a conduta na testagem de um mesmo examinador podem ter um efeito
diferente em diferentes examinandos, em função de suas características de personalidade.
Interações semelhantes podem ocorrer com variáveis de tarefas, tais como a natureza do teste,
o objetivo da testagem e as instruções dadas aos testandos. Dyer (1973) acrescentou outras
variáveis a esta lista, chamando a atenção para a possível influência das diversas percepções
das funções e dos objetivos da testagem por parte dos examinadores e dos testandos.
Uma outra maneira como um examinador pode inadvertidamente afetar as respostas do

testando é por meio de suas expectativas. Este é simplesmente um caso especial da profecia
que ao ser feita determina a ocorrência do que foi profetizado (Barris & Rosenthal, 1985; R.
Rosenthal, 1966; R. Rosenthal & Rosnow, 1969). Um experimento realizado com o Rorschach
ilustra este efeito (Masling, 1965). Os examinadores eram 14 alunos voluntários de uma
faculdade, sete dos quais foram informados, entre outras coisas, de que examinadores
experientes obtêm mais respostas humanas do que respostas animais, enquanto os outros sete
foram informados de que examinadores experientes obtêm mais respostas animais do que
humanas. Nestas condições, os dois grupos de examinadores obtiveram proporções
significativamente diferentes de respostas animais e humanas de seus examinandos. Estas
diferenças ocorreram apesar do fato de examinadores e testandos relatarem não ter
consciência de qualquer tentativa de influência. Além disso, registros gravados de todas as
sessões de testagem não revelaram nenhuma evidência de influência verbal por parte de
qualquer examinador. As expectativas dos examinadores aparentemente operaram através de
sugestões posturais e faciais sutis, às quais os testandos responderam.
Além do examinador, outros aspectos da situação de testagem podem afetar significativamente

o desempenho no teste. Recrutas militares, por exemplo, freqüentemente têm sido examinados
logo depois de seu ingresso, durante um período de reajustamento intenso a uma situação
desconhecida e estressante. Em uma investigação planejada para testar o efeito da
aclimatização a essa situação sobre o desempenho nos testes, a Navy Classification Battery foi
aplicada a 2.724 recrutas em seu nono dia no Naval Training Center (L.V. Gordon & Alf, 1960).
Quando os escores foram comparados aos obtidos por 2.180 recrutas testados na época
convencional, durante seu terceiro dia, o grupo do nono dia apresentou escores
significativamente mais elevados em todos os sub-testes da bateria.
As atividades dos testandos imediatamente precedentes ao teste também podem afetar seu
desempenho, especialmente quando elas produzem perturbação emocional, fadiga ou outras
condições desvantajosas. Em uma investigação com escolares de terceira e quarta séries,
havia alguma evidência sugerindo que o QI no Desenho da Figura Humana era influenciado
pelas atividades precedentes de sala de aula (McCarthy, 1944). Em uma ocasião, os alunos
tinham escrito uma composição sobre "A Melhor Coisa Que Já Me Aconteceu"; em outra
ocasião, eles também tinham escrito, mas sobre "A Pior Coisa Que Já Me Aconteceu". Os QIs
no segundo teste, seguindo-se ao que pode ter sido uma experiência emocionalmente
depressiva, apresentavam uma média de 4 ou 5 pontos mais baixa do que no primeiro teste.
Estes achados foram corroborados em uma investigação posterior planejada especificamente
para determinar o efeito da experiência imediatamente precedente ao Desenho da Figura
Humana (Reichenberg-Hackett, 1953). Nesse estudo, as crianças que tinham tido uma
experiência gratificante envolvendo a solução correta de um enigma interessante, seguida por
uma recompensa de brinquedos e balas, apresentaram uma melhoria maior em seus escores
de teste do que aquelas que tinham passado por experiências neutras ou menos gratificantes.
Resultados semelhantes foram obtidos por W.E. Davis (1969a, 1969b) com alunos
universitários. O desempenho em um teste de raciocínio aritmético foi significativamente inferior
quando precedido por uma experiência de fracasso em um teste de compreensão verbal do que
em um grupo de controle que não recebera nenhum teste precedente e em um grupo que fizera
um teste de compreensão verbal padrão em condições normais.
Vários estudos trataram dos efeitos feedback referente aos escores de teste sobre o
desempenho subseqüente do indivíduo. Em uma investigação especialmente bem-planejada
com alunos de sétima série, Bridgeman (1974) descobriu que o feedback de "sucesso" era
seguido por um desempenho significativamente mais elevado em um teste semelhante, se
comparado ao feedback de "fracasso" para alunos que na verdade tinham apresentado um
desempenho igualmente bom. Esse tipo feedback motivacional pode operar amplamente
através dos objetivos que os participantes estabelecem para si mesmos em desempenhos
posteriores, e pode, portanto, representar um outro exemplo de uma profecia auto-realizadora.
Esse feedback motivacional geral, todavia, não deve ser confundido com o feedback corretivo,
em que o indivíduo é informado sobre os itens específicos que errou e recebe instruções
corretivas; nestas condições, é muito mais provável que o feedback melhore o desempenho de
pessoas com um baixo escore inicial.
Os exemplos citados nesta seção ilustram a ampla diversidade das variáveis da tarefa que
podem afetar os escores de teste. Na maioria dos programas de testagem bem aplicados, o
examinador experiente está constantemente atento para detectar qualquer operação possível
de tais variáveis e para minimizar sua influência. Quando as circunstâncias não permitem o
controle destas condições, as conclusões derivadas a partir do desempenho nos testes devem
ser qualificadas.
UMA VISÃO DA PERSPECTIVA DO TESTANDO

Ansiedade de Teste. Entre os primeiros estudos das reações dos examinandos à situação de
testagem estão aqueles que tratam da ansiedade de teste. Indubitavelmente, o interesse inicial
por este tipo de resposta foi estimulado por sua fácil visibilidade e por seus efeitos claramente
prejudiciais sobre o desempenho. Na aplicação de testes, muitas das práticas planejadas para
intensificar o rapport também servem para reduzir a ansiedade de teste. Os procedimentos com
tendência a desfazer a surpresa e a estranheza da situação de testagem e a reassegurar e
encorajar o testando certamente devem ajudar a diminuir a ansiedade. A conduta do
examinador e uma testagem bem organizada, que transcorre tranqüilamente, também
contribuem para o mesmo objetivo.
As diferenças individuais na ansiedade de teste foram estudadas tanto em crianças em idade

escolar quanto em estudantes universitários (Gaudry & Spielberger, 1974; Hagtvet&Johnsen,
1992; I.G. Sarason, 1980; Spielberger, 1972). Grande parte desta pesquisa foi iniciada por S.B.
Sarason e seus colegas em Yale (Sarason, Davidson, Lighthall, Waite & Ruebush, 1960). O
primeiro passo foi a construção de um questionário para avaliar as atitudes de cada testando. O
questionário para as crianças, por exemplo, continha itens semelhantes aos seguintes:
Você se preocupa muito antes de fazer um teste?
Quando a professora diz que ela quer descobrir quanto vocês aprenderam, o seu
coração começa a bater mais rápido?
Quando você está fazendo um teste, geralmente pensa que não está se saindo bem?
De grande interesse é o achado de que tanto os escores de teste de realização escolar como
os de inteligência apresentaram correlações negativas significativas com a ansiedade de teste.
Correlações semelhantes foram encontradas entre estudantes universitários (I.G. Sarason,
1961). Estudos longitudinais também revelaram uma relação inversa entre mudanças no nível
de ansiedade e mudanças no desempenho em testes de inteligência ou de realização (K.T. Hill
& S.B. Sarason, 1966; S.B. Sarason, K.T. Hill & Zimbardo, 1964).
Estes achados, é claro, não indicam a direção das relações causais. É possível que os alunos
desenvolvam ansiedade de teste porque eles têm um mau desempenho em testes e, portanto,
experienciaram fracasso e frustração em situações anteriores de testagem. Em apoio a esta
interpretação está o achado de que em subgrupos de estudantes com escores elevados em
testes de inteligência, a correlação negativa entre o nível de ansiedade e o desempenho no

teste desapareceu (Denny, 1966; Feldhusen & Klausmeier, 1962). Por outro lado, há evidências
sugerindo que pelo menos parte da relação resulta dos efeitos prejudiciais da ansiedade no
desempenho no teste. Em um estudo (Waite, Sarason, Lighthall & Davidson, 1958), crianças
muito ansiosas e crianças pouco ansiosas, com escores equivalentes em testes de inteligência,
fizeram provas repetidas em uma tarefa de aprendizagem. Embora inicialmente iguais no teste
de aprendizagem, o grupo pouco ansioso melhorou significativamente mais do que o grupo
altamente ansioso.
Vários investigadores compararam o desempenho em testes sob condições planejadas para

evocar estados "ansiosos" e "relaxados". Mandler e Sarason (1952), por exemplo, descobriram
que instruções que envolviam o ego, tais como dizer aos testandos que era esperado que todos
terminassem o teste no tempo designado, tiveram um efeito benéfico sobre o desempenho das
pessoas pouco ansiosas, mas um efeito prejudicial sobre as muito ansiosas. Outros estudos
também encontraram uma interação entre as condições de testagem e as características
individuais, como o nível de ansiedade e a motivação para a realização (Lawrence, 1962; Paul
& Eriksen, 1964). É provável que a relação entre a ansiedade e o desempenho no teste seja
não-linear: um leve aumento de ansiedade é benéfico, ao passo que um grande aumento é
prejudicial. Os indivíduos que são costumeiramente pouco ansiosos beneficiam-se das
condições de teste que despertam alguma ansiedade, enquanto os que são costumeiramente
muito ansiosos apresentam um desempenho melhor em condições mais tranqüilas.
Certamente é verdade que um nível cronicamente elevado de ansiedade exerce um efeito

prejudicial sobre a aprendizagem escolar e o desenvolvimento intelectual. A ansiedade interfere
tanto na aquisição como na recuperação de informações (Hagtvet &Johnsen, 1992). Mas esse
efeito deve ser distinguido dos efeitos limitados ao teste tratados nesta discussão. Em que
extensão a ansiedade de teste torna o desempenho do indivíduo não representativo de seu
costumeiro desempenho em situações de não-teste? Em virtude da pressão competitiva
experienciada por alunos de ensino médio que vão prestar exame vestibular, foi argumentado
que o desempenho no vestibular pode ser muito afetado pela ansiedade de teste. Em uma
investigação cuidadosa e bem-controlada desta questão, French (1962) comparou o
desempenho de alunos de ensino médio em um teste apresentado como parte da aplicação
regular do Scholastic Aptitude Test com o desempenho em uma forma paralela desse teste
aplicado em um momento diferente, em condições "relaxadas". As instruções nesta última
ocasião especificavam que o teste fora aplicado apenas para fins de pesquisa e que os escores
não seriam enviados para nenhuma faculdade. Os resultados demonstraram que o
desempenho não foi pior durante a aplicação-padrão do que durante a aplicação em situação
relaxada do teste. Além disso, a validade concorrente dos escores de teste comparada às notas
no ensino médio não diferiu significativamente nas duas condições. Várias investigações
recentes também questionaram o estereótipo comum do aluno que fica ansioso em testes
apesar de conhecer o assunto e "congela" quando está fazendo um teste (ver Culler & Holahan,
1980). Esta pesquisa descobriu que os alunos com escores elevados em uma escala de
ansiedade de teste obtém médias mais baixas nas notas e tendem a ter hábitos de estudo
piores do que aqueles com baixos escores em ansiedade de teste.
A pesquisa sobre natureza, mensuração e tratamento da ansiedade de teste tem continuado

em um ritmo cada vez mais acelerado (I.G. Sarason, 1980; Spielberger, Anton & Bedell, 1976;
Spielberger, Gonzalez & Fletcher, 1979; Spielberger, Gonzalez, Taylor, Algaze & Anton, 1978;
G.S. Tryon, 1980). Com relação à natureza da ansiedade de teste, foram identificados dois
componentes importantes: emocionalidade e preocupação. O componente de emocionalidade
compreende sentimentos e reações fisiológicas, tais como tensão e batimentos cardíacos
acelerados. A preocupação ou o componente cognitivo incluem pensamentos negativos auto-
orientados, tais como a expectativa de sair-se mal e o medo das conseqüências do fracasso.
Esses pensamentos afastam a atenção do comportamento orientado para a tarefa exigida pelo
teste, e, portanto, perturbam o desempenho. Ambos os componentes são medidos por diversos
inventários de ansiedade de teste. Embora amplamente usados na pesquisa, esses inventários
até recentemente só estavam disponíveis em relatos na literatura de pesquisa. O Test Anxiety
Inventory desenvolvido por Spielberger e seus colegas é um exemplo de um teste publicado;
ele é descrito no Capítulo 13 e listado no Apêndice A.
Consideráveis esforços foram dedicados ao desenvolvimento e à avaliação de métodos para

tratar a ansiedade de teste. Eles incluem vários procedimentos de terapia comportamental
(Capítulo 17) para reduzir o componente emocional da ansiedade de teste. Os resultados
geralmente têm sido positivos, mas é difícil atribuir a melhoria à qualquer técnica específica, em
virtude das falhas metodológicas nos estudos de avaliação (G.S. Tryon, 1980). De fato, o
componente da emocionalidade na ansiedade de teste tende a diminuir de teste para releste
mesmo em grupos de controle sem nenhuma intervenção terapêutica, assim como em grupos
especiais de controle que receberam uma pseudoterapia verossímil. Além disso, a redução no
componente de emocionalidade tem pouco ou nenhum efeito sobre o nível de desempenho.
O desempenho tanto em testes quanto no trabalho escolar tende a melhorar quando o

tratamento é dirigido para as reações cognitivas auto-orientadas. As pesquisas existentes até o
momento sugerem que os melhores resultados são obtidos com programas de tratamento
combinados, que incluem a eliminação da emocionalidade e da preocupação, assim como a
melhoria das habilidades de estudo. A ansiedade de teste é um fenómeno complexo com
múltiplas causas, e a contribuição relativa de diferentes causas varia de acordo com o indivíduo.
Para serem efetivos, os programas de tratamento devem ser adaptados as necessidades
individuais. Também deve ser reconhecido que a ansiedade de teste é apenas uma
manifestação de uma série mais geral de condições que reduzem a efetividade do indivíduo
como aprendiz.
Investigação Abrangente das Visões do Testando. Embora a ansiedade de teste seja um

aspecto distinto e importante do comportamento do testando, há muito mais coisas a serem
exploradas proveitosamente. Um livro de 1993, editado por Baruch Nevo e R.S. Jáger, relata
um amplo esforço para coletar informações disponíveis sobre as reações dos examinandos à
testagem em ambientes educacionais, clínicos e de aconselhamento. Os quinze capítulos de
pesquisadores experientes sobre vários aspectos e aplicações da testagem apresentam
publicações multinacionais sobre cada tópico, e também os achados da pesquisa dos autores.
O resultado é uma tentativa séria, baseada em dados, de responder a perguntas até então
tratadas principalmente em fontes jornalísticas, políticas ou legais. O livro serve, portanto, como
um corretivo para as opiniões possivelmente tendenciosas e conflitantes sobre a testagem, tão
abundantes atual-mente. Por exemplo, o primeiro capítulo baseia-se em dez pesquisas de

opinião bem-conduzidas sobre as atitudes em relação à testagem, em amostras de uma
variedade ampla de populações. Os resultados revelam discrepâncias entre as visões do
público e algumas das afirmações amplamente difundidas de porta-vozes não-representativos
sobre questões de testagem.
Os capítulos abrangem uma grande diversidade de tópicos. Alguns descrevem o

desenvolvimento e o uso de questionários de feedback e entrevistas grupais para avaliar as
atitudes em relação a um dado teste e as percepções daquilo que o teste mede, conforme
expresso por diferentes grupos de testandos. Um dos capítulos compara as opiniões de
estudantes sobre os testes dissertativos e de múltipla escolha realizados em sala de aula, com
resultados muito favoráveis ao formato de múltipla escolha. Alguns autores tratam das reações
de candidatos a empregos a aspectos como justiça e adequação do teste à função. Vários
capítulos sugerem maneiras de melhorar a aplicação dos testes e o ambiente de testagem,
como resultado de seus achados. No conjunto, os vários capítulos abrem uma área promissora
a ser explorada na busca de soluções para alguns dos problemas sociais e práticos enfrentados
atualmente na testagem. Eles também oferecem maneiras de melhorar o entendimento mútuo
entre os usuários de testes e os testandos.
EFEITOS DO TREINAMENTO SOBRE O DESEMPENHO NO TESTE

Ao avaliar os efeitos do treinamento ou da prática sobre os escores de teste, uma questão
fundamental é se a melhoria limita-se aos itens específicos incluídos no teste ou se ela se
estende ao domínio mais amplo de comportamento que o teste pretende avaliar (Anastasi,
1981a, 1981b). A resposta para essa pergunta representa a diferença entre treinamento e
educação. Obviamente, qualquer experiência educacional vivida pelo indivíduo, quer formal ou
informal, dentro ou fora da escola, deve refletir-se em seu desempenho nos testes que
investigam os aspectos relevantes do comportamento. Estas influências amplas de maneira
nenhuma invalidam o teste, na medida em que os escores de
teste apresentam um quadro preciso da posição do indivíduo nas habilidades sendo
consideradas. A diferença, é claro, é uma diferença de grau. As influências não podem ser
classificadas como limitadas ou amplas, mas obviamente variam muito em alcance, desde as
que afetam apenas uma única aplicação de um único teste, aquelas que afetam o desempenho
em todos os itens de um certo tipo, até as que influenciam o desempenho do indivíduo na
grande maioria das atividades. No entanto, do ponto de vista da testagem efetiva, convém fazer
uma distinção funcional. Assim, podemos afirmar que um escore de teste só é invalidado
quando uma determinada experiência eleva o escore sem afetar apreciavelmente o domínio de
comportamento que o teste deve medir.
Treinamento. Os efeitos do treinamento sobre os escores de teste têm sido amplamente

investigados. Vários estudos iniciais foram conduzidos por psicólogos britânicos, com referência
especial aos efeitos da prática e do treinamento sobre os testes anteriormente usados para
designar crianças de 11 anos para diferentes tipos de escolas de ensino médio (Yatesetal.,
1953-1954). Como poderíamos esperar, a extensão da melhoria depende da habilidade e de
experiências educacionais anteriores dos testandos, da natureza dos testes e da quantidade e
do tipo de treinamento oferecido. Os indivíduos com backgrounds educacionais deficientes
tendem a beneficiar-se mais de um treinamento especial do que aqueles que tiveram
oportunidades educacionais superiores e já estão preparados para sair-se bem nos testes.
Também é óbvio que quanto maior a semelhança entre o conteúdo do teste e o material de
treinamento, maior será a melhoria nos escores de teste. Por outro lado, quanto mais a
instrução se restringe ao conteúdo específico de um teste, menos provável que a melhoria se
estenda ao desempenho de critério. Muitos estudos de treinamento, além disso, apresentam
resultados ambíguos e não-interpretáveis, em virtude de sérias deficiências metodológicas
(Anastasi, 1981a; Bond, 1989; Messick, 1980a). Uma das principais deficiências é a não-
utilização de um grupo de controle não-treinado que seja verdadeiramente comparável ao grupo
treinado. Os alunos que se inscrevem em programas comerciais de treinamento, por exemplo,
são auto-selecionados e tendem a diferir daqueles do grupo de controle na habilidade inicial, na
motivação e em outras características pessoais que afetam o desempenho nos testes. Além
disso, em delineamentos experimentais que usam pré-testes e pós-testes é difícil assegurar
que os testandos estejam igualmente motivados a sair-se bem em ambos os testes; isso é
especialmente verdadeiro se um teste é apresentado em uma aplicação regular, e o outro em
uma aplicação especial para prática ou apenas para fins de pesquisa.
O College Entrance Examination Board tem preocupando-se com o crescente número de cur-
sos comerciais de má qualidade oferecidos para os candidatos às universidades. Para
esclarecer a questão, o College Board realizou vários experimentos bem-controlados para
determinar o efeito de tal treinamento sobre o Scholastic Aptitude Test (SAT) e examinou os
resultados de estudos semelhantes de outros investigadores independentes (Donlon, 1984;
Messick, 1980a, 1981; Messick&Jungeblut, 1981). Esses estudos abrangiam uma variedade de
métodos de treinamento e incluíam estudantes de escolas públicas e particulares de ensino
médio. Também foram investigadas amostras de estudantes de minorias de áreas urbanas e
rurais. A conclusão de todos esses estudos é que o exercício intensivo em itens semelhantes
aos do SAT não tende a produzir ganhos apreciavelmente maiores do que os obtidos quando
os alunos são retestados com o SAT depois de um ano de instrução regular de ensino médio.
Convém observar também que sem seus procedimentos de construção de teste, organizações
como o College Board e o Graduate Record Examination Board investigam a suscetibilidade de
novos tipos de itens ao treinamento (Evans & Pike, 1973; Powers, 1983; Powers & Swinton,
1984; Swinton & Powers, 1985). Os tipos de itens em que o desempenho pode ser
apreciavelmente melhorado por treinamento a curto prazo ou instrução de natureza limitada não
são mantidos nas formas operacionais do teste. Um exemplo óbvio seria o tipo de problema
que requer uma solução simples, perspicaz, que, uma vez obtida, pode ser diretamente
aplicada à solução de problemas semelhantes. Quando encontrados no futuro, esses
problemas testariam a lembrança, e não as habilidades de solução de problemas. Um outro
exemplo é oferecido por tipos complexos de itens que usam materiais novos ou desconhecidos
e exigem instruções detalhadas e complicadas (Powers, 1986).
O treinamento, no sentido restrito, tradicional, é planejado para desenvolver habilidades

altamente específicas que podem ser pouco úteis nas atividades da vida. Da mesma forma, a
prática de "ensinar para o teste" tende a concentrar-se em amostras específicas de habilidades
e conhecimento abrangidos pelo teste, e não no domínio mais amplo de conhecimento que o
teste tenta avaliar. As chamadas leis de "verdade na testagem", ou revelação, que exigem a
liberação geral das formas dos testes depois de cada aplicação, também encorajam um foco
em habilidades específicas para o teste, de aplicabilidade limitada. Finalmente, na medida em

que o treinamento pode estar disponível para alguns testandos e não para outros, ele tende a
introduzir diferenças individuais em habilidades de teste limitadamente definidas, reduzindo
assim o valor diagnóstico do teste.
Sofisticação em Testes. Os efeitos da sofisticação em testes, ou da simples prática em fazer

testes, também são relevantes a este respeito. Nos estudos com formas alternadas do mesmo
teste, existe uma tendência de o segundo escore ser mais elevado. Ganhos significativos de
média foram relatados quando formas alternadas foram aplicadas em imediata sucessão ou
após intervalos variando de um dia a três anos (Donlon, 1984; Droege, 1966; Peei, 1951, 1952).
Resultados semelhantes foram obtidos com amostras de crianças em idade escolar, alunos de
ensino médio e de faculdade, e trabalhadores normais e intelectualmente bem-dotados. Dados
sobre a distribuição esperada dos ganhos em um releste com uma forma paralela devem
constar nos manuais de teste, e devemos considerá-los quando interpretamos os escores de
teste.
Os ganhos de escore também não se limitam às formas alternadas. O indivíduo que teve uma
longa experiência anterior com testes padronizados apresenta certa vantagem no desempenho
se comparado a alguém que está fazendo o teste pela primeira vez (Millman, Bishop &Ebel,
1965; Rod-ger, 1936). Parte dessa vantagem origina-se de o indivíduo ter superado um
sentimento inicial de estranheza, e também de ter desenvolvido mais autoconfiança e melhores
atitudes como testando. Outra parte é resultado de uma certa sobreposição no tipo de conteúdo
e funções abrangidos por muitos testes. A familiaridade específica com tipos de itens comuns e
a prática no uso de folhas de respostas objetivas também podem melhorar levemente o
desempenho. É especialmente importante levar em conta a sofisticação em teste quando com-
paramos escores obtidos por pessoas cuja experiência em testagem pode ter variado
amplamente. No caso da testagem aplicada por computador, devemos dar atenção à
familiaridade do testando com esta forma de aplicação (Hofer & Green, 1985).
Uma breve orientação e sessões de prática podem ser muito efetivas para equiparar a
sofisticação em testes (Anastasi, 1981a; Wahlstrom & Boersman, 1968). Este treinamento de
familiarização reduz os efeitos das diferenças anteriores em experiências de testagem. Uma
vez que essas diferenças individuais são específicas para a situação de teste, sua diminuição
deve permitir uma avaliação mais válida do domínio comportamental amplo que o teste deve
medir. Esta abordagem é ilustrada pela publicação do College Board intitulada Taking the SW I:
Reasoning Test, um folheto distribuído a todos os candidatos à universidade que se inscrevem
para fazer este teste. O folheto oferece sugestões de comportamentos efetivos na realização do
teste, ilustra e explica os diferentes tipos de itens incluídos no teste, e reproduz uma forma
completa dele, recomendando que os estudantes façam o teste usando o tempo-padrão e que
pontuem as respostas de acordo com o gabarito incluído. Um folheto semelhante, Taking the
SATII: Subject Tests, ilustra e explica itens de diferentes conteúdos do teste.
O Graduate Record Examinations (GRE) também oferece materiais de familiarização com o tes-
te. O Information Bulletin distribuído a todos os candidatos inclui uma explicação de alguns itens
do Teste Geral, assim como um teste completo anteriormente aplicado com seu gabarito de
respostas. Formas adicionais do teste são publicadas regularmente em forma de livro
(Practicing to Take the GRE General Test). Estão disponíveis folhetos de prática semelhantes,
apresentando testes GRE individuais em várias áreas de conteúdo.
A onda de materiais de familiarização com testes iniciada nas décadas de oitenta e noventa não
se limita ao meio impresso, mas inclui transparências, slides, filmes, fitas de vídeo e software de
computador. Muitos desses materiais foram desenvolvidos e são distribuídos pelo Educational
Testing Service. Alguns são planejados para uso com testes específicos, conforme ilustrado por
um conjunto de slides que acompanha o Taking the SAT e outros sobre a interpretação dos
escores no SAT e nos testes de realização do College Board. Um programa de computador
para ajudar a compreender os escores do SAT também está disponível. Um software de
preparação de testes, relativamente elaborado, foi desenvolvido para estudantes que planejam
fazer o Teste Geral do GRE. Por meio de um programa interativo de computador, este pacote
oferece amostras de itens, uma situação de testagem simulada, com tempo cronometrado,
explicações para itens respondidos incorretamente e uma análise dos pontos fortes e fracos do
testando.
Outros materiais (impressos, filmes, pacotes de multimídia, software de computador) são plane-
jados para orientações de testagem mais gerais, abrangendo um intervalo que vai de crianças
de ensino fundamental a adultos. Um exemplo é On Your Own: Preparing for a Standardized
Test (1987), um vídeo que pode ser usado por alunos de ensino médio individualmente ou em
grupos. Um guia simples, completo, em forma de livro é How to Take a Test: Doing Your Best
(Dobbin, 1984). Alguns dos principais editores de testes comerciais e agências governamentais
também prepararam manuais de orientação para a realização de testes. Um exemplo é o
conjunto de materiais para uso com a General Aptitude Test Battery (GATB) do Serviço de
Empregos dos Estados Unidos.
Instrução em Habilidades Cognitivas Amplas. Alguns pesquisadores têm explorado a

abordagem oposta para a melhoria do desempenho em testes. Seu objetivo é o
desenvolvimento de habilidades intelectuais, hábitos de trabalho e estratégias de resolução de
problemas amplamente aplicáveis. Os efeitos de tais intervenções devem manifestar-se tanto
nos escores de testes quanto no desempenho de critério, como os cursos universitários. De
acordo com a distinção apresentada no início desta seção, este tipo de programa é planeja do
para proporcionar educação, e não treinamento. Alguns desses investigadores trabalharam com
crianças e adolescentes mentalmente retardados educáveis (Babad & Budoff, 1974; Belmont &
Butterfield, 1977; A.L. Brown, 1974; Budoff & Corman, 1974; Campione & Brown, 1979,1987;
Feuerstein, 1979, 1980; Feuerstein, Rand, Jensen, Kaniel & Tzuriel, 1987). Outros
concentraram-se em alunos universitários com backgrounds educacionalmente deficientes
(Linden & Whimbey, 1990; Whimbey, 1975,1977,1980).
Muitos dos procedimentos de treinamento empregados nesses programas são planejados para
desenvolver comportamentos efetivos de solução de problemas, tais como uma análise
cuidadosa dos problemas ou das perguntas; consideração de todas as alternativas, detalhes
relevantes e implicações para chegar-se a uma solução; formulação ou escolha deliberada, em
vez de impulsiva, de uma solução; e aplicação de padrões elevados na avaliação do próprio
desempenho. Estas, obviamente, são estratégias que devem melhorar o funcionamento
intelectual da pessoa não apenas em testes, mas também no trabalho académico e em muitas
outras atividades da vida cotidiana que dependem da aprendizagem escolar. Uma questão
crucial, todavia, refere-se ao grau de transferência e generalização dos efeitos para além dos
tipos de conteúdos e ambientes empregados no treinamento. Os resultados relatados até agora
são promissores. Mas os programas ainda estão em um estágio exploratório, e precisamos de
mais pesquisas para estabelecer a amplitude e a durabilidade da melhoria obtida.
Resumo. Nós consideramos três tipos de treinamento de pré-teste que têm objetivos muito
diferentes. De que forma esses tipos de treinamento afetam a validade de um teste e sua
utilidade prática como um instrumento de avaliação? O primeiro foi o treinamento, no sentido de
exercícios intensivos, em grande quantidade, com itens semelhantes aos do teste. Foi
observado que testes bem-construídos escolhem tipos de itens que minimizam sua
suscetibilidade a tal exercício; e eles também protegem a segurança dos itens específicos de
testes. Na medida em que esse treinamento pudesse melhorar o desempenho no teste, ele o
faria sem uma melhoria correspondente no comportamento de critério. Portanto, ele reduziria a
validade do teste. O teste se tornaria uma medida menos efetiva das amplas habilidades que
deveria avaliar e um meio menos preciso de determinar se o indivíduo desenvolveu as
habilidades e os conhecimentos necessários para ter sucesso na situação de critério.
Os procedimentos de orientação para o teste, por outro lado, são planejados para excluir ou
equiparar diferenças na experiência anterior de testagem. Como os efeitos do treinamento,
essas diferenças representam condições que afetam os escores do teste em si, sem se
refletirem necessariamente no domínio comportamental mais amplo a ser avaliado.
Consequentemente, os procedimentos de orientação para o teste devem torná-lo um
instrumento mais válido ao reduzir a influência de fatores específicos do teste.
Finalmente, o treinamento de habilidades cognitivas amplamente aplicáveis, se bem-sucedido,
deve melhorar a habilidade do examinando para lidar com tarefas intelectuais subsequentes.
Essa melhoria certamente vai se refletir no desempenho no teste. Na medida em que tanto os
escores de teste quanto o desempenho de critério são melhorados, esse treinamento não altera
a validade do teste, mas ele aumenta as chances de o indivíduo atingir objetivos desejados.

21-Texto Por Que Controlar o Uso Dos Testes Psicológicos

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

21-Texto Por Que Controlar o Uso Dos Testes Psicológicos

Enviado por

Direitos autorais:

Formatos disponíveis

METODOLOGIA DE TÉCNICAS DE EXAME PSICOLÓGICO 1

Prof. Álvaro José LELÉ

ANASTASI, Anne; URBINA, Susana. Testagem Psicológica. Tradução Maria Adriana

Examinador Qualificado. A necessidade de um examinador qualificado está evidente nos três

A discussão introdutória da padronização dos testes neste capítulo já sugeriu a importância de

A interpretação apropriada dos escores de teste requer um entendimento completo do teste, do

Papel do Usuário de Testes. Um desenvolvimento significativo na testagem psicológica nas

Comitês especiais de organizações profissionais nacionais, trabalhando em conjunto com

Segurança do Conteúdo do Teste e Comunicação das Informações do Teste.

Um terceiro objetivo da comunicação a respeito dos testes é o de familiarizar os testandos com

de transmitir estas informações em diferentes contextos. Procedimentos apropriados são

A disseminação de informações sobre testagem é de importância fundamental. Há maneiras

Preparação Antecipada dos Examinadores. A exigência mais importante para um bom

A preparação antecipada para a sessão de testagem assume muitas formas. Memorizar as

Uma familiaridade completa com os procedimentos específicos de testagem é um outro pré-

Condições de Testagem. Os procedimentos padronizados não se aplicam apenas às

É importante que se perceba a extensão em que as condições de testagem podem influenciar

Muitas outras condições de testagem, mais sutis, demonstraram afetar o desempenho em

Apresentando o Teste: Rapport e Orientação do Testando. Na aplicação de testes, o rapport

O treinamento dos examinadores abrange técnicas para o estabelecimento do rapport e

Embora o rapport possa ser estabelecido mais completamente na testagem individual, na

Problemas motivacionais especiais podem ser encontrados na testagem de pessoas

Também é desejável eliminar tanto quanto possível os elementos de surpresa da situação de

A testagem de adultos apresenta alguns problemas adicionais. Diferentemente da criança em

VARIÁVEIS SITUACIONAIS E DO EXAMINADOR

O desempenho em testes de inteligência aplicados individualmente e em técnicas projetivas foi

A influência do comportamento do examinador imediatamente precedente ou durante a

Uma outra maneira como um examinador pode inadvertidamente afetar as respostas do

Além do examinador, outros aspectos da situação de testagem podem afetar significativamente

UMA VISÃO DA PERSPECTIVA DO TESTANDO

As diferenças individuais na ansiedade de teste foram estudadas tanto em crianças em idade

Você se preocupa muito antes de fazer um teste?

testes de inteligência, a correlação negativa entre o nível de ansiedade e o desempenho no

Vários investigadores compararam o desempenho em testes sob condições planejadas para

Certamente é verdade que um nível cronicamente elevado de ansiedade exerce um efeito

A pesquisa sobre natureza, mensuração e tratamento da ansiedade de teste tem continuado

Consideráveis esforços foram dedicados ao desenvolvimento e à avaliação de métodos para

O desempenho tanto em testes quanto no trabalho escolar tende a melhorar quando o

Investigação Abrangente das Visões do Testando. Embora a ansiedade de teste seja um

abundantes atual-mente. Por exemplo, o primeiro capítulo baseia-se em dez pesquisas de

Os capítulos abrangem uma grande diversidade de tópicos. Alguns descrevem o

EFEITOS DO TREINAMENTO SOBRE O DESEMPENHO NO TESTE

Treinamento. Os efeitos do treinamento sobre os escores de teste têm sido amplamente

O treinamento, no sentido restrito, tradicional, é planejado para desenvolver habilidades

em habilidades específicas para o teste, de aplicabilidade limitada. Finalmente, na medida em

Sofisticação em Testes. Os efeitos da sofisticação em testes, ou da simples prática em fazer

Instrução em Habilidades Cognitivas Amplas. Alguns pesquisadores têm explorado a

Você também pode gostar