Você está na página 1de 20

A CRÍTICA DESINFORMADA AOS TESTES DE INTELIGÊNCIA 17

A CRÍTICA DESINFORMADA AOS


TESTES DE INTELIGÊNCIA

THE UNSUPPORTED CRITICISM TO


THE INTELLIGENCE TESTS

Carmen E. FLORES-MENDOZA1
Elizabeth do NASCIMENTO
Adail Victorino CASTILHO

RESUMO

Prestes a comemorar um século da criação dos testes psicológicos e,


com ela, a sofisticação da avaliação psicológica, o presente artigo
pretende apresentar alguns dos pontos polêmicos que acompanham a
produção e aplicação dos instrumentos psicológicos, principalmente
aqueles relacionados à medição da capacidade intelectual. Discute-se
que o desprestígio dos testes de inteligência no país deve-se, em primeiro
lugar, ao desconhecimento dos princípios básicos sobre construção de
testes, o que permite freqüentemente que se exija dos testes o que não
pode ser esperado (ex. predição perfeita) e, em segundo lugar, a
exacerbação de crenças políticas pretensamente científicas. Conclui-se
que os testes que, inicialmente, indicaram a existência de grandes
diferenças intelectuais entre grupos humanos conforme a etnia, faixa
etária e gênero sexual são os mesmos que atualmente indicam que
essas diferenças estão diminuindo. Os testes continuam sendo os
mesmos, porém mudaram as condições sociais. Portanto, os testes não
criam diferenças intelectuais, apenas as retratam.
Palavras-chave: Testes psicológicos, medição do comportamento, crítica
da medição.

ABSTRACT

Now, when psychologists can celebrate a century since the creation of


psychological tests and the sophistication of psychological measurements,

(1)
Dra. da Universidade Federal de Minas Gerais. Endereço para correspondência: Av. Antônio Carlos, 6627.
Departamento de Psicologia Sala 4042 Universidade Federal de Minas Gerais - Belo Horizonte/MG
Tels. (031) 3499-6277 (Sala) (031) 3492-1077 (Res.) - E-mail: carmenflor@uol.com.br

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


18 C.E. FLORES-MENDOZA et al.

this paper presents some polemical viewpoints that comes along with the
uses and applications of psychological tests, mainly those concerned
with assessment intellectual ability. It says the discre about tests, in
our country, at first because of lack of acquaintance with its basic
construction principles that often allows unreal expectations as for
example perfect predictions and, at second, because political and
ideological beliefs intended as scientific itselves. The psychological
tests that years ago pointed to the existence of large intellectual
differences among human groups concerning ethnical, age and gender
variables are the same that, currently tell us these differences are
showing diminution. Psychological tests continue to be the same,
notwithstanding social conditions changed. So, psychological tests do
not create intellectual differences, they just show it.
Keywords: Psychological tests, behavior measurement, measurement
criticism.

INTRODUÇÃO comportamento humano, particularmente, no


que se refere à inteligência humana e seus
Em 2005, a área de avaliação psicológica correlatos sociais. No entanto, muitas das
estará comemorando um século da criação de informações produzidas, principalmente na
testes desde que o psicólogo francês Alfred metade do século passado, criaram certo
Binet, no início do século XX, criou o primeiro mal-estar em alguns segmentos acadêmicos
teste de avaliação da inteligência. e não sem razão. Houve no passado alguns
No decorrer dos anos, muitos testes fatos, no mínimo suspeitos, de prática científica
psicológicos foram criados e hoje em dia fraudulenta e crenças políticas antipopulares
pode-se encontrar desde aqueles que de alguns pioneiros da psicometria; o que
pretendem avaliar comportamentos específicos contribuiu para reforçar uma atitude de
como ansiedade, crenças irracionais, liderança descrença em relação aos testes psicológicos
e outros, até aqueles que pretendem avaliar em geral. Lamentavelmente, a descrença
aspectos mais gerais do comportamento, generalizada propiciou o surgimento de críticas
como inteligência ou personalidade; também
sem fundamento científico, opiniões baseadas
os modelos estatísticos aplicados à medição
na desinformação, atitudes emotivas e crenças
psicológica foram aperfeiçoados e diversi-
irracionais, apesar dos testes terem permitido
ficados. A psicometria aliou-se à psicologia
um melhor conhecimento da inteligência do
cognitiva e, assim, a técnica correlacional
que outros construtos psicológicos (Wechsler,
juntou-se ao método experimental. Também,
1971).
consoante com a era da informação, a
medição psicológica pouco a pouco deixa A atitude de repúdio aos testes agrava-se
de se apresentar apenas em mídia impressa quando se veiculam em revistas acadêmicas
e cada vez mais utiliza a mídia eletrônica alguns artigos que se posicionam contra os
(software). testes. Se bem fundamentados, os artigos
Tal produção permitiu um acúmulo de deveriam servir de reflexão para aqueles que
informações valiosas a respeito do se preocupam com a medição psicológica,

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


A CRÍTICA DESINFORMADA AOS TESTES DE INTELIGÊNCIA 19

porém o que se lê, em geral, é um conjunto de imigrantes. Segundo Colom (2000), em nenhum
afirmações baseadas no terreno político- momento Goddard teria dito que 80% dos
ideológico e não na análise do conhecimento imigrantes eram retardados mentais ou que as
teórico e técnico, que são as fontes da amostras por ele estudadas eram
construção dos testes. Tais artigos, absorvidos representativas dos imigrantes que desembar-
por profissionais, alunos e leigos em avaliação cavam na Ilha. Portanto, a totalidade dos
psicológica, fazem ecoar as vozes contrárias imigrantes nunca fora estudada utilizando os
à medição da conduta humana. Pretende-se testes psicológicos. Tampouco o Congresso
aqui, portanto, discutir algumas dessas críticas dos Estados Unidos soubera dos resultados
e levantar os alcances e limites da prática de dessas avaliações e nem Goddard fora
medição psicológica, especificamente no que chamado a depor sobre seus resultados.
se refere à inteligência humana. Segundo Rushton (1994), a responsabilidade
de Goddard na lei de restrição à imigração de
Crítica 1: “Os testes reforçam a 1924 parece ser mais um “mito” do que um fato
inferioridade dos segmentos sociais histórico.
desfavorecidos e das minorias étnicas”. Quando se reproduz o mito de que os
testes psicológicos teriam fornecido as bases
O argumento é um dos preferidos da
para a lei de restrição à imigração, no período
crítica aos testes. Um dos fatos históricos
entre 1910 e 1930, pouco se diz do clima
mais lembrados é o estudo de Henry Goddard
político que se respirava na Universidade de
efetuado nos Estados Unidos, no início do
Harvard quando tal crença se disseminou no
século passado, com imigrantes do sul e do
mundo acadêmico na década de 70.
leste da Europa. Em nota, Roazzi, Spinillo e
Almeida (1991) comentam que o estudo de Um retrato dessa época foi oferecido
Goddard, realizado com 178 imigrantes, teria pelo professor Edward Wilson, um pesquisador
mostrado que 83% dos húngaros, 79% dos da sociobiologia, no seu artigo autobiográfico
italianos e 87% dos russos apresentavam intitulado “Ciência e Ideologia”, apresentado
resultados muitos baixos, o que reforçaria a originalmente em 1994 na reunião da
crença do baixo nível intelectual dos imigrantes. Associação Nacional de Acadêmicos na
Segundo os autores “as pesquisas de Goddard Universidade de Cambridge. Ele descreve o
tiveram um impacto significativo na ambiente acadêmico da Universidade de
implementação de leis de restrição à imigração Harvard nos anos 70 e 80, no qual era freqüente
nos anos 20” (pág. 31). Esse mesmo episódio assistir a calorosos debates políticos entre
foi enfaticamente descrito nas obras de Kamin cientistas que se autodenominavam “esquerda”
(1974) e Gould (1996), dois autores e os que eram apelidados de “direita”. Como o
americanos, um psicólogo social e o outro professor Wilson pesquisava as bases
paleontobiólogo, fartamente evocado pelos biológicas da conduta social, ele foi classificado
críticos dos testes psicológicos. como de “direita” pelo “Grupo de Estudo sobre
A respeito desse fato, Colom (2000) afirma a Sociobiologia” - um grupo presidido por
que os sujeitos estudados por Goddard eram Richard Lewontin, então diretor do programa
sujeitos pré-selecionados da Ilha de Ellis de no qual Wilson trabalhava. Lewontin, junto
Nova York e vistos pela comunidade como com Steven Rose e Leon Kamin, liderava o que
portadores de retardo mental. O objetivo de eles mesmos chamaram de “filosofia da ciência
Goddard era apenas verificar a sensibilidade radical”. Essa filosofia teria como objetivo
da escala métrica de Binet para identificar fazer oposição a uma parte da ciência que,
pessoas com retardo mental tanto dentro da interessada em preservar uma classe
população norte-americana quanto da dos dominante, não estaria permitindo a construção

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


20 C.E. FLORES-MENDOZA et al.

de uma sociedade igualitária e socialista. fenômeno de “efeito pigmaleão” e foi


Supostamente Wilson ao afirmar que alguns apresentado pela primeira vez ao público por
comportamentos sociais teriam sua base Rosenthal e Jacobson por meio do artigo
biológica, ele faria parte desse tipo de ciência. “Teacher’s expectancies: Determinants of
Nesse sentido, uma das medidas adotadas pupils’ IQ gains” (Rosenthal & Jacobson, 1966)
pelo “Grupo de Estudo sobre a Sociobiologia” e depois com a obra “Pygmalion in the
foi a condenação da obra principal de Wilson classroom: Teacher expectation and pupils’
(“Sociobiologia: a nova síntese”), por meio de intellectual development” (Rosenthal &
uma carta enviada e publicada no New York Jacobson, 1968).
Review of Books, em 13 de novembro de 1975. As observações de Rosenthal e Jacobson
Na carta vinculava-se Wilson a teorias interessavam muito, posto que, se a inteligência
eugenicistas e políticas nazistas. Foi nessa das crianças fosse tão maleável a ponto de as
carta que se afirmou que teorias que opiniões dos professores determinarem o
mostrassem uma justificação genética dos aumento ou diminuição dos seus níveis
privilégios existentes em uma determinada intelectuais, então as reivindicações dos
classe ou raça teriam permitido a aprovação, ambientalistas radicais estariam corretas. O
no início do século XX, da famosa lei de estudo consistiu em fornecer aos professores
restrição à imigração nos Estados Unidos. de 18 classes, da primeira à sexta série, três
Seguiram-se a essa carta numerosos classes por série, uma lista de alunos (grupo
manifestos contra a sociobiologia humana. E, experimental) que supostamente teriam alto
como ocorrera com Arthur Jensen (citado mais potencial para as atividades acadêmicas, se
à frente), as aulas de Wilson foram comparados ao restante da classe (grupo
interrompidas, palestras foram palco de controle), segundo resultados do TOGA, um
agressão física e, numa determinada teste de inteligência não verbal, desenvolvido
conferência, um contingente policial teve que pela Universidade de Harvard. Meses mais
ser acionado para preservar a integridade física tarde, novas testagens dos alunos (três ao
do professor. Passados 20 anos, 90% das todo) apontaram um QI mais elevado do grupo
obras, dentre as 200 que se seguiram à obra experimental do que dos alunos do grupo de
de Edward Wilson, aceitaram os pressupostos controle. Os professores, portanto, tinham
contidos no livro “Sociobiologia: a nova síntese” aumentado o QI dos alunos trabalhando
(Wilson, 1995). segundo suas expectativas. O efeito pigmaleão
Outra “prova” considerada crucial pelos teve grande repercussão na mídia e na
críticos dos testes psicológicos é o efeito sociedade americana, a ponto de influenciar
“pigmaleão”. Trata-se do efeito das expectativas decisões judiciais relacionadas ao ensino,
dos pesquisadores sobre suas investigações. como é o caso da decisão do Estado da
Califórnia que proibiu o uso dos testes de
Sem querer, os pesquisadores trabalhariam
inteligência para encaminhamento de crianças
inconscientemente para que os resultados de
suspeitas de retardo mental leve. A alegação
experimentos se apresentassem na direção
era que as situações de testagem sofriam o
esperada por eles. Essas evidências foram
efeito pigmaleão.
transpostas ao ensino. Se as expectativas
dos professores forem boas então os alunos A reedição americana de 1992 do
terão bom desempenho; se, pelo contrário, “Pygmalion in the Classroom”, sem nenhuma
elas forem más, os alunos apresentarão baixo mudança no texto ou informação sobre as
rendimento. É como se os professores fortes críticas à metodologia usada, motivou
trabalhassem inconscientemente para que a Spitz (1999) a realizar um levantamento dos
profecia se cumprisse. Chamou-se esse aspectos frágeis do estudo de Rosenthal e

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


A CRÍTICA DESINFORMADA AOS TESTES DE INTELIGÊNCIA 21

Jacobson, primeiramente observados por necessário para obter um escore por


renomados estudiosos como Thorndike e acaso.
Snow. Entre esses podem ser citados: - Houve exagerada variabilidade de QIs:
- O aumento de QI observado no grupo uma criança de QI 17 no pré-teste
experimental referia-se apenas às séries obteve nas retestagens QIs de 148, 110
iniciais (1 e 2), sendo insignificante na e 112; assim como uma outra com QI
terceira e quarta série. Na quinta e de 18 obteve nos pós-testes QIs de 44,
sexta série, o QI do grupo controle foi 122 e 98. E houve uma terceira que
ligeiramente maior que o do grupo obteve QI Verbal de 183 e depois QIs de
experimental. Na escala verbal do TOGA, 166, 221 e 168. Os dados caóticos
o grupo experimental (considerando ficam mais absurdos quando se sabe
sempre a 1ª e 2ª série) teria ganho 14,5 que as normas do TOGA iam de QI 60
pontos e o grupo controle teria ganho a QI 160, sendo que o manual do teste
4,5 pontos de QI. Surpreendentemente, recomendava não extrapolar tal
na escala de raciocínio do TOGA, o amplitude. Portanto, alguns dados
grupo experimental teria ganho nada simplesmente parecem não ter validade.
menos do que 40 pontos de QI e o grupo
de controle teria ganho “apenas” 27 - De 18 estudos produzidos entre 1969 e
pontos (quase dois desvios padrão). A 1974, tentando replicar o estudo do
variabilidade interescalar e a extensão efeito pigmaleão, apenas um estudo
de ganhos em pontos de QI mostrou um ganho de cerca de cinco
evidenciavam que o TOGA não pontos de QI no grupo experimental.
apresentava normas adequadas para Surpreende, pois, que um estudo com
aplicação em crianças muito pequenas. sérios problemas metodológicos possa ter
- Resultados individuais mostravam recebido tanta atenção.
casos de crianças que depois de 8
Enquanto se discutia o efeito pigmaleão,
meses teriam ganhos de QI, no mínimo,
em 1969 surgia um dos artigos mais polêmicos.
suspeitos: de 133 a 202, de 61 a 106,
Trata-se do artigo produzido por Jensen
de 88 a 128, de 60 a 97. Tais resultados
intitulado “How Much Can We Boost IQ and
significavam que crianças com
pontuação típica de deficientes mentais Scholastic Achievement?” (Jensen, 1969),
(QI 61) teriam alcançado, em oito publicado pela Harvard Educational Review.
meses, pontuações normais (QI 106), Trata-se de um documento de 125 páginas,
assim como crianças de inteligência que foi reproduzido e comentado, parcialmente,
superior (QI 133) teriam alcançado nas principais publicações jornalísticas
pontuações típicas de genialidade (QI americanas, assim como na televisão e no
202). rádio. A repercussão do artigo provocou uma
- Parte da amostra era composta de 63 onda de protestos que iam desde a agressão
crianças que recentemente tinham verbal até a ameaça física; pedia-se inclusive
entrado na escola. O QI médio de a cabeça de Jensen. Devido a essas ameaças,
raciocínio dessa amostra era de 58, ou tanto na escola quanto na sua residência,
seja, todas apresentavam deficiência Jensen (1998b) narrou a necessidade, naquela
mental. Para obter resultado tão baixo época, de estar revisando correspondências
as crianças teriam que ter acertado suspeitas de conterem explosivos. Dois anos
apenas duas questões do teste de mais tarde, em 1971, o psicólogo alemão,
inteligência, ou seja, menos do naturalizado inglês, Hans Eysenck publicou

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


22 C.E. FLORES-MENDOZA et al.

“Race, Intelligence, and Education”, no qual O estudo de gêmeos univitelinos criados


reforçava as afirmações de Jensen. Em visita dentro e fora de seus lares de origem permite
à London School of Economics em 1973, estimar a influência do ambiente
Eysenck receberia um ataque físico de compartilhado. Convencionou-se que o grau
estudantes maoístas (Rushton, 1998). Anos de hereditariedade fosse representado pelo
mais tarde, a polêmica ainda continuava e, em símbolo h². Um h² igual ou próximo de zero
1977, um contingente de 50 policiais teve que significa que a contribuição dos fatores
resguardar Jensen de uma multidão irada que genéticos é quase nula. Por outro lado, um h²
tinha ido à Universidade de Melbourne para igual ou próximo de 1,00 significa que a
agredi-lo. Que informações continha o artigo contribuição genética é quase total. Pois bem,
que provocou tamanha reação social? Nas é um consenso científico que dentro da
palavras do próprio Jensen (1998b): população branca americana o h² para medidas
“...foram as poucas páginas sobre como o QI oscila entre 0,40 e 0,80 (Neisser,
diferenças de QI e alcance acadêmico 1998). Esses valores indicam que a influência
entre as raças (cerca de 5% do artigo) genética é bastante forte (a oscilação dos
que causaram tanto barulho e fúria... . valores é devida ao fator idade; em geral,
Eis o que escrevi a respeito das quanto maior a idade maior a influência genética
diferenças de QI entre brancos e negros: no QI), mas indicam também uma participação
‘a preponderância da evidência é, na considerável do ambiente (1-h) nas diferenças
minha opinião, menos consistente com a individuais com relação à inteligência.
hipótese estritamente ambiental do que Especificamente, quais fatores do ambiente
com a hipótese genética, a qual por certo são responsáveis pelas diferenças intelectuais
não exclui a influência do ambiente ou de na população branca? Ninguém sabe ao certo.
sua interação com os fatores Agora imagine realizar um estudo para
genéticos’...” (pág. 197). investigar as diferenças intelectuais entre as
raças. As diferenças de fatores ambientais
Durante anos Jensen tentou explicar que
entre os grupos não são apenas de natureza
o que tinha afirmado na época era a necessidade
quantitativa, mas também qualitativa. O
de verificar uma hipótese, no caso, a influência
ambiente da raça branca não é semelhante ao
genética nas diferenças individuais e não que
da raça negra. É sabido que este último grupo
as pessoas da raça negra nasciam
tem enfrentado maiores obstáculos sociais
intelectualmente inferiores. Jensen (1998b)
que o primeiro. Portanto, não faz sentido pensar
afirmou que seria tolice transpor as evidências
que as mesmas influências genéticas e
genéticas observadas nas diferenças
ambientais responsáveis pelas diferenças
intelectuais dentro de uma raça para explicar
intelectuais dentro de um grupo sejam as
as diferenças entre as raças.
mesmas responsáveis pelas diferenças entre
A investigação das causas que os grupos.
determinam as diferenças individuais de uma
determinada população no fator g considera a A obra “The Bell Curve” (1994) talvez
variância genética e a variância ambiental. represente a retomada das discussões em
Porém, a variância ambiental pode advir de torno da medida psicológica. Seus autores, os
duas fontes: o ambiente compartilhado psicólogos americanos Herrnstein e Murray (o
(ambiente que compartilham os membros de primeiro falecido no mesmo ano da publicação),
uma família) e o ambiente não compartilhado apresentaram numerosas evidências dos
(ambientes específicos, por exemplo, escola, correlatos físicos e sociais da inteligência. A
nos quais interagem pessoas de outras obra contém duas partes: a primeira, na qual
famílias). analisam numerosos trabalhos psicométricos

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


A CRÍTICA DESINFORMADA AOS TESTES DE INTELIGÊNCIA 23

e a segunda, na qual os autores apresentam refere a brancos e negros americanos, as


suas posições sociais e políticas. Uma das diferenças estão diminuindo. As diferenças
conclusões foi a de que a sociedade moderna não se devem a um possível viés dos testes
está se mobilizando em função das diferenças contra determinados grupos étnicos e
intelectuais e não mais do status ou da classe tampouco refletem diferenças socioeco-
social de origem. Assim sendo, estaria em nômicas.Na realidade, se desconhece a causa
formação uma elite intelectual e uma subclasse dessas diferenças.
cognitiva, sendo que a primeira, na previsão Neisser (1998) organizou uma obra
dos autores, imporá normas à segunda. Porém, intitulada “The Raising Curve-Long-Term Gains
a parte mais polêmica, e pela qual a obra se in IQ and Related Measures”, na qual escrevem
tornou a mais conhecida e debatida tanto nos reconhecidos pesquisadores como James
meios acadêmicos quanto nos governamentais, Flynn, Richard Lynn, Stephen Ceci. A obra
foi a apresentação de dados que mostram discute as duas boas notícias que estão sendo
novamente a questão das diferenças de comentadas hoje em dia: 1) no mundo
desempenho cognitivo entre as raças branca e industrializado os escores nos testes de
negra. Os críticos acadêmicos e da imprensa inteligência estão aumentando e não caindo e
em geral se dividiram, uns afirmando que se 2) a disparidade de alcance acadêmico entre
trata da obra mais antidemocrática de que se crianças negras e brancas tem diminuído nos
teve notícia e outros afirmando que a obra últimos anos. Essas notícias têm importante
merece respeito, haja vista que os autores não repercussão social e se contrapõem à dose
inventaram os dados, apenas os compilaram pessimista de Herrstein e Murray (1994).
(Colom, 1995).
A discussão sobre o aumento do QI no
Devido à extrema polêmica que a obra mundo teve início a partir da meta-análise de
suscitou na sociedade americana, graças à estudos provenientes de 14 nações, realizada
sua difusão nos meios de comunicação, o por Flynn (1987). O estudo apontava um ganho,
Wall Street Journal, em 13 de dezembro de em apenas uma geração, entre 5 e 25 pontos
1994, resolveu publicar um relatório de 25 de QI em testes de inteligência fluida (Gf). Em
pontos, assinado por 52 renomados cientistas média, o ganho teria sido de 15 pontos, ou
e pesquisadores da área da inteligência. Pouco seja, o correspondente a um desvio padrão.
tempo depois, a American Psychological Contudo, o ganho obtido não está muito claro
Association-APA tomou a iniciativa de publicar em 10 países, mas sim em apenas quatro
um informe mais detalhado a respeito do que (Bélgica, Noruega, Nova Zelândia e Holanda)
a psicologia, enquanto ciência, conhece sobre dos 14 países estudados. Pouco mais de uma
o construto chamado inteligência. Um grupo década depois, Flynn (1998) continua
de seletos investigadores da área da cognição afirmando o que dizia em 1987: dado que é
humana, como Sternberg, Brody, Bouchard, improvável que os habitantes dos quatro países,
Ceci, Loehlin e outros, redigiram e assinaram onde os ganhos de QI parecem ser
um relatório, em nome da APA, que foi contundentes (ganhos de 15 pontos em média),
publicado na revista American Psychologist tivessem em 1896, portanto duas gerações
(Neisser et al., 1996). O informe é bastante atrás, um QI de 70, seria pouco provável que os
prudente nas suas conclusões, mas nada testes meçam exatamente inteligência.
diferente do que já foi apresentado até o Na Espanha, Colom, Andrés-Pueyo e
momento. No que diz respeito às diferenças Juan-Espinosa (1998) analisaram, utilizando a
intelectuais, considerando os diversos grupos metodologia de Flynn, os dados brutos das
étnicos, diz-se que, de fato, há diferenças de duas normatizações do teste Raven (Escala
QIs entre os grupos étnicos, porém no que se Geral e Avançada), a primeira feita entre 1963

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


24 C.E. FLORES-MENDOZA et al.

e 1968, e a segunda entre 1991 e 1996. Os próximas do fator g) do que nas capacidades
resultados apontaram um ganho de 19,2 pontos relacionadas à aprendizagem.
de QI na Escala Geral e 6,75 pontos de QI na Embora ainda não esteja claro porque os
Escala Avançada. O ganho, portanto, parece fatores ambientais (educação, estimulação) e
ser maior na população heterogênea (Escala os fatores biológicos (nutrição) afetam mais a
Geral) do que naquela mais homogênea (Escala capacidade fluida do que a cristalizada, o caso
Avançada). Um outro estudo realizado por é que os instrumentos, que no passado foram
Abad et al. (2001), com base nos dados da tão criticados por apontar as diferenças das
adaptação e padronização para a população pessoas, são os mesmos que, atualmente,
espanhola do WISC-III, mostrou que o fator g apontam para um aumento das capacidades
explica menos a variância dos grupos mais intelectuais entre as pessoas. Trata-se, sem
instruídos do que dos menos instruídos. 1 Por dúvida, de uma boa notícia.
outro lado, fatores de grupo explicam mais a
variância de desempenho dos grupos com Por outro lado, os testes podem auxiliar
maior educação do que a variação de na verificação do efeito de políticas governa-
desempenho dos grupos menos instruídos. mentais para redução das desigualdades
Essa hipótese, em realidade, já havia sido sociais entre etnias, como a política americana
levantada por Detterman e Daniel (1989). Os de “ação afirmativa”. Recentemente, Nyborg e
autores afirmam que quanto maior for o nível Jensen (2001) apresentaram dados sobre o
intelectual da pessoa, menos relevante é a fator g (extraídos de 19 testes cognitivos),
inteligência geral (fator g), pois a inteligência renda econômica e status ocupacional,
se especializa. É o caso dos resultados de coletados entre 1985 e 1986, de veteranos das
Abad et al. (2001). A variância de desempenho forças armadas americanas nos últimos 30
dos grupos mais instruídos, que explica os anos. A comparação entre pessoas negras e
fatores de grupo, foi maior. No caso dos ganhos brancas de igual g revela que as primeiras
de QI nos países industrializados, deve-se apresentam maior renda econômica e posição
considerar que os estudos utilizaram amostras ocupacional do que as segundas desde que o
heterogêneas. Os ganhos, portanto, devem g se encontre acima do percentil médio.
ser mesmo de inteligência geral (fator g). Mas
como então explicar os ganhos de inteligência Crítica 2: “Houve prática fraudulenta na
geral? Uma possível resposta é que, se as produção psicométrica”
pessoas nos últimos 50 anos ficaram mais
altas, melhor alimentadas, passaram a As crenças políticas dos pesquisadores,
freqüentar em maior número as universidades em qualquer área de estudo, podem, afinal de
e passaram a ter maior acesso à tecnologia, é contas, ser apoiadas ou não pelos resultados
de se esperar, portanto, uma melhora tanto de pesquisas que possuem um rigor científico.
das capacidades fluidas (Gf), aquelas que No entanto, um estudo que descreva o rigor
dependem pouco da educação formal, quanto científico utilizado não garante a probidade
das cristalizadas (Gc), aquelas que dependem dos dados. Em outras palavras, não podemos
em maior extensão da educação formal. ser ingênuos em acreditar que todo trabalho
Contudo, os ganhos observados foram maiores científico é verdadeiro ou correto. As razões
nas capacidades fluidas (Gf), isto é, naquelas variam: há estudos que escondem falhas
capacidades que são mais vulneráveis a metodológicas e há outros que não percebem
componentes biológicos (e, portanto, mais a inadequação metodológica. Os primeiros

(1)
Um fator “g” pode ser extraído como o primeiro fator principal não rotado de uma análise de componentes
principais. O famoso estudo de Detterman & Daniel (1989) sobre a hipótese de diferenciação do fator g foi
realizado utilizando os dados da padronização americana do WISC_R.

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


A CRÍTICA DESINFORMADA AOS TESTES DE INTELIGÊNCIA 25

mostram que seus responsáveis adotaram Uma das melhores armas da ciência
uma atitude incorreta e não ética, enquanto os para mostrar equívocos (ex. falhas
segundos mostram que seus responsáveis metodológicas) ou comportamentos suspeitos
ainda não adquiriram maturidade científica. (ex. fraude) é a replicabilidade dos estudos. E
Contudo, a atitude mais condenável que um surpreendentemente um deles, iniciado em
pesquisador pode adotar é a fraude científica. 1979, apresentou um valor correlacional
No caso das diferenças individuais, o episódio próximo do apregoado por Burt. Trata-se do
mais citado é o de Cyril Burt, um psicólogo estudo de Minnesota (Bouchard, et al., 1990).
escolar inglês de meados do século passado. Foram reunidos mais de 100 pares e trios de
Os dados mostrados por Burt, com efeito, gêmeos, monozigóticos e dizigóticos, criados
sugerem a prática fraudulenta em alguns juntos e separados. Os gêmeos eram
estudos relacionados às bases biológicas da procedentes da Inglaterra, Estados Unidos,
inteligência. O descobridor foi o psicólogo Austrália, Canadá, China, Nova Zelândia,
social Leon Kamin. Suécia e Alemanha. Os participantes foram
Kamin (Eysenck & Kamin, 1982) submetidos a mais de 50 horas de avaliação
descreveu a estranheza que provocou nele a médica e psicológica. No que diz respeito à
irregularidade dos valores das correlações avaliação psicológica, foram aplicados quatro
apresentados por Burt em estudos de gêmeos questionários de personalidade, três inventários
criados em separado. Segundo Burt, a de interesses e duas baterias de capacidade
cognitiva. Os resultados do estudo de
correlação positiva entre QIs de gêmeos seria
Minnesota apresentaram um valor correlacional
uma evidência de que a inteligência é
de 0,70 entre QIs de gêmeos monozigóticos
fundamentalmente influenciada pela genética.
adultos. Bouchard et al. (1990) concluíram
Em 1943, Burt teria comunicado que a
que seus resultados estão bastante próximos
correlação entre QIs de gêmeos idênticos era
de outros, nos quais se obteve valores oscilando
de 0,77. Em 1955, quando a amostra aumentou
entre 0,64 e 0,74.
de 15 para 21 pares, o valor da correlação era
Embora ainda seja comprometedora a
de 0,771. Em 1958, a amostra teria aumentado
irregularidade dos dados de Burt, a semelhança
para 30 pares e o valor manteve-se em 0,771.
entre os valores supostamente obtidos por
No final de 1958, aumentou a amostra para 42
aquele e os de Minnesota causa surpresa no
pares e a correlação se modificou muito pouco meio acadêmico. No entender de vários autores
(0,778). Em 1966, quando a amostra era de 53 (Colom, 2000; Fletcher, 1990; Rushton, 1994),
pares, a correlação era a mesma de 1955, isto o “Burt Affair” ainda não foi bem esclarecido.
é, de 0,771. Há, pois pouca dúvida de que os
estudos relatados por Burt, no mínimo, eram Crítica 3: “Os testes não medem aquilo
irregulares e suspeitos. Kamin descreveu que pretendem medir”
outros estudos efetuados em gêmeos criados
juntos e separados e tentou mostrar diversas É a expressão mais ouvida daqueles que
falhas metodológicas. se posicionam contrários aos testes
psicológicos. Trata-se da questão da validade
A suspeita de fraude por parte de Burt
dos instrumentos, isto é, como podemos saber,
(que até então era considerado um dos por exemplo, se os testes de inteligência
melhores pesquisadores da inteligência medem, de fato, a capacidade cognitiva de um
humana) reforçou a posição da ciência radical indivíduo e em que medida eles o fazem? Para
e provavelmente obscureceu os avanços das responder a essa questão cabe remontar à
pesquisas na área das diferenças individuais psicometria, particularmente, às técnicas da
durante alguns anos. análise fatorial (validade do construto) e às

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


26 C.E. FLORES-MENDOZA et al.

teorias sobre o construto investigado, aspectos inteligência (Flores-Mendoza & Nascimento,


esses freqüentemente não considerados ou 2001). Na população leiga, praticamente todos
desconhecidos pelos críticos dos testes os indivíduos reconhecem, desde o menos
psicológicos (Colom, 1998). instruído até o mais culto, que as pessoas se
A análise fatorial, como outras técnicas, comportam de maneira diferenciada ao resolver
tem sido aperfeiçoada com o passar dos anos, problemas ou tomar decisões. Algumas
permitindo o desenvolvimento de formas de pessoas são rápidas e eficientes e são
análise cada vez mais poderosas. chamadas de pessoas muito inteligentes;
Tecnicamente, a análise fatorial se propõe outras não são tão rápidas e nem tão eficientes
verificar todas as relações possíveis entre as e são chamadas de pessoas pouco
variáveis de uma matriz de dados e as reduz a inteligentes. O criador de um teste parte de
um conjunto de dimensões chamadas “fatores” uma concepção do que venha a ser inteligência,
(Hair, Anderson, Tatham & Black, 1995). a fim de elaborar itens cuja solução represente
Assim, por exemplo, se o objetivo é descobrir a manifestação desse construto. Saber
as variáveis subjacentes ao sucesso de venda calcular, possuir informações sobre o ambiente
de um determinado produto, é muito provável em que reside, resolver problemas do
que se apontem diversas delas, tais como a quotidiano, realizar analogias, possuir um
imagem do fabricante, o preço do produto, a vocabulário extenso são todos indícios de
quantidade, a embalagem, a tradição da marca comportamento inteligente. Quais desses
no mercado, a durabilidade do produto, seu comportamentos representam melhor a
cheiro e a cor, as informações contidas no inteligência? Talvez nunca se chegue a um
produto, etc. Uma análise fatorial poderá reduzir acordo. Sabemos que as atividades humanas,
todas essas variáveis a três dimensões que quaisquer que sejam, implicam sempre, em
podem receber o nome de qualidade maior ou menor grau, o uso da inteligência. E
(durabilidade, cheiro, textura, cor), custo se essa inteligência se mantém relativamente
(preço, quantidade do produto) e publicidade
estável num indivíduo, enquanto resposta a
(imagem do fabricante, embalagem do produto,
determinadas situações, então a inteligência
tradição do produto, informação do produto).
é um traço do comportamento humano que
Essas dimensões podem ser chamadas de
pode ser medido. A existência diferenciada
“fatores” e o peso de cada uma na venda do
nos seres humanos desse traço de
produto determinará a atuação do fabricante
comportamento constitui a base das diferenças
(ex. reforçar a qualidade e manter a publicidade
individuais. O teste psicológico delineado para
ou manter o preço e a qualidade e aumentar a
avaliar a inteligência deverá, portanto,
publicidade).
apresentar itens que demandem o uso de
No caso do construto chamado habilidades cognitivas que representem o traço
“inteligência” aplica-se também a análise de inteligência, embora como diz Cronbach
fatorial. E, antes de aplicá-la, deve-se ter
(1998) “Nenhum construtor de testes pode
alguma clareza a respeito do construto que se
elaborar um teste com todas as qualidades
quer avaliar. No caso da inteligência, esta
desejáveis”(pág. 172).
pode ser entendida como um construto que
designa uma condição abstrata do ser humano. Se as pontuações em testes de
Entre os acadêmicos existe uma diversidade inteligência acompanham, em algum grau, o
de definições, dependendo da orientação comportamento fisiológico e social de um
teórica adotada, embora se observe certo indivíduo, então, que inteligência é essa que é
consenso de que o ato de resolver problemas medida pelos testes? Qual é a natureza e a
seja uma das características principais da estrutura da inteligência?

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


A CRÍTICA DESINFORMADA AOS TESTES DE INTELIGÊNCIA 27

Responder a essas questões implica em representativas da população, assim como


ir além da construção de testes. Saber que um também testes variados que demandassem
teste apresenta resultados estáveis no decorrer do sujeito distintas atividades cognitivas
do tempo (precisão), que se correlaciona com (Jensen & Weng, 1994; Jensen, 1998a).
um critério externo (validade de critério) e que O que a prática psicométrica tem
se utilizou uma amostra representativa da mostrado? As estimativas dos fatores têm
população para a elaboração das normas não mostrado, como dito anteriormente, um fator
é suficiente para explicar o construto que o geral permeando o desempenho em todas as
teste pretende medir; para tanto, é necessário tarefas intelectuais; daí a importância do fator
aprofundar as discussões no terreno teórico “g” proposto por Spearman. Outros
científico e também analisar as interações psicometristas têm exigido a análise minuciosa
entre os testes e a vida quotidiana. Realizar dos numerosos componentes e, portanto, dos
essa análise significa o que os psicometristas diversos fatores que seriam responsáveis pelas
chamam de estabelecimento da validade de diferenças individuais. Dessa forma, desde o
construto, ou seja, investigar se o teste constitui trabalho pioneiro do psicólogo inglês Spearman
uma representação legítima do construto até pouco tempo atrás, os psicometristas se
(Pasquali, 1997) e implica utilizar técnicas de dividiram; uns afirmando a importância de um
análise fatorial e métodos interdisciplinares de fator geral para explicar as diferenças individuais
investigação experimental que possam na inteligência (Eysenck,1982; Jensen, 1987;
contribuir para a elucidação do construto. Burt, 1955; Gustafsson, 1988; R. Thorndike,
A análise fatorial teve seu início no final 1994) e outros afirmando a existência de
do século XIX, quando o inglês Charles numerosos fatores como importantes
Spearman elaborou o método tetrádico. componentes estruturais da inteligência (E.
Segundo esse método, quando há correlação Thorndike, 1921; Thurstone, 1921; Guilford,
significativa entre dois ou mais testes, essa 1954, 1988).
correlação é devida a um fator comum (ou fator Tais arranjos fatoriais dividiram-se em
“g”). A parte que não se correlaciona dois grupos: o grupo dos modelos hierárquicos
corresponderia a fatores específicos a cada (que pressupõem dimensões mais gerais na
teste. Portanto, a análise fatorial isola ambos parte superior da estrutura da inteligência e
os fatores (fator “g” e fatores específicos). Os dimensões de menor generalidade, freqüen-
fatores extraídos, então, são expressões temente as mais numerosas, que se encontram
estatísticas e não pressupõem entidades na parte inferior da estrutura) e o grupo dos
concretas. Mas, Spearman (1955) afirmou que modelos não-hierárquicos (que pressupõem
o fator “g”, em última instância, reflete uma diversos componentes que compõem a
“energia” mental, uma capacidade geral dos estrutura da inteligência desconsiderando
indivíduos para resolver testes de natureza qualquer relação entre as dimensões). Até o
diversa. Posteriormente, tanto o fator “g” como momento, o modelo hierárquico é o que mais
os fatores específicos foram reunidos no tem contribuído para a prática da avaliação
“modelo dos dois fatores”.2 Outros métodos psicológica, dado que é mais parcimonioso
fatoriais, além do tetrádico, foram surgindo na estimar a capacidade de um indivíduo a partir
literatura psicométrica e em todos eles obteve- de testes de ampla generalidade do que utilizar
-se um g significativo, desde que os estudos numerosos testes específicos (Colom, 1998;
empregassem amostras amplas e Juan-Espinosa, 1997).

(2)
Posteriormente, Spearman aceitaria o fato de que entre o fator “g” e o fator “e” haveria um certo número de fatores
de grupo, mas que considerava de menor importância se comparado à importância do “g” (Thorndike,1994).

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


28 C.E. FLORES-MENDOZA et al.

Os modelos hierárquicos ganharam força qual Detterman (1998) afirma: “...belamente


também graças ao trabalho de John Carroll escrito eu predigo que o livro será o fundamento
(1993), considerado um marco no campo das das pesquisas nas próximas décadas.”
diferenças individuais. Trata-se de uma árdua (pág.176). A obra, em resumo, mostra o fator
investigação em que o autor reanalisou g, a partir de estudos das áreas da genética,
aproximadamente 460 estudos fatoriais da neurologia e da psicologia da conduta
realizados em diversos países num período de humana, como a dimensão mais geral na
40 anos, a maioria nos Estados Unidos e que análise hierárquica e que parece estar
envolveram mais de 130.000 sujeitos. A associado, inclusive, a variáveis não-
conclusão dessa reanálise foi que os fatores psicométricas como tempo de reação. Dessa
podem ser agrupados, de acordo com seu forma, o fator “g” representaria uma variável
grau de generalidade, em três dimensões ou que ligaria a psicologia à biologia; uma tese
estratos. O primeiro estrato corresponde aos compartilhada nos últimos anos de vida por R.
fatores lingüísticos, raciocínio, memória e L. Thorndike (1994).
aprendizagem, percepção visual, recepção Para elucidação da natureza e estrutura
auditiva, produção de idéias, velocidade da inteligência e sua medição, a validade de um
cognitiva, capacidade de conhecimento e teste de inteligência é verificada utilizando-se
rendimento e capacidades motoras. O segundo do princípio de correlação. No caso da validade
estrato corresponde a fatores que caracterizam de critério, correlaciona-se o resultado obtido
a inteligência fluida, inteligência cristalizada, com o instrumento (teste) e um critério (ex.
memória geral, percepção visual e auditiva, rendimento escolar). A relação entre dois
capacidade de recuperação da informação fenômenos, no caso os resultados do teste e
(memória a longo prazo) e velocidade cognitiva. o desempenho em outra atividade cognitiva,
O terceiro estrato corresponde ao fator g expressa-se mediante o coeficiente de
correlação r. Uma correlação pode ser positiva
relacionado à velocidade de processamento
ou negativa: se positiva, os dois fenômenos
de informação e capacidade de memória de
assumem valores na mesma direção; se
trabalho. Os fatores dos estratos superiores
negativa, cada fenômeno assume um valor em
apenas resumem os fatores dos estratos
sentido inverso ao do outro. Se o coeficiente
inferiores. Assim, o fator g do terceiro estrato
de correlação for próximo de 1,00, a relação é
resume os fatores do segundo e estes últimos
quase perfeita (ex. 0,90 ou -0,90) e pode-se
resumem os fatores do primeiro estrato. Dado
predizer o valor de um fenômeno a partir do
que o estudo de Carroll representa as respostas
valor do outro. Inversamente, se o coeficiente
dos sujeitos a situações definidas (testes) em
de correlação for próximo de zero a relação é
diferentes épocas e em diversos ambientes
imperfeita (ex. 0,09 ou -0,09) e, portanto, o
culturais, a teoria dos três estratos representa,
valor de um fenômeno não prediz o valor do outro.
atualmente, o modelo psicométrico mais bem
aceito na comunidade acadêmica; nele se O valor da correlação é denominado
confirma a superioridade do fator g como a “coeficiente de validade”. É comum que as
dimensão mais geral subjacente a toda correlações entre um teste de inteligência e os
atividade cognitiva (Juan-Espinosa, 1997). critérios externos não sejam muito altas, posto
A obra “The g Factor: The science of que diversos fatores concorrem e afetam as
mental ability”, do professor americano Arthur correlações (ex. amadurecimento do sujeito,
Jensen (1998a), constitui a compilação de variação no sistema de atribuição de notas es-
seus numerosos estudos efetuados durante colares, experiências que afetam o sujeito - co-
quase 50 anos sobre a validade do fator g. O mo as familiares e sociais -, a margem de
profícuo trabalho de Jensen mereceu uma erro na precisão do instrumento, etc.).
edição especial da revista Intelligence, na Portanto, no campo da medição da inteligência

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


A CRÍTICA DESINFORMADA AOS TESTES DE INTELIGÊNCIA 29

é improvável uma correlação perfeita entre o críticas à segunda situação não se sustentam,
instrumento e o critério. Segundo Cronbach pois trata-se de um dos princípios de construção
(1998), é pouco freqüente, inclusive, que o de testes. O item que compõe um teste não
índice de validade alcance um valor acima de deve necessariamente representar fielmente a
0,60. Esperar, portanto, que um teste prediga rotina do dia-a-dia (tampouco se afirma que o
perfeitamente o nível de inteligência de um item deve ser o mais alheio possível à
indivíduo ou afirmar que um teste de inteligência experiência do indivíduo), posto que o conteúdo
nada prediz da conduta inteligente de um dos testes importa pouco. A chave está na
indivíduo são posturas, no mínimo, insensatas. complexidade de processamento que o teste
Encontrar correlatos tanto fisiológicos solicita do sujeito. Por exemplo, quando se
quanto sociais do desempenho em testes de extrai o fator g de um conjunto de testes
inteligência não significa encontrar uma relação cognitivos, observa-se que sujeitos mais
de causa e efeito entre eles. As correlações inteligentes obtêm altas pontuações em provas
apenas indicam em que medida dois fenômenos como dígitos ou vocabulário do WAIS do que
se relacionam. Dependendo do índice de r sujeitos menos inteligentes. Há, portanto, uma
obtido, a predição de uma variável em função relação entre a memória (dígitos) e o fator g,
da outra é possível. Para efeitos práticos, é útil assim como entre fluência verbal (vocabulário)
a um psicólogo organizacional ou escolar saber e o fator g. Mas esse resultado não indica que
em que medida se pode predizer o desempenho o fator g equivale a “guardar números na
de uma pessoa num cargo de chefia ou no cabeça” ou “saber o significado das palavras”.
sistema de ensino regular a partir do O fator g não se relaciona ao conteúdo
desempenho em testes de inteligência. específico dos problemas dos testes ou com
Predizer a partir de outros critérios pode não suas características superficiais. Isto constitui
ser uma conduta profissional acertada. o princípio da indiferença do indicador, teorema
Segundo Juan-Espinosa (1997), a predição do cunhado por Spearman (1955) ao observar as
rendimento laboral a partir de testes de correlações entre as distintas tarefas que
personalidade gira ao redor de 0,24; a partir de compunham a bateria de Binet e o alcance
entrevistas, 0,14 e a partir de inventários de acadêmico. O fator g relaciona-se com o que
interesses, 0,10 (os testes de inteligência há de comum no desempenho de diversas
conseguiriam uma predição em torno de 0,52). tarefas e que exige dos indivíduos determinado
nível de cognição. Os tratamentos fatoriais
Enquanto os avanços psicométricos não
conseguem detectar esse aspecto comum e
são do domínio de muitos dos que praticam a
os psicometristas o chamam de g psicométrico
avaliação psicológica, é comum ouvir dizer ou inteligência geral. O fator g está relacionado
que os testes de inteligência não são úteis
à complexidade da atividade cognitiva exigida
para predizer o rendimento na vida quotidiana
pelos diversos problemas, isto é, com a
(ex. na escola ou no trabalho) dado que seus capacidade de estabelecer relações entre os
itens freqüentemente parecem alheios à vida elementos, entre os conceitos abstratos,
quotidiana, isto é, devido a seu viés interno. raciocinar, analisar, discriminar entre
Aqui se deve fazer uma distinção entre o uso informações relevantes e aquelas irrelevantes
de testes importados sem nenhuma adaptação e inferir conclusões a partir dos elementos de
ao novo meio cultural e o uso de testes informação (Colom, 1998). Nesse sentido,
adaptados, validados e normatizados para a Jensen (1998a) enfatiza que g não é o processo
população que se deseja testar. Enquanto a cognitivo ou a configuração dos circuitos
primeira situação reflete quase a metade dos neuronais com que opera o cérebro; g seria a
testes utilizados no Brasil, a crítica, no sentido capacidade para realizar operações cognitivas,
acima, estará sempre correta; no entanto, as uma noção semelhante ao conceito de CPU ou

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


30 C.E. FLORES-MENDOZA et al.

de potência e eficiência de um computador. E outros consideram que a relação não


o que é mais interessante, como bem deverá ultrapassar a barreira de -0,30 a
destacam Colom e Andrés-Pueyo (1999), g -0,40 (Hunt, 1980).
não exclui as diversas aptidões que compõem
f) Há correlação significativa, porém
a inteligência. Tanto é assim que o modelo
pequena, entre QI e tamanho cerebral
de Carroll (1993) mostra que a inteligência
(medição intracraniana por neuroimagem).
enquanto construto científico seria composta
Os coeficientes giram em torno de
de aproximadamente 60 aptidões. O fator g
é a dimensão compartilhada por essas 0,35 (Willerman et al., 1994) a 0,40
aptidões. (Andreasen et al., 1993).

Um século de investigações com testes Na abertura do Tenth Meeting of


de inteligência tem mostrado resultados International Society of the Study of Individual
interessantes: Differences - ISSID, realizado em Edimburgo
(2001), foi descrito um dos estudos mais
a) A correlação entre as pontuações de
consistentes sobre a validade dos testes de
testes de inteligência e o rendimento
inteligência. Trata-se da retomada dos estudos
escolar gira em torno de 0,50 (Neisser
de Godfrey Thomson (que coordenou a
et al., 1996).
testagem, em 1932 e 1947, de todas as
b) Há correlação significativa entre o fator crianças da Escócia nascidas entre 1921 e
g e rendimento laboral. Os coeficientes
1936), pelo pesquisador escocês Ian Deary.
giram em torno de 0,50 a 0,90,
Os primeiros resultados da avaliação de
dependendo do tipo de emprego (Hunter
pessoas sobreviventes da testagem de 1932,
& Hunter, 1984; Jensen, 1998a; Ree &
Earle, 1992; Ree, Earles & Teachout, isto é, da retestagem de pessoas (n=101)
1994). depois de 66 anos da primeira testagem
utilizando-se o mesmo instrumento, mostram,
c) Há significativas correlações negati-
entre outras coisas, a estabilidade das
vas, porém pequenas, entre QI e
diferenças individuais nas habilidades mentais
problemas sociais como delinqüência,
alcoolismo, autoritarismo (Brand, na ausência de enfermidades ou doenças
1987), taxa de acidentes automobi- crônicas (r= 0,63). As implicações de tais
lísticos graves (O’Toole & Stankov, resultados para outras áreas do conhecimento
1992). humano, especialmente a geriatria, são
extremamente positivas, dado que é possível
d) Não há diferenças significativas entre
estudar, com certo grau de precisão, a extensão
os sexos com respeito ao desempenho
e a época do declínio de funções cognitivas no
em testes de inteligência geral (Colom
ser humano (veja-se também Deary, Whalley,
et al., 1999; Aluja-Fabregat et al., 2000;
Lemmon & Crawford, 2000).
Andrés-Pueyo, 1997).
Assim sendo, conclui-se que a
e) Há correlação significativa entre o
desempenho em testes de inteligência inteligência é uma variável psicológica estável
e variáveis psicobiológicas como tempo e, portanto, passível de ser medida. Ela é
de reação e tempo de inspeção. Alguns também ubíqua, presente em maior ou menor
pesquisadores situam a relação entre grau em todas as atividades humanas e o
-0,40 e -0,50 (Bates & Eysenck, 1993; instrumento que a mede, o teste psicométrico,
Chaiken & Young, 1993; Kranzler & pode ser considerado uma das mais importantes
Jensen, 1986; Deary, 1994, 1996), mas contribuições da ciência psicológica.

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


A CRÍTICA DESINFORMADA AOS TESTES DE INTELIGÊNCIA 31

Crítica 4: “Interessa mais a Inteligência arruinar a qualidade de vida de uma pessoa,


Emocional do que a Inteligência constituem uma pequena parcela e não é,
Acadêmica” portanto, a regra. As evidências psicométricas
ainda continuam apoiando a tese de que quanto
Uma dimensão importante do mais inteligente for uma pessoa maior será a
comportamento inteligente é a capacidade de sua capacidade em gerenciar seus
gerenciar as emoções de forma a permitir às sentimentos, suas emoções e seu
pessoas a sociabilidade e a aquisição de um funcionamento adaptativo. Talvez, as
padrão de vida adequado. A psicologia tem capacidades relacionadas à administração das
chamado essa capacidade de “inteligência emoções possam ser mais bem entendidas na
intra e interpessoal” (Gardner, 1994) de esfera da personalidade e das habilidades
“inteligência prática” (Sternberg, 1985, 2000) sociais (Flores-Mendoza & Nascimento, 2002).
e, desde 1990, de “inteligência emocional” por
Um estudo que reforça a suspeita da
Mayer e Salovey (1997).
ligação da inteligência emocional a aspectos
A popularização do termo “inteligência da personalidade constitui o trabalho de
emocional” veio com Goleman, um psicólogo Ciarrochi, Chan e Caputi (2000). Esses autores
formado pela Universidade de Harvard. aplicaram em 134 universitários australianos
Goleman (1995) enfatiza que o sucesso das uma bateria de testes composta por medidas
pessoas na vida quotidiana depende mais do de QI, personalidade, satisfação de vida,
uso inteligente das emoções do que da qualidade de relacionamento e a Escala
inteligência acadêmica tal como é medida Multifatorial de Avaliação da Inteligência
pelos testes de QI. Nesse sentido, o autor Emocional (MEIS). Os estudantes também
relata diversos casos de pessoas que não foram induzidos a experimentar diversos
tiveram sucesso na vida apesar dos seus altos humores para observar se aqueles que
níveis intelectuais. O “analfabetismo” emocional tivessem altas pontuações no MEIS
seria o responsável pelo fracasso social dessas apresentavam melhor capacidade em gerenciar
pessoas. seus humores e discriminavam melhor seus
Os resultados dos testes de inteligência, julgamentos sociais para prevenir humores
como visto anteriormente, correlacionam-se inadequados. Os resultados mostraram que a
fortemente com o desempenho acadêmico, inteligência emocional não estava relacionada
laboral e, em menor grau, com o desempenho ao QI (r = 0,05) e sim a aspectos da
social e afetivo. Isto porque seus itens visam personalidade como empatia (r = 0,43) ou
avaliar a capacidade subjacente à resolução aspectos motivacionais como satisfação na
de problemas lógico-matemáticos, verbais, vida (r = 0,28). Surpreendentemente, enquanto
espaciais, psicomotores e outros. Os testes o QI se relacionou tanto com o gerenciamento
de inteligência não foram criados para avaliar quanto com a prevenção de estados humorais,
a capacidade de reconhecer os próprios a partir de julgamentos adequados, a
sentimentos e os dos outros; tampouco avaliam
inteligência emocional esteve relacionada
a capacidade de controlar e gerenciar as
apenas com o gerenciamento humoral.
emoções, embora se saiba há muito tempo
que tais capacidades podem auxiliar ou dificultar Mais tarde, uma análise realizada por
o desempenho acadêmico e laboral. A Ciarrochi et al. (2001) sobre as diversas escalas
“negligência” da emoção nos testes de e questionários de inteligência emocional
inteligência pode dever-se ao fato de que os apontou que as medidas de inteligência
casos em que a influência de emoções emocional baseadas no desempenho estariam
negativas altera significativamente o mais relacionadas a medidas tradicionais de
desempenho acadêmico e laboral, a ponto de QI do que a medidas de auto-relato. Estas

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


32 C.E. FLORES-MENDOZA et al.

últimas estariam mais relacionadas com as desempenho intelectual e as atividades


dimensões da personalidade. Contudo, um fisiológicas, acadêmicas e sociais. Embora
estudo recente de Roberts, Zeidner e Matthews ainda não haja um consenso sobre o que
(2001) foi realizado para investigar as venha a ser inteligência, pode-se afirmar que
propriedades psicométricas e correlatos os testes medem aquela capacidade utilizada
psicológicos do MEIS (uma medida baseada na cultura ocidental para resolver e enfrentar
em desempenho). Participaram 704 sujeitos desafios quotidianos (por exemplo, escola,
que, além do MEIS, completaram o Inventário emprego). No entanto, deve-se ressaltar que
de Auto-Descrição do Traço-IADT (uma medida testes mal adaptados e/ou construídos com
do modelo dos Cinco Fatores de inadequadas propriedades psicométricas,
Personalidade), e o ASVAB (Armed Services como é o caso da maioria dos testes nacionais,
Vocational Aptitude Battery), uma medida de prejudicam qualquer avaliação psicológica. A
inteligência. Os resultados mostraram que, segunda crença, que provavelmente fornece
embora o MEIS tenha se correlacionado base à primeira, é a de que os testes
moderadamente com o ASVAB e levemente inferiorizam ainda mais alguns segmentos
com o IADT, encontraram-se índices pobres étnico-sociais. Os testes não podem ser
de precisão de alguns subtestes do MEIS, responsabilizados pelas diferenças observadas
assim como a pontuação dada por peritos foi entre as pessoas, eles apenas as retratam.
bastante diferente da que foi dada pelos não Infelizmente, a interpretação errônea dos
peritos. Tais resultados levantam sérias dúvidas resultados obtidos nos testes e a suspeita de
sobre a estabilidade e validade do construto. invenção de dados por parte de alguns
Em outro documento Zeidner, Matthews e psicometristas do início do século passado,
Roberts (2001) analisam as condições parece ter provocado uma resistência aos
necessárias para que um construto se torne avanços ocorridos na esfera das diferenças
cientificamente válido; entre elas, estão: a individuais.
necessidade de demonstrar um número de E, ultimamente, um interesse popular
habilidades primárias emocionais, que reunidas tem surgido sobre a chamada inteligência
definam um construto de ordem superior; emocional. Trata-se de um construto para o
apresentar evidências genéticas, neuropsico- qual ainda não há evidência científica da sua
lógicas, cognitivas e de desenvolvimento; validade porque os instrumentos que tentam
identificar os componentes fluido e cristalizado. medi-lo ainda apresentam problemas
Sem essas condições a inteligência emocional psicométricos. Para que a inteligência
ainda constitui uma miragem. emocional conquiste o mesmo status que a
inteligência geral (ou fator g) é necessário
replicar e delinear numerosos estudos por um
CONSIDERAÇÕES FINAIS bom período de tempo a fim de verificar a
solidez e abrangência do referido constructo.
A revisão dos pontos mais polêmicos
relacionados aos testes psicológicos, Em relação à inteligência propriamente
especificamente daqueles relacionados à dita, embora ainda persistam diversas
medição da inteligência humana, teve como perguntas, conforme mostra o relatório da
objetivo auxiliar a corrigir algumas atitudes APA (Neisser et al., 1996), é inegável que a
erradas a respeito dos testes. A principal medição psicológica tem melhorado com o
delas é a crença bastante generalizada no passar dos anos e tem auxiliado a compreender
país de que os testes não servem para medir melhor a cognição humana. Ignorar tais avanços
a conduta humana. Como já se argumentou, e afirmar que os testes somente servem aos
são significativas as correlações entre o interesses da classe dominante significa voltar

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


A CRÍTICA DESINFORMADA AOS TESTES DE INTELIGÊNCIA 33

às discussões já superadas das décadas de Chaiken, S. R. & Young, R. K. (1993). Inspection


60 e 70. O principal desafio agora não é saber time and intelligence: Attempts to eliminate
se existem diferenças entre as pessoas ou the apparent movement strategy. American
grupos, o desafio maior é saber, por um lado, Journal of Psychology, 106, 191-210.
a que se devem essas diferenças e, por outro CIARROCHI, J. V., Chan, A. Y. C. & Caputi, P.
lado, como ajudar as pessoas desfavorecidas. (2000). A critical evaluation of the emotional
O novo milênio exige que cientistas e intelligence construct. Personality and
pesquisadores encontrem respostas a esses Individual Differences, 28, 539-561.
desafios.
CIARROCHI, J. V., Chan, A. Y. C., Caputi, P.
& Roberts, R. D. (2001). Measuring
emotional intelligence. In: J. Ciarrochi, J.
REFERÊNCIAS BIBLIOGRÁFICAS Forgas, & J.D. Mayer (Eds.). Emotional
intelligence in every life: A scientific inquiry.
ALUJA-FABREGAT, A., Colom, R., Abad, F. (pp. 25-45). Philadelphia, PA: Psychology
& Juan-Espinosa, M. (2000). Sex differences Press.
in general intelligence defined as g among
young adolescents. Personality and COLOM, R. (1995). Tests, inteligencia y
Individual Differences, 28, 813-820. personalidad. Madrid: Pirámide.

ANDREASEN, N.C., Flaum, M., Swayze, V., COLOM, R. (1998). Psicología de las
O’leary, D.S., Alliger, R., Cohen, G., diferencias individuales. Teoría y práctica.
Ehrhardt, J.& Yuh, W. T. C. (1993). Madrid: Pirámide.
Intelligence and brain structure in normal
COLOM, R. (2000). Algunos <<Mitos>> de la
individuals. American Journal of Psychiatry,
Psicología: Entre la Ciencia y la Política.
150, 130-134.
Psicothema, 12, 1, 1-26.
ANDRES-PUEYO, A. (1997). Manual de
COLOM, R., Abad, F.J., Garcia, L. F. & Juan-
psicologia diferencial. Barcelona: McGraw-
Espinosa, M. (no prelo). Education,
Hill.
Wechsler’s Full Scale IQ, and g.
BATES, T.C. & Eysenck, H. J. (1993).
COLOM, R., Andrés-Pueyo, A. & Juan-
Intelligence, inspection time, and decision
Espinosa, M. (1998). Generational IQ gains:
time. Intelligence, 17, 523-531.
Spanish data. Personality and Individual
BOUCHARD, T., Lykeen, D., Mc Gue, M. Differences, 25, 927-935.
Segal, N. & Tellegen, A. (1990). Sources of COLOM, R. & Andrés-Pueyo, A. (1999). El
human psychological differences: The estudio de la inteligencia humana:
Minnesota Study of Twins Reared Apart. recapitulación ante el Cámbio de Milenio.
Science, 250, 223-228. Psicothema, 11, 3, 453-476.
BRAND, C. (1987). The importance of general COLOM, R., Quiroga, M. A. & Juan-Espinosa,
intelligence. In S. Modgil & C. Modgil (Eds.), M. (1999). Are cognitive sex differences
Arthur Jensen: Consensus and Controversy disappearing?. Evidence from Spanish
(pp.251-265). New York: Falmer. populations. Personality and Individual
Differences, 27, 1189-1195.
BURT, C. (1955). The evidence for the concept
of intelligence. British Journal of Educational CRONBACH, L. J. (1998). Fundamentos de
Psychology, 25, 159-177. los tests psicológicos. Madrid: Biblioteca
Nueva.
CARROLL, J. B. (1993): Human cognitive
abilities. A survey of factor analytic studies. DEARY, I. J. (1994). Sensory discrimination
Cambridge, Cambridge Univ. Press. and intelligence: Postmortem or

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


34 C.E. FLORES-MENDOZA et al.

resurrection? American Journal of GOLEMAN, D. (1995). Inteligência emocional.


Psychology, 107, 95-115. Trad. Marcos Santarrita. Rio de Janeiro:
Objetiva (original publicado em 1995).
DEARY, I. J. (1996). Intelligence and inspection
time. American Psychologist, 51, 6, 599-608. GOULD, S. J. (1996). The mismeasure of
man. 2. ed. New York: Norton.
DEARY, I.J., Whalley, L.J., Lemmon, H. &
Crawford, J.R. (2000). The stability of GUILFORD, J. P. (1954). Psychometric
individual differences in mental ability from methods. NY : McGraw-Hill.
childhood to old age: Follow-up of the 1932
Scottish Mental Survey. Intelligence, 28,1, GUILFORD, J. P. (1988). Some changes in the
49-55. structure of intellect model. Educational
and Psychological Measurement, 48, 1-4.
DETTERMAN, D. K . (1998). Kings of men:
introduction to a special Issue. Intelligence. GUSTAFSSON, J. (1988). Hierarchical models
26, 3, 175-180. of individual differences in cognitives abilities.
In: R. J. Sternberg (ed.). Advances in the
DETTERMAN, D. K. & Daniel, M. H. (1989).
Psychology of Human Intelligence, vol. 4.
Correlations of mental tests with each other
New Yersey : LEA.
and with cognitive variables are highest for
low-IQ groups. Intelligence, 15, 247-250. HAIR, J. F., Anderson, R. E, Tatham, R. L. &
EYSENCK, H. J. (1982). A model for Black, W. C. (1995). Multivariate data
intelligence. New York: Springer-Verlag. analysis. New Yersey: Prentice Hall.

EYSENCK, H. J. & Kamin, L. (1982). O grande HERRNSTEIN, R. J. & Murray, Ch. (1994). The
debate sobre a inteligência. Trad. Maria bell curve - intelligence and class structure
Julieta A. A. C. Penteado. Brasília: Editora in American life. New York: A Free Press
UNB. Paperbacks Books.

FLETCHER, R. (1990). The Cyril Burt scandal: HUNT, H. (1980). Intelligence as an Information-
Case for the defense. New York: MacMillan. -Processing Concept. British Journal of
Psychology, 71, 4, 449-474.
FLORES-MENDOZA, C. E. & Nascimento, E.
(2001). Inteligência: o melhor construto HUNTER, J. E. & Hunter, R. F. (1984). Validity
investigado em Psicologia (manuscrito and utility of alternative predictors of job
submetido a publicação). performance. Psychological Bulletin, 96,
72-98.
FLORES-MENDOZA, C.E. & Nascimento, E.
(2002). Inteligência emocional: Um JENSEN, A. R. (1987). Psychometric “g” as a
construto científico? (manuscrito submetido focus of concerted research effort.
a publicação). Intelligence, 11 3, 193-198.

FLYNN, J. R. (1987). Massive IQ gains in 14 JENSEN, A. R. (1998a). Jensen on


nations: What IQ tests really measure. "Jensenism". Intelligence, 26, 3, 181 - 208.
Psychological Bulletin, 101, 171-191.
JENSEN, A. R. (1998b). The g factor. New
FLYNN, J.R. (1998). IQ gains over time: Toward York: Praeger.
finding the causes. In: Ulric Neisser (ed.).
JENSEN, A. R. & Weng, L. (1994): What is a
The rising curve: Long-term gains in IQ and good g?. Intelligence, 18, 231-258.
related measures. (pp.25-66). Washington:
APA. JUAN-ESPINOSA, M. (1997). Geografía de la
inteligencia humana. Madrid: Pirámide.
GARDNER, H. (1994). Estruturas da mente. A
teoria das inteligências múltiplas. Trad. KAMIN, L. (1974). Ciencia y política del
Sandra Costa. Porto Alegre: Artes Médicas. cociente intelectual. Madrid: Pirámide.

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


A CRÍTICA DESINFORMADA AOS TESTES DE INTELIGÊNCIA 35

KRANZLER, J. H. & Jensen, A. R. (1989). ROBERTS, D. R., Zeidner, M. & Matthews, G.


Inspection time and intelligence: A Meta- (2001). Does emotional intelligence meet
Analysis. Intelligence, 13, 4, 329-347. traditional standards for an intelligence?
Some New Data and Conclusions. Emotion,
MAYER, J. D. & Salovey, P. (1997). What is 1,196-231.
emotional intelligence?. In P. Salovey & D.
Sluyter (Eds.) Emotional Development and ROSENTHAL, R. & Jacobson, L. (1966).
Emotional Intelligence: Implications for Teachers’ expectancies: determinants of
educators (pp. 3-31). New York: Basic pupils’ IQ gains. Psychological Report, 19,
Books. 115-118.
MAYER, J. D., Caruso, D. R. & Salovey, P. ROSENTHAL, R. & Jacobson, L. (1968).
(2000). Emotional intelligence meets Pygmalion in the classroom: teacher
traditional standards for an intelligence. expectation and pupils’ intellectual
Intelligence, 27, 4, 267-298. development. New York: Holt, Rhinehart &
Winston.
NEISSER, U. (1998). The rising curve - long
term gains in IQ and related measures. RUSHTON, J. P. (1994). The equalitarian
Washington, DC: APA. dogma revisited. Intelligence, 19, 263-280.

NEISSER, U., Boodoo, G., Bouchard, T., RUSHTON, J. P. (1998). The “Jensen effect”
Boykin, A., Brody, N., Ceci, S., Halpern, and the “Spearman-Jensen Hypothesis” of
D., Loehlin, J., Perloff, R., Sternberg, R. & black-white IQ differences. Intelligence, 26,
Urbina, S. (1996): Intelligence: knowns and 3, 217-225.
unknowns. American Psychologist, 51, 2,
SPEARMAN, C. H. (1955). Las habilidades
77-101.
del hombre. Trad. Jaime Bernstein. Bs.
NYBORG, H. & Jensen, A.P. (2001). As.: Paidos (original publicado em 1927).
Occupation and income related to
SPITZ, H. H. (1999). Beleaguered Pygmalion:
psychometric g. Intelligence, 29, 45-55.
A history of the controversy over claims that
O’TOOLE, B. J. & Stankov, L. (1992). Ultimate teacher expectancy raises intelligence.
validity of psychological tests. Personality Intelligence, 27, 3, 199-234.
and Individual Differences, 13, 699-716.
STERNBERG, R. J. (1985). Beyond IQ: A
PASQUALI, L. (1997). Psicometria: teoria e triarchic theory of human intelligence. New
aplicações. Brasília: Editora UnB. York: Cambridge University Press.

REE, M. J. & Earle, J. A. (1992). Intelligence STERNBERG, R. J. (1992). As capacidades


is the best predictor of job performance. intelectuais humanas: uma abordagem em
Current Directions in Psychological Science, processamento de informação. Trad. Dayse
1, 86-89. Batista. Porto Alegre: Artes Médicas
(original publicado em....).
REE, M. J., Earles, J. A. & Teachout, M. S.
(1994). Predicting job performance: Not THORNDIKE, E. P. (1921). Contribution to
much more than g. Journal of Applied intelligence and its measurement. Journal
of Educational Psychology, 12, 124-127.
Psychology, 79, 518-524.
THORNDIKE, R. L. (1994). “G”. Intelligence,
ROAZZI, A., Spinillo, A., & Almeida, L. S.
19, 2, 145-155.
(1991). Definição e avaliação da
inteligência: Limites e perspectivas. In: L. THURSTONE, L. L. (1921). Contribution to
S. Almeida. Cognição e Aprendizagem intelligence and its measurement. Journal
Escolar. Lisboa: APPORT. of Educational Psychology, 12, 201-207.

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002


36 C.E. FLORES-MENDOZA et al.

WECHSLER, D. (1971). Intelligence: definition, WILSON, E. (1995). Ciencia e ideología.


theory and the IQ. In: Cancro R. (ed.) Academic Questions, vol. 8, 06-10. Trad.
Intelligence: genetic and environmental Andrés-Pueyo e R. Colom (Comps):
influences. New York: Grune Straton. Ciencia y política de la inteligencia en la
sociedad moderna. Madrid: Biblioteca
WILLERMAN, L., Shultz, R., Rutledge, A. N. & Nueva, 1998.
Bigler, E. D. (1992). Hemisphere size
asymmetry predicts relative verbal and ZEIDNER, M., Matthews, G. & Roberts, R. D.
nonverbal intelligence differently in the (2001). Slow down, you move too fast:
sexes: Na MRI study of structure-function emotional intelligence remains an “elusive”
relations. Intelligence, 16, 315-328. intelligence. Emotion.1, 265-275.

Rev. Estudos de Psicologia, PUC-Campinas, v. 19, n. 2, p. 17-36, maio/agosto 2002

Você também pode gostar