Escolar Documentos
Profissional Documentos
Cultura Documentos
Crítica Falha Aos Testes de Inteligência PDF
Crítica Falha Aos Testes de Inteligência PDF
Carmen E. FLORES-MENDOZA1
Elizabeth do NASCIMENTO
Adail Victorino CASTILHO
RESUMO
ABSTRACT
(1)
Dra. da Universidade Federal de Minas Gerais. Endereço para correspondência: Av. Antônio Carlos, 6627.
Departamento de Psicologia Sala 4042 Universidade Federal de Minas Gerais - Belo Horizonte/MG
Tels. (031) 3499-6277 (Sala) (031) 3492-1077 (Res.) - E-mail: carmenflor@uol.com.br
this paper presents some polemical viewpoints that comes along with the
uses and applications of psychological tests, mainly those concerned
with assessment intellectual ability. It says the discre about tests, in
our country, at first because of lack of acquaintance with its basic
construction principles that often allows unreal expectations as for
example perfect predictions and, at second, because political and
ideological beliefs intended as scientific itselves. The psychological
tests that years ago pointed to the existence of large intellectual
differences among human groups concerning ethnical, age and gender
variables are the same that, currently tell us these differences are
showing diminution. Psychological tests continue to be the same,
notwithstanding social conditions changed. So, psychological tests do
not create intellectual differences, they just show it.
Keywords: Psychological tests, behavior measurement, measurement
criticism.
porém o que se lê, em geral, é um conjunto de imigrantes. Segundo Colom (2000), em nenhum
afirmações baseadas no terreno político- momento Goddard teria dito que 80% dos
ideológico e não na análise do conhecimento imigrantes eram retardados mentais ou que as
teórico e técnico, que são as fontes da amostras por ele estudadas eram
construção dos testes. Tais artigos, absorvidos representativas dos imigrantes que desembar-
por profissionais, alunos e leigos em avaliação cavam na Ilha. Portanto, a totalidade dos
psicológica, fazem ecoar as vozes contrárias imigrantes nunca fora estudada utilizando os
à medição da conduta humana. Pretende-se testes psicológicos. Tampouco o Congresso
aqui, portanto, discutir algumas dessas críticas dos Estados Unidos soubera dos resultados
e levantar os alcances e limites da prática de dessas avaliações e nem Goddard fora
medição psicológica, especificamente no que chamado a depor sobre seus resultados.
se refere à inteligência humana. Segundo Rushton (1994), a responsabilidade
de Goddard na lei de restrição à imigração de
Crítica 1: “Os testes reforçam a 1924 parece ser mais um “mito” do que um fato
inferioridade dos segmentos sociais histórico.
desfavorecidos e das minorias étnicas”. Quando se reproduz o mito de que os
testes psicológicos teriam fornecido as bases
O argumento é um dos preferidos da
para a lei de restrição à imigração, no período
crítica aos testes. Um dos fatos históricos
entre 1910 e 1930, pouco se diz do clima
mais lembrados é o estudo de Henry Goddard
político que se respirava na Universidade de
efetuado nos Estados Unidos, no início do
Harvard quando tal crença se disseminou no
século passado, com imigrantes do sul e do
mundo acadêmico na década de 70.
leste da Europa. Em nota, Roazzi, Spinillo e
Almeida (1991) comentam que o estudo de Um retrato dessa época foi oferecido
Goddard, realizado com 178 imigrantes, teria pelo professor Edward Wilson, um pesquisador
mostrado que 83% dos húngaros, 79% dos da sociobiologia, no seu artigo autobiográfico
italianos e 87% dos russos apresentavam intitulado “Ciência e Ideologia”, apresentado
resultados muitos baixos, o que reforçaria a originalmente em 1994 na reunião da
crença do baixo nível intelectual dos imigrantes. Associação Nacional de Acadêmicos na
Segundo os autores “as pesquisas de Goddard Universidade de Cambridge. Ele descreve o
tiveram um impacto significativo na ambiente acadêmico da Universidade de
implementação de leis de restrição à imigração Harvard nos anos 70 e 80, no qual era freqüente
nos anos 20” (pág. 31). Esse mesmo episódio assistir a calorosos debates políticos entre
foi enfaticamente descrito nas obras de Kamin cientistas que se autodenominavam “esquerda”
(1974) e Gould (1996), dois autores e os que eram apelidados de “direita”. Como o
americanos, um psicólogo social e o outro professor Wilson pesquisava as bases
paleontobiólogo, fartamente evocado pelos biológicas da conduta social, ele foi classificado
críticos dos testes psicológicos. como de “direita” pelo “Grupo de Estudo sobre
A respeito desse fato, Colom (2000) afirma a Sociobiologia” - um grupo presidido por
que os sujeitos estudados por Goddard eram Richard Lewontin, então diretor do programa
sujeitos pré-selecionados da Ilha de Ellis de no qual Wilson trabalhava. Lewontin, junto
Nova York e vistos pela comunidade como com Steven Rose e Leon Kamin, liderava o que
portadores de retardo mental. O objetivo de eles mesmos chamaram de “filosofia da ciência
Goddard era apenas verificar a sensibilidade radical”. Essa filosofia teria como objetivo
da escala métrica de Binet para identificar fazer oposição a uma parte da ciência que,
pessoas com retardo mental tanto dentro da interessada em preservar uma classe
população norte-americana quanto da dos dominante, não estaria permitindo a construção
e 1968, e a segunda entre 1991 e 1996. Os próximas do fator g) do que nas capacidades
resultados apontaram um ganho de 19,2 pontos relacionadas à aprendizagem.
de QI na Escala Geral e 6,75 pontos de QI na Embora ainda não esteja claro porque os
Escala Avançada. O ganho, portanto, parece fatores ambientais (educação, estimulação) e
ser maior na população heterogênea (Escala os fatores biológicos (nutrição) afetam mais a
Geral) do que naquela mais homogênea (Escala capacidade fluida do que a cristalizada, o caso
Avançada). Um outro estudo realizado por é que os instrumentos, que no passado foram
Abad et al. (2001), com base nos dados da tão criticados por apontar as diferenças das
adaptação e padronização para a população pessoas, são os mesmos que, atualmente,
espanhola do WISC-III, mostrou que o fator g apontam para um aumento das capacidades
explica menos a variância dos grupos mais intelectuais entre as pessoas. Trata-se, sem
instruídos do que dos menos instruídos. 1 Por dúvida, de uma boa notícia.
outro lado, fatores de grupo explicam mais a
variância de desempenho dos grupos com Por outro lado, os testes podem auxiliar
maior educação do que a variação de na verificação do efeito de políticas governa-
desempenho dos grupos menos instruídos. mentais para redução das desigualdades
Essa hipótese, em realidade, já havia sido sociais entre etnias, como a política americana
levantada por Detterman e Daniel (1989). Os de “ação afirmativa”. Recentemente, Nyborg e
autores afirmam que quanto maior for o nível Jensen (2001) apresentaram dados sobre o
intelectual da pessoa, menos relevante é a fator g (extraídos de 19 testes cognitivos),
inteligência geral (fator g), pois a inteligência renda econômica e status ocupacional,
se especializa. É o caso dos resultados de coletados entre 1985 e 1986, de veteranos das
Abad et al. (2001). A variância de desempenho forças armadas americanas nos últimos 30
dos grupos mais instruídos, que explica os anos. A comparação entre pessoas negras e
fatores de grupo, foi maior. No caso dos ganhos brancas de igual g revela que as primeiras
de QI nos países industrializados, deve-se apresentam maior renda econômica e posição
considerar que os estudos utilizaram amostras ocupacional do que as segundas desde que o
heterogêneas. Os ganhos, portanto, devem g se encontre acima do percentil médio.
ser mesmo de inteligência geral (fator g). Mas
como então explicar os ganhos de inteligência Crítica 2: “Houve prática fraudulenta na
geral? Uma possível resposta é que, se as produção psicométrica”
pessoas nos últimos 50 anos ficaram mais
altas, melhor alimentadas, passaram a As crenças políticas dos pesquisadores,
freqüentar em maior número as universidades em qualquer área de estudo, podem, afinal de
e passaram a ter maior acesso à tecnologia, é contas, ser apoiadas ou não pelos resultados
de se esperar, portanto, uma melhora tanto de pesquisas que possuem um rigor científico.
das capacidades fluidas (Gf), aquelas que No entanto, um estudo que descreva o rigor
dependem pouco da educação formal, quanto científico utilizado não garante a probidade
das cristalizadas (Gc), aquelas que dependem dos dados. Em outras palavras, não podemos
em maior extensão da educação formal. ser ingênuos em acreditar que todo trabalho
Contudo, os ganhos observados foram maiores científico é verdadeiro ou correto. As razões
nas capacidades fluidas (Gf), isto é, naquelas variam: há estudos que escondem falhas
capacidades que são mais vulneráveis a metodológicas e há outros que não percebem
componentes biológicos (e, portanto, mais a inadequação metodológica. Os primeiros
(1)
Um fator “g” pode ser extraído como o primeiro fator principal não rotado de uma análise de componentes
principais. O famoso estudo de Detterman & Daniel (1989) sobre a hipótese de diferenciação do fator g foi
realizado utilizando os dados da padronização americana do WISC_R.
mostram que seus responsáveis adotaram Uma das melhores armas da ciência
uma atitude incorreta e não ética, enquanto os para mostrar equívocos (ex. falhas
segundos mostram que seus responsáveis metodológicas) ou comportamentos suspeitos
ainda não adquiriram maturidade científica. (ex. fraude) é a replicabilidade dos estudos. E
Contudo, a atitude mais condenável que um surpreendentemente um deles, iniciado em
pesquisador pode adotar é a fraude científica. 1979, apresentou um valor correlacional
No caso das diferenças individuais, o episódio próximo do apregoado por Burt. Trata-se do
mais citado é o de Cyril Burt, um psicólogo estudo de Minnesota (Bouchard, et al., 1990).
escolar inglês de meados do século passado. Foram reunidos mais de 100 pares e trios de
Os dados mostrados por Burt, com efeito, gêmeos, monozigóticos e dizigóticos, criados
sugerem a prática fraudulenta em alguns juntos e separados. Os gêmeos eram
estudos relacionados às bases biológicas da procedentes da Inglaterra, Estados Unidos,
inteligência. O descobridor foi o psicólogo Austrália, Canadá, China, Nova Zelândia,
social Leon Kamin. Suécia e Alemanha. Os participantes foram
Kamin (Eysenck & Kamin, 1982) submetidos a mais de 50 horas de avaliação
descreveu a estranheza que provocou nele a médica e psicológica. No que diz respeito à
irregularidade dos valores das correlações avaliação psicológica, foram aplicados quatro
apresentados por Burt em estudos de gêmeos questionários de personalidade, três inventários
criados em separado. Segundo Burt, a de interesses e duas baterias de capacidade
cognitiva. Os resultados do estudo de
correlação positiva entre QIs de gêmeos seria
Minnesota apresentaram um valor correlacional
uma evidência de que a inteligência é
de 0,70 entre QIs de gêmeos monozigóticos
fundamentalmente influenciada pela genética.
adultos. Bouchard et al. (1990) concluíram
Em 1943, Burt teria comunicado que a
que seus resultados estão bastante próximos
correlação entre QIs de gêmeos idênticos era
de outros, nos quais se obteve valores oscilando
de 0,77. Em 1955, quando a amostra aumentou
entre 0,64 e 0,74.
de 15 para 21 pares, o valor da correlação era
Embora ainda seja comprometedora a
de 0,771. Em 1958, a amostra teria aumentado
irregularidade dos dados de Burt, a semelhança
para 30 pares e o valor manteve-se em 0,771.
entre os valores supostamente obtidos por
No final de 1958, aumentou a amostra para 42
aquele e os de Minnesota causa surpresa no
pares e a correlação se modificou muito pouco meio acadêmico. No entender de vários autores
(0,778). Em 1966, quando a amostra era de 53 (Colom, 2000; Fletcher, 1990; Rushton, 1994),
pares, a correlação era a mesma de 1955, isto o “Burt Affair” ainda não foi bem esclarecido.
é, de 0,771. Há, pois pouca dúvida de que os
estudos relatados por Burt, no mínimo, eram Crítica 3: “Os testes não medem aquilo
irregulares e suspeitos. Kamin descreveu que pretendem medir”
outros estudos efetuados em gêmeos criados
juntos e separados e tentou mostrar diversas É a expressão mais ouvida daqueles que
falhas metodológicas. se posicionam contrários aos testes
psicológicos. Trata-se da questão da validade
A suspeita de fraude por parte de Burt
dos instrumentos, isto é, como podemos saber,
(que até então era considerado um dos por exemplo, se os testes de inteligência
melhores pesquisadores da inteligência medem, de fato, a capacidade cognitiva de um
humana) reforçou a posição da ciência radical indivíduo e em que medida eles o fazem? Para
e provavelmente obscureceu os avanços das responder a essa questão cabe remontar à
pesquisas na área das diferenças individuais psicometria, particularmente, às técnicas da
durante alguns anos. análise fatorial (validade do construto) e às
(2)
Posteriormente, Spearman aceitaria o fato de que entre o fator “g” e o fator “e” haveria um certo número de fatores
de grupo, mas que considerava de menor importância se comparado à importância do “g” (Thorndike,1994).
é improvável uma correlação perfeita entre o críticas à segunda situação não se sustentam,
instrumento e o critério. Segundo Cronbach pois trata-se de um dos princípios de construção
(1998), é pouco freqüente, inclusive, que o de testes. O item que compõe um teste não
índice de validade alcance um valor acima de deve necessariamente representar fielmente a
0,60. Esperar, portanto, que um teste prediga rotina do dia-a-dia (tampouco se afirma que o
perfeitamente o nível de inteligência de um item deve ser o mais alheio possível à
indivíduo ou afirmar que um teste de inteligência experiência do indivíduo), posto que o conteúdo
nada prediz da conduta inteligente de um dos testes importa pouco. A chave está na
indivíduo são posturas, no mínimo, insensatas. complexidade de processamento que o teste
Encontrar correlatos tanto fisiológicos solicita do sujeito. Por exemplo, quando se
quanto sociais do desempenho em testes de extrai o fator g de um conjunto de testes
inteligência não significa encontrar uma relação cognitivos, observa-se que sujeitos mais
de causa e efeito entre eles. As correlações inteligentes obtêm altas pontuações em provas
apenas indicam em que medida dois fenômenos como dígitos ou vocabulário do WAIS do que
se relacionam. Dependendo do índice de r sujeitos menos inteligentes. Há, portanto, uma
obtido, a predição de uma variável em função relação entre a memória (dígitos) e o fator g,
da outra é possível. Para efeitos práticos, é útil assim como entre fluência verbal (vocabulário)
a um psicólogo organizacional ou escolar saber e o fator g. Mas esse resultado não indica que
em que medida se pode predizer o desempenho o fator g equivale a “guardar números na
de uma pessoa num cargo de chefia ou no cabeça” ou “saber o significado das palavras”.
sistema de ensino regular a partir do O fator g não se relaciona ao conteúdo
desempenho em testes de inteligência. específico dos problemas dos testes ou com
Predizer a partir de outros critérios pode não suas características superficiais. Isto constitui
ser uma conduta profissional acertada. o princípio da indiferença do indicador, teorema
Segundo Juan-Espinosa (1997), a predição do cunhado por Spearman (1955) ao observar as
rendimento laboral a partir de testes de correlações entre as distintas tarefas que
personalidade gira ao redor de 0,24; a partir de compunham a bateria de Binet e o alcance
entrevistas, 0,14 e a partir de inventários de acadêmico. O fator g relaciona-se com o que
interesses, 0,10 (os testes de inteligência há de comum no desempenho de diversas
conseguiriam uma predição em torno de 0,52). tarefas e que exige dos indivíduos determinado
nível de cognição. Os tratamentos fatoriais
Enquanto os avanços psicométricos não
conseguem detectar esse aspecto comum e
são do domínio de muitos dos que praticam a
os psicometristas o chamam de g psicométrico
avaliação psicológica, é comum ouvir dizer ou inteligência geral. O fator g está relacionado
que os testes de inteligência não são úteis
à complexidade da atividade cognitiva exigida
para predizer o rendimento na vida quotidiana
pelos diversos problemas, isto é, com a
(ex. na escola ou no trabalho) dado que seus capacidade de estabelecer relações entre os
itens freqüentemente parecem alheios à vida elementos, entre os conceitos abstratos,
quotidiana, isto é, devido a seu viés interno. raciocinar, analisar, discriminar entre
Aqui se deve fazer uma distinção entre o uso informações relevantes e aquelas irrelevantes
de testes importados sem nenhuma adaptação e inferir conclusões a partir dos elementos de
ao novo meio cultural e o uso de testes informação (Colom, 1998). Nesse sentido,
adaptados, validados e normatizados para a Jensen (1998a) enfatiza que g não é o processo
população que se deseja testar. Enquanto a cognitivo ou a configuração dos circuitos
primeira situação reflete quase a metade dos neuronais com que opera o cérebro; g seria a
testes utilizados no Brasil, a crítica, no sentido capacidade para realizar operações cognitivas,
acima, estará sempre correta; no entanto, as uma noção semelhante ao conceito de CPU ou
ANDREASEN, N.C., Flaum, M., Swayze, V., COLOM, R. (1998). Psicología de las
O’leary, D.S., Alliger, R., Cohen, G., diferencias individuales. Teoría y práctica.
Ehrhardt, J.& Yuh, W. T. C. (1993). Madrid: Pirámide.
Intelligence and brain structure in normal
COLOM, R. (2000). Algunos <<Mitos>> de la
individuals. American Journal of Psychiatry,
Psicología: Entre la Ciencia y la Política.
150, 130-134.
Psicothema, 12, 1, 1-26.
ANDRES-PUEYO, A. (1997). Manual de
COLOM, R., Abad, F.J., Garcia, L. F. & Juan-
psicologia diferencial. Barcelona: McGraw-
Espinosa, M. (no prelo). Education,
Hill.
Wechsler’s Full Scale IQ, and g.
BATES, T.C. & Eysenck, H. J. (1993).
COLOM, R., Andrés-Pueyo, A. & Juan-
Intelligence, inspection time, and decision
Espinosa, M. (1998). Generational IQ gains:
time. Intelligence, 17, 523-531.
Spanish data. Personality and Individual
BOUCHARD, T., Lykeen, D., Mc Gue, M. Differences, 25, 927-935.
Segal, N. & Tellegen, A. (1990). Sources of COLOM, R. & Andrés-Pueyo, A. (1999). El
human psychological differences: The estudio de la inteligencia humana:
Minnesota Study of Twins Reared Apart. recapitulación ante el Cámbio de Milenio.
Science, 250, 223-228. Psicothema, 11, 3, 453-476.
BRAND, C. (1987). The importance of general COLOM, R., Quiroga, M. A. & Juan-Espinosa,
intelligence. In S. Modgil & C. Modgil (Eds.), M. (1999). Are cognitive sex differences
Arthur Jensen: Consensus and Controversy disappearing?. Evidence from Spanish
(pp.251-265). New York: Falmer. populations. Personality and Individual
Differences, 27, 1189-1195.
BURT, C. (1955). The evidence for the concept
of intelligence. British Journal of Educational CRONBACH, L. J. (1998). Fundamentos de
Psychology, 25, 159-177. los tests psicológicos. Madrid: Biblioteca
Nueva.
CARROLL, J. B. (1993): Human cognitive
abilities. A survey of factor analytic studies. DEARY, I. J. (1994). Sensory discrimination
Cambridge, Cambridge Univ. Press. and intelligence: Postmortem or
EYSENCK, H. J. & Kamin, L. (1982). O grande HERRNSTEIN, R. J. & Murray, Ch. (1994). The
debate sobre a inteligência. Trad. Maria bell curve - intelligence and class structure
Julieta A. A. C. Penteado. Brasília: Editora in American life. New York: A Free Press
UNB. Paperbacks Books.
FLETCHER, R. (1990). The Cyril Burt scandal: HUNT, H. (1980). Intelligence as an Information-
Case for the defense. New York: MacMillan. -Processing Concept. British Journal of
Psychology, 71, 4, 449-474.
FLORES-MENDOZA, C. E. & Nascimento, E.
(2001). Inteligência: o melhor construto HUNTER, J. E. & Hunter, R. F. (1984). Validity
investigado em Psicologia (manuscrito and utility of alternative predictors of job
submetido a publicação). performance. Psychological Bulletin, 96,
72-98.
FLORES-MENDOZA, C.E. & Nascimento, E.
(2002). Inteligência emocional: Um JENSEN, A. R. (1987). Psychometric “g” as a
construto científico? (manuscrito submetido focus of concerted research effort.
a publicação). Intelligence, 11 3, 193-198.
NEISSER, U., Boodoo, G., Bouchard, T., RUSHTON, J. P. (1998). The “Jensen effect”
Boykin, A., Brody, N., Ceci, S., Halpern, and the “Spearman-Jensen Hypothesis” of
D., Loehlin, J., Perloff, R., Sternberg, R. & black-white IQ differences. Intelligence, 26,
Urbina, S. (1996): Intelligence: knowns and 3, 217-225.
unknowns. American Psychologist, 51, 2,
SPEARMAN, C. H. (1955). Las habilidades
77-101.
del hombre. Trad. Jaime Bernstein. Bs.
NYBORG, H. & Jensen, A.P. (2001). As.: Paidos (original publicado em 1927).
Occupation and income related to
SPITZ, H. H. (1999). Beleaguered Pygmalion:
psychometric g. Intelligence, 29, 45-55.
A history of the controversy over claims that
O’TOOLE, B. J. & Stankov, L. (1992). Ultimate teacher expectancy raises intelligence.
validity of psychological tests. Personality Intelligence, 27, 3, 199-234.
and Individual Differences, 13, 699-716.
STERNBERG, R. J. (1985). Beyond IQ: A
PASQUALI, L. (1997). Psicometria: teoria e triarchic theory of human intelligence. New
aplicações. Brasília: Editora UnB. York: Cambridge University Press.