Kerlinger, Fred Nichols - Metodologia Da Pesquisa em Ciencias Sociais - Um Tratamento Conceitual-Epu (2003) PDF

Metodologia da
Pesquisa em
Ciências Sociais
Um tratamento conceituai
Data J O I O i ___ 20 O ^L.

TR R T / < 3 W í--------------------
N.F. *855 g ______________
F 0 R N E C E D 0 R :B ^ 2 L - Í £ S ^
CIP-Brasil. Catalogação-na-Fonte
Câmara Brasileira do Livro, SP
Kerlinger, Fred Nichols, 1910-

K47m Metodologia da pesquisa em ciências sociais:
um tratamento conceituai / Fred N. Kerlinger;
[tradução Helena Mendes Rotundo; revisão técnica
José Roberto Malufe]. São Paulo: EPU.
Bibliografia.
1. Ciências sociais — Metodologia 2. Pesquisa

3. Pesquisa social I. Título.
CDD-300.72
-300.18
80-1332 -507.2
Índices para catálogo sistemático:

1. Metodologia: Ciências sociais 300.18
2. Pesquisa científica 507.2
3. Pesquisa comportamental: Ciências sociais 300-72
4. Pesquisa social: Ciências sociais 300.72
Fred N . Kerlinger
Universidade de Amsterdã
Metodologia da
Pesquisa em
Ciências Sociais
Um tratam ento
conceituai
íMfOM KBBGÓGICB
€ UnreRSfTfíRM ITDfi.
Tradução do original em inglês:
Behavioral Research — a conceptual approach
Copyright © 1979 by Holt, Rinehart and Winston
UNIVERSIDADE t ,hA
BIBLIO ■ ' nTRAL
r O?
Tradução:
Helena Mendes Rotundo
Revisão técnica:
José Roberto Malufe
Professor-Assistente de Metodologia da Pesquisa em Educação, na PUC/SP
10a- reim pressão, 2007
ISBN 978-85-12-60340-7
ISBN 85-12-60340-2
© E.P.U. - Editora Pedagógica e Universitária Ltda., São Paulo, 1980. Todos os direitos reservados.
A reprodução desta obra, no todo ou em parte, por qualquer meio, sem autorização expressa e por
escrito da Editora, sujeitará o infrator, nos termos da lei n° 6.895, de 17-12-1980, à penalidade
prevista nos artigos 184 e 186 do Código Penal, a saber: reclusão de um a quatro anos.
E. P. U. - Telefone (0++11) 3168-6077 - Fax. (0++11) 3078-5803
E-M ail: vendas@epu.com.br Site na Internet: http://www.epu.com.br
Rua Joaquim Floriano, 72 - 6o andar - conjunto 65/68 - 04534-000 São Paulo - SP
Impresso no Brasil Printed in Brazil
Para
William Clark Trow
Theodore M. Newcomb
5
Sumário
Prefácio .................................................................................... r ? . . XV
1. A natureza da ciência e da pesquisa científica....................... 1
t»
2. Conceitos comportamentais científicos e definições................... 22
3. Problemas, hipóteses e variáveis . . . . ....................................... 33
4. Relações e explicações .............................................................. 51
5. Probabilidade e estatística .......................................................... 74
6. O delineamento da pesquisa experimental: delineamentos de
uma só variável.......................................................................... ■. 94
7. Delineamento da pesquisa experimental: delineamentos fatoriais 105
8. Pesquisa experimental e não-experimental ............................... 120
9. Observação e mensuração de variáveis ................................... 144
10. Investigação sociológica, levantamentos e análise de freqüências 162
11. A abordagem multivariada: regressão múltipla e partição da
variância ............................... ...................................................... 179
12. A abordagem multivariada: análise fatorial ........................... 202
13. A abordagem multivariada: correlação canônica, análise dis-
criminantè e análise de estruturas de covariância.................... 235
14. O com putador.............................................................................. 271
15. Concepções errôneas e controvérsias: questões metodológicas 296
16. Concepções errôneas e controvérsias: pesquisa e prática . . . 317
Apêndice — Tipos de pesquisa, métodos de observação e testes de
significância estatística ................................................................... 347
Bibliografia ....................................... 363
Índice onomástico .............................. 369
Índice analítico ................................ 372
Sobre o autor
Fred N. Kerlinger, nascido em 1910, é professor convidado do

Laboratório de Psicologia da Universidade de Amsterdã, Holanda, desde
1975. Doutorou-se em 1953, pela Universidade de Michigan, Estados
Unidos, em psicologia educacional. Foi professor de psicologia educa- i
cional na Universidade de Nova Iorque de 1960 a 1975, e dirigiu a
Divisão de Ciências Comportamentais dessa universidade de 1968 a o
1971. Kerlinger é autor do já clássico Foundations of Behavioral Re- ~j
search (2.a ed.) e co-autor, juntamente com E.J. Pedhazur, de Multiple
Regression in Behavioral Research. O presente volume, seu mais recente {
trabalho, figura entre os melhores livros já escritos no gênero.
J.R.M.%
*■ » J
ar
Ui
I
Prefácio
O propósito deste livro é auxiliar as pessoas a compreenderem a

ciência e a pesquisa científica. Embora focalize a ciência comportamental
e a pesquisa psicológica, sociológica e educacional, sua preocupação
central é a abordagem e os princípios básicos de todas as ciências. As
disciplinas científicas diferem em conteúdo e substância, mas sua abor- .5
dagem ampla à investigação é, no geral, a mesma. E é neste núcleo de
semelhança que se concentra este livro.
Uma das grandes necessidades do momento é a de que as pessoas
compreendam a ciência. Existe, naturalmente, muita popularização da
ciência e das realizações científicas, nos meios de comunicação. Há tam
bém livros tentando explicar a ciência. Entretanto, a maioria dos espe-£
cialistas, provavelmente, concordaria que é preciso fazer ainda muito^
mais para tornar a ciência compreensível para um maior número dew
>essoas, e os próprios cientistas devem assumir uma parte da responsa-™:
bilidade por tais esforços. 5
O objetivo específico de Metodologia da Pesquisa em Ciências So
ciais: Um Tratamento Conceituai é explicar as complexidades abstratas
da pesquisa científica de modo significativo e não-técnico, sem sacrificar a
profundidade e a exatidão. O livro tenta conseguir isto concentrando-se
nas bases conceituais da ciência e da pesquisa, e limitando as discussões
técnicas e metodológicas a umas poucas áreas e temas básicos. Tenta
também explicar o que a ciência é, e o que não é; quais os seus propósi
tos e como funciona.
Outro objetivo do livro é preencher o hiato de compreensão entre
o cientista comportamental e o não-cientista. A natureza abstrata da
ciência e as tecnicidades da pesquisa podem ser obstáculos à compre
ensão. Além disso, podem obscurecer sua simplicidade essencial e econo
mia de propósitos. É uma séria deficiência educacional o fato de que
muitas pessoas, talvez a maioria, sabem pouco a respeito do que é um
experimento, para que serve, a respeito de mensuração, sua natureza e
propósitos, ou a respeito da função e lugar da estatística na pesquisa.
A pessoa que tiver lido atentamente este livro deverá ter uma sólida
compreensão conceituai da ciência comportamental e da pesquisa com
portamental — dò ponto de vista do pesquisador.
Uma terceira finalidade do livro é definir e explicar algumas das
principais questões controvertidas associadas à pesquisa sócio-científica.
As controvérsias surgem e multiplicam-se devido a conflitos e diferenças
de valores. Às vezes, entretanto, nascem de concepções errôneas a respeito
dos problemas que estão subjacentes a elas. Para que serve a pesquisa?
Por que fazer pesquisas? O que é objetividade? Por que a objetividade é
considerada tão importante pelos cientistas? O que são pesquisa básica e
pesquisa aplicada? Pode-se medir a inteligência humana? Como os valo
res afetam a ciência e a pesquisa? Mal-entendidos sobre tais problemas
dificultam a compreensão da ciência e da pesquisa. O presente livro,
portanto, tenta analisar e colocar esses problemas em perspectiva, embora
não pretenda resolvê-los.
Há dois públicos que são especialmente visados por este texto.
O primeiro é formado por aqueles que desejam conhecer algo da natureza
e dos problemas da ciência e da pesquisa em psicologia, sociologia,
educação e outras disciplinas comportamentais. O que significa, por
exemplo, estudar cientificamente a inteligência e o preconceito? Como
são abordados problemas assim tão complexos e difíceis de apreender?
O segundo tipo de público é o formado por estudantes universitários
que estão terminando seus cursos de graduação, ou iniciando a pós-
graduação, em praticamente qualquer disciplina, inclusive disciplinas
não-científicas, e que necessitam compreender a ciência e a pesquisa
comportamentais. Os estudantes de ciências comportamentais acharão o
livro particularmente pertinente e útil. Entretanto, eu o concebí como
um texto geral e um guia para estudantes de várias disciplinas, ainda
que sua ênfase seja psicológica, sociológica e educacional.
O livro tem três partes principais. Na primeira parte, que abrange
os capítulos 1, 2 e 3, é discutida a natureza da ciência e da pesquisa
científica. Os termos necessários são definidos, as idéias fundamentais
são explicadas e ilustradas, e são introduzidos um ou dois pontos contro
vertidos — por exemplo, a questão da objetividade. Os capítulos 1 e 3
são, provavelmente, os capítulos mais importantes do livro, porque
discutem qual é a meta da ciência e por que, e revelam a essência e o
propósito dos problemas e hipóteses da pesquisa científica. Esta parte,
portanto, podería ser chamada de fundamentos conceituais do tema.
A segunda parte — capítulos de 4 a 13 — trata dos aspectos
técnicos da pesquisa comportamental que são, em minha opinião, os
mais importantes. Ninguém pode compreender realmente a ciência e a
pesquisa comportamental sem compreender pelo menos as mais funda
mentais das idéias técnicas. Por exemplo, a idéia de aleatoriedade é
fundamental. Não se pode compreender experimentos ou ter qualquer
tipo de idéia clara do que seja estatística e delineamento de pesquisa sem
compreender funções e processos aleatórios e o seu uso na pesquisa
XII
contemporânea. A cobertura desta parte é ampla e diversificada. Inclui
relações, probabilidade, delineamento de pesquisa, mensuração e análise
multivariada. É o núcleo técnico do livro, mas na sua maior parte
expresso em linguagem não-técnica.
O capítulo 4 estabelece a base: examina relações e explicações e
tenta mostrar como estão subjacentes a todo o empreendimento científico.
O capítulo 5 apresenta uma abordagem intuitiva à probabilidade e à
estatística. A importância da idéia de aleatoriedade, mencionada acima,
é fortemente enfatizada. Os capítulos 6, 7 e 8 formam uma unidade
sobre experimentação e delineamento de pesquisa. Os delineamentos de
pesquisa têm o propósito essencial de fornecer quadros de referência que
tornem possível responder diferentes questões de pesquisa. Os capítulos 6
e 7 esboçam os princípios de tais quadros de referência. O capítulo 8
mostra as semelhanças e diferenças entre a pesquisa experimental e a
não-experimental. Raramente essa distinção tão importante é discutida
na bibliografia. Considero-a suficientemente importante para justificar
um capítulo inteiramente dedicado a ela. A distinção e as suas con-
seqüências, tais como apresentadas no capítulo 8 e em outros trechos do
livro, podem ser questionadas. Todavia, por mais corretas ou incorretas
que sejam julgadas a definição, as distinções e as conseqüências, não há
dúvida de que o tema requer divulgação e compreensão.
Mensuração é a principal preocupação do capítulo 9. Assim como a
estatística, a mensuração psicológica é uma das maiores conquistas de
nossos tempos. Embora tenha ainda um longo caminho pela frente, boa
parte deste já é conhecido, e uma parcela do núcleo desse conhecimento
está condensada no capítulo 9. A despeito de ser uma grande realização,
a mensuração tem sido também o calcanhar de Aquiles de grande parte
da pesquisa comportamental. O capítulo ajuda a esclarecer suas forças e
fraquezas.
O capítulo 10 procura descrever um volumoso e importante tipo de
pesquisa — em termos gerais denominado “investigação sociológica” —
cujas principais características são sua natureza não-experimental, sua
mensuração e seus modos de análise. Temos este tipo de pesquisa quando,
por exemplo, os pesquisadores estudam principalmente o que pode ser
chamado de “variáveis sociológicas” — classe social, status ocupacional,
sexo, preferências religiosas e políticas, e assim por diante — e quando
o método predominante de observação é a contagem, geralmente a conta
gem de características “ sociológicas” de indivíduos. O capítulo ocupa-se
de suas características e de seu uso na pesquisa comportamental.
A inclusão dos capítulos 11, 12 e 13, sobre a abordagem multiva
riada, é essencial em um livro sobre a pesquisa comportamental contem
porânea. Algumas pessoas poderão achar que o assunto é muito complexo
para um livro deste tipo. Como se poderia explicar análise fatorial,
XIII
regressão múltipla e análise discriminante de modo preciso e não-técnico?
Essa é uma boa pergunta, e para a qual não existe uma resposta pronta
e fácil. O problema é que, se não forem discutidas as abordagens multi-
variadas à pesquisa e à análise de dados, deixa-se uma grande lacuna no
conhecimento e na compreensão que terá o leitor sobre a pesquisa com-
portamental. A pesquisa comportamental passa, atualmente, por uma
verdadeira revolução, a meu ver, precisamente por causa, em grande parte,
da abordagem multivariada e do ultra-rápido computador moderno.
Problemas de pesquisa, que antes não poderíam ser contemplados por
uma incapacidade de se fazer as complexas análises envolvidas, são hoje
abordados quase rotineiramente. Assim, decidiu-se incluir o assunto, a
um nível cortceptual e semitécnico. Há a conseqüente supersimplifica-
ção, ignorando-se diversos problemas importantes. Os riscos, entretanto,
talvez sejam compensados por uma imagem melhor e mais completa que
o leitor poderá adquirir. Pelo menos, estes capítulos poderão aumentar o
1-interesse e difundir uma abordagem fascinante, com muitas probabili
dades para a teoria e a pesquisa significativas e criativas.
A terceira parte do livro, capítulos 14, 15 e 16, discute e explora
diversos problemas controvertidos e mal compreendidos, que trazem
considerável preocupação à ciência e aos cientistas. Um deles — feliz
mente, relativamente fácil de manejar — é a natureza e a finalidade do
computador. Não há dúvida de que o computador foi e é uma das
influências mais fortes na pesquisa comportamental contemporânea.
Esta influência é examinada no capítulo 14. Os notáveis poderes do com
putador são descritos e analisados com o propósito de se compreender o
que o computador pode fazer e, o que é praticamente tão importante
quanto isso, o que o computador não pode fazer. Depois de estabelecida
essa base, procurou-se também esclarecer um ou outro mal-entendido
sobre o computador e o seu lugar na pesquisa e na ordem das coisas.
Os dois últimos capítulos do livro, capítulo 15 e 16, exploram basica
mente um certo número de problemas mal compreendidos e contro
vertidos, que intrigam e desorientam os pesquisadores e os indivíduos
que observam a ciência e a pesquisa. Por exemplo, a questão de para
que serve a ciência é atacada diretamente, e são tiradas conclusões que
poderão desconcertar alguns leitores. Qualquer atividade humana com
plexa é controvertida. A ciência não é exceção. Decidi, portanto, que
alguns dos mal-entendidos mais perturbadores e importantes sobre a
ciência e a pesquisa teriam que ser abordados. Naturalmente, ao se fazer
isso, há um risco considerável. Poderá parecer que se está tomando
partido em um debate. Na realidade, o que se está assumindo é menos
um partido em um debate do que uma posição baseada no que se
considera ser a natureza da ciência. Novamente, isto se torna um
obstáculo à compreensão. Por exemplo, muitas pessoas acreditam que o
XI V
propósito da pesquisa científica é aumentar o bem-estar humano. Quando
isso é categoricamente negado, e se afirma que o propósito da pesquisa
científica é a teoria, ou a compreensão e explicação, não é de se admirar
que surjam dificuldades. Pretende-se, entretanto, explicar de tal maneira
as coisas, que as razões para as afirmações feitas possam ser compreendi
das e, pelo menos, consideradas. Assim, os últimos dois capítulos do
livro exploram controvérsias e mal-entendidos. Tentam colocar em
perspectiva três ou quatro das maiores questões, em parte filosóficas, da
ciência e da pesquisa.
Embora possa ser considerado metodológico, num sentido amplo,
este não é um livro de métodos. Não se tenta ensinar como fazer pesquisa;.,-
Toda a ênfase é posta em compreender pesquisa. Na verdade, é provável- '-í
mente impossível compreender qualquer assunto complexo sem trabalhar1'
ativamente com ele; Para compreender realmente a estatística, a maioria^
das pessoas precisaria trabalhar com problemas estatísticos, por exemplo, j
Todavia, um nível substancial de compreensão pode ser alcançado por-'
uma forma vicária de trabalhar com os problemas. Muitos de tais
“trabalhos vicários” são dados no livro. Por exemplo, uma característica
importante do livro é a descrição de pesquisas reais, geralmente acom
panhada da teoria em que se baseiam os estudos, bem como as questões:.
colocadas pelos pesquisadores. Assim, o livro descreve a maneira pelar
qual as pesquisas têm sido feitas e é, portanto, numa certa medida^ 5
metodológico. Mas deixa quase que completamente de lado os métodos;
reais de fazer observações, medir variáveis, analisar dados e assim pog
diante. A necessidade de informações sobre esses tópicos é atendida, numá*
certa medida, pelo Apêndice, no qual são discutidos tipos de pesquisa
diferentes dos tratados no texto, bem como alguns métodos de observação.
Embora saiba o quanto me ajudou, não creio que minha mulher
compreenda realmente até que ponto ela é uma parte importante deste
livro. Em todo caso, por suportar minhas rabugices e frustrações,
deixando de lado o que ela considerava obstáculos menores, dando-me
apoio e ânimo, eu lhe agradeço.
Amsterdã, Holanda
junho de 1978 Fred N. Kerlinger
XV
1, A natureza da ciência e da pesquisa científica
Como “conhecemos” o mundo? Como conseguimos entender as

pessoas e o que elas fazem? Podemos ler a respeito do mundo e das
pessoas e aprender muita coisa. Por exemplo, o conhecimento das pes
soas, de seus motivos e comportamento, pode ser tirado de poemas,
novelas e textos de psicologia. Para investigar mais profundamente os
sentimentos e motivação das pessoas, podemos ler Freud e Dostoievsky.
Outra maneira de nos informarmos a respeito do mundo é ouvir os
outros. Pais e professores descrevem o mundo para as crianças. Políticos,
jornalistas e professores estão constantemente nos dizendo o que eles
acham que deveriamos saber. Tal conhecimento é derivado da autori
dade; alguma fonte que aceitamos como digna de crédito nos dá esse
conhecimento.
Outro caminho importante para o conhecimento é a observa
ção. Observamos o mundo e outras pessoas durante toda a nossa
vida. Usamos nossos sentidos para receber e interpretar as informa
ções que recebemos de fora. Vejo um carro vindo em minha direção
à grande velocidade. Fujo dele. Observei o carro em velocidade, inferi
perigo e agi. A observação é então, obviamente, uma importante fonte
de conhecimento.
Infelizmente, a observação comum e a autoridade nem sempre são
guias de toda confiança. Populações inteiras de indivíduos lêem, ouvem
e acreditam no que dizem os demagogos. Há muito se sabe que a maioria
das pessoas são más observadoras até dos fenômenos mais simples. Por
exemplo, duas pessoas observam uma terceira fazer gestos; pergunte-lhes
o que o indivíduo fez. Se ambas concordarem em sua observação, será
Incrível. Se concordarem na interpretação do que o indivíduo fez, mais
incrível ainda. Uma das dificuldades é que nenhum acontecimento é tão
simples assim. Outra é que os observadores interagem com e afetam o
que observam. Assim, a observação é um processo ativo que raramente
é simples.
A ciência se desenvolveu, em parte, pela necessidade de um método
de conhecimento e compreensão mais seguro e digno de confiança do
que os métodos relativamente desprovidos de controle geralmente usados.
Foi preciso inventar uma abordagem do conhecimento, apta a permitir
1
informação válida e fidedigna sobre fenômenos complexos, inclusive o
complexo fenômeno do próprio homem. Era preciso superar explicações
absolutistas, metafísicas e mitológicas de fenômenos naturais — ou pelo
menos suplementá-las — com uma abordagem até certo ponto exterior
ao homem O sucesso da ciência como abordagem do conhecimento e
compreensão de fenômenos naturais tem sido notável. Mas a compreen
são da ciência e da abordagem usada pelos cientistas tem sido conside
ravelmente menos notável. Pode-se dizer que a ciência é seriamente
mal compreendida.
O objetivo básico deste livro é ajudar o leitor a compreender a
abordagem, o pensamento e os métodos da ciência e da pesquisa cien
tífica. Seu foco especial se dirigirá para a pesquisa em psicologia, socio-
> logia é educação. A abordagem geral é a mesma, ou pelo menos basica
mente semelhante, em todas as ciências. Estudaremos esta abordagem
'* muito cuidadosamente. Entretanto, há dificuldades e problemas especiais
na ciência e pesquisa comportamentais que precisamos conhecer se qui
sermos entender tal pesquisa.1 Em outras palavras ,a abordagem geral do
conhecimento e compreensão da física e da psicologia é a mesma, mas os
detalhes da teoria e investigação são muito diferentes. Por exemplo, a
complexidade e a ambigüidade do comportamento humano, geralmente
considerado como mais complexo e ambíguo do que os objetos do mundo
físico, criam grandes problemas de observação e inferência válidas e
fidedignas. Medir aspectos do comportamento humano — agressividade,
preconceito, preferências políticas e realização escolar, por exemplo —
é geralmente mais difícil do que medir as propriedades dos corpos
físicos.
E grande a necessidade de compreender a ciência e a abordagem
científica. Esta necessidade é grande principalmente na psicologia, socio
logia e educação, dada a urgência dos problemas humanos e sociais que
os pesquisadores estudam, e dada a natureza controvertida de alguns
dos problemas e métodos das ciências comportamentais. Este livro se
concentra nesta necessidade.
1 As ciências comportamentais são as que estudam e procuram entender o homem,

as instituições humanas, ações e comportamentos humanos: sociologia, psicologia,
antropologia, economia, ciência política. O termo “ciências sociais” é também
usado, mas “ciências comportamentais" parece um termo mais geral, mais abran
gente. Esta definição é correta apenas no plano geral.-Embora as disciplinas com
portamentais possam ser claramente definidas, muitas vezes as distinções entre
elas são atenuadas na teoria e na pesquisa reais. Sociólogos e psicólogos, por
exemplo, frequentemente penetram uns no campo dos outros. Além disso, outros
cientistas comportamentais, apesar da definição da pesquisa comportamental,
estudam animais, às vezes com grande impacto no conhecimento científico do
comportamento.
2
Natureza geral da ciência
A ciência é um empreendimento preqcupado-exclusiyamente,com

o conRecimSnõTe a .compreensão .de. fenômenos .naturais. Os cientistas
desejam conhecer e compreender as coisas. Eles querem poder dizer:
se fizermos isto aqui, acontecerá aquilo ali. Se frustrarmos as crianças,
provavelmente elas agredirão outras, seus pais, seus professores e até
a si próprias. Se observarmos uma organização com regras relativamente
rígidas a restringir seus membros, digamos, os professores de uma escola,
poderemos esperar encontrar considerável insatisfação entre eles.
QlJ^BtÍg|asJ então,_guerêm._‘lconhj:cêr.”--O.S-.f.ejiQmenos. Eles querem
saber, entre outras coisas, o que produz o comportamento agressivo em
crianças e adultos. Querem saber se a frustração conduz à agressão.
Querem saber os efeitos dos meios restritivos ou permissivos de admi
nistração sobre os membros de uma organização. Em resumo, querem
“ampre&ndeu!i--de-.-que__jn.ari£Íra---se_.EelacÍQnam..,os-.fenômenos psir.nló- r
gicos, sociológicos e educacionais.
Dois exemplos de pesquisa
Para termos algo específico com que trabalhar, examinemos dois

estudos. Um é um experimento, o outro não é. Por enquanto, vamos
considerar experimento um estudo no qual se fazem coisas diferentes
com grupos diferentes de sujeito — pombos, ratos, crianças, adultos —
para ver se o que se faz com eles produz efeitos diferentes nos diferentes
grupos. Por exemplo, um pesquisador educacional pode pedir a professo-
- res que escrevam notas elogiosas nos testes de um grupo de alunos e nada
nos testes de outro grupo de alunos. (Ver Page, 1958).2 Então, o pesqui
sador vê como esta “manipulação”, como é chamada, afeta o desempenho
dos dois grupos em testes subseqüentes.
Por outro lado, em um estudo não-experimental, não há “manipu
lação”, não há tentativa deliberada e controlada de produzir efeitos
diferentes através de diferentes manipulações. As relações entre fenô
menos são estudadas sem intervenção experimental. As características
dos sujeitos, “como eles são”, são observadas e as relações entre as
características avaliadas sem tentar mudar nada. Por exemplo, quando
os sociólogos estudam a relação entre classe social e realização escolar,
eles tomam a classe social e a realização escolar “como eles são”. Medem
as duas “variáveis”, como são chamadas, e então estudam as relações
entre elas. Não procuram mudar uma das variáveis para estudar o efeito
2 As referencias citadas desta maneira são dadas no fim do livro.
3
da mudança sobre a outra variável. Estas idéias devem ficar claras depois
de lermos a discussão dos dois estudos que vêm a seguir.
Um experimento: recompensa maciça e aproveitamento na leitura
Muitas pesquisas vêm se devotando a entender como o homem e os

animais aprendem. Uma das descobertas mais bem documentadas é que
a recompensa aumenta a aprendizagem. Se as respostas forem recom
pensadas de alguma forma, as mesmas respostas, ou respostas seme
lhantes, serão repetidas quando ocorrerem condições semelhantes nova
mente. Se, por exemplo, a criança é elogiada quando pronuncia uma
palavra corretamente, a pronúncia correta tenderá a ser lembrada e
usada subseqüentemente. (Os resultados não são tão previsíveis quando
se usa punição.) A teoria por detrás da pesquisa, chamada teoria do
reforçamento, está sendo aplicada agora na educação, às vezes com resul
tados gratificantes.3
Clark e Walberg (1968) desejavam saber se a recompensa maciça
ajudaria a dar melhores resultados na leitura entre alunos potencialmente
reprovados. Criaram um experimento simples para testar esta idéia. Usa
ram crianças negras de 10 a 13 anos e com um atraso de vida escolar de
um a quatro anos.
Dois grupos foram formados de tal maneira4 que se podería admi
tir serem aproximadamente iguais em características que pudessem afetar
o resultado. Sabe-se, por exemplo, que a inteligência afeta o trabalho
escolar, como leitura e aritmética. Os pesquisadores devem, portanto,
tentar formar grupos iguais em inteligência antes de começar o estudo.
Do contrário, o resultado pode ser devido não ao que for feito no
experimento, mas ao fato de um grupo ter em média um nível de
3 Sc o leitor acha que o princípio do reforçamento positivo é óbvio, deve levar

em consideração que ele não era usado em escolas de outras épocas, exceto,
naturalmente, por professores muito compreensivos. Antes, a punição era eviden
temente o princípio fundamental. Esperava-se que as crianças tivessem uma con
duta correta e que estudassem, e eram punidas se não o faziam. Sem dúvida,
o castigo ou reforçamento negativo é ainda um método amplamente usado na
motivação escolar.
4 Reuniram as crianças, em dois grupos “ao acaso”. Uma das maneiras de fazer
isso é atirando uma moeda para cada criança. Se der cara, coloque a criança
em úm grupo. Se der coroa, coloque a criança em outro. O princípio é que o
acaso governa a formação dos grupos, e nada mais. Há vários outros métodos,
por exemplo,, tabelas de números equiprováveis. Todos os métodos são inspirados
pelo mesmo princípio. O objetivo básico da divisão ao acaso é “igualar” os grupos
experimentais. Desde que Clark e Walberg usaram a escolha ao acaso, podiam
admitir que os grupos eram iguais antes do experimento. Discutiremos essa
questão do acaso num capítulo posterior.
4
Inteligência superior ao do outro. No tipo de pesquisa em que se usam
dois grupos e um tratamento especial é aplicado a um deles, este grupo
é íreqüentemente chamado “grupo experimental”. O outro, ao qual não
se faz nada em especial, chama-se “grupo de controle”.
No início do experimento, todos os alunos foram elogiados por seu
trabalho. Isto foi usado para estabelecer médias de recompensa para
os professores das crianças. (Naturalmente os professores diferem quanto
à recompensa que usam.) Depois de seis sessões, as médias de recom
pensa ficaram estabilizadas e o experimento propriamente dito começou.
Os professores do grupo experimental, das crianças a receberem trata
mento èspecial ou experimental, foram avisados para dobrarem ou tripli
carem a recompensa, enquanto os professores do grupo de controle
foram avisados para “manterem o trabalho em ordem”. No fim de um
período de três semanas foi feito um teste de leitura com as crianças.
A análise dos resultados dos testes mostrou que o grupo experi
mental ou da “recompensa maciça” fez o teste melhor do que o grupo
de controle. Esta conclusão foi inferida de um teste estatístico da dife
rença entre a média de pontos de leitura entre os dois grupos: a média
do grupo experimental foi maior do que a média do grupo de controle.
Mais tarde explicaremos o princípio que rege tais testes estatísticos.
Por enquanto, pode-se dizer que a recompensa maciça teve resultados
aumentando a contagem de pontos do grupo experimental em compa
ração com o número de pontos feitos pelo grupo de controle. Se se
pode dizer que recompensas maciças funcionam com crianças negras
carentes e que possam ou devam ser usadas com elas, dependerá de
outras pesquisas, destinadas a averiguar se os mesmos resultados são
obtidos repetidamente — isso se chama replicação — e testando o
reforçamento em geral com diferentes tipos de crianças. Em outras
palavras, os resultados de um estudo são sugestivos, embora não conclu
sivos. Talvez as crianças negras carentes necessitem de reforço maciço
— mas talvez não.
2. Um estudo não-experimental: classes sociais e tipos de criação
Vamos examinar agora um estudo não-experimental. Sabemos que

em tal estudo não há manipulação experimental; não há tratamento
diferencial de grupos de sujeitos. Tomamos pessoas e grupos “como eles
são” e estudamos as supostas influências das variáveis em outras variá
veis, as relações entre variáveis. (“Variável” é definida no capítulo 2.
Por ora, é o tempo usado para significar um conceito psicológico ou
sociológico no qual pessoas ou coisas diferem ou variam, por exemplo,
sexo, classe social, habilidade verbal, realização.) Uma “ relação" em
ciência sempre significa uma relação entre variáveis. Quando dizemos
5
que as variáveis A e B estão relacionadas, queremos dizer que existe
algo em comum entre as duas variáveis, alguma ligação entre elas.
Suponhamos que os dois círculos da figura 1.1 representem essências
do que sejam A e B. Isto é, A representa a essência do que seja a va
riável A. É a substância de A. O círculo B, naturalmente, representa a
essência de B. Observe que os círculos A e B se sobrepõem e que a
superposição é indicada por traços horizontais. Isso indica que algo das
essências de A e B é compartilhado. Uma parte de A é igual a uma
parte de B e vice-versa. Esta faixa compartilhada, indicada pela área
de traços finos, representa a relação entre A e B. A pode ser inteligência
e B aproveitamento escolar. A superposição na figura 1.1 é a relação
entre as duas. O que é esta propriedade dividida? É difícil dizer sem
outras evidências. Pode ser aptidão ou habilidade verbal; pode ser o
que se denominou inteligência geral. Mas voltemos ao nosso exemplo.
Os psicólogos e sociólogos fizeram grande número de pesquisas
sobre classes sociais e descobriram sua importância para a explicação de
diferentes tipos de comportamento: recreação, eleições e criação dos
filhos, por exemplo, são fenômenos associados às classes sociais. Miller
e Swanson (1960) levantaram a hipótese, entre outras coisas, de uma
relação entre a classe social dos pais e o tempo que levavam para
desmamar os filhos. Foi perguntado a uma amostra de 103 mães da
classe média e da classe trabalhadora de uma grande cidade do
meio-oeste como estavam criando seus filhos. O resultado de uma per
gunta sobre o tempo do desmame é apresentado na tabela 1.1. Os
números nas casas representam a quantidade de mães que eram da classe
média ou da classe trabalhadora e que haviam desmamado os filhos
mais cedo ou mais tarde.
O estudo dos números nas diferentes casas da tabela indica que as
mães da classe média parecem desmamar os filhos mais cedo do que
as mães da classe trabalhadora. Das 55 mães de classe média, 33 des
mamavam cedo enquanto 22 desmamavam tarde; das 48 mães da classe
Figura L I
6
Tabela 1.1 Classe social e tempo de desmame, estudo de Miller e Swanson (1960). *
Classe social Desmame
Cedo Tarde
Classe média 33 22
(0,60) (0,40) 55
Classe trabalhadora 17 31
(0,35) (0,65) 48
50 53 103
As entradas nas casas são frequências: número de mães. As cifras entre parên
teses são proporções, por exemplo, 33/55 = 0,60. Se as proporções forem multi
plicadas por 100, obtêm-se as porcentagens: (33/55) (100) = (0,60) (100) = 60
por cento, ou 60 por cento das mães da classe média disseram que desmamaram
seus mhos cedo.
trabalhadora, 17 desmamavam cedo e 31 desmamavam tarde.5 Há, apa

rentemente, uma relaçao, embora não muito forte, entre a classe social
e o tempo do desmame. As mães da classe média desmamavam seus
filhos mais cedo; as mães da classe trabalhadora desmamavam mais
tarde. Se se calcularem as proporções e porcentagens, o que acabou de
ser dito torna-se um pouco mais claro: 33/55 = 0,60, 22/55 = 0,40,
17/48 = 0,35, 31/48 = 0,65 (multiplicando cada um destes por 100
obtém-se a porcentagem). Essas proporções estão na tabela, no canto
inferior direito das casas. Observe que eles exprimem mais claramente
a relação sob discussão do que as freqüências (os números originais).
Podemos dizer que há uma tendência entre as mães da classe média
a desmamar seus filhos mais cedo e entre as mães da classe trabalha
dora, mais tarde. Sempre que pudermos fazer uma afirmação “se-então”,
temos uma relação. Neste caso, podemos dizer, embora cautelosamente:
se mãe classe média, então desmame mais cedo e se mãe classe traba
lhadora, então desmame mais tarde. Naturalmente não se pode dizer
que esta tendência se apresenta entre todas as mães classe média e mães
classe trabalhadora. Esta é apenas'uma amostra e a tendência pode ou
? se preocupe muito se não conseguir entender completamente como se deve

ler. e enteder esta e. outras tabelas. As tabelas estão sendo usadas apenas com o
objetivo de ilustrar. O entendimento maior virá mais tarde.
7
não estar presente entre todas as mães. É necessário mais pesquisa para
reforçar a afirmação e a certeza que se pode ter quanto à sua “verdade” .
Estes dois estudos têm um bom número de aspectos que são caracte
rísticos da pesquisa comportamental. Primeiro, um é um estudo experi
mental, o outro não-experimental. Segundo, eles ilustram a objetividade,
uma característica da pesquisa científica que logo examinaremos. Ter
ceiro, seu uso de análise quantitativa elementar irá nos ajudar a apro
fundar mais na análise e estatística. Por exemplo, no estudo de Clark
e Walberg, foram calculadas e comparadas as médias e no estudo de
Miller e Swanson, foram tabuladas e comparadas as freqüências. Estes
são dois dos modos mais comuns de se fazer análise quantitativa. Quarto,
os problemas, relações e metodologia de ambos os estudos são simples
e claros; serão úteis para ilustrar colocações a serem feitas em discussões
subseqüentes.
Mais pertinentes ao tema principal deste capítulo é o que os estudos
tentaram fazer, quais foram seus objetivos. Um dos objetivos do estudo
de Clark e Walberg foi compreender e explicar o aproveitamento, ou
antes, um certo aspecto do aproveitamento, o chamado subaproveita-
mento. Um dos objetivos do estudo de Miller e Swanson foi explicar o
desmame, que é, naturalmente, um aspecto do trabalho de cuidar de uma
criança. As palavras “compreender” e “explicar” devem ser interpretadas
num sentido amplo. Quando dizemos que “compreendemos” um fenô
meno, queremos dizer que conhecemos suas características — pelo
menos algumas — o que o produz e quais as suas relações com outros
fenômenos. Queremos dizer que tentamos “explicar” o fenômeno. Po
demos dizer o que provavelmente o tenha causado, o que o influencia
agora, o que o influenciará e no que ele influencia. É importante obser
var aqui que nossa compreensão de um fenômeno é sempre incompleta,
parcial e probabilística. Sem dúvida, muito do nosso conhecimento do
mundo, especialmente do fenômeno social e humano, é parcial e
até falho.
A realização é um fenômeno importante no mundo ocidental.
Quando dizemos que procuramos “compreendê-lo” , em parte queremos
dizer que desejamos saber por que certas pessoas conseguem grandes
coisas, enquanto outras conseguem muito pouco. Ou, mais ambiciosa
mente, queremos saber por que certos grupos conseguem tanto e outros
tão pouco. Por exemplo, McClelland (1961), num livro estimulante,
The Achieving Society, relatou uma pesquisa voltada para uma questão
geral: Como e por que as pessoas de diferentes países diferem em sua
motivação para a realização? É possível se estender muito discutindo
um conceito tão rico quanto o de realização. O núcleo da idéia de com
preensão e explicação, entretanto, é que explicamos um fenômeno espe
cificando o que está relacionado a ele.
8
Clark e Walberg se interessaram por explicar um aspecto relativa
mente limitado da realização. Eles desejavam explicar e compreender a
realização em leitura, de crianças negras que eram geralmente defi
cientes, na realização escolar. Queriam saber se o reforçamento maciço
da realização iria afetá-la positivamente. Estudaram, então, a relação
entre o reforçamento e a realização em leitura. Conseguiram mostrar
que o reforçamento maciço afetava positivamente a realização das
crianças em leitura. Eles, até certo ponto, “ explicaram” a realização por
que mostraram uma coisa que á afetou.6
O fenômeno “explicado” por Miller e Swanson foi o desmame, ou,
talvez mais exatamente, a técnica de cuidar de crianças, que inclui entre
outras coisas métodos disciplinares, tipos de recompensas usadas e mé
todos para induzir à obediência. Eles mostraram, por exemplo, que mães
da classe média e da classe operária diferem nas suas práticas de des
mame. Assim estabeleceram uma relação, por um lado, entre classes
sociais e por outro, no método de desmame. Mostraram que algumas
diferenças observadas no desmame eram devidas à classe social, em
outras palavras. Assim, até certo ponto, eles “explicaram” as diferenças
nas práticas de desmame.
Vamos interromper nossa discussão a respeito das metas e propó
sitos científicos para discutirmos duas características importantíssimas
da ciência. A primeira, objetividade, é uma característica metodológica
controvertida e difícil de entender. A segunda é a natureza empírica da
ciência. Após discutirmos estas características, estaremos em melhor
posição para continuar a discussão principal. Pode ser dito clara e
categoricamente que sem o “método” ou “critério” de objetividade, ou
sem a abordagem e a atitude empírica, a ciência como é conhecida no
mundo moderno não seria possível. O que significa esta afirmativa? E o
que ela tem a ver com a natureza da pesquisa científica?
Objetividade e pesquisa científica
Embora fácil de definir, a objetividade não é fácil de ser com

preendida por causa de sua sutileza e de suas implicações complexas.
É um aspecto metodológico muito importante da ciência, especialmente
da psicologia, porque sua implementação possibilita aos cientistas testa
rem suas idéias fora de si próprios. Eles montam seus experimentos
“lá fora”. Os experimentos acontecem, por assim dizer, fora deles, de
6 Eles esclareceram um pouco mais outro fenômeno importante, o reforçamento.

Parece que mostraram que, com algumas crianças, quantidades comuns de elogio
e encorajamento não são suficientes; tais crianças evidentemente exigem grandes
quantidades de ambos — pelo menos no que diz respeito à realização em leitura.
9
sua influência e predileções. Em vez de estarem em suas cabeças, as
idéias testadas são objetivadas, feitas objetos “do lado de fora”, objetos
que têm uma existência, por assim dizer, separada de seus inventores.
Qualquer um pode observar um experimento e como ele é feito; ê coisa
pública.
Todo conhecimento do mundo é afetado, e até distorcido de certa
forma, pelas predisposições dos observadores. Quanto mais complexas
as observações, mais se afastam da realidade física, e quanto maiores
as inferências feitas, maiores as probabilidades de distorção. Quando o
cientista físico lida com pesos, por exemplo, há uma baixa probabilidaue
de distorção: existem pequenas oportunidades para pontos de v ist:
pessoais, inclinações e prenoções entrarem no processo. Mas considerem
se as possibilidades de distorção no estudo e mensuraçâo de autoritaris
mo, dogmatismo, inteligência, nível de aspiração, realização, classe social,
ansiedade e criatividade.
Tomemos apenas uma destas variáveis, a criatividade. Embora
concordemos que vamos estudar e medir a criatividade, podemos ter
idéias muito diferentes do que seja a criatividade. Essas idéias diferentes,
estas percepções diferentes, podem influenciar nossas observações de,
digamos, criatividade em crianças. Um ato comportamental que para
um indica criatividade pode não indicar criatividade para outro e essas
diferenças em percepção podem afetar nossa mensuraçâo. Em outras
palavras, as verdadeiras observações do comportamento criativo podem
ser, muito diferentes, dependendo de quem observa, a não ser que se
concorde em adotar um método de observação — e se ater rigidamente
a ele.
Objetividade é um acordo entre juizes “especialistas” relativo ao
que é observado, ou o que deve ser ou o que foi feito em pesquisa.
Suponhamos que um cientista observe alguma coisa e anote essa obser
vação, digamos, em forma numérica. Outro, de igual competência,
observa a mesma coisa, independentemente, e registra sua observação.
Se o processo puder ser repetido com resultado idêntico ou parecido
— isto é, se há acordo entre as observações dos cientistas — consegue-se
objetividade. Em algumas áreas da ciência, como na química e física,
por exemplo, a objetividade não é problema sério, graças aos instru
mentos de alta precisão, como os microscópios eletrônicos. Tais instru
mentos aumentam a probabilidade de acordo entre os juizes, porque, ao
usá-los, juizes diferentes provavelmente obterão e anotarão os mesmos
resultados. Além disso, a máquina tem menos possibilidade de influen
ciar observações e de ser influenciada pela natureza do que estiver
sendo observado.
A definição de objetividade como acordo entre juizes não deve
ser interpretada com estreiteza: é bastante ampla. O que significa isto?
10
A condição principal para satisfazer o critério de objetividade é, ideal
mente, que quaisquer observadores com um mínimo de competência
concordem em seus resultados. Em psicologia e educação, por exemplo,
usam-se testes e escalas objetivas. São chamados "objetivos” porque
qualquer pessoa, devidamente orientada, pode avaliá-los e obter os mes
mos resultados (com pequena margem de erro). A expressão “testes
objetivos” não significa que os testes sejam em si mesmos “objetivos”.
Eles o são porque a contagem de pontos é a mesma, não impor
tando quem os avalie. Por outro lado, a correção de respostas em
redações depende muito mais do julgamento pessoal do juiz, enquanto
tais julgamentos são virtualmente excluídos em testes objetivos. (Deve
ser notado, entretanto, que a avaliação de redações pode ser feita de
maneira muito mais objetiva do que geralmente se faz.)
Mudemos um pouco a perspectiva. No estudo Clark e Walberg a
mensuração do aproveitamento em leitura foi mais objetiva do que a
mensuração de tempo de desmame no estudo de Miller e Swanson por
que o primeiro foi medido com um teste de tipo objetivo, enquanto o
segundo foi medido através de entrevistas. Qualquer um que avaliasse o
teste de leitura obteria os mesmos resultados. Mas dois entrevistadores
poderíam mostrar diferenças na mensuração de tempo de desmame, no
caso por dois motivos. O primeiro acaba de ser dado: juizes diferentes
podem interpretar as respostas do entrevistado diferentemente. Uma mãe
pode dizer que desmamou seu filho quando a criança tinha entre 7 e 9
meses. Um entrevistador pode se satisfazer com esta resposta e anotá-la,
mas outro pode querer se aprofundar mais "e acabar descobrindo que
a mãe desmamou o filho aos seis meses. O segundo motivo se deve à
falta de memória da mãe: ela pode simplesmente não se lembrar quando
desmamou o filho e dizer que foi aos dez meses, quando de fato foi
aos oito. Não existe tal ambigüidade com mensuração de tipo objetivo
(embora não esteja isenta de outros tipos de dificuldades). Um teste de
leitura de tipo objetivo, por exemplo, tem regras explícitas para a ava
liação das respostas. A resposta a qualquer pergunta só pode ser ou cor
reta ou incorreta: há pouca margem para a iniciativa ou o julgamento
do avaliador.
A importância da objetividade exige mais explicação ainda. Embora
seja aplicada geralmente a observações e mensuração científicas, a idéia
é mais ampla. Quando os psicólogos fazem experimentos, lutam por
objetividade. Isso significa que fazem sua pesquisa controlando de tal
modo a situação experimental e descrevendo de tal modo o que fazem
que outros psicólogos poderão repetir ó experimento e obter resultados
iguais ou semelhantes. Em outras palavras, a objetividade ajuda o pes
quisador a “ sair” de si mesmo, ajuda-o a conseguir condições publica
mente replicáveis e, conseqüentemente, descobertas publicamente averi-
11
guáveis. A ciência é um empreendimento social e público, como tantos ^
outros empreendimentos humanos, mas uma regra importantíssima do
empreendimento científico é que todos os procedimentos sejam objetivos
— feitos de tal forma que haja ou possa haver acordo entre juizes
especialistas. Esta regra dá à ciência uma natureza distinta, quase remota,
porque quanto maior a objetividade mais o procedimento se afasta das
características humanas — e de suas limitações. Por exemplo, a obje
tividade quase glacial de partes das ciências naturais, cujos experimentos
são feitos em laboratórios e em circunstâncias altamente controladas,
cujas observações são feitas quase inteiramente por máquinas de alta
precisão e fidedignidade, parece coisa muitíssimo distante de gente e de
suas preocupações sociais e pessoais. (Isto não significa que os cientistas
que pesquisam e controlam as máquinas sejam imunes a erros.)
Comparem-se agora os procedimentos em psicologia e educação. O
cientista físico pode “sair de si mesmo” mais facilmente do que o cien
tista comportamental, porque é mais fácil para ele preparar uma pesquisa
e testar hipóteses “fora” e longe de suas próprias predileções e inclina
ções e de outros. Isto acontece porque os procedimentos são mais fáceis
de ser “objetivados”. Uma vez que o funcionamento de um processo
físico fique compreendido, pode ser repetido e medido pela maioria de
técnicos e cientistas competentes. Em outras palavras, há uma replica-
bilidade relativamente alta.
Em pesquisa sociológica, psicológica e educacional, entretanto, isto
é verdadeiro em grau muito menor. A manipulação de variáveis psicoló
gicas, como a coesão de grupo, a atmosfera em sala de aula, estilos de
liderança e ansiedade, é muito mais difícil de ser feita objetivamente
por causa da maior complexidade, amplitude de variação e acessibili
dade a influências outras que as do pesquisador. Igualmente, a mensu-
ração de variáveis comportamentais, tais como inteligência, realização,
atitudes, classe social e motivação é mais sujeita a influências sistemá
ticas e casuais, tornando mais difícil — embora não impossível, como
pretendem alguns críticos — vários observadores concordarem em suas
observações e mensurações. Isto não significa, entretanto, que os proce
dimentos do psicólogo não sejam objetivos. Na verdade, eles freqüente-
mente podem possuir um nível de objetividade relativamente alto. Eles
são simplesmente menos objetivos do que os do cientista físico.
Não há qualquer diferença de princípio, por outro lado, entre o
uso do critério de objetividade pelo cientista físico e pelo cientista com
portamental. A única diferença está no grau de objetividade. Já foi dito
que as ciências comportamentais não podem ser verdadeiramente cientí
ficas porque não podem usar os métodos das ciências físicas. Isto não
é assim, a não ser num sentido puramente literal. Em todas as ciências
são usados a mesma abordagem e os mesmos métodos gerais. Assim está
12
longe de ser impossível chegar-se à objetividade nas ciências comporta-
mentais; isto já foi conseguido com sucesso, muitas vezes. É apenas
mais difícil.
Objetividade e explicação
À medida que avançarmos veremos que a objetividade, tanto ex

pressa quanto implicitamente, estará presente em toda a nossa discussão
e estudo. É preciso que assim seja. Sem objetividade a ciência e_a
pesquisa científica perdem seu caráter único e especial. Sem dúvida,
nãõTTaveria IcSnciã sém objetividade, como já ficou dito. Deve-se acres
centar, entretanto, que objetividade em e por si própria tem pouca
importância. Isto é, o objetivo básiccTHã ciência é a explicação de fenô
menos naturais; não- ê~ simpTêsmente ser objetiva. Objetividade é im
portante porque pode auxiliar a fornecer explicações mais exatas dos
fenômenos riãtüraís. Ser apenas objetivo não significá ser científico. Um
procedimento pode ser altamente objetivo e conter observações engano
sas e conclusões falsas. Um pesquisador pode, por exemplo, fazer um
estudo que seja um modelo de objetividade mas cujos resultados sejam
enganosos. Pode haver testado o que julgou ser a influência de A sobre B
e obtido resultados que parecem mostrar qué A, sem dúvida, influenciou
B. Ele não percebe outra influência; K foi a “verdadeira” causa da
mudança em B. Sua manipulação de A ativou K, que produziu a mu
dança observada em B. Isto é mostrado na figura 1.2. A seta interrom
pida mostra a influência de A sobre B, que' o pesquisador estava estu
dando; ele pensou que A tivesse influenciado B. A seta contínua indica
a verdadeira influência: A ativou K, que influenciou B.
Objetividade, além disso, não significa importância. Uma pessoa
pode ser muitíssimo objetiva com problemas mais triviais do que com
problemas mais importantes. Podemos, por exemplo, estudar a relação
entre o número de carteiras nas classes e o aproveitamento verbal das
crianças. Tanto o número de carteiras quanto o aproveitamento verbal
podem ser medidos com um alto grau de objetividade. Mas e daí? A
Figura 1.2
13
objetividade, entretanto, é uma característica indispensável e inseparável
da ciência e da pesquisa científica.
Objetividade como característica e como procedimento
Antes de deixarmos o assunto objetividade, tentaremos esclarecer

e corrigir uma importante concepção errônea. Muitas pessoas, mesmo
alguns cientistas comportamentais, pensam que objetividade refere-se a
uma qualidade ou característica de pessoas. Embora provavelmente, seja
verdade que os indivíduos diferem em grau de objetividade — consi
derando objetividade como um traço que o indivíduo possua — isto
tem pouco ou nada a ver com objetividade em ciência. Objetividade em
ciência-é. aim,-prQcedimento, um método, uma maneira de dirigir um
assunto científico. Não quer dizer "quê pessoalmente os cientistas sejam
mais objetivos que outras pessoas, embora muitos deles possam sê-lo.
Esta concepção errônea infelizmente cria confusão. Certos críticos
da ciência dirigem sua crítica principal à objetividade, dizendo, por
exemplo, que a distância e a frieza da ciência destroem valores humanos
e assim a ciência é fundamentalmente prejudicial. Esta distância e frieza,
dizem, levam à desumanização do cientista e das pessoas afetadas pela
ciência — todos nós. Os cientistas são até descritos como monstros,
ainda mais perigosos porque aparecem envoltos em um manto de virtude.
O argumento é totalmente sem sentido. É verdade — não à ma
neira romântica dos críticos, porém — que a ciência é distante e talvez
fria. Isto deriva de sua, meta -de -abst-r-ação e.d eseu ctitém _àe objetivi
dade. Leis gerais, enunciados gerais de relações são necessariamente
abstratos porque têm que se aplicar a muitos casos específicos. A lei
científica ideal é uma equação matemática, não porque os cientistas
amem símbolos misteriosos e esotéricos e a matemática (alguns, sim,
claro), mas porque a equação matemática é altamente abstrata e geral.
Se válida empiricamente, ela pode explicar muitas manifestações dife
rentes da lei ou enunciado de relação. “A frustração leva à agressão”
é um amplo enunciado geral de relação. Tem valor porque abrange
muitas, senão todas as manifestações de frustração e agressão. 7 É tam
bém distante e talvez mesmo um pouco frio comparado à descrição de
um menino ou menina agressivos feita por um professor ou um
terapeuta.
7 Tais enunciados não podem ser gerais demais porque, se forem, não podem ser
refutados. Como veremos mais tarde, os enunciados científicos têm que ser pas
síveis de serem submetidos a teste e acessíveis a serem mostrados como falsos
se realmente o forem.
14
A abstração, parte do poder da ciência, está sempre distante das
preocupações cotxiuns e do calor do relacionamento humano. Isto por
dffTnlrao; é parte dãTnatureza da ciência. Sem tal abstração, não há
ciência. O' mesmo quanto a objetividade, que também tende a fazer a
fiiinciã parecer fria e distante. Parece distante e fria porque os testes
das proposições científicas são feitos “la fora ’, o mais longe possível
das pessoas e suas emoções, desejos, valores e atitudes, incluindo os do
próprio cientista. Mas é isto precisamente o que deve ser feito. Deve-se
obedecer ao cânone da objetividade — ou abandonar a ciência.
O caráter empírico da ciência
O caráter empírico da ciência é muito mais facil de compreender

do que a objetividade, talvez porque esteja associado ao que se tornou
quase um estereótipo do cientista: um esmiuçador de fatos vestido de
branco. É verdade que a maioria dos cientistas vive preocupada com
“fatos”, mas devemos substituir idéias estereotipadas pela compreensão
das razões da preocupação com a evidência fatual. Por esta altura o
leitor já terá percebido que o ponto de vista deste livro é fortemente
influenciado pelo cuidado e preocupação com, juteoria-e explicação. Os
não-cientistas podem dizer que também eles estão muito preocupados
com teorias e explicações. E assim é. O filosofo, por exemplo, procura
explicar como sabemos das coisas. O historiador deseja explicar a ori
gem de movimentos e fatos históricos, por exemplo, as causas e conse-
qiiências da Guerra Civil ou da Revolução • Russa. O ^ónco^polltiço
procura explicação para movimentos políticos, como a influência do
pensamento conservador sobre os atos .de partidos ou figuras políticas.
A explicação, como explicação, nãão é, pois, prerrogativa única da
ciência. Nem a ê n f is T tie n tí^ ^ uma obsessão
exclusiva. Historiadores e teóricos políticos, entre outros, invocam a
evidência para apoiar suas explicações de fenômenos históricos e polí
ticos. Então, qual é a diferença? Por que a ciência é peculiar? Grande
parte deste livro é dedicada a responder a estas perguntas. Mas podemos
agora pelo menos começar a explicação.
A maior parte da ciência comportamental moderna e caracterizada
por uma forte atitude e abordagem empíricas. Infelizmente a palavra
"empírico” foi usada de duas formas com significados muito diferentes.
Em uma, “empírico” significa guiado pela experiência prática e_obser-
vação e não pela ciência. e_.pela teoria. Este é um ponto de vista pragmá-
fíco queTãfirma que “se funciona, está certo” . Os motivos não importam;
o que importa é que funcione. Este não é o significado de “empírico”
usado pelos cientistas (embora eles não deixem de ser pragmáticos).
P ara n dentista-lifemnírica?...s.ignific.a guiado pela evidência obtida em
15
pesquisa científica sistemática e- controlada. Aqui está um exemplo que \
nTSiTSjudãrá a compreender o que “empírico” significa para a ciência. \
Uma pesquisa científica foi feita para determinar se é possível
animais e seres humanos aprenderem a controlar reações do sistema
nervoso autônomo. Podem, por exemplo, diminuir as batidas cardíacas
ou aumentar a secreção da urina à vontade? (Miller, 1971, caps. 55, 56).
Tanto velhas quanto novas crenças dizem que isso não é possível. Então,
a generalização é: as pessoas não conseguem controlar reações gover
nadas pelo sistema nervoso autônomo. Acontece que a afirmação talvez
não seja verdadeira: descobriu-se que animais (e talvez pessoas) podem
ser treinados para fazerem coisas tais como aumentar e diminuir as
batidas cardíacas, aumentar e diminuit sua secreção urinária e até alterar
sua pressão sanguínea (Miller, 1971, Parte XI). Um enunciado empiri-
camente orientado seria: os animais podem, dentro de certos limites,
controlar reações do sistema nervoso autônomo, recebendo “instrução”
apropriada. Os animais podem ser ensinados a, por exemplo, aumentar
ou diminuir as batidas cardíacas e aumentar ou diminuir sua secreção
urinária. Não é fácil, mas já foi feito. São afirjnativas..empíricas, já que
estão baseadas em evidência científica.
Por ser empírica, não significa necessariamente que uma afirma
tiva seja verdadeira. Se baseada em pesquisa científica e evidência, é
mais provavelmente verdadeira do que uma afirmativa baseada intei
ramente em crenças. Entretanto, pode ainda não ser verdadeira. A
afirmativa acima, de que é possível aprender a controlar o sistema ner
voso autônomo até certo ponto, embora apoiada pela evidência da pes
quisa científica, pode acabar sendo refutada a longo prazo. Pode não
ser possível obter os mesmos resultados no próximo ou no ano seguinte,
ou na Austrália assim como na América. É possível que as descobertas
de pesquisa apoiando o enunciado fossem o resultado de alguma causa
temporária e não reconhecida, característica apenas da situação parti
cular em que foi feita a pesquisa. Não obstante, a probabilidade de uma
afirmativa baseada em evidência empírica ser verdadeira é maior do
que a probabilidade de uma afirmativa não-empírica ser verdadeira. Evi
dência empírica cuidadosamente obtida, como veremos, é um corretivo
saudável e necessário para as crendices do homem e um meio salutar
de diminuir sua ignorância. Evidência não-empírica, por outro lado,
pode e às vezes ajuda a perpetuar a ignorância, como fazem os velhos
provérbios. E, em resumo, a evidência empírica freqüentemente controla
nossa mania desenfreada de fazer afirmações sobre as coisas, afirmações
que podem ou não ser verdadeiras.
A palavra “empírica” então é importante porque mostra uma ma
neira de olhar o mundo e as pessoas profundamente diferente da
maneira tradicional, que procura explicações apelando para a autoridade,
16
senso comum, ou para a razão. O homem é basicamente egoísta? Po
demos citar a Bíblia, Freud ou Shakespeare; podemos dizer que é
auto-evidente ou óbvio que o homem é basicamente egoísta ou não-
egoísta; ou podemos raciocinar cuidadosamente na base da autoridade
e da observação e concluir que o homem é basicamente egoísta ou
não-egoísta. Esta é mais ou menos a maneira tradicional.
Os cientistas, entretanto, não estão satisfeitos com essa maneira.
Se acham que a questão é cientificamente respondível — muitas questões
não podem ser respondidas cientificamente — então eles abordam o
problema díferentemente. Embora possam apresentar uma explanação
teórica, sempre fica em suas cabeças uma pergunta a importunar: O
que dirá a evidência científica? Decidindo primeiro como definir e
medir o egoísmo, o cientista preparará um estudo ou uma série de
estudos para tentar determinar até onde o egoísmo motiva o comporta
mento humano e como isto é feito. Fará, então o estudo sob condições
controladas e, depois de analisar os resultados obtidos, chegará a con
clusões que parecerão saltar da evidência. A evidência, então, é o centro
de todo o processo. Sem ela as conclusões geralmente não têm valor
científico.
Alguns leitores podem ficar em dúvida quanto à importância desta
distinção entre abordagens empíricas e não-empíricas. Podem dizer que
é óbvio, até auto-evidente, que procuramos evidências para as afirma
tivas que fazemos. Pessoas racionais sempre farão isto. Mas a questão
é justamente esta: às vezes fazem, mas muitas vezes não. Nossos siste
mas de crenças — religiosas, políticas, econômicas, educacionais — são
sem dúvida poderosos e freqíientemente guiam nosso comportamento,
não a evidência. Parece que é muito difícil usar a evidência empírica
como hábito. Se não o fosse, muitos dos problemas sociais que enfren
tamos poderíam ser resolvidos, admitindo-se a existência de boa vontade
e motivação adequada. Para compreender a ciência e a pesquisa cientí
ficas, portanto, ê necessário um esforço contínuo e consciente, nada fácil,
porque a necessária atitude empírica exige no mínimo uma suspensão
temporária de poderosos sistemas de crenças. Em outras palavras, a
primeira e última corte de apelação da ciência é a evidência empírica.
O objetivo da ciência: teoria e explicação
O objetivo da ciência já foi determinado. Precisamos agora rea

firmar este objetivo formalmente e tentar dissipar certas noções equi
vocadas sobre suas metas. O propósito da-dência é ajeoria. Examine
mos esta afirmativa simples e um bocado controvertida. Uma teoria
é uma exposição sistemática das relações entre um conjunto de variá
veis. Ê uma explicação geralmente de um fenômeno particular, ainda
17
*
Figura 13
que amplo. Um psicólogo poderá propor uma teoria da liderança em

grupos e organizações ou, como Freud, uma teoria da motivação hu-
.mana, ou, como o influente sociólogo europeu, Weber, uma teoria para
esclarecer o capitalismo moderno ou, como o psicólogo suíço, Piaget,
uma teoria do conhecer humano. Tais teorias são tentativas sistemáticas
de “explicar”’ os vários fenômenos, postulando as relações entre os fe
nômenos a serem explicados e um certo número de “variáveis explica
tivas” que também estão relacionadas entre si de modo sistemático. O
propósito básico da ciência é chegar à teoria, inventar e descobrir expli
cações válidas de fenômenos naturais.
Para tirar um pouco do mistério da palavra, vamos examinar um
exemplo fictício de uma “pequena teoria”, cujo propósito é explicar a
realização escolar. Vamos relacionar quatro variáveis — inteligência,
situação econômica familiar, classe social e motivação para a realização
— com realização escolar de tal forma a “explicá-la” satisfatoriamente.
Para isso, vamos usar a idéia de influências diretas e indiretas. Os
estudantes universitários diferem muito quanto ao sucesso na faculdade
e queremos explicar essas diferenças. Por que alguns estudantes se saem
bem e outros nem tanto? Suponhamos que podemos medir todas as
variáveis satisfatoriamente. A “pequena teoria” é dada em forma de
diagrama na figura 1.3. 8
8 Este exemplo é parcialmente realista, parcialmente fictício. O leitor não deverá

tomá-lo como “teoria estabelecida”. Embora se saiba muito a respeito de reali
zação, em cursos superiores e em outros contextos, muita coisa ainda não ficou
compreendida. As teorias na ciência comportamental podem ser consideradas tenta
tivas de desbastar nossa ignorância. Neste sentido o exemplo não é artificial.
18
Na teoria, duas variáveis, inteligência e motivação para a realiza-
çfio, são influências diretas; acredita-se que ambas influenciem a reali
zação escolar sem passarem pelas outras variáveis. Estas influências
diretas são mostradas pela figura 1.3: as setas de inteligência e motiva
ção para a realização vão para realização na universidade. Acredita-se
que as outras duas variáveis, situação econômica familiar e classe social,
tenham influência indireta na realização escolar; elas “atravessam” a
motivação para a realização. Acredita-se, por exemplo, que em geral,
quanto mais afluente a família, maior a motivação para a realização.
Igualmente a classe social influencia a motivação para a realização: ra
pazes e moças da classe média têm maiores motivos para desejarem
progredir que os jovens das classes trabalhadoras. A inteligência, além
de sua influência direta na realização escolar — quanto maior a inteli
gência, maior a realização — tem influência indireta na realização esco- <
lar através da motivação para a realização: quanto maior a inteligência,
maior a motivação para a realização.
Temos então uma teoria da realização escolar, que pode ser boa /
ou má, dependendo de quão bem explique a realização escolar. É bas- c
tante testável. Todas as variáveis são suscetíveis de mensuração satisfa
tória (embora uma teoria não tenha necessariamente que ter apenas5'.
variáveis mensuráveis) e há técnicas analíticas que podem permitir testes^’
bastante claros das relações especificadas na teoria. -■-<
Outras finalidades da ciência, além da teoria e explicação, foram-
propostas. Não precisamos elaborar as mais técnicas destas, pois geral
mente já são dedutíveis da teoria como propósito. Há um alegado pro
pósito da ciência, entretanto, que dá muitos problemas e que confundiu
um bocado a compreensão clara da finalidade da ciência. Essa alegada
finalidade está contida em afirmações como as que se seguem, todas
elas estreitamente relacionadas: “A finalidade da ciência é ,melhorar o
destino do homem”; “A finalidade da psicologia e sociologia é ajudar
a melhorar a sociedade humana”; “A finalidade da pesquisa educacional
é melhorar a prática e o pensamento educacional”. Sem dúvida, os
sentimentos por detrás de tais afirmativas são fortes — e não é de se
admirar. Parece óbvio que a finalidade da ciência é melhorar o destino
do homem; parece tão auto-evidente!
A confusão, sem dúvida, surgiu porque os efeitos dos progressos
científicos muitas vezes aumentaram o bem-estar do homem — mas
também feriram o bem-estar humano — principalmente através de aper
feiçoamentos tecnológicos possibilitados por pesquisas e descobertas
científicas desinteressadas. Mas isto não significa que o propósito da
ciênica seja melhorar o bem-estar humano, assim como seu propósito
não é ajudar a promover guerras. Uma interpretação mais exata é que a
melhoria da vida .pode ser subproduto da ciência, um produto afortu
nado, embora não necessário das descobertas e do trabalho científico.
19
Há um parodoxo aqui. Parece óbvio que o propósito da ciência é
melhorar a humanidade. Entretanto, é uma posição perigosa porque
conduz, entre outras coisas, a distorções. As distorções resultam de duas
ou três razões. Uma, a mistura de forte compromisso e a exigência de
programas sociais e políticos, por um lado, e a pesquisa científica de
problemas de tais programas, por outro, parecem induzir preconceitos
e o que foi chamado percepção seletiva. Isto significa que vemos o que
desejamos ou precisamos ver em vez do que realmente existe. Esta
tendência é tão forte que quase cheguei ao ponto de pensar que cièn-
tistas comportamentais não deveríam pesquisar coisas que advogam
apaixonadamente. Ou melhor, quando pesquisarem, devem criar e usar
salvaguardas excepcionalmente elaboradas contra suas próprias incli
nações.
Uma segunda razão para distorções é que tendemos a confundir
missões sociais e científicas e isto leva a distorcer o que vemos, a des
gastar nossa objetividade e, mais importante, nosso compromisso com
a objetividade. O desgaste do compromisso com a objetividade é peri
goso para um cientista, póis, como já ficou dito, a objetividade é uma
característica, .científica ..inconfundível e indispensável .S ua perda destrói
a proprja ciência.
Voltando ao argumento principal, a_ciêneia e_a pesquisa científica
são absolutamente^neutras. Os resultados de pesquisas científicas podem
e são usados tanto para bons propósitos quanto para maus. Fazemos uso
de bombas atômicas, instrumentos de destruição baseados na teoria
científica, pesquisa em física e campos relacionados; usamos também
descobertas atômicas para a dessalinização da água, para a criação de
energia praticamente ilimitada, e assim por diante. Bondade e maldade,
melhora e deterioração, felicidade e sofrimento humanos, são assuntos
para as pessoas que resolveram fazer certas coisas que têm boas ou más
conseqüências, que melhoram ou pioram as coisas, que promovem a
felicidade humana ou que aumentam seu sofrimento. Naturalmente os
resultados da ciência podem ser usados para ajudar a tomar tais deci
sões, e os cientistas, como seres humanos, podem participar na tomada
de decisões, mas a ciência em si, estritamente falando, não tem nada
a ver com as decisões. Isto porque a preocupação da ciência — e é a
única atividade humana em larga escala cuja preocupação é tão desin
teressada — diz respejta.apenas à compreensão e explicação de__fenô-
mçnos naturais.
Enfatizo fortemente a finalidade da ciência desta forma porque a
concepção errada exposta acima, levada ao extremo lógico de colocar
o bem-estar humano como finalidade fundamental da ciência, conduz
finalmente a um desgaste da própria ciência e à conseqüente diminuição
da compreensão dos fenômenos físicos e humanos. O último capítulo
20
deste livro examinará novamente este problema com mais detalhes. O
motivo por que o propósito da ciência como teoria foi enfatizado aqui
é que a tentativa de sua aceitação a esta altura muito nos ajudará a
jRímpreender o conteúdo deste livro. Esta ênfase nos manterá ligados à
essência e à natureza da ciência e não nos permitirá sermos distraídos
por considerações estranhas. Por exemplo, se falarmos do chamado
lubaproveitamento de crianças brilhantes, vamos poder focalizar a com
preensão do aproveitamento ao invés de remédios específicos para o
problema. Ao fazer isto, naturalmente, já teremos assumido que a com
preensão científica do problema pode aumentar as possibilidades nossas
e dos outros de encontrar soluções práticas para o problema.
21
2. C o n c e it o s c o m p o r t a m e n t a is c ie n t íf i c o s e
d e f in iç õ e s
Uma das maiores dificuldades ao abordar um assunto novo é o seu

vocabulário. Não se inventam e se usam palavras novas apenas; velhas
palavras são usadas de maneira nova e diferente. Este, naturalmente, é
o caso na ciência. Teremos que nos familiarizar com termos e expressões
que são usados constantemente na pesquisa psicológica, sociológica e
educacional. A finalidade deste curto capítulo é promover esta fami
liaridade.
As definições raramente são interessantes para o leitor, mas são
essenciais porque é virtualmente impossível conversar inteligentemente
sobre ciência e pesquisa — ou sobre qualquer campo complexo — sem
usar termos abstratos e técnicos desconhecidos do leitor. Os cientistas
comportamentais usam termos como “amostra casual”, “variável inde
pendente”, “manipulação experimental” e “significância estatística”. Ao
passo que tais expressões são familiares e fáceis para o cientista, podem
ser estranhas, perturbadoras e mesmo assustadoras para o leigo. Assim,
elas poderão ser uma forte barreira para a compreensão de um livro
como este. O truque de costume, usado para resolver o problema, é
definir os termos à medida que forem aparecendo. Na pesquisa compor-
tamental, entretanto, há termos demais, usados quase todos de uma vez.
Assim, além de definirmos os termos à medida que formos avançando,
incluímos este capítulo de definições no início do livro.
Variáveis
O termo “variável” talvez seja o mais usado na linguagem da

ciência comportamental. É literalmente impossível escapar dele. Por
exemplo, pretendí escrever o capítulo 1 sem nenhum termo técnico. Não
foi possível: tive que usar “variável” junto com uma ou outra palavra
técnica. O termo “variável” é um conceito ou “constructo”, como dizem
os psicólogos. Um conceito, naturalmente, é um substantivo que repre
senta uma classe de objetos: homem, sexo, agressão, habilidade verbal,
classe social, inteligência e conformidade, são exemplos. É fácil perceber
que “homem” significa organismo de duas pernas, que fala, escreve e
22
algumas vezes exibe inteligência. Não é fácil ver o que “agressão” repre
senta. Para o psicólogo, “agressão” pode significar um estado interior
que predispõe a pessoa a certos tipos de comportamentos chamados
Igressivos”. Para o pesquisador psicológico, entretanto, “ agressão”
Blgnifica tipos diferentes de comportamentos que têm as características
de ferir outros ou a si próprio, física e psicologicamente. Devem ser
bastante específicos; devem definir “agressão” especificando de alguma
forma o que são comportamentos “agressivos”. Fazem isto para poderem
medir ou manipular a “agressão”. A idéia de "variável” deve ficar clara
depois que examinarmos tipos e exemplos de variáveis.
Variáveis categóricas, medidas e manipuladas
Quando alguma coisa pode ser 'classificada em duas ou mais cate

gorias, pode ser uma variável. “Sexo” é uma variável, o tipo de variável
mais simples porque existe apenas em duas categorias, masculina e femi
nina. “ Preferência religiosa”, “preferência política”, e “classe social”
são variáveis com mais de duas categorias. Tais variáveis são chamadas
váriáveis categóricas. Têm por característica o fato de todos os membros
de uma categoria — todos os do sexo feminino, por exemplo — serem
Considerados iguais no que diz respeito àquela variável. Outros exemplos
são nacionalidade, raça, escolha ocupacional.
Se uma propriedade de objetos pode ser medida, ela pode ser uma
variável. Ser "medida”, por ora, significa que algarismos podem ser
atribuídos a pessoas diferentes ou objetos diferentes com base na posse
de quantidades de alguma propriedade ou característica. Altura e peso
são exemplos fáceis e óbvios. Mas podemos atribuir os algarismos
1, 2, 3, 4 e 5 a determinadas crianças com base em sua suposta ansie
dade, 5 significando muita ansiedade, 4 uma boa quantidade de ansieda-,
de e assim até 1, que significa pouca ansiedade. Se pudermos fazer
isso, temos a variável “ansiedade”. Em termos de senso comum, variável
é algo que varia. Ou pode ser dito que uma variável é uma propriedade
que assume valores diferentes. Um psicólogo, por exemplo, pode atribuir
a diferentes crianças valores diferentes, dependendo de sua posse de
quantidades diferentes de habilidade verbal. Para isso ele pode usar
um teste de habilidade verbal e atribuir à criança números de 10 a 50,
sendo que 10 significa baixa quantidade de habilidade verbal e 50, alta
quantidade. A variável “sexo” foi mencionada acima: pode-se atribuir
1 ou 0 aos indivíduos, dependendo de serem homens ou mulheres.
Mesmo atribuindo-lhe somente dois algarismos, 1 e 0, sexo é uma
variável.
Na discussão do estudo de Clark e Walberg no primeiro capítulo,
0 reforçamento foi “manipulado” como uma variável experimental, dando
23
a um grupo de crianças um reforçamento maciço e a um ségundo grupo,
reforçamento regular. Esta manipulação, com efeito, cria uma variável.
Sempre que os pesquisadores preparam condições experimentais, eles
criam variáveis. Nós chamamos tais variáveis variáveis experimentais ou
variáveis manipuladas. Pode-se demonstrar que elas satisfazem a defini
ção dada acima, embora não façamos isto aqui.
Há, então, três tipos gerais de variáveis na pesquisa comporta-
mental: variáveis categóricas, variáveis medidas e variáveis experimen
tais ou manipuladas. O reforçamento, no estudo de Clark e Walberg, é,
como ficou dito, uma variável experimental. Classe social (classe média
e trabalhadora) no estudo de Miller e Swanson sobre classe social e
criação dos filhos, descrito no capítulo 1, é uma variável categórica.
Exemplos de variáveis medidas são inteligência, ansiedade, autoritarismo,
* aptidão verbal e realização escolar. São chamadas variáveis medidas
porque são “medidas” com um teste ou outro instrumento que produz
resultados que vão de altos a baixos.
Variáveis dependentes e independentes
Dois termos que são bastante usados em pesquisa comportamental

e neste livro, são “variável independente” e “variável dependente”. Uma
variável independente é uma variável que se supõe influenciar outra
variável, chamada variável dependente. Quando dizemos: “ O reforça
mento aumenta a aprendizagem.” ; reforçamento é a variável indepen
dente e aprendizagem a variável dependente. Os cientistas fazem pre-
dições a partir de variáveis independentes para variáveis dependentes.
Eles dizem, por exemplo, “ Se os professores elogiarem as crianças, o
trabalho escolar das crianças melhorará”.
A variável independente numa pesquisa é o antecedente; a variável
dependente é o conseqüente. Os termos vêm da matemática. Sempre
que uma equação matemática ou estatística é escrita, a variável depen
dente fica à esquerda da equação e a independente à direita. Por exem
plo, uma equação muito usada pelos pesquisadores comportamentais:
y = a + bx. Aqui y é a variável dependente e x a independente. É
como dizer, embora mais precisamente, “Se x, então y” . Com o problema
de Clark e Walberg, diriamos “Se reforçamento (x), então realização
(y)”. (a e b na equação são constantes cujos valores são determinados
pela pesquisa. Seu significado e uso serão explicados mais adiante.)
Quando são desenhados gráficos, como veremos mais adiante, a variável
independente é o eixo horizontal (das abscissas) e a variável dependente
o eixo vertical (das ordenadas).
24
Outros tipos de variáveis
Há outras classificações de variáveis, mas geralmente não são tão im

portantes quanto as dadas no item anterior. Mas já que são usadas na bi-,
bliografia e na conversação dos pesquisadores comportamentais, os leito
res devem se familiarizar com elas. A primeira destas classificações carac
teriza variáveis de acordo com o campo em que são usadas: variáveis
psicológicas, variáveis sociológicas, variáveis econômicas e assim por
diante. Inteligência, ansiedade e conformidade são variáveis psicológicas;
classe social, escolaridade (número de anos de freqüência à escola, por
exemplo) e profissão do pai, são variáveis sociológicas; renda, produto
nacional bruto e lucros são variáveis econômicas. Outras possibilidades o
são variáveis políticas, antropológicas e fisiológicas. As variáveis na 1
pesquisa educacional são principalmente psicológicas, sociológicas e c
sócio-psicológicas. Por exemplo, a realização, a aptidão verbal, motivação
para a realização e nível de aspiração são psicológicas; classe social, ,
escolaridade dos pais, nível de escolaridade e profissão do pai são socio- ^
lógicas.
Outra maneira de distinguir as variáveis é através de disciplinas ■
de um campo. Em psicologia, por exemplo, ouve-se falar de variáveis,
de personalidade (introvertido-extrovertido, agressividade, autoritarisf
mo), variáveis fisiológicas (reflexo psicogalvânico, transpiração palmai^
batida cardíaca), variáveis sócio-psicológicas (conformidade, pressão*
grupai, coesão) e assim por diante. Mas tais distinções não parecem
muito importantes. Sem dúvida, algumas vezes é difícil classificar as
variáveis desta forma porque elas podem pertencer simultaneamente a
duas ou três categorias.
Normalmente não é possível estudar fenômenos e relações entre
fenômenos sem definir e usar diversas variáveis. Para estudar a realiza
ção escolar de crianças, por exemplo, os pesquisadores precisam “criar”
a variável “realização”. Isso significa que eles precisam definir e medir
essa variável; devem atribuir algarismos ao aproveitamento escolar de
crianças diferentes. A importância da idéia de variável e da idéia conco
mitante de variabilidade, variação ou variância (ver abaixo) não pode
ser superenfatizada.
Uma variável, então, é um constructo. um conceito com um signi-
ficado especificado “construído” dado por um pesquisador. Uma variá-
vel pode também ser vista como um nome ou um símbolo ao qual se
i fribui valores, os valores diferentes indicando quantidades ou graus da
ESriáveí descrita pelo nome ou símbolo. Assim, inteligência e cònfor-
níismo e x e y são variáveis se se atribuírem valores (algarismos) a eles
iistematicamente.
25
Relações
“Relação” provavelmente é a palavra mais fundamental em ciência.

Ela será usada amplamente em todo este livro. Grande parte do capí
tulo 4 será dedicada a definir o termo, explicando seu significado e
dando exemplos de seu uso. Por enquanto, usaremos uma definição mui
tíssimo simplificada. Relação é um “ir junto” de duas variáveis: é o
que as duas variáveis têm em comum. A idéia é comparativa: uma
relação é um elo, uma ligação entre dois fenômenos,, duas variáveis.
Dizemos que há uma relação positiva entre, por exemplo, inteligência
e realização escolar ou entre classe social e renda, ou ainda entre auto
ritarismo e preconceito. Isto significa que crianças de maior inteligência
se saem bem na escola e crianças menos inteligentes tendem a se saírem
menos bem (embora haja muitas exceções); que as classes sociais mais
altas recebem maiores rendas que as mais baixas; e que quanto maior
o autoritarismo, maior o preconceito. Há» então,, uma ligação, um elo,
entre estes três. pares de variáveis. Em cada par, uma porção de cada
variável é comum a ambas. Voltando à figura 1.1, podemos ver o de
senho da idéia da parte comum de duas variáveis. A parte superposta
dos dois círculos mostra que há algo em comum nas duas variáveis.
Estudos e experimentos
Quando os cientistas fazem determinada pesquisa, diz-se que fize

ram um “estudo” . Estudo, então, é uma palavra geral abrangendo qual
quer tipo de pesquisa. Diz-se, por exemplo, “Fizeram um estudo sobre
inteligência e realização escolar na Inglaterra, França e Estados Unidos” ;
“Ele estudou a influência da ansiedade no desempenho de crianças su
burbanas em testes”; “Ela fez um estudo sobre os fatores de autorita
rismo e dogmatismo”; “O estudo experimental de Clark e Walberg
sobre o efeito do reforçamento na realização em leitura entre crianças
negras foi severamente criticado” . Observe então que “estudo” se refere
tanto a investigações experimentais quanto não-experimentais e a tipos
diferentes de pesquisa.
A maioria das pessoas pensa que sabe o que é um experimento:
é uma coisa que os pesquisadores fazem em laboratórios com equipa
mento esotérico. A verdadeira natureza do experimento é obscurecida
por idéias vagas e estereotipadas como esta. Embora os experimentos
sejam feitos na maioria em laboratórios, podem ser feitos em outros
lugares — em escolas, lares, fábricas e até nas ruas. Mais importante,
um experimento propriamente dito tem duas características básicas. Uma
delas é uma característica que todo experimento deveria ter: designação
aleatória dos sujeitos para os diferentes grupos experimentais. Isto quer
26
dizer, simplesmente, que os sujeitos são designados para os grupos
IXperimentais de tal forma que qualquer um possa se tornar membro
de qualquer grupo, sem ser possível dizer de qual grupo ele participará.
Ê possível fazer-se um experimento sem designação aleatória, embora
não seja desejável. Vamos deixar o assunto de designação aleatória para
o capítulo 6, porque o assunto exige explicações mais completas e
detalhadas.
A segunda característica básica de um experimento foi mostrada
no capítulo 1 — manipulação. Agora podemos ser mais precisos: mani
pulação de variáveis independentes. (Variáveis dependentes quase nunca
são manipuladas.) Repetindo: isto si unifica mie o pesquisador faz coisas
diferentes com grupos diferentes de indivíduos. Suponhamos que eu
ensine quatro grupos de alunos do quarto ano com quatro métodos dife
rentes. Isto é uma manipulação. Suponhamos que eu queira estudar os
efeitos dos tipos de tomada de decisão na produtividade do grupo. Tenho
um grupo de 90 pessoas que divido em 3 grupos de 30, denominando-os
Ai, Aa e As. As pessoas do grupo Ai terão o máximo de oportunidades
de participar das decisões do grupo (as quais são uma parte da manipu
lação), as do grupo A2 uma ou outra oportunidade de participar,
e as do grupo A3 nenhuma oportunidade. Isto também é uma ma-
pipulação.
A manipulação experimental varia da mais simples à mais com
plexa. A manipulação da variável independente de Clark e Walberg foi
simples: dois grupos, um recebendo reforçamento maciço, o outro, re
gular. Para que o leitor não pense que toda ou mesmo a maioria das
manipulações se limitam a dois grupos, examinemos uma ligeira exten
são da manipulação até três grupos. Aronson e Mills (1959), num inte
ressante experimento sócio-psicológico, testaram a idéia de que quanto
mais dificuldade se encontrar para entrar em um grupo, mais os mem
bros deste grupo darão valor a ele. Os membros de um grupo receberam
uma iniciação severa, os de outro, uma iniciação suave e aos membros
do grupo restante não se exigiu nada para se tornarem membros do
grupo (o “grupo de controle”). (A manipulação incluiu a leitura, por
jovens do sexo feminino, de palavras que variavam em termos de
Obscenidade.) Foi predito que os membros do primeiro grupo valoriza
riam mais a participação no grupo, os membros do segundo, um pouco
menos, e os do terceiro — o grupo de controle — valorizariam menos
ainda. (A exnectativa foi confirmada pelos resultados.) Isto também é
uma manipulação: foram feitas coisas diferentes sistematicamente com
os três grupos. As virtudes e outras características deste poderoso método
de obter conhecimento serão exploradas mais tarde. Veremos também
que é perfeitamente possível manipular mais do que uma variável inde
pendente por ver.
27
Há vários tipos de estudo científico. Um experimento é apenas um
deles. Todos os outros são não-experimentais. Um levantamento de
opiniões é não-experimental. Assim é toda a investigação das relações
entre variáveis quando não há manipulação. O estudo de Miller e
Swanson sobre classe social e criação de filhos é um exemplo. Não
foi um experimento porque não houve manipulação de uma variá
vel independente. Freqüentemente a distinção é mal entendida. Estudos
que são não-experimentais são às vezes chamados experimentos. Entre
tanto, a distinção é muito importante porque as conclusões de um expe
rimento bem conduzido geralmente são mais fortes do que as conclusões
de um estudo bem conduzido que não seja um experimento. Voltaremos
a esta distinção no capítulo 8 ,
Dados
Os cientistas usam comumente a palavra “ dados” (data) e sabem

muito bem o que ela significa. 1 O leigo poderá se confundir com a
palavra, porque nem sempre fica claro o que se quer dizer com ela.
A palavra “dados” significa alguma coisa dada ou aceita como dada,
da qual se podem fazer inferências. Por exemplo, alguém me diz que 60
por cento do povo da Bélgica é a favor do Mercado Comum, mas que
apenas 40 por cento do povo da Inglaterra é a favor. Então tenho
dados que me permitem fazer uma inferência ou duas e até mais: o
povo da Bélgica aprova o Mercado Comum mais do que o povo da
Inglaterra (outras coisas sendo iguais, claro); o apoio ao Mercado
Comum não é muito forte na Bélgica e Inglaterra. Neste exemplo, as
percentagens definidas são dados que permitem certas inferências. Mas
dados não se limitam a resultados numéricos ou estatísticos. Material
verbal, como editoriais de jornais ou redações infantis, podem ser consi
derados dados.
Os cientistas, então, geralmente usam a palavra “dados” para se
referirem a resultados obtidos em pesquisas, embora nem sempre resul
tados numéricos e estatísticos, dos quais tiram conclusões e inferências.
Eles podem dizer: “Os dados indicam que, quanto mais severa a inicia
ção, mais as pessoas valorizarão sua participação no grupo”. Querem
dizer que alguma espécie de resultados quantitativos — por exemplo,
as médias dos pontos nos três grupos do experimento de Aronson e
Mills — foram tais que permitiram fazer a afirmativa.
1 “Data” é uma dessas palavras curiosas que é realmente plural — o singular

é “datum” — mas às vezes é tratada como singular. O uso no plural é sempre
preferível.
28
Apesar de seu uso específico, “ dados” também se refere a quase
qualquer evidência obtida em pesquisas. Pode-se até afirmar que “ dados”
e “evidência” são usados quase como sinônimos. As observações feitas
por ministérios de educação e anotadas sob determinada forma são cha
madas “dados”. Saídas de computador são chamadas “dados” . Pontos
obtidos em testes são chamados “dados”.
Medidas, pontos, testes, escalas

Constantemente os cientistas comportamentais precisam obter esti
mativas quantitativas das magnitudes de propriedades ou características
apresentadas por grupos ou indivíduos. Eles obtêm tais estimativas,
em primeiro lugar, para poderem avaliar a magnitude de relações entre
au variáveis. Dados brutos — respostas a perguntas, descrição do compor
tamento das pessoas através da observação, coisas deste tipo — geral
mente precisam, de alguma forma, serem convertidos em números. Os
números, que presumivelmente mostram os dados brutos de forma redu
zida, são, então, tratados de forma que as relações entre os números e
assim entre as características possam.ser estudadas.
Estimativas quantitativas da magnitude de uma propriedade ou ca
racterística de grupos ou indivíduos sãó chamadas medidas. Medidas
obtidas em testes são chamadas pontos (scores). “ Medida” é uma palavra
mais abrangente do que “ponto”, embora pontos sejam medidas.
Um teste é um procedimento sistemático no qual os indivíduos são
colocados diante de um conjunto de estímulos construídos, chamados
itens, aos quais reagem de uma forma ou de outra. As respostas possibi
litam ao aplicador do teste atribuir pontos individuais ou números indi
cando o grau em que o indivíduo possui certo atributo ou propriedade
ou até que grau “conhece” a coisa que foi testada. Falamos sobre testes
de inteligência, testes de realização, testes de aptidão e muitos outros
tipos.
Uma escala é como um teste, só que lhe falta o aspecto competitivo
do teste. A palavra “teste” tem um sabor de sucesso ou fracasso; a pa
lavra “escala”, não. É um instrumento construído de modo que números
diferentes podem ser atribuídos a indivíduos diferentes para indicar
quantidades diferentes de algum atributo ou propriedade. Há escalas
para medir atitudes, valores, compulsividade, rigidez, interesses, precon
ceito e muitas outras.
Variação e variância
Um conceito estatístico fundamental na pesquisa científica é “ va-

riância”. É fundamental porque os fenômenos só podem ser comparados
29
e relacionados através das suas variações. O que significa esta afirmação
ligeiramente estranha? Virtualmente nenhum conhecimento científico
seria possível se o fenômeno não variasse. O psicólogo não poderia
estudar a inteligência se a inteligência das pessoas não variasse. O soció
logo não poderia estudar classes sociais e suas relações com outras
variáveis se as pessoas e grupos não diferissem em classes sociais. Diz-se
que um grupo de pessoas, por exemplo, alunos de quarta série, é alta
mente variável em inteligência. Outra maneira de dizer isto é: a variância
de inteligência da classe é grande. Por outro lado, a variância de inteli
gência de um grupo de candidatos ao doutorado pode ser pequena. Se
por ora o leitor puder confiar na veracidade destas afirmações sobre
variação, vamos apoiar esta confiança con. razões em um capítulo
posterior.
Embora não se discuta bastante estatística neste livro, é imperativo
que conheçamos alguns termos estatísticos e seu significado geral.
“Variância” é um termo tanto estatístico quanto geral. É geral enquanto
significa a variabilidade do fenômeno, como discutido acima. Os cien
tistas comportamentais usam-no muito desta forma. “Variância” é tam
bém uma medida estatística que expressa a variabilidade de qualquer
conjunto de medidas, e, assim, indiretamente, de qualquer conjunto de
indivíduos. 2 Os cientistas comportamentais falam muito sobre a va
riância de um fenômeno ou sobre a variância de uma variável afetada
pela variância de outra variável. O pesquisador educacional poderá per
guntar: “ Quanto da variância de realização é devida à variância de inte
ligência, à variância de motivação, à variância de background familiar?”
Isto é simplesmente uma maneira resumida e semitécnica de dizer: “As
crianças de alto grau de inteligência têm alta realização e as crianças de
inteligência inferior têm baixa realização? As crianças com alta motiva
ção se saem bem e as crianças com baixa motivação não se saem bem?
Crianças de ambiente familiar favorável se saem bem, enquanto
crianças de ambiente familiar desfavorável não se saem bem?
Esta é uma maneira de dizer que as variáveis covariam, variam
juntas de modos sistemáticos. Assim, os pesquisadores falam freqüente-
mente em covariância, um termo técnico que significa a variância com
partilhada por duas ou mais variáveis. Olhe novamente para a figura 1.1.
A parte sombreada representa a covariância ou a variância compartilhada
pelas duas variáveis.
Olhe os números na tabela 2.1. Os dois grupos de números em I
covariam perfeitamente. Os dois grupos de números, a e b, são os
mesmos: para um número alto em a, há um número alto em b; para
2 Uma-discussão técnica e geral do termo, das idéias por detrás dele e de como é
usado, pode ser encontrada em Kerlinger (1973, cap. 6).
30
Tabela 2.1 Três conjuntos de pares de postos * expressando covariâncias e
relações diferentes.
I II III
a b a b a b
1 1 i 5 i 3
2 2 2 4 2 5
3 .3 3 3 3 1
4 4 4 2 4 4
3 5 5 1 5 2
Alto Alto Baixo

Positivo . Negativo
* "Posto” (rank): lugar em uma ordenação. O posto 1 corresponde ao primeiro

colocado, o posto 2 ao segundo, e assim por diante. (N. do Revisor Técnico.)
um número baixo em a, há um número baixo em b. Há uma relação

alta e positiva entre os dois grupos de números. Os grupos de números
sob II também covariam perfeitamente — mas em direções opostas: para
um número alto em a há um número baixo em b, e para um número
baixo em a há um número alto em b. Há uma relação alta e negativa
entre a e b. Vejamos agora III. Não é possível fazer qualquer afirmativa
sistemática sobre a relação entre a e b. Elas estão, como se diz, não-
relacionadas. Ou se diz que a relação é baixa, o que significa, aliás, a
incapacidade de dizer alguma coisa sobre os números b, conhecendo
os números a. O leitor deverá tentar traduzir estes grupos de números
para um exemplo realista. Por exemplo, fazer afirmativas sobre I, II e
III, usando inteligência e realização em vez de a e b.
A palavra “variância” é muito usada na moderna ciência compor-
tamental e vamos ter que usá-la muito neste livro. O motivo é simples:
não é possível esclarecer e compreender modernas abordagens à pesquisa
e análise sem a idéia básica geral de variação e a idéia mais técnica
de variância.
Probabilidade
Um dos maiores bloqueios à compreensão e apreciação da pesquisa

eomportamental é uma espécie de anseio geral por certeza. Viver com a
incerteza parece muito duro para nós. Infelizmente o anseio pela certeza
ajuda demagogos, pessoas autoritárias, falsos religiosos e predadores
famintos a prosperarem, porque eles oferecem certeza. Eles freqüente-
mente nos dão a oportunidade de escaparmos da insuportável sensação
31
de desassossego e ansiedade em nós induzidos pela incerteza do nosso
mundo. Eles nos oferecem um credo ou uma pessoa a seguir cegamente,
com promessas de grandes recompensas.
A ciência e a pesquisa comportamental não nos oferecem certeza.
(Nem a ciência natural!) Não oferece nem mesmo certeza relativa.
Oferece apenas conhecimento probabilístico: Se A for feito, então pro
vavelmente B ocorrerá. A afirmativa usada antes, “A frustração leva à
agressão.”, é na verdade incorreta. Uma afirmativa mais correta é: “A
frustração provavelmente leva à agressão”. Uma maneira de definir a
pesquisa comportamental pode ser dizer que ela é urn meio de ajudar a
reduzir a incerteza. A pesquisa empírica jamais pode nos dizer que
alguma coisa é certamente assim. Pode, entretanto, dizer: “As probabi
lidades de tal coisa ser assim ou «.«sado são de 70 para 30”.
A probabilidade e o pensamento probamiísuco são o núcleo da
moderna ciência e pesquisa comportamental. Infelizmente, é difícil defi
nir a probabilidade satisfatoriamente. Vamos usar uma abordagem
intuitiva, como sempre, mas o leitor fica avisado de que pode desa
gradar os especialistas. A probabilidade de um acontecimento é o número
de casos “favoráveis” dividido pelo número total de casos (igualmente
possíveis). (“Caso favorável” significa qualquer resultado estipulado ou
previsto.) Seja f = número de casos favoráveis. E p = número de
casos favoráveis dividido pelo número total de casos, N. Seja o caso
favorável à ocorrência de cara no lançamento de uma moeda. Então p é
a proporção de caras em N lançamentos, ou p = f/N . Já que há duas
possibilidades no lançamento de uma moeda, p = 1/ 2. O caso ou evento
favorável pode ser o 6 do dado. Então, p = 1/6: a probabilidade de
ocorrer um 6 é 1/6. Se houver 50 homens e 50 mulheres em determinada
amostra de 100 pessoas, a probabilidade de escolher um homem (ou
mulher) é 50/100 = 1/2 (num processo de seleção imparcial).
Isto tudo é muito simples. Mas a probabilidade pode ser complexa.
Nossa preocupação aqui, entretanto, é apenas com a compreensão preli
minar e intuitiva. Em geral, o leitor precisa compreender que todos os
enunciados científicos são probabilísticos. Sempre há incerteza. As ciên
cias naturais oferecem maior certeza do que as comportamentais. Aliás,
todas as disciplinas científicas são mais ou menos incertas. Todas as afir
mativas, em outras palavras, vêm acompanhadas com um valor p implícito
ou explícito. É por isso que a bibliografia da ciência comportamental
fala tanto em “tendências”.
O leitor não deverá ficar muito preocupado se não apreendeu com
pletamente os termos e expressões dados acima. Leva-se tempo para
acostumar-se a eles. O que precisamos a esta altura é uma familiaridade
geral. As lacunas serão preenchidas mais tarde. Em todo caso, agora
temos suficientes definições para continuarmos com a discussão principal.
3. P r o b le m a s , h i p ó t e s e s e v a r iá v e is
UNIVERSIDADE ¥ DERAL DO PARÍ 1

' NTRALj
n* ^
«?£
Ao tentar resolver um problema, procuram-se soluções alternativas,
cu
meios diferentes de chegar-se ao núcleo do problema. Este processo de §
pensamento geralmente é incipiente, vago, confuso até. Geralmente não j
se sabe para onde se virar, o que fazer. Esperam-se idéias, principal-A
mente uma boa idéia. O mesmo acontece na pesquisa.
Para entender o que é um problema na pesquisa científica com-
portamental, vamos primeiro ser negativos. Consideraremos problemas
que realmente não são problemas no sentido científico. Eles podem ser ^
chamados problemas de valor ou de engenharia. Eis alguns exemplos:
Como se pode conseguir melhorar a integração? Qual é o melhor 3
caminho para se conseguir igualdade de oportunidades educacionais?'!;
Qual é o meio mais eficiente de se construir uma rede de rodovias em^
determinado estado? Como podemos ajudar a melhorar a sorte dos
pobres da cidade? O que torna um professor bem sucedido? Como
estão relacionadas a auto-atualização e a maturidade da personalidade?
A razão principal por que nenhum destes é problema científico é que
nenhum deles, como propostos, pode ser testado empiricamente.
“Como conseguir a integração?” é um problema de engenharia.
O interlocutor quer saber como fazer alguma coisa. A construção de
rodovias e a questão dos pobres também são questões de engenharia. A
ciência não pode resolvê-las porque sua forma e substância são tais
que não é possível testá-las: elas não afirmam nem implicam relações
entre variáveis. Elas perguntam, antes como fazer as coisas. A ciência
pode fornecer sugestões e inferências sobre possíveis respostas, mas
jamais poderá responder a essas questões diretamente. A igualdade de
oportunidades educacionais é uma mistura de questão de valor e ques
tão de engenharia: Qual é o melhor caminho para se conseguir igualdade
de oportunidades educacionais?
Enquanto uma questão de engenharia pergunta como fazer alguma
coisa, uma questão de valor pergunta qual de duas ou mais coisas é
melhor ou pior que outra, ou se alguma coisa sob consideração é kboa,
má, desejável, indesejável, ou moralmente certa ou errada. Questões de
valor contêm palavras como “bom”, “mau”, “melhor”, “ desejável”,
“precisa”, “ deve” . Elas pedem julgamento das coisas a serem avaliadas.
“ Qual é o melhor (mais eficiente, mais desejável e assim por diante)
jeito de fazer isto ou aquilo?” é uma questão de valor. Assim como “ O
método A é melhor que o método B para alcançar igual oportunidade
educacional?” As proposições ou enunciados de valor são semelhantes,
só que são sentenças afirmativas em vez de interrogativas. Exemplos:
“A avaliação dos professores, pelos alunos, ajudará a melhorar o
ensino”; “ É errada a discriminação contra as minorias”; “Não matarás” ;
“ O professor precisa compreender as necessidades do aluno”. A quali
dade de julgamento e os imperativos morais contidos nestas afirmativas
são óbvios. Mais importante, não há modo de testar tais afirmativas
empiricamente. O enunciado “ Ê errada a discriminação contra as mino
rias”, por exemplo, não afirma relação ou implicação de relação entre
variáveis que possa ser testada; apenas dá um julgamento moral sobre
uma prática social.
A ciência, como ciência, não pode então dar respostas a questões
de engenharia e valor porque não pode testar tais proposições e mostrar
sua correção ou incorreção. Quando alguém me diz que religião é uma
boa coisa, eu só posso concordar ou discordar — amar ou odiar meu
interlocutor, fazer paz com ele ou lutar. Não posso, como cientista,
sujeitar a afirmativa a um teste empírico, principalmente porque ela
contém um julgamento humano — algo é “bom” — e a ciência é e
sempre foi estúpida em questão de julgar qualquer coisa.
Pode ser dito, por enquanto, que proposições testáveis contêm
variáveis que podem ser medidas ou manipuladas ou que implicam tais
medições e manipulações de variáveis. Aqui estão três proposições testá
veis, uma delas já bem familiar:. “A frustração produz agressão”;
“Quanto maior a coesão de um grupo, maior influência tem sobre seus
membros”; “As condições das favelas produzem delinqüência”. Observe
que estes enunciados têm variáveis que podem ser medidas ou mani
puladas: frustração, agressão, coesão de grupo, influência, condições de
favela, delinqüência. Quando se diz que estes enunciados são testáveis,
isso não implica que eles são “bons” enunciados que levam à “boa”
pesquisa científica. A única coisa que se quer dizer é que de alguma
forma são capazes de ser provados corretos ou incorretos, pela evidência.
Proposições de valor e de engenharia, então, não são cietificamente
testáveis. Há outros tipos de- proposições que não são testáveis e que
são muito difíceis de ser categorizadas. Sua característica comum parece
ser a falta de clareza e uma espécie de virtude. Eis alguns exemplos:
“A doença é uma manifestação da vontade de Deus” ; “As práticas e as
instituições democráticas combinam peculiarmente com o ethos do povo
americano”; “A harmonia racial depende da compreensão mútua”; “A
maturidade humana depende da auto-atualização” . Para o cientista, tais
34
enunciados têm pouco ou nenhum significado. Naturalmente, têm signi
ficado para religiosos, políticos, pais, professores e novelistas, mas se
mantêm além do alcance da ciência.
Tais questões, propostas desta forma, não são testáveis, ou porque
lhes falta a forma de questões ou proposições testáveis (que discutire
mos mais tarde) ou porque a linguagem em que são expressas é tão
vaga que as torna cientificamente intratáveis. Eis outro exemplo da
educação. É um problema que, embora tenha intrigado e importunado
os pesquisadores de educação durante meio século, é virtualmente
irrespondível cientificamente, pelo menos desta forma: “ O que faz um
professor bem sucedido?” Para muitos educadores, isto pode não parecer
um problema. Eles acham que sabem a resposta; acham que sabem o
que é um professor bem-sucedido. Até agora, entretanto, o problema
não foi resolvido — num sentido científico.
Há diversas razões pelas quais ainda não foi resolvido. Para come
çar, a questão é inútil porque não há o enunciado de uma relação entre
variáveis. Portanto, não pode ser testada ou respondida cientificamente.
(Com toda a honestidade, talvez jamais seja respondida.) Por outro lado,
o problema é extremamente complexo: tem inúmeras facetas que não
são imediatamente aparentes, tornando-se difícil lidar com elas. Por
exemplo, o que se quer dizer com “bem sucedido”? Bem sucedido em
conseguir que os alunos aprendam, será? Aprender o quê? O que signi
fica “aprender”? O “sucesso” está ligado a certas características pessoais
e profissionais dos professores? Ao que os professores realmente fazem
em classe? Às suas atitudes? “Bem sucedido” também implica “mal
sucedido”. O que significa um professor mal sucedido? Este “mal su
cedido” significa o oposto de “bem sucedido”? Ou é diferente apenas?
Ou “mal sucedido” é uma idéia tão complexa quanto “bem sucedido”?
Em resumo, temos aqui uma questão complexa cuja dificuldade
úda. É de se admirar, então, que não tenha sido resolvida?
______ umjro b le m a i_um a, questão_.que.jmqstra uma

situação necessitada de. discussão.,..investigação, decisão ou solução. En-
quãntxTêsfa definição geral carrega um significado que a maioria de
nós consegue entender, é insatisfatória para finalidades científicas por
que não é suficientemente definida. Não diz ou implica o que os pesqui
sadores devem fazer para responder à questão que o problema apresenta.
Uma definição mais satisfatória é: “Um problema é uma questão que
pergunta como as variáveis estão relacionadas”,
” Nõ "estudo de Clark e Walberg delineado no capítulo 1, o problema
de pesquisa pode'ser apresentado: “O reforçamento maciço aumenta a
35
realização em leitura entre crianças negras carentes?” O problema geral
do estudo de Miller e Swanson pode ser colocado: ‘‘Mães de diferentesi
classes sociais usam tipos diferentes de criação?” Um problema maisi
específico (Ver tabela 1.1) é: “ O tempo de desmame de crianças difere
nas classes média e trabalhadora?” Estes problemas são bem específicos;
e, naturalmente, podem ser apresentados de maneira mais geral.
Há muitos anos Hurlock (1925) perguntou: “ Qual é o efeito de
diferentes tipos de incentivo no desempenho dos alunos?” Este problema
é mais geral. Eis outro (Etzioni, 1964): “O conflito aumenta ou impede
a eficiência de organizações?” Um interessante problema sócio-psicoló-
gico foi apresentado por Frederiksen, Jensen e Beaton (1968): “Como
o clima organizacional afeta o desempenho administrativo?” Berkowitz
(1959) fez esta importante pergunta: “Sob condições de deflagração
de hostilidade, como o anti-semitismo influi no deslocamento da agres
são?” Ou, quando frustradas, pessoas altamente anti-semitas exibem
comportamentos mais agressivos em relação aos outros, que pessoas
menos anti-semitas?” Em seu importantíssimo estudo inter-cultural sobre
“categorias naturais” de cognição, Rosch (1973) fez a seguinte pergunta:
“ Protótipos naturais de cor e forma facilitam a aprendizagem de cate
gorias de cor e forma?” 1
Repetindo, um problema de pesquisa científica em primeiro lugar
é unia questão, uma...sentença em-lõnna Jpterrogativã7 SegundõT uma
questão jjuejgeralmente pergunta alguma coisa a respeito- clãs relações
entre fenômenos ou variáveis. À resposta à questaoTe procurada nã pes-
quísaTClark e Walberg, baseando-se em suas descobertas, puderamafir-
mar que o reforçamento maciço melhorava a leitura de crianças negras
carentes. Miller e Swanson puderam afirmar que as mulheres da classe
média tinham tendência a desmamar seus filhos mais cedo que as mães
da classe trabalhadora.
Três critérios de bons problemas de pesquisa e proposições de pro
blemas podem ajudar-nos a compreender problemas de pesquisa. Pri
meiro, o problema deve expressar uma—relação, entre duas ou mais
variáveis. Pergunta: “A está relacionado com B?” “Como A e B estão
relacionados com C?” Embora haja exceções neste critério,_s.ãa. raras.
Segundo, o problema deve ser ~apresentado em forma interrogativa. A
interrogação têm a virtude de apresentar ó problema diretamente. No
exemplo de Hurlock, dado acima, o problema é apresentado diretamente
pela pergunta sobre a relação entre incentivos e desempenho.
1 Estas proposições de problemas nem sempre são apresentadas nas palavras de

seus autores originais.
36
Empírico da Ciência” no capítulo 1.) Testagem empírica significa que
seja obtida evidência real sobre a relação apresentada no problema.
Obter evidência na questão incentivos-desempenho de Hurlock signi
fica manipular (ou medir) incentivos, medir o desempenho do aluno e ava
liar o suposto efeito do incentivo sobre o desempenho. Às vezes é difícil
dizer claramente que o problema tem implicações de testagem empírica.
Entretanto, é preciso fazer a distinção para que a pesquisa tenha possi
bilidade de dar certo. As principais dificuldades com questões não-tes-
táveis são o fato de não serem enunciados de relações (“O que é o
conhecimento?” “Como se deve ensinar a ler?”), ou seus constructos ou
variáveis serem difíceis ou impossíveis de definir de maneira a poderem
ser manipulados ou medidos. Isto geralmente funciona com questões de
valor e moral, questões que indagam sobre o certo e o errado das coisas,
suas qualidades ou defeitos ou sua desejabilidade ou indesejabilidade.
Vamos nos concentrar novamente em juízos de valor. Tomemos afirma
tivas como: “A democracia é o melhor de todos os sistemas de governo” ;
“ Igualdade é tão importante quanto liberdade” e “ O casamento é bom”.
São juízos de valor; não são testáveis cientificamente. A não-testabilidade
de juízos de valor já foi discutida, mas a distinção entre jmzõTêTãlõr
©“enuntrrados empíricos TmHEesFáveis êt a o ímjíõftãnte^que^âeVe^nKKêxa-
nMá4a"-de~TOv^'üm'^põuco màB'^nãIiHicãineníer' —“
—"TTízêr que alguma coisa é boa ou má, melhor ou pior, é dar um
julgamento humano. Só o homem pode dizer que uma coisa é boa ou
má — e não se discute. Nenhum procedimento científico pode conter
uma resposta sobre a rela~tiva desejabilidade, de uma coisa. Ãs afirma
tivas científicas dizem simplesmente: “ Se Tsto for verdade, então pro
vavelmente acontecerá aquilo”; “Se se frustram as pessoas, elas prova
velmente agredirão outras, agredirão objetos ou elas próprias”. Tais
afirmativas não têm comprometimento com virtude ou defeito, desejabi
lidade ou indesejabilidade, valor moral ou falta de valor moral. Nem
podem fazer tal comprometimento. Na verdade, o cientista, como pessoa,
pode fazer tal julgamento — e pode ser sábio ou tolo como qualquer
um — mas ao fazer isto ele sai fora de seu papel de cientista.
É neste sentido que a ciência é neutra. Não é neutra por haver
alguma virtude especial em ser neutra. É simplesmente a natureza da
ciência, que está em testar relações empíricas entre fenômenos ou variá
veis — e, para fazer isto, exige que o fenômeno seja de natureza a ser
observado, manipulado ou medido. Enquanto o cientista pode estudar
yalQres,_ c.omo_ valores, e sua_ relação.-com outros, .fenômenos —. por
exemplo, ele pode estudar como a posse de certos ...valores econômicos
influencia a maneira de as pessoas votarem (“O capitalismo é bom”.
“Ja propriedade privada é sagrada”) — ele não pode estudar proposi-
ções que incluam julgamentos éticos ou morais. Simplesmente não há
37
maneira de chegar aos referentes empíricos de palavras como “deveria”,
“conviría”, “bom”, “mau” e “ precisaria”.
/
Hipóteses
Uma hipótese um enunciado çonjetural das relações entre^duas

ou mais variáveis. Hipóteses são sentenças declarativas e relacionam de'
alguma forma variáveis a variáveis. 2 São enunciados de relações, e,
como os problemas, devem implicar a testagem das relações enunciadas.
Problemas e hipóteses são_ semelhantes. Ambos enunciam relações, só
que os problemas jiüo.SÊntÊnç.asînterrQgativas e as hipóteses sentenças
afjrjjiativas. Às vezes são quase idênticos em substância. Uma diferença
importante, entretanto: as hipóteses geralmente são mais específicas do
que os _problemas:. geraftneiite’ estão., mais próximas das operaçoês de
teste e pesquisa. Muitos exemplos esclarecerão isto pelo livro afora,,
embora não seja fácil colocar regras estritas.
Eis algumas hipóteses: “ Quanto maior a coesão de um grupo, maior
sua influência sobre seus membros” (Schachter, Ellertson, McBride
& Gregory, 1951); “Aprender coisa nova interfere com a lembrança de
coisas já aprendidas” (Lindsay & Norman, 1977, pp. 320-324); “ Pri
vação na infância resulta em deficiência mental mais tarde” (Bennett,
Diamond, Krech & Rosenzweig, 1964). Observe que todas estas três
hipóteses são relações e que sua testagem empírica está claramente im
plicada porque as variáveis pod£m-serunan.íp.uladasJiriíerfe.rência, coesão
de grupo e até privação na infância) ou medidas (influência, lembrança,
deflcíencTa mental) ou ambas.
Vamos tomar a última: “Privação na infância resulta em deficiência
mental mais tarde”. “Privação na infância” é a variável independente.
Pode significar falta de alimento nos primeiros anos. Ou pode significar
uma falta prematura de amor ou afeição. Ou pode significar falta de
estimulação adequada — conversa, brinquedos, outras pessoas ou outros
animais, e assim por diante. Observe que pode ser uma variável mani
pulada: os animais podem ser privados sistematicamente de alimento,
afeto ou estímulo. Pode ser também uma variável medida: determina
mos, por exemplo, a magnitude de privação que teve uma criança ou um
adulto nos seus primeiros anos, talvez perguntando a ele e a seus pais.
Evidentemente, “privação nos primeiros anos” é acessível empiricamente.
“Deficiência mental” é também acessível empiricamente. Pode ser me-
2 Como já foi rnencionado, há exceções ao requisito de relação. Por exemplo,

algumas pesquisas procuram descobrir as dimensões ou fatores subjacentes a muitas
variáveis. Hipóteses relacionais podem não ser usada em tais pesquisas.
38
dicJa com um ou mais dos muitos testes disponíveis de capacidade
mental ou de deficiência mental. Naturalmente pode surgir um problema
difícil em decidir o que é ou não é “deficiência” . Mas o que interessa
aqui é determinar se_a_jza£Íáv^pod&-Rer—medi da.
A_hipótese “Privação na infância prodqjz deficiência mental mais
tarde” é uma hipótese _.p.orque-. enunGÍa uma—relação—conjetural_entre
variáveis aue podem ser manipuladas ou medidas. A relação é expressa
pela palavra “produz.^. Uma palavra- cm expressão de relação une de
alguma forma as variáveis: “produz”, “está positivamente relacionada
a”, “é uma função de”, e assim por diante. Um modo melhor de com
preender todas estas afirmativas, entretanto, é traduzi-las todas para
enunciados “se-então”. Embora não haja regras fixas para se escrever hi
póteses — há várias espécies, todas legítimas e úteis — a maioria pode
ser colocada na forma se-então: “Se p, então q”, p e q sendo contructos
ou variáveis. “ Se frustração, então agressão” ; “Se privação na infância,
então deficiência na realização escolar mais tarde”; “Se reforçamento,
então aumento na aprendizagem”. Em todos estes enunciados duas va
riáveis estão ligadas entre si como as palavras “se” e ‘então’ Colocado
muito simplesmente, uma hipótese é quase sempre ura enunciado de
uma relação,j j natureza da relação sendo especificada até certo ponto
pãlã"estrutura se-então do enunciado.
Consideramos hipóteses com duas variáveis apenas. Na pesquisa
comportamental moderna, entretanto, é mais provável haver mais de
duas variáveis. As hipóteses serão então: “ Se p, então q, sob as condi
ções r e s”. Se incentivo positivo (p), então aprendizagem aumentada
(q), dado sexo feminino (r) e classe média (s). Outra maneira de simbo
lizar esta hipótese é.: “Se p, e p 2 e p3, então q” ; “Se incentivo positivo
(pO e sexo feminino (p2) e classe média (p3), então aumento na apren
dizagem (q)”. Voltaremos mais tarde aos problemas multivariáveis, ou
“multivariados”. São muito importantes.
Em resumo,_hiPÓtescs,.sã.O-enunciados conieturais ,de relações e são
estas conjeturas que são testadas na pesquisa. Vejamos agora jx jrq u e
ás" hipóteses são importantes.
O valor das hipóteses
As hipóteses são muito mais importantes na pesquisa científica

do que parece, quando se considera apenas o que são e como são cons
truídas. Elas têm o objetivo profundo e altamente significativo de tirar
o homem de si mesmo, por assim dizer. Isto é, sua formulação apro
priada e seu uso capacitam o homem a testar aspectos da realidade com
um mínimo de distorção causada por suas predileções. Elas são urna
parte da metodolôgia-da^ciência. Jaaasiâdâ. ao.. critério ás„QhÍfetiyidade
39
discutido no capítulo 1. Iste qu.er dizer que as hipóteses são uma fer
ramenta poderosa para o avanço do conhecimento porque, embora for
muladas pelo homem, podem ser testadas e mostradas como provavel
mente corretas ou incorretas à parte dos valores e crenças do homem.
Naturalmente, os cientistas querem que suas idéias sobre a realidade
concordem com a “realidade”.
Um psicólogo social, por exemplo, pode acreditar que um método
por ele criado de lidar com o preconceito, chamado método K, seja mais
eficiente do que outros em diminuir, o preconceito. Ele acha que se K
fosse usado sistematicamente em escolas de segundo grau e em univer
sidades, ajudaria a reduzir o preconceito contra as minorias onde quer
que fosse usado. Ele está dizendo que o método K é mais eficiente do
que outros métodos e mais eficiente do que não fazer nada. Se ele for
testar sua crença cientificamente, ele terá que achar um meio de ficar
de fora de sua crença, saindo para fora de si mesmo. As hipóteses aju
dam a fazer isto, O psicólogo social pode formular uma hipótese de que
o método K, depois de uso suficiente, resultará em maior diminuição de
preconceito do que, digamos, os métodos L e M (e talvez outros mé
todos ou nenhum método).
A hipótese agora é uma afirmativa “lá fora”, independente do pes
quisador. Está “fora dele” no sentido de que, apesar de sua crença
pessoal, predileções e inclinações — sua aversão pelo preconceito, por
exemplo — pode ser testada fora de suas crenças, predileções e viéses.
Embora esteja pessoalmente a favor do método K, sua crença de que o
método K seja superior não pode afetar o teste da hipótese e o resultado.
Assim, as hipóteses são meios especialmente potentes de preencher obie-
tivamente as lacunas entre uma crença pessoal e a realidade empírica.
"São ferramentas para testar a realidade e podem ser mostradas como
provavelmente corretas ou incorretas, independentemente do investigador.
As hipóteses têm outras virtudes. Uma delas é que podem ser, e
freqüentemente são, deduzidas da teoria. Qualquer teoria de importância
terá um número de implicações empíricas que podem ser deduzidas
dela. Foi escrito um livro inteiro (Dollard, Doob, Miller, Mowrer & Sears,
1939) sobre as implicações da hipótese geral de que a frustração produz
agressão. Na verdade, esta hipótese geral é bastante ampla para ser o
enunciado básico de uma teoria, a teoria da agressão. Tem implicações
empíricas. Por exemplo, se frustrarmos as crianças, elas agredirão outras
crianças, adultos ou elas próprias. Dollard e seus colegas até salienta
ram que se podem deduzir implicações marxistas da hipótese geral:J‘Se
o trabalhador TQ^-^plorado- treciBênciõ '“salários' baixos, trabalhando
horaiTêxtras e_agsim_par_diante), ele iicará frustrado. Se continuar frus-
trádõ ~Dormm~l&ne8-r3eríodoy.ele...acabará...se revoltando, e destruindo seu
frustrador. a burguesia”. A questão é que qualquer teoria, se realmente
40
for uma teoria, terá muitas implicações para serem testadas; ela gerará
(com ajuda, naturalmente) muitas hipóteses testáveis. Sem dúvida é
assim que as teorias são testadas.
Hipóteses e testabilidade
Esta linha de pensamento nos leva a outra idéia importante sobre

hipóteses. Para serem cientificamente úteis, elas precisam ser testáveis.
gu no mínimo, conter ..iranlfcacões pára teste.'Uma hipótese não-testável
ftão tem utilidade científica. Isto é, é preciso identificar clara e inteira
mente as variáveis de uma hipótese — ou é preciso deduzir suas impli
cações em forma de variáveis — e depois ter um meio operacional de
manipular ou medir as variáveis para poder estudar as relações entre
elas. A hipótese agressão-frustração é um bom exemplo: já demos duas
ou três possibilidades de teste — e há muitas mais. A teoria do reforça
mento, muito da qual se concentra na recompensa ou reforçamento posi
tivo, gera muitas hipóteses em campos diferentes e com tipos diferentes
de organismos. Um de tais exemplos foi dado ao discutir o estudo de
Clark e Walberg no capítulo 1. Lembre-se de que foram testados os
efeitos relativos do reforçamento maciço e do reforçamento regular na
realização em leitura. Teorias de mudança de atitude, teorias de pro
cesso de grupo, teorias da aprendizagem e teorias de status ocupacional,
todas geraram hipóteses testáveis.
Algumas teorias e enunciados teóricos, por outro lado, são não-
testáveis — pelo menos com os meios de que'dispomos hoje. Assim, elas
se colocam além da abordagem científica. Um caso clássico é o de algu
mas teorias freudianas. Por exemplo, a teoria de Freud sobre a ansiedade
é não-testavel, pelo menos como Freud a formulou, em parte porque
inclui o constructo da repressão. Por repressão Freud quis dizer o ato
de forçar idéias inaceitáveis no inconsciente. Deduções empíricas da
teoria terão, naturalmente, que incluir o constructo de repressão, que está
ligado ao construto de inconsciente. Embora seja possível enunciar rela
ções entre as variáveis da teoria de ansiedade, definir os constructos
de repressão (no sentido pretendido por Freud) e inconsciente, com o
fim de medi-los, é extremamente difícil, se não impossível.
Para usar um constructo no teste de uma hipótese, deve-se deduzir,
pelo menos até certo ponto, as implicações empíricas ou o significado
do constructo. Quando se faz isto, tem-se a chamada definição opera
cional, idéia explicada em detalhe mais adiante neste capítulo. No caso
do constructo de repressão, isto é difícil de fazer por que as manifesta
ções comportamentais de repressão são difíceis de compreender. O pró
prio Freud dá várias. Uma famosa é o “lapso de língua”. Mas será que
todo lapso de língua indica uma repressão? E como podemos medi-los,
assumindo que indiquem repressão? Embora o assunto seja muito mais
complexo, espero que um pouco da essência da dificuldade tenha sido
transmitido.
As relações da teoria, então, não podem ser testadas satisfatoria
mente, pelo menos por enquanto, porque os constructos que entram nas
relações, os p e q dos enunciados se p, então q, não podem ser levados
ao nível de operação empírica. Isto não significa, como já se disse, que
as idéias de Freud não sejam científicas. Tal enfoque é simplificado
demais. Pode-se deduzir muitas hipóteses testáveis da teoria de Freud.
E talvez até os conceitos freudianos mais difíceis finalmente se renderão
à habilidade científica.
Exemplos de problemas e hipóteses
A discussão até aqui foi quase toda sobre problemas e hipóteses.

É aconselhável dar mais exemplos. Lembre-se, primeiro, de que proble
mas são. perguntas a respeito de relações entre variáveis. O treino em
uma função mental melhora a aprendizagem futura dessa função mental?
(Gates & Taylor, 1925). Este problema é velho e conhecido. Se você
treinar memorização, pode melhorar sua memória e sua futura memori
zação? (A resposta parece ser desanimadora.) A obediência forçada
induz à mudança de crença? É um problema importante. Depois da
Segunda Grande Guerra, os Aliados ocuparam o Japão. Os japoneses
foram forçados — embora esta palavra fosse usada raramente — a
obedecer às ordens aliadas. Esta obediência mudou as crenças japonesas?
As autoridades, por exemplo, foram comandadas a dirigir seus negócios
políticos e econômicos de maneira democrática. Eles se tornaram mais
democráticos? (A resposta parece ser Sim.) Os soviéticos e os chineses,
entre outros, há muito usam obediência forçada para mudar estruturas
de crença. Funciona? (Novamente a resposta parece ser Sim.)
As mulheres difíceis são mais desejáveis para os homens do que
as ansiosas por uma ligação? (Walster, Walster, Piliavin & Schmidt,
1973). Este problema vem do folclore sobre as mulheres: as que são
relativamente inacessíveis são mais desejáveis. As variáveis são inaces
sibilidade, “difíceis” e desejabilidade. O problema é muito interessante
porque a pesquisa feita por Walster e seus colegas parece tocar um
velho mito. Walster et al. começaram testando a hipótese de que os
homens preferem mulheres difíceis. Eles até formularam uma elaborada
e engenhosa justificativa teórica para explicar a relação. Mas quatro
experimentos não conseguiram apoiar a hipótese. Numa declaração clás
sica, os autores disseram: “Abandonamos nossa hipótese? Céus, não!
Afinal ela foi desconfirmada só quatro vezes” (Walster et al., 1973,
p. 115). Daremos a resposta ao problema mais tarde.
42
A semelhança de crenças influi mais em aceitar os outros que a
semelhança de raça? (Rokeach & Mezei, 1966). Este problema tão
controvertido, pergunta, com efeito, se a semelhança de crença é mais
poderosa do que a semelhança (e diferença) de raça em influenciar as
pessoas a aceitarem outras. Se um branco concorda com as crenças de
um negro, ele irá aceitá-lo mais do que aceitaria um branco de cujas
crenças ele discordasse? Se for conservador, por exemplo, ele aceitará
os conservadores negros em geral mais do que aceitaria brancos liberais?
São perguntas fascinantes, difíceis de responder. Temos aqui um pro
blema que é enunciado implicando termos quantitativos, já que vamos
usar “mais”. (Parece que a resposta é Sim, crença é mais importante
do que raça, mas não em todas as circunstâncias.)
Já foi dito que muitos, talvez a maioria dos problemas da pesquisa
comportamental, têm mais que uma variável independente. Aqui está
um enunciado de problema com três variáveis independentes: Como a
aptidão acadêmica, a realização no ginásio e o nível de aspiração influen
ciam a realização acadêmica? (Worell, 1959). Tais problemas com múl
tiplas variáveis estão mais próximos da realidade psicológica e social;
eles refletem com mais nitidez as complexas estruturas causais dos fenô
menos, neste caso, a realização acadêmica.
Eis uma hipótese derivada do primeiro problema dado acima. “ A
prática em uma função mental não tem efeito sobre a futura aprendiza
gem desta função mental” (Gates & Taylor, 1925). Observe a estrutura
se p, então q da hipótese: "Se prática numa função mental, então (não)
futura aprendizagem da função mental” . Observe também a forma nega
tiva da hipótese: “A prática (treino) não tem efeito” . Isto é raro. A
maioria das hipóteses especifica alguma direção do efeito. (A hipótese
foi corroborada.)
Uma hipótese mais convencional: “ Indivíduos que têm papéis
ocupacionais iguais ou semelhantes terão atitudes semelhantes em rela
ção a coisas significativamente relacionadas ao papel ocupacional”. Isto
significa, por exemplo, que os médicos manterão crenças e atitudes
semelhantes em relação a assuntos médicos. Se a hipótese for apoiada
pela evidência, conclüímos que a maioria dos médicos pensa igual no
que se refere a cuidados médicos.
Nossa hipótese final é uma hipótese que vem sendo cada vez mais
testada na pesquisa comportamental contemporânea: “ Pessoas anti-semi
tas deslocarão agressão para outros quando ua hostilidade estiver
deflagrada” (BerKowitz, 1959). Aqui há duas variáveis — anti-semitismo
e deflagração de hostilidade — que levamâoîeslo&amento da agressão.
A hipótese diz que o anti-semitismo (‘produzirá^ agressão deslocada
apenas sob a circunstância de deflagração de-hosíílidade. Isto é, a estru
tura do argumento é: Se p, então q, dado r; ou Se anti-semitismo, então
43
Figura 3.1
agressão deslocada, dado deflagração de hostilidade. O argumento é mos

trado na figura 3.1 (A). Na figura B está o argumento mais simples da
hipótese imediatamente precedente sobre papel ocupacional e atitude.
Vemos que em (B) o papel ocupacional influi diretamente sobre a atitu
de. Em (A), entretanto, o anti-semitismo produz agressão deslocada só
quando a hostilidade é deflagrada. Isto é chamado uma in teração, que
significa que duas (ou mais) variáveis trabalham juntas; elas interagem
para produzir um efeito. Veremos este fenômeno interessante com mais
detalhes num capítulo mais à frente.
Variáveis
Uma das palavras-chave na literatura das ciências comportamentais

6 “variável”. Já demos seu significado e muitos exemplos, mas agora é
necessário sermos mais sistemáticos e precisos em relação ao termo e
sua definição. Esperamos que a precisão tenha a virtude de nos livrar
de grande parte da ambiguidade que muitas vezes acompanha a palavra
e seu uso.
D e fin iç ã o gera l d e variável
Obviamente, variável é uma coisa que varia, que tem valores dife-
rentesJVIêdimos, digamos, o nível de aspirãçaõ deüm gmpolíé'criãncas.
Para cada criança~oBfemos uma nota, algum tipo de número Dizemos
44
que medimos a variável “nível de aspiração”. Embora intuitivamentè
atraente, até instrutiva, esta definição não é realmente uma definição.
E também não é exata.
Uma variável é um símbolo ao qual são atribuídos algarismos.
Exempios de tais símbolos são A, x, M ou inteligência, nível de aspira
ção, ansiedade. A variável x pode assumir um conjunto dé valores numé
ricos, por exemplo, pontos obtidos em um teste de inteligência ou de
leitura. A variável A pode assumir os valores at, a2 e a3, e assim pôr
diante, que podem representar os valores numéricos obtidos por uma
medida de atitude feita com uma escala de sete pontos. Podemos obter
òs resultados de atitude de quatro indivíduos: a, = 6, a2 = 3, a.i = 5,
Ü4 = 4. A é uma variável. Se quisermos, podemos dar-lhe o nome de
Atitude em relação às mulheres.
Esta definição de variável é simples e geral, embora um pouco
afastada do senso comum. É geral porque abrange todos os casos conce
bíveis e tipos de variáveis. E, embora seja um tipo de definição que não
pertence ao senso comum — pode parecer estranho até — não é nada
complicada e é fácil de entender. Há símbolos que podem ser letras dc
alfabeto, palavras ou expressões curtas: X, Y, A, K, inteligência, atitudes
em relação às mulheres, ansiedade, classe social, nível de aspiração,
retenção, preferência religiosa, renda e assim por diante. Logicamente,
variáveis são propriedades que tomam valores diferentes. Algumas variá
veis podem ter muitos valores, até um número infinito (teoricamente:
por outro lado, variável podem ter um mínimo de dois valores. 3 Inteli
gência, retenção, atitudes em relação às mulheres, podem ter vários valo
res. Sexo tem apenas dois valores, geralmente 1 e 0, 1 sendo designado
para um sexo e 0 para o outro. Morto-vivo, empregado-desempregado
são também variáveis de dois valores ou dicotômicas. Classe social,
geralmente, tem dois, três ou quatro valores. Preferência religiosa é um
tanto diferente. Embora seja uma variável chamada nominal ou cate
górica (veja abaixo), os valores a ela atribuídos são invariavelmente 1 e 0,
mas por enquanto não vamos mostrar como isso é feito.
Antes de mudarmos de assunto, devemos observar que variáveis
são também conceitos e constructos. Um conceito e, Tiitúfalmenté, um
t-ermo—geral ~qüè expressa a suposta idéia central por trás de objetos
particulares relacionados. Quando os cientistas falam sobre os conceitos
usados em seu trabalho, chamam-lhes freqüentemente “constructos”.
“Constructo” é um termo útil porque indica a natureza sintética das
variáveis psicológicas e sociológicas. Expressa a idéia de que os cientistas
3 É possível, por definição, uma variável ter só um valor. Nestes caso é chamada
constante. Lidamos • quase que exclusivamente com variáveis de dois ou mais
valores.
45
freqüentemente usam termos de acordo com a necessidade e exigências
de suas teorias e pesquisas. Inteligência, aptidão, ansiedade, locus de
controle, agressão, autoritarismo, classe social, sexo e realização são
todos constructos. Se a definição de “variável” dada acima pode ser
satisfeita — isto é, se algarismos puderem ser atribuídos a objetos de
acordo com regras — então, podemos chamar de variável um cons-
tructo. Õ leitor encontrará freqüentemente estes termos na bibliogra
fia da psicologia e educação, mas eles nem sempre serão usados pre-
eisamente. Entretanto, deve ser lembrado que há diferenças entre eles.
Por exemplo, é bom saber que, embora seja teoricamente possível
transformar a maioria dos constructos em variáveis, nem sempre é pra
ticamente possível fazê-lo. Um exemplo, a repressão de Freud, foi dado
»anteriormente.
Definições operacionais
Há dois tipos de definição: constitutiva e operacional. Uma defi

nição constitutiva define palavras com outras palavras: “peso” é a “qua
lidade de um objeto pesado”; “ansiedade” é "apreensão ou um vago
medo”. Definições constitutivas são definições de dicionário e, natural
mente, são usadas por todo mundo, inclusive pelos cientistas. Entretanto,
são insuficientes para propósitos científicos. Suponhamos que vamos
definir inteligência como “acuidade mental”, “a habilidade de pensar
abstratamente”, ou coisa parecida. Observe que estamos usando outros
conceitos ou expressões conceituais em lugar de “inteligência” . Natural
mente não se escapa à necessidade de usar tais definições dentro e fora
da ciência. Mas os cientistas têm que ir adiante. Precisam definir as
variáveis que usam nas hipóteses de maneira tal que as hipóteses possam
ser testadas. Fazem isto usando o que é conhecido como definição
operacional.
As definições operacionais surgiram de um novo modo de pensar:
em vez de pensar apenas constitutivamente, os cientistas também pensam
operacionalmente. Uma definição operacional é uma ponte entre os
conceitos e as observações. Este é um meio de pensar e operar radical
mente diferente, um meio que revolucionou a pesquisa comportamental,
especialmente a pesquisa em psicologia e educação.-
Uma definição operacional atribui significado a um constructo ou
variável especificando as atividades ou “operações” necessárias para
medi-lo ou manipulá-lo. Uma definição operacional, alternativamente,
especifica as atividades do, pesquisador para medir ou manipular uma
variável. É como um manual de instruções para o pesquisador: Diz, com
efeito, “faça assim e assado, desta e daquela maneira” . Um exemplo bem
conhecido, embora extremo, é: Inteligência (ansiedade, realização e
46
•Ilim por diante) é o resultado no teste de inteligência X, ou inteligência
i o que o teste de inteligência X mede. Esta definição nos diz o que
fazer para medir a inteligência. Diz ao pesquisador para usar o teste
tlc inteligência X. Realização pode ser definida citando um teste padro
nizado de realização, um teste feito pelo professor, ou notas dadas pelos
Ijofessores. Aqui temos três maneiras diferentes de definir operacional-
tnente o mesmo constructo. O leitor não deverá se preocupar com esta
Multiplicidade de definições operacionais; faz parte de sua flexibilidade
• força. Afinal, um constructo como realização tem várias facetas em •<
Momentos diferentes. Consideremos até o exemplo óbvio de diferentes
Areas de realização: leitura, aritmética, artes e assim por diante.
O
Vejamos um exemplo mais difícil. Suponhamos que queiramosO
definir a variável “consideração”. Pode ser definida operacionalmente;'
ftrrolando-se comportamentos de crianças que são presumivelmente com- j
portamentos que expressam consideração, e fazendo os professores obser-.-'
varem e classificarem os comportamentos das crianças numa escala de-
çinco pontos. Tais comportamentos podem ser: quando uma criança diz::
a outra: “com licença”, “desculpe”; quando uma criança entrega um*:
n sig
|finquedo pedido a outra; ou quando uma criança ajuda outra enS
uma tarefa. g
O tipo de definição discutido pode ser chamado uma definiçãi-
ifperacional medida. Ela mostra ao pesquisador como medir (e observaçB
uma variável. Lembre-se das variáveis de Miller e Swanson, classe
gocial e tempo de desmame. Há também definições operacionais experi
mentais que mostram ao pesquisador como manipular uma variável. Por
exemplo, o reforçamento pode ser definido operacionalmente dando os
detalhes de como os indivíduos devem ser reforçados — como Clark
e (Walberg fizeram. No estudo sobre os efeitos dos diferentes incentivos
sqjjre o desempenho de alunos em aritmética, já mencionado, Hurlock
(1925) elogiou algumas crianças, criticou outras e ignorou outras. A
frustração pode ser definida como um impedimento de alcançar uma
meta, uma definição constitutiva com implicações claras para a manipu
lação experimental. Isto foi muito bem realizado por Barker, Dembo e
Lewin (1943), que definiram frustração operacionalmente descrevendo
Crianças em uma sala de jogos “com um número muito grande de brin
quedos muito atraentes, mas inacessíveis.” (Os brinquedos foram deixados
atrás de uma tela de arame; as crianças podiam vê-los, mas não tocá-los.)
Como outras idéias apresentadas neste livro, a definição operacional
é uma invenção notável. Como ficou dito no início deste tópico, é uma
ponte entre conceitos ou constructos e observações, comportamentos e
atividades reais. Para esclarecer, veja a figura 3.2. A figura mostra os
dois níveis nos quais os cientistas operam: o nível dos constructos e
hipóteses (I) e o nível da observação e manipulação (II). Os dois níveis
47
Figura 3.2
são ligados por uma definição operacional. Quando o pesquisador em

psicologia diz: “Frustração produz agressão”, ele opera no nível I; para
testar a hipótese, ele tem que trabalhar no nível II: deve realmente
manipular (ou observar, ou medir) a frustração e medir a agressão. Para
trabalhar no nível II, ele deve primeiro conseguir um meio de lá chegar.
O meio é a definição operacional, que faz a ponte do nível constructo-
hipótese para o nível da observação. O pesquisador então vai e volta
entre os dois níyeis. As opiniões sobre os cientistas, como pessoas que
fiam teorias confusas divorciadas do mundo real (nível I), ou que apenas
manipulam as coisas, fazem observações e medem as coisas (nível II),
são ambas igualmente estereotipadas e divergentes da realidade científica.
Virtualmente todos os cientistas operam em ambos os níveis.'
Os dois exemplos seguintes de definições operacionais podem ajudar
a solidificar as idéias apresentadas. Em pesquisas sobre educação secun
dária e superior, a “realização”, muitas vezes, é definida operacional
mente como média de notas, ou MN. Holzman e Brown (1968), num
estudo dos prováveis efeitos dos hábitos e atitudes de estudo na reali
zação de alunos do segundo grau, definiu da seguinte maneira: “ O
critério da realização escolar, média de notas. . . era obtido geralmente
atribuindo pesos de 4, 3, 2, 1 e 0 aos conceitos A, B, C, D e F, respecti
vamente”. Em outras palavras, os números foram atribuídos às notas
dos professores. Esta é uma definição operacional de realização: dava
um “significado” concreto e específico ao constructo “ realização”.
Observem, entretanto, que há outros meios de definir realização opera
cionalmente. Um deles seria pedir aos professores que fizessem uma
classificação da realização geral de seus alunos, atribuindo um número
de um conjunto de números (ou letras por categorias) a cada aluno. As
48
Iuuh definições operacionais, entretanto, podem dar resultados dife
rentes. Se ambas forem “ boas” definições operacionais, devem estar em
jiifffeito acordo.
Em um interessante estudo mencionado anteriormente, Walster e
outros (1973) definiram uma de suas principais variáveis com muita
igbllidade. Tentaram, em sua pesquisa, encontrar a resposta para uma
Antiga pergunta: “As ‘mulheres difíceis’ são mais atraentes para os
liOmens do que as mulheres não tão difíceis?” Sujeitos do sexo masculino
tlpeberam cinco pastas contendo informações sobre uma mulher. Três
delas continham “formulários para a seleção de candidatos” , contendo
iin possíveis reações da mulher a cinco homens seus prováveis candidatos.
Illias reações eram anotadas como marcas feitas pela mulher numa escala
partindo de “escolhido com toda certeza”. Ou seja, cada “mulher”
llaera, presumivelmente, cinco marcas em cinco pastas, e estas marcas
lllflicavam-na como “fácil” ou “difícil”. Por exemplo, a que marcasse
um todas as escalas “escolhido com toda certeza” era uma mulher
"fácil”. Se, por outro lado, ela não se entusiasmasse com nenhum dos
ffn didatos. era “difícil”. A categoria mais interessante e decisiva foi a
mulher “seletivamente difícil” : ela não desejava nenhum dos outros
homens além de você (uma das pastas referia-se ao sujeito). Este proce
dimento, então, era a definição operacional de “dificuldade” da mulher,
Uma definição muito habilidosa.
Nos exemplos acima, observe que a definição operacional mostra
com bastante detalhe o que o pesquisador deve fazer para medir as
Üfiáveis. Holtzman e Brown especificamente relataram como a média
de notas seria calculada, e Walster e outros detalharam o procedimento
para obter medidas de “dificuldade”. Igualmente, em situações experi
mentais, as definições operacionais especificam o que os experimenta-
dores devem fazer para manipular uma ou mais variáveis independentes.
Elas dão as operações envolvidas.
Nada, entretanto, ficou dito sobre a qualidade das definições opera
cionais. Como as definições constitutivas, elas podem ser boas ou más,
bem ou mal concebidas. Tem havido críticas às definições operacionais
(e à filosofia do operacionalismo que as inspirou), que erraram comple-
tomente o alvo. Foi dito, por exemplo, que nenhuma definição opera
cional jamais pode expressar o significado completo e a riqueza de
Conceitos como agressão, repressão, ansiedade, autoritarismo, aprendi-
Mgem, realização e assim por diante. Exatamente. Jamais poderá. Mas
acontece o mesmo com as definições constitutivas! Definições operacio
nais são definições limitadas freqüentemente muito limitadas, cujo
pbjetivo é ajudar o pesquisador a chegar a aspectos da “ realidade”
fljOtnportamental. Há sempre o perigo de fracionar de tal modo um
conceito que este passe a ter pequena relevância para o seu "verdadeiro”
significado. Isto não implica, contudo, que seja impossível inventar e
usar definições operacionais que aproximem aspectos significativos da
“realidade” conceituai. Difícil, mas não impossível. Sem dúvida, o
sucesso científico em inventar e usar definições tão limitadas tem sido
gratificante. À medida que avançarmos em nosso estudo veremos exem
plos cada vez mais marcantes de definições operacionais e o ir e vir
entre os dois níveis de operação da ciência.
4
*
50
4. R e la ç õ e s e e x p lic a ç õ e s
Suponhamos que eu seja um cientista social interessado em proble

mas de grupos minoritários. Venho estudando em minha pesquisa várias
relações, com o intuito de me aprofundar na compreensão dos proble
KTkAi
mas de grupos minoritários e dos problemas de preconceito e discrimi
nação. Uma dessas relações é a que existe entre a discriminação contrai
grupos minoritários e a tendência à violência dos grupos minoritários.
Acredito, por exemplo, que quanto mais o grupo for discriminado, mais
seus membros apelarão para a violência. Coletei dados sobre oito grupos
e posso classificá-los em duas variáveis: discriminação e violência. Espe
cialistas classificaram os oito grupos conforme os graus de discriminação
usados contra eles, 1 significando a maior discriminação e 8 o mínimo
de discriminação. Obtive também estatísticas do total de violência que
caracterizou os oito grupos nos últimos cinco anos. (Não vamos nes;
preocupar agora de como isso foi feito.) A partir dessas estatísticas,
jçlassifiquei os oito grupos de alto a baixo em violência, 1 significando
glta violência e 8 baixa.
Os dois conjuntos obtidos estão na figura 4.1 A figura expressa uma
"relação”. Faz isto porque mostra dois conjuntos de números que foram
sistematicamente emparelhados: o primeiro grupo minoritário, o que
foi mais fortemente discriminado e que portanto recebeu o posto 1,
recebeu um posto 2 em violência. O segundo grupo, o segundo mais
fortemente discriminado (posto 2) teve o terceiro (3) lugar em violência
e assim por diante com os grupos restantes. Em resumo, os dois con
juntos de postos colocados em relação entre si, como na figura 4.1,
expressam uma relação.
Pode parecer um pouco estranho chamar os dois conjuntos de
©.úmeros uma “relação”. Mas não é. Aliás, é muito preciso e claro, como
Veremos. Todas as relações podem ser expressas de algum jeito, embora
nem sempre seja preciso usar números. O caso é que os dois conjuntos
de números, considerados conjuntamente como na figura 4.1, são uma
felação. Mais adiante veremos que as relações têm direção e magnitude.
No caso presente, a direção é positiva: os dois conjuntos de números
"vão juntos” um com o outro: os postos baixos em discriminação ten
dem a emparelhar-se com postos baixos em violência e postos altos com
postos altos. A magnitude da relação será discutida mais adiante neste
gBpítulo.
51
Figura 4.1
No capítulo 2 dissemos que “relação” provavelmente seja o termo

mais fundamental em ciência. Isto acontece porque a compreensão e
explicação de um fenômeno é a meta básica da ciência e os fenômenos
podem ser compreendidos somente através de suas relações com outros
fenômenos. Não existe isso de “conhecer” uma coisa perfeitamente em
e por si mesma. Não podemos contemplar e estudar, digamos, a delin-
qüência por si mesma. Podemos compreendê-la e explicá-la somente após
estudar o que está relacionado a ela, quais as variáveis sociológicas e
psicológicas que nela influem. Só então poderemos ter uma pista de
como e por que ocorre a violência.
Mas o que é uma relação? Quando se fala sobre relações acredita-se
que o interlocutor saiba do que se esta falando: que uma coisa esta
relacionada a outra coisa. Mas isto é muitíssimo vago; realmente não
nos diz nada do que sejam relações. Até a definição do dicionário é
insatisfatória. Uma tal definição podería ser: “Uma relação é um elo,
uma ligação entre pessoas ou coisas; é uma associação lógica, natural
ou sintética entre fenômenos”. Infelizmente isto não ajuda muito. Apesar
de a definição nos dar uma idéia do que seja uma relação, ela continua
muito vaga para a ciência. Felizmente e fácil definir relações sem
ambigüidade e com precisão, contanto que tenhamos um background
elementar na teoria dos conjuntos. Faremos, então, uma breve digressão
para examinar conjuntos.
52
Conjuntos
Um conjunto é uma coleção bem definida de objetos ou elementos

£Kemeny, Snell & Thompson, 1966, p. 58). “Bem definida” quer dizer
que deve ser possível dizer se determinado objeto, numa coleção de
objetos sob discussão, pertence ou não pertence ao conjunto. Termos
como “grupo”, “classe”, “ bando” e “família” indicam conjuntos.
Há duas maneiras de definir um conjunto. Primeiro, podemos fazer
uma lista de todos os membros do conjunto. Daí é fácil dizer se deter
minado objeto pertence ao conjunto. Por exemplo, suponhamos que
temos uma lista dos nomes dos países membros das Nações Unidas.
Para determinar se um país é membro do conjunto Nações Unidas,
fimplesmente corremos a lista de todos os países membros. A própria
lista é a definição do conjunto. Ê muito precisa e exata, mas nem
sempre é útil em pesquisa. Listas de membros de conjuntos frequente
mente são longas demais para serem práticas — os moradores de
Madri, por exemplo — , não estão disponíveis ou são difíceis de con
seguir ou, mesmo se se conseguir, podem ter mudado depois que correr
mos toda a lista.
O segundo meio e mais útil de definir conjuntos é dar uma regra
que nos diga se determinado objeto ou indivíduo pertence ou não a
determinado conjunto. Muitas das chamadas “definições por regra” são
fáceis. Ao definir a variável preferência política, por exemplo, a regra
pode ser esta: registrado no Partido Republicano ou no Partido Demo
crata. Outra regra simples, embora mais falível: pergunte a determinado
indivíduo se ele é republicano ou democrata. As “regras” para a maioria
das variáveis da ciência comportamental são, entretanto, mais complexas.
Em grande parte, talvez na maioria das pesquisas comportamentais,
São usadas definições por regra para definir os conjuntos de objetos —
ptòsoas, pombos, números, palavras — em estudo.
Relações
Na figura 4.2 damos dois conjuntos que foram encerrados em for

mas ovais para indicar que são conjuntos. O primeiro, chamado A, é
um conjunto de cinco crianças, três meninos e duas meninas. Vamos
admitir que as crianças foram escolhidas de alguma forma sistemática
para fins de pesquisa. Vamos supor, por exemplo, que sejam uma amos
tra de crianças de sexta série da escola K de Amsterdã, Holanda. O
legundo conjunto, chamado X, é um conjunto de cinco resultados em
um teste de inteligência, obtidos pela testagem de cinco crianças. As
linhas ligando os nomes aos pontos indicam simplesmente que, com base
Figura 4.2
no teste, Marie recebeu 131, Jacob 127 e assim por diante. Temos, então,
dois conjuntos, um de cinco nomes representando as cinco crianças e
um de cinco números representando os pontos feitos pelas crianças em
um teste de inteligência.
Talvez possamos tornar o exemplo um pouco mais interessante.
Estude a figura 4.3. O conjunto dos cinco resultados no teste de inteli
gência, X, está à esquerda. O conjunto da direita, S (de “sexo”), tem
dois membros, M e F, significando masculino e feminino. Os membros
dos dois conjuntos, X e S, estão ligados por linhas, assim: se um resul
tado em X é de um menino, trace uma linha até M; sc o resultado for
de uma menina, trace uma linha até F. Desta forma mostramos a relação
entre os resultados e as letras M e F, ou, mais geralmente, uma relação
entre inteligência e sexo. Podemos acreditar que as meninas (nesta
amostra, ou talvez em Amsterdã) são mais inteligentes que os meninos.
Para testar isto podemos calcular a média de pontos dos meninos e
meninas e compará-las. As médias são 125 para as meninas e 110 para
os meninos. Podemos concluir que as meninas são mais inteligentes
do que os meninos, sem dúvida uma conclusão arriscada! A questão
agora não é a adequação da conclusão mas o uso de conjuntos para
estudar uma relação.
Esta discussão bastante óbvia de conjuntos pode ser estendida a
números maiores de casos e variáveis mais complexas. Não importa
quantos casos e quão complexas as variáveis, os princípios básicos e as
regras são as mesmas. Mais objetivamente, definimos uma relação, uma
54
relação entre inteligência e sexo. Como? Ligamos simplesmente os
membros de um conjunto, X, aos membros de outro, S, usando a
jttgra simples para traçar as linhas, dada acima. Agora damos uma
lefinição abstrata de “relação” que é completamente geral e que se
aplica a todos os casos.
Uma relação é um conjunto de pares ordenados. Um par ordenado
iSo dois objetos de qualquer espécie em que há uma ordem fixa para
os objetos aparecerem ou para serem colocados. Na figura 4.2, Maríe,
131 é um par ordenado. O conjunto de pares ordenados são os dois
lonjuntos na figura 4.2, colocados juntos, os nomes em primeiro lugar
0 os pontos em segundo: -{ (Marie, 131), (Jacob, 127), (Annie, 119),
(Pieter, 108), (Jan, 95) }. Em outras palavras, “ordenado” significa
tomar os membros de um dos conjuntos, primeiro, e os membros do
OUtro, depois. O conjunto de pares mencionado é uma relação. Pode
nfio ser interessante, importante ou mesmo significativo, mas é uma
relação.
Na figura 4.3 também foi dada uma relação, embora um pouco
mais difícil de se ver. Se apresentarmos a relação de outra forma, como
na figura 4.4, é mais fácil ver. De novo temos um conjunto de pares
ardenados: j (131, F), (127,M), (119, F), (108, M), (95, M) }. Esta é,
por definição uma relação. Neste caso, entretanto, é um pouco mais
ggn;F:cativa: o conjunto de pares ordenados expressa uma relação entre
os pontos do teste de inteligência e o sexo dos participantes, ou, mais
§Jmplesmente, entre inteligência e sexo.
Figura 4.3
X s
Figura 4.4
A definição de relação como conjunto de pares ordenados é com

pletamente geral, bastante precisa e muitíssimo útil. Com ela eliminamos
a ambigüidade das definições de dicionário. Observem que a definição
não diz absolutamente nada sobre o interesse, importância ou valor
de uma relação. Diz apenas o que é uma relação. E isto é o bastante,
porque sabemos que ,se a ciência é em grande, medida um estudo das
relações, então, é em grande medida um estudo de conjuntos de pares
ordenados. Além do mais, permite-nos estudar e entender a substância,
direção e magnitude das relações. Antes de mergulharmos nessas idéias,
vejamos uma relação onipresente, o casamento.
Se o casamento é uma relação, então é um conjunto de pares orde
nados. Esta maneira de encarar o casamento pode ser um pouco curiosa,
mas é útil na pesquisa. Tome todos os maridos e mulheres de uma
comunidade em pares, com os maridos (ou as mulheres) colocados sem
pre primeiro em cada par. Isto é visto na figura 4.5, onde os maridos,
Hi, H2, . . . , Hn são dados no conjunto chamado H, e as mulheres
Mi, M2, . . . , Mn são dadas no conjunto chamado M .1 Os pares orde
nados, com H sempre em primeiro lugar, são unidos por linhas, forman
do um novo conjunto de pares, indicado pela linha interrompida dese
nhada à volta de ambos os conjuntos e denominada C; esta é, por
definição, uma relação. Podemos chamá-la “casamento”.1
1 Os símbolos Hi, Hi e H« e Mi, Ma e Mn significam marido 1, marido 2 e

marido n e mulher 1, mulher 2 e mulher n; n é o último marido e a última
mulher. Os algarismos neste simbolismo são chamados subscritos; eles definem
simplesmente o número de um indivíduo ou um par em um conjunto.
56
c
Figura 4.5
Relações na pesquisa comportamental
A definição de relações como conjuntos de pares ordenados é sim

ples e poderosa conceitualmente, mas um pouco árida para o leigo.
Podemos agora considerar o que pode ser mais interessante: o uso das
felações na pesquisa científica comportamental. Antes, porém, precisa
mos saber que há aspectos da ciência e da pesquisa nos quais as
relações parecem não ser estudadas. Por exemplo, boa parte da pesquisa
tem função taxionômica e descritiva. Um estudo pode tentar apenas
áescobrir as características de determinada população ou amostra: a
Incidência relativa de nascimentos, mortes, suicídios, casamentos e
Itsim por diante, em São Francisco. Pouca ou nenhuma tentativa se
fará para relacionar as variáveis entre si. Tal trabalho é legítimo e
muitas vezes importante.
Igualmente, os pesquisadores freqüentemente agrupam observações
de Características de pessoas e coisas, em categorias. Isto é taxion om ia,
OU o trabalho de classificar coisas em agrupamentos sintéticos ou natu
rais. Grande parte, do trabalho psicológico, por exemplo, foi dirigido
para classificar indivíduos em categorias: introvertidos e extrovertidos:
flominadores e submissos; independentes e dependentes. Embora impor
tante e essencial, o trabalho taxionômico e descritivo, estritamente
fj|lando, é suplementar no estudo de relações. Em todo caso, a maior
parte da discussão deste livro considerará a ciência como preocupada
com o estudo das relações. Vamos abordar tal estudo um pouco mais de
parto, examinando primeiro a direção e a magnitude das relações.
57
A direção e a magnitude das relações
Vamos supor, novamente, que eu esteja estudando discriminação

e violência e que durante um determinado estudo, obtive os dois con
juntos de postos dados ria figura 4.1. Vamos supor também que estou
testando a hipótese de que a discriminação contra minorias está associada
à violência. A hipótese pode ser expressa quantitativamente: Quanto
maior a discriminação contra grupos minoritários, maior a violência
dos grupos minoritários. (Supomos que discriminação e violência estejam
adequadamente definidas e medidas.) Perguntamos: “Os dados da
figura 4.1 apoiam a hipótese?” Para responder precisamos saber a
direção e a magnitude da relação expressa pelos dois conjuntos de postos.
A direção é determinada facilmente. Simplesmente examinamos os-
postos para ver se eles parecem “caminhar juntos” e como eles seguem
juntos. Os postos no conjunto da esquerda (Discriminação) variam de
1 a 8 em perfeita ordem. Os postos da direita (Violência) não seguem
esta ordem perfeita. Será que, no entanto, eles em geral seguem a ordem
dos postos à esquerda? Isto é, os postos altos em Discriminação são
acompanhados, em geral, por postos altos em Violência, o mesmo ocor
rendo para os postos baixos? Se for assim, então a direção da relação é
positiva. Neste caso, a resposta é sim: postos altos de Discriminação em
geral são acompanhados por postos altos de Violência, e postos baixos
de Discriminação são acompanhados por postos baixos de Violência.
A relação é positiva.
Mas qual é a magnitude da relação? Sabemos que a relação é
positiva, mas não conhecemos a extensão do acordo que há entre os
pares de postos. Há diversos meios para avaliar a magnitude das relações
e vamos examinar três ou quatro deles, apesar de desejarmos evitar
complexidade técnica em nossa busca de clareza conceituai. Primeiro,
fazemos um gráfico das relações da figura 4.1. O gráfico é dado na
figura 4.6. O eixo horizontal é geralmente chamado X e o vertical, Y.
X é a variável independente, Y a variável dependente, ou X = Discri
minação e Y = Violência. Os oito postos foram indicados em cada
eixo e os oito pares de postos assinalados como indicado: (1,2), (2,3),
. . . , (8,7). Por exemplo, o valor 1 de Discriminação na figura 4.1
está referido ao X ou o eixo de Discriminação da figura 4.6, e o valor
2 de Violência é referido ao Y ou eixo de Violência da figura. Coloca-se
uma cruz na junção dos dois valores e marca-se (1,2). Os outros valores
da figura 4.1 são igualmente representados. Foi traçada uma linha
através dos pontos representados, de sorte a ficar o mais próxima pos
sível de todos eles simultaneamente. Esta linha expressa a relação da
mesma forma que os pontos. Chama-se “linha de regressão”, embora
possamos chamá-la uma “linha de relação”. Voltaremos a estas utilís-
58
X = Discriminação
Figura 4.6
limas linhas mais tarde, quando veremos como elas expressam relações
dara e sucintamente.
Os pontos representados e a linha de regressão indicam que a
hipótese é apoiada por estes “dados”? A resposta é sim — indicam. Os
pOntos representados indicam que grandes valores de X, Discriminação,
iSo acompanhados por grandes valores de Y, Violência, valores médios
de X por valores médios de Y e valores baixos de X por valores baixos
de Y. O enunciado “ Se discriminação, então violência” parece estar
Correto. Especificamente, os grupos minoritários que sofreram a maior
jdiscriminação foram os mais violentos, e os grupos minoritários que
fCCeberam menos discriminação foram os menos violentos. A relação
nfio é perfeita — há exceções, por exemplo (3,1) e (7,4) no gráfico —
mas em geral se mantém.
Mas ainda não discutimos diretamente a magnitude da relação.
Dissemos que os valores altos de Y “acompanham” os valores altos
de X e valores menores de Y “acompanham” valores menores de X.
Naturalmente, este é um enunciado de magnitude, mas desejamos ser
nlXU precisos. Queremos saber até que ponto a relação é “forte” ou
"Ekca”. Se a direção da linha de regressão for da esquerda inferior
para a direita superior no gráfico e todos os pontos se encontrarem pre-
fiiiamente sobre a linha, a relação é “perfeita” e positiva. Tais relações
lltfeitas quase nunca acontecem na pesquisa comportamental. Às vezes
iodos os pontos •representados •se aproximam da linha. Quando isso
59
acontece, a relação é “forte” . Quando não, quando se encontram dis
persos relativamente longe da linha, a relação é “fraca” ou até se
aproxima de zero. (No último caso, a própria linha seria horizontal,
ou quase. Explicaremos isto mais adiante.)
Há meios ainda mais precisos de expressar a direção e magnitude
das relações. Um meio muito usado é através da correlação e do chamado
coeficiente de correlação. “Correlação” significa exatamente o que diz
a palavra: a co-relação entre dois conjuntos de valores ou a variação
conjunta dos valores de X e Y, como já foi explicado. “Coeficiente de
correlação”, um termo muito usado na pesquisa, é uma medida da inter
dependência, da variação conjunta, do aumento ou decréscimo simultâ
neo de dois conjuntos de valores numéricos. Por sua grande importância
na pesquisa, estudemos as idéias de relação, correlação, direção e magni
tude mais profundamente. ^
Embora do ponto de vista definicional seja correto dizer que uma
relação é um conjunto de pares ordenados, tal definição apenas esclarece
a idéia de uma relação. Não ajuda os cientistas a tirarem conclusões a
partir dos dados. Eles dèsejam saber a direção e a magnitude das rela
ções, como já ficou dito. A direção de uma relação é ela ser positiva ou
negativa (ou mais complexa). Se os dois conjuntos de medidas de um
conjunto de pares ordenados variam juntos — os pesquisadores dizem
“covariam” — na mesma direção, a relação é positiva. Se variam simul
taneamente (juntas) na direção oposta, a relação é negativa.
Na tabela 4.1 são apresentados três conjuntos de pares ordenados.
No conjunto A, os valores de X e Y têm a mesma ordem de postos.2
Tabela 4.1 Três Conjuntos de pares ordenados mostrando diferentes direções de

relações.
(A) (B) (C)
X Y X Y X Y
1 2 1 8 1 4
2 4 2 6 2 8
3 5 3 5 3 5
4 6 4 4 4 2
5 8 5 2 5 6
2 Os valores da tabela 4.1 não são postos. Entretanto, podem ser facilmente
convertidos em postos; por exemplo, os postos dos valores de Y em A são
5, 4, 3, 2, 1.
60
Por outro lado, no conjunto B a ordem de postos dos dois conjuntos
de valores é oposta, isto é, os valores altos de X são acompanhados por
valores baixos de Y [por exemplo (5,2), (4,4) ], e os valores baixos
de X são acompanhados por valores altos de Y [por exemplo (1,8),
(2,6) ]. Os pares de conjuntos de pares ordenados mostrados em C não
têm direção discernível; os dois não mostram tendência sistemática a
Variar de uma ou outra forma. O conjunto foi incluído na tabela para
Ilustrar o caso de “nenhuma relação”, ou, mais precisamente, relação
zero, e para contrastá-lo com os conjuntos A e B.
A magnitude de uma relação é a extensão na qual dois conjuntos
de medidas variam simultaneamente (covariam) positiva ou negativa
mente. No conjunto A da tabela 4.1, a magnitude da relação é alta
porque as ordens de postos de X e Y são idênticas. Igualmente alta é a
relação de B porque as ordens de grau são completamente opostas.
Entretanto, os dois conjuntos de números variam juntos: os números
mais baixos de Y acompanham os números mais altos de X, e os núme
ros mais altos de Y acompanham os números mais baixos de X. No
ÚOnjunto C, entretanto, não se percebe variação sistemática simultânea
dos dois conjuntos de números. É como se os números do segundo con
junto fossem incluídos ao acaso (e foram). Em tais casos, costuma-se
dizer que “não há relação” entre os conjuntos. É óbvio que esta é uma
maneira meio inexata de falar, porque qualquer conjunto de pares
ordenados é uma relação. Entretanto, na linguagem corrente da pesquisa,
os pares ordenados do conjunto C seriam mencionados como não mos
trando relação alguma. A expressão correta é “relação zero” .
Será possível ser mais preciso sobre as magnitudes das relações
dos conjuntos de medidas da tabela 4.1? Felizmente sim. Uma medida
muito útil da magnitude das relações é o coeficiente de correlação,
que já foi mencionado e explicado ligeiramente há pouco. É simples
mente um índice, em forma decimal, que indica a direção e a magnitude
da covariação de dois conjuntos de valores.3
Tais índices variam de —1,00, passando por 0,00, até +1,00.
+ 1,00 indica uma relação positiva perfeita, — os dois conjuntos de
3 índice é um número usado para caracterizar um conjunto de números e geral-

mente é calculado com uma fórmula, a partir de dois ou mais números diferentes.
A média, ou média aritmética, é um índice que indica a tendência central de um
ippjunto de números. A amphtude, o número mais alto menos o número mais
(b xo, é um índice. QI (quociente de inteligência) é um índice: idade mental
njíalculada por teste) dividida pela idade cronológica. O coeficiente de correlação
fl um índice muito complexo que expressa com precisão o “caminhar junto” de
Ois conjuntos de pontos. É uma estatística muito usada em razão de sua força
Í íscritiva e porque conjuntos de coeficientes de correlação podem, por sua vez,
ser analisados com ó uso de métodos poderosos.
61
pontos têm exatamente a mesma ordem de postos, por exemplo, como
em A da tabela 4.1 — e — 1,00 indica uma relação negativa perfeita,
como em B da tabela. O (zero), naturalmente, indica “nenhuma relação” ,
ou “relação zero” . Todas as frações decimais entre —1,00 e +1,00
são possíveis: —0,78; —0,51; —0,08; 0,12; 0,42; 0,83; e assim por
diante. Muitos coeficientes ou índices de relações como estes são usados
nas ciências comportamentais, mas neste livro estamos preocupados prin
cipalmente com a compreensão e interpretação de tais índices e não com
seu cálculo.4
Gráficos de relações
Na figura 4.6 fizemos, um gráfico da relação entre os postos da

figura 4.1. Para uma compreensão intuitiva mais profunda das relações^
quantitativas, vamos fazer gráficos das três relações da tabela 4.1. Isto
será mostrado na figura 4.7. Os valores de X serão indicados pelo
eixo X e os valores de Y pelo eixo Y. Os pares — (1,2), (2,4), (5,8),
e assim por diante, serão indicados por cruzes: a cruz para o par (4,6)
em A, por exemplo, está colocada no ponto de interseção entre 4 uni
dades em X e 6 unidades em Y. Está situado dentro de um círculo.
Linhas foram traçadas através dos pontos para que possam correr o
mais próximo possível de todos eles. Ao discutir a figura 4.6 dissemos
que tais linhas são chamadas linhas de regressão, que são traçadas de
sorte a ficarem o mais próximas possível de todos os pontos represen
tados e que elas expressam a relação entre os valores de X e os de Y.
Observe que as linhas traçadas em A e B se aproximam muito de todos
os pontos. A linha traçada em C, entretanto, não pode se aproximar de
todos os pontos. O melhor que se pode fazer é, sem dúvida, traçar uma
linha quase horizontal próxima da média (média aritmética) dos
pontos Y.
Talvez a interpretação mais importante das três situações seja a
que se segue. Em A, a relação positiva alta significa que, à medida
que os valores de X aumentam, aumentam os valores de Y. A relação
alta negativa de B, por outro lado, significa que, à medida que os
valores de X aumentam, os de Y diminuem. Não é possível fazer tal
afirmação sistemática em C: não se pode prever a magnitude dos valo
res de Y a partir da magnitude dos valores de X. Em ciências avançadas
como a física — e às vezes em psicologia e educação — pode-se fazer
afirmativas mais precisas de magnitude; por exemplo, quando X
4 O leitor interessado poderá consultar um livro de estatística elementar à procura

de instruções de como calcular tais índices. Ver, por exemplo, Edwards (1973).
62
-L- -J-X
1 2 3 4 5 6 7
(A) Relação alta positiva (B) Relação alta negativa (C) Relação alta neutra
Figura 4.7
aumenta uma unidade, Y aumenta duas unidades, ou quando X aumenta

uma unidade, Y diminui meia unidade.
Talvez possamos ajudar o leitor se vestirmos estas relações nuas e
estes gráficos com a roupagem das variáveis. Em A da figura 4.7, supo
nhamos que X seja escolaridade ou anos de escolaridade, e Y rendi
mentos. A relação de A, então, significaria que, à medida que a educa
ção aumenta, aumentam os rendimentos. Isto é assim, mas a relação
não é tão alta quanto o gráfico indica. Usando as mesmas variáveis em
B teremos uma relação improvável que a eyidência da pesquisa não
apóia: à medida que aumenta a escolaridade, diminuem os rendimentos.
Em C não é possível nenhuma previsão sistemática dos rendimentos a
partir da escolaridade. Conhecer a escolaridade não nos capacita a dizer
que os rendimentos aumentam ou diminuem sistematicamente. Mas con-
alderemos um exemplo mais interessante.
Utn exemplo de direção e magnitude de uma relação
Suponhamos que um pesquisador desconfie que o preconceito

OOntra grupos minoritários seja em parte resultado do autoritarismo.5
Foi descoberto, digamos, que algumas pessoas têm um tipo de persona
lidade denominada autoritária. Algumas características dos autoritários
Iflo agressividade, tendência a serem punitivos, convencionalidade, sub
missão sem crítica à autoridade e líderes e hostilidade generalizada em
nlação a grupos diferentes dos seus. O pesquisador raciocina, na base
Eita é uma hipótese famosa para a qual há considerável evidência (Adorno,

IfrMkel-Brunswick, Levinson & Sanford, 1950).
63
de uma teoria do preconceito, que essas características se combinam
para produzir o preconceito contra membros de grupos minoritários.
O pesquisador tem vários meios de. descobrir até onde está correto.
Suponhamos que ele construa uma escala para medir a extensão em
que os indivíduos possuam as características dadas acima. Chamemos
isto Escala A. Ele usa também outra escala, a escala AS, que pesquisas
anteriores mostraram medir o anti-semitismo, ou o preconceito contra
os judeus. Ele está estudando, então, um aspecto da relação entre autori
tarismo e anti-semitismo. Ele podería, naturalmente, ter medido as ati
tudes dos sujeitos em relação a negros, estrangeiros, índios e outros
grupos minoritários. Entre as várias pessoas que responderam às duas
escalas, suponhamos que foram selecionadas 10 para representar todo
o grupo e que os dez pares de pontos sejam os da tabela 4.2. (Dez
conjuntos de pares ordenados dificilmente bastariam para avaliar uma
relação com fidedignidade. Geralmente os cientistas comportarrientais
usam muitos mais. Entretanto, o princípio é o mesmo, quer se usem
10 ou 10.000 conjuntos de pares.)
O pesquisador quer saber a direção e a magnitude de sua relação:
seu sinal, positivo ou negativo, e até onde os dois conjuntos de valores
covariam. Primeiro, os dois conjuntos de valores, com os de autoritaris
mo sempre em primeiro lugar e os de anti-semitismo em segundo, são
um conjunto de pares ordenados e, portanto, uma relação. Ê fácil ver
a direção da relação: é positiva porque há uma tendência marcante
dos valores altos de A serem acompanhados por valores altos de As —
por exemplo, (6,2; 5,7), (5,9; 5,3) — e igualmente para valores A e AS
baixos — por exemplo, (3,5; 4,0), (3,9; 3,5).
Não é tão fácil avaliar a magnitude da relação, isto é, até onde é
pronunciada a tendência de os valores de A e AS “caminharem juntos” :
alta com alta, média com média e baixa com baixa. O exame de con
juntos de pares ordenados parece indicar que a covariação dos pontos,
seu “caminhar juntos”, é pronunciada. Para ver isto mais claramente,
os postos dos valores, postos de 1 a 10, com 1 indicando o valor mais
alto e 10 o niais baixo, estão indicados na tabela 4.2 ao lado dos pontos
de A e AS (entre parênteses). Observe que em geral os postos vão
juntos: os postos baixos de A combinam com os postos baixos de AS,
acontecendo o mesmo com os postos médios e altos. Resumindo, a
relação entre autoritarismo e anti-semitismo, nesta amostra, é positiva
e “substancial”. É “substancial” até onde? É possível e aconselhável
calcular os índices da magnitude das relações. Tais índices são chamados
coeficientes de correlação, como já ficou sabido. 6
6 Para o leitor curioso, o coeficiente de correlação dos pontos A e AS da

tabela 4.2 é 0,7, que indica que a relação é substancial.
64
•Anti-Semitismo (AS)
Autoritarismo (A)
5.7 (2)
6,2 ( 1)
5.3 (3)
5,9 (2)
4.7 (5)
5.7 (5)
5.8 (1)
5.1 (4)
4.4 (7)
4.8 (5)
4.5 (6)
4.5 (6)
3.9 (9)
4.2 (7)
4,8 (4)
4,1 (8)
3.5 (10)
3.9 (9)
4,0 (8)
3.5 (10)
a Os números entre parênteses são os postos dos valores, com 1 sendo alto e 10 baixo.
Exemplos de diferentes tipos de relações
A descrição e discussão dos estudos de Clark e Walberg, Miller -

Swanson, no primeiro capítulo, e a descrição acima das relações entre
anti-semitismo e autoritarismo já devem ter-nos dado^ um pouco o
gosto da pesquisa psicológica e educacional contemporânea e da natu
reza das relações. Agora precisamos ser mais específicos. Para isso vamos
delinear rapidamente uma relação hipotética entre inteligência e reali
zação escolar e depois estudar três tipos diferentes ou formas de relaçao,
usando outra vez exemplos hipotéticos.
Inteligência e realização escolar: um exemplo hipotético
Quando há uma relação entre dois fenômenos, duas variáveis, eles

variam juntos. Coloquemos assim: “Se há uma relação entre duas vana-
veis, quando uma delas muda, a outra também muda’’. Suponhamos
aue tenhamos um meio de medir, digamos, inteligência e realizaçao
Cscolar e que observemos os valores de ambas as medidas em uma
amostra de crianças. Na medida em que os valores de uma delas varia
ou “vai junto com” os valores da outra, nesta medida, as duas se
íelacionam. Na medida em que os valores observados de realizaçao
escolar mudam quando mudam os valores observados de inteligência,
nesta medida, as duas estão relacionadas. A isto se chama vanaçao
ioncomitante.
65
X
Figura 4.8
Estude o gráfico da figura 4.8, que mostra uma relação hipotética

entre inteligência e realização escolar. Alguns pares de valores foram
incluídos no gráfico. O primeiro par de valores (na extrema esquerda)
é (1,2), isto é, o número de pontos de inteligência da criança é 1 e sua
realização é 2. Os pontos da criança seguinte são (2,2). O par de pontos
da última criança é (5,4). O princípio é: “Assim como os ^pontos de
inteligência variam, também variam os pontos de realização”. Os dois
conjuntos de pontos em geral variam juntos — neste caso aumentam
juntos. Foi traçada uma linha entre os pontos marcados de sorte a
ficar o mais próxima possível de todos eles. Indica a direção da relação:
positiva porque pontos baixos de inteligência são acompanhados por
pontos baixos de realização, enquanto pontos altos de inteligência vêm
acompanhados de pontos altos de realização.
Exemplos hipotéticos de relações com direções e magnitudes diferentes
Suponhamos que um professor tenha os pontos (sob a forma de

QIs) do teste de inteligência e os pontos do teste de realização de sete
alunos e queira saber alguma coisa sobre a relação entre os dois conjun
tos de pontos. Os pontos são os do quadro da página seguinte. O pro
fessor marca os pontos em um gráfico, como na figura 4.9. Ele quer
saber a direção e a magnitude aproximada da relação.
É óbvio que a relação é positiva. Em geral, Qfs altos tendem a ser
acompanhados por pontos mais altos de realização, e QIs mais baixos
por pontos mais baixos em realização. A magnitude da relação é mais
difícil de entender pelo gráfico. Mas podemos observar que é substan
cial. Se a realização fosse tão alta quanto possível, os pequenos círculos
estariam todos em linha reta partindo da esquerda inferior para a direita
superior. Quanto mais se afastam da linha reta, mais baixa a relação.
66
---------------------------------------- -—
c> Realização
145 51
125 57
118 60
110 48
100 54
97 35
90 32
Embora os sete círculos não se tenham colocado na linha reta que passa
0 mais próximo possível de todos os círculos simultaneamente — a linha
traçada no gráfico — eles se mantêm bastante perto dela. (Lembre-se
de que esta linha se chama linha de regressão.) Outro meio de ter alguma
Idéia da magnitude da relação é comparar os postos dos dois conjuntos
de pontos, como já fizemos. Isto fica para o leitor como um exercício.
Agora suponhamos que tomamos uma relação com direção negativa
e consideravelmente menor em magnitude. Tal relação é mostrada no
gráfico da figura 4.10. Suponhamos que ela mostre a relação entre a
afluência de um bairro e a delinqüência. Novamente temos sete pontos.
Desta vez, entretanto, estão mais espalhados; estão mais distantes da
linha traçada, o mais próxima possível de todos os pontos. Além disso,
a direção da linha, que agora corre da esquerda superior para a direita
inferior do gráfico, é diferente. Indica que a relação é negativa: à
67
medida que o bairro se torna mais afluente, há menos delinqüência.
Mas agora a relação é muito mais fraca do que era na figura 4.9, onde
os pares de pontos estavam mais perto da linha de regressão. Observe
que quatro dos pontos (os pequenos círculos) estão bem distantes da
linha. Em suma, a relação é negativa e não é muito forte.
Figura 4.11
68
Muitas variáveis, naturalmente, não têm nenhuma relação entre si,
n não ser por acaso: sua relação é zero ou próxima de zero. Isto quer
dizer que o conhecimento de uma variável não contribui para o conhe
cimento de outra variável. Não se pode dizer, por exemplo, que enquanto
uma variável aumenta a outra variável aumenta ou diminui. Tal situa-
I0 é mostrada na figura 4.11, onde 100 pares de números entre 0 e 100
! pram marcados. Os números foram obtidos de duas colunas de números
uiprováveis de um ou dois algarismos, numa tabela maior de tais
S i&ieros (Kerlinger, 1973, pp. 715 e 717, duas últimas colunas de
números de dois algarismos).7 Casualidade e números aleatórios, um
portante desenvolvimento técnico e científico moderno, serão expli-
E dos no capítulo 5. É suficiente dizer, por enquanto, que números alea
tórios são como o resultado do jogo de dados ou de moedas: não há
Ordem dedutível ou previsível de espécie alguma nos números. Não se
pode predizer — já que ambos os conjuntos de números são casuais —
nenhum número a partir de outro. Se aparecer um 90 em uma coluna,
pão se pode dizer que é provável que um número alto o acompanhe na
outra coluna, o mesmo para números baixos e médios. Em linguagem
Comum, os números dos pares estão todos misturados: todas as combi
nações possíveis podem ocorrer, mas não se pode prever um número
n partir de outro.
Compare a figura 4.11 com as figuras 4.9 e 4.10. Nas duas últimas
houve um “caminhar junto” sistemático dos números, embora tenha
havido consideravelmente menos “caminhar junto” na figura 4.10 do
que na 4.9. Mas pode-se ver que os círculos da figura 4.11 estão por
todo o gráfico e, mais importante, não há ordem discernível ou
^caminhar junto”. Este é um estado de relação zero.
Ainda temos muito o que dizer sobre relações neste livro. Elas são
o recheio e o núcleo da ciência. Compreender que o objetivo maior da
ciência é a explicação e que a explicação vem principalmente do estudo
das relações é compreender a base da ciência. Agora vamos tentar
amarrar as idéias de explicação e relações e, já que estamos no assunto,
falar da importante idéia de teoria.
Bxplicação científica, teoria e relações
Embora relações, teoria e a explicação fossem discutidas no pri

meiro capítulo, sua importância exige exame mais profundo. A ciência
está constantemente preocupada em explicar as coisas. “Explicar” uma
Coisa significa dizer o que é esta coisa. Mas é virtualmente impossível,
* Estes números foram criados por um programa especial em um computador

(1( grande porte.
69
pelo menos neste mundo, dizer-se diretamente o que uma coisa e. Tamais
poderemos chegar à “essência” total de alguma coisa (embora os místicos
nos digam o contrário). Em ciência _ queremos explicar fenômenos
naturais. Por exemplo, queremos explicar “preconceito , o que quer
dizer que vamos dizer como nasce, por que nasce, como caminha, o
que o afeta, o que ele afeta e assim por diante.
Explicar alguma coisa, pelo menos satisfatoriamente, certamente e
uma das tarefas mais difíceis que podemos empreender. Mais que isto,
é literalmente impossível explicar tudo sobre algum fenômeno, ou sobre
conjuntos de fenômenos. E explicar tudo sobre preconceito, por exem
plo, simplesmente não é possível, principalmente se quisermos^ que boa
parte de nossa explanação venha apoiada em evidência empírica. Em
outras palavras, a “verdade” absoluta é para sempre impossível. Mas
aproximações razoáveis a explicações de fenômenos naturais podem ser
dadas de maneira científica satisfatória.
O único meió, então, de explicar alguma coisa, é determinar de
que maneira esta coisa se relaciona com outras coisas. Assim a explica
ção do preconceito significa descobrir como o preconceito se relaciona
com outros fenômenos naturais. Se estivéssemos interessados apenas no
desenvolvimento do preconceito em crianças, teríamos que saber pelo
menos em que idade as crianças tomam consciência de “outros grupos .
A relação seria entre a idade e conhecimento ou consciência de
outros grupos.
Já dissemos que a ciência lida apenas com fenômenos naturais e
explicações “naturais” de tais fenômenos. Explicar o preconceito, por
exemplo, dizer que ele faz parte da natureza humana, que todo o indi
víduo é “naturalmente” preconceituoso em relação a grupos diferentes,
do seu, não é uma explicação no sentido científico porque usa um
termo “natureza humana” , que é tão vago que se torna inacessível a
observação científica. Onde encontramos “natureza humana”? Como
podemos medi-la? Ou pode-se dizer: “Deus fez grupos diferentes e as
diferenças levam à hostilidade” . Isto também não é uma explanaçao no
sentido científico. Invocar Deus como a causa das diferenças, retira a
afirmativa do âmbito da preocupação científica. Mais ainda, pode-se
retorquir que Deus fez todos os homens iguais. Dizer que diferenças
levam à hostilidade, embora uma afirmativa melhor porque pelo menos
implica a possibilidade de observação, ainda é vago demais para a obser
vação científica. Todas as diferenças de grupos? Algumas apenas? Que
espécie? Que espécie de hostilidade? Sob que circunstâncias? E assim
por diante.
Naturalmente há muitas “explicações” para o comportamento hu
mano e para fenômenos. “Doença é castigo pelo pecado”; “As depressões
econômicas são devidas aos judeus” ; “Os pretos são músicos matos .
70
Tais “explicações” são cientificamente sem valor porque não podem
ser submetidas a investigações científica e a testes. Sem dúvida, uma
grande contribuição da ciência é sua rejeição de “ explicações” que real
mente nada explicam. A explicação pode referir-se apenas a fenômenos
naturais, e “fenômenos naturais” significam ocorrências no mundo
Sflbservável. Qualquer fenômeno, para ser um fenômeno natural, precisa
ser observável, potencialmente mensurável ou manipulável. Não é neces
sário ser visto diretamente. Mas precisa haver alguma evidência de suas
gjiliifestações no mundo empírico. “ Preconceito”, neste sentido, implica
em certo tipo de comportamento.
Como, então, a ciência explica o preconceito — ou qualquer outro
fenômeno natural? Repetindo, pode ser explicado apenas pelas suas rela
ções com outros fenômenos. Necessariamente tais explicações são sempre
parciais e incompletas. Foi descoberto, por exemplo, que o autoritarismo
está positivamente ligado ao preconceito (Adorno e outros, 1950):
jessoas muito autoritárias tendem também a ser preconceituosas contra
J udeus, negros e estrangeiros. Descobriu-se também que se a maioria das
pessoas de determinado grupo de indivíduos tem crenças estereotipadas
(crenças relativamente fixas e rígidas) sobre membros de outro grupo, elas
então tenderão a ter atitudes negativas em relação aos membros do
OUtro grupo. Ficou dito também — e provado por evidência (Dollard e
OUtros, 1939) — que a frustração leva à agressão, que muitas pessoas
aão social e economicamente frustradas e dirigem a hostilidade resultante
para outros grupos. Temos aqui, então, fenômenos relacionados com o
preconceito: autoritarismo, estereotipia e frustração. Assim, temos uma
Jjtplicação parcial de preconceito.
Preconceito é um conceito ou constructo bastante difícil. Vamos
tomar um fenômeno ou variável igualmente complexo, mas talvez mais
ficilmente ilustrável, realização, e sintetizar uma explicação. Fazemos
isto usando um exemplo de uma explanação teórica semelhante àquela
dada quase no fim do capítulo 1. A importância das idéias justifica
o exemplo adicional. Suponhamos que queremos saber por que certos
âlunos não se saem bem na escola. Já sabemos que inteligência é uma
Variável explanatória: crianças abaixo de um certo nível de inteligência
tendem a não se sair bem na escola. 8 Mas muitas dessas crianças se
«aem bem — e muitas crianças de nível superior de inteligência não
fce saem bem. Apenas inteligência, então, é uma explicação parcial.
Ilibe-se também que crianças de classes sociais mais baixas não se saem
Ifio bem na escola, comparadas às crianças de classe média. Há muito se1
11 Como a natureza de nossa tarefa neste livro é esclarecer a ciência e a pesquisa

ttntíflca, não tentaremos discutir os aspectos controvertidos de conceitos como
Hlllgêncía. Acreditamos, quando usamos uma variável como inteligência, que
pomui ser medida validamente. Naturalmente, podemos estar errados.
71
pensa também, embora sem apoio muito forte de evidência, que a mo
tivação — desejar ou não desejar sair-se bem — é uma variável impor
tante que influencia a realização escolar.
Agora vamos colocar uma “explicação” de realização escolar com
as três variáveis que acabamos de mencionar. Tenha em mente que este
exemplo é muito simplificado. A realização escolar é um fenômeno com
plexo, cuja explicação ainda confunde cientistas e educadores. Estamos
dando uma explicação apenas parcial e limitada com fim pedagógico.
Em todo caso, a “explicação” está representada na figura 4.12. As setas
indicam as relações ou influência. Uma seta de linha contínua e uma só
ponta indica “ influência” ; uma seta de linha interrompida e duas pontas
indica uma influência mútua, ou simplesmente uma relação. (“ Influência
geralmente implica um efeito numa só direção; “ relação” implica que a
influência pode ser numa direção ou noutra, ou em ambas.)
A explanação assim representada indica que inteligência e motiva
ção influenciam diretamente na realização escolar. As crianças mais inte
ligentes tendem a fazer melhor o trabalho escolar, e as crianças que estão
mais interessadas no trabalho escolar e mais desejosas de fazê-lo, fazem
um trabalho melhor. Inteligência e classe social e inteligência e motivação
influenciam-se mutuamente. Crianças de classe média, por exemplo, têm
em média pontos mais altos em testes de inteligência, e as crianças mais
altamente motiváveis são, em média, crianças de maior inteligência. A
motivação é influenciada diretamente pela classe social. Crianças das
classes trabalhadoras não se interessam tanto pelo trabalho escolar como
as de classe média, talvez porque o ambiente menos afluente não con
duza à aceitação entusiástica do aprendizado e do estudo. (Além disso,
72
a escola norte-americana ê uma instituição de classe média.) A classe
social não exerce efeito direto sobre a realização escolar, então, influen
cia a realização apenas indiretamente, através da inteligência e da moti
vação.
O objetivo deste exemplo não é sua adequação ou validade. Antes,
o objetivo é mostrar como é uma explicação comportamental científica
de um fenômeno e como as relações são o recheio de tal explicação.
O fenômeno da realização escolar é “explicado” pela relação entre, de
um lado, inteligência, motivação e classe social, e, de outro, realização
escolar — e também pelas relações entre inteligência, motivação e classe
social.
Todo o conjunto de variáveis e as relações especificadas entre elas
podem ser chamadas uma “tèoria”. Naturalmente, esta deveria ser
chamada uma “pequena teoria”, ou o embrião de uma teoria, porque
um fenômeno tão complexo quanto realização escolar dificilmente pode
ría ser explicado por três variáveis. Entretanto, a maioria das teorias
científicas consiste em tais relações sistemáticas entre variáveis. Uma
teoria, então, é um conjunto de constructos inter-relacionados (variáveis),
definições e proposições que apresentam uma visão sistemática de um
problema especificando relações entre variáveis, com a finalidade de
explicar fenômenos naturais.
Esta discussão sobre “explicação" em' ciência foi necessária para
tirar o mistério da explicação e da teoria científicas. Toda explicação,
paturalmente, usa relações. A diferença entre explicações científicas e
jSXplicações não-científicas de fenômenos, entretanto, é profunda. É inse
parável das palavras “sistemática”, “controlada” e “empírica.” A dife
rença deve ficar mais clara à medida que continuarmos discutindo.
73
5. P r o b a b ilid a d e e e s t a t í s t i c a
X
Vivemos num mundo probabilístico. Num inundo onde quase nada é
absolutamente certo. Muita coisa é relativamente certa, claro. Ê quase
certo que choverá em Nova Iorque ou Amsterdã durante os próximos 30
dias. É quase certo que algumas pessoas farão amor amanhã na Califór
nia! Mas nunca se garante certeza absoluta. Há limites nas certezas:
algumas coisas são virtualmente certas, como as que mencionamos. Entre
tanto, outras estão longe disso. Falamos probabilisticamente o tempo
todo, embora freqüentemente vivamos como se os acontecimentos da
vida fossem infalíveis. Os cientistas, entretanto, não apenas falam
probabilisticamente; eles vivem probabilisticamente em seu mundo de
pesquisas.
Uma das principais diferenças entre os vários ramos da ciência é o
grau de certeza dos acontecimentos e relações. Nas ciências naturais,
por exemplo, o grau de certeza é muito alto. Um físico pode expor uma
lei física e pôr alta confiança no comportamento de corpos físicos e em
acontecimentos. Aliás, müitas relações em física são chamadas leis ,
em parte pelo alto grau de certeza a elas associado. Entretanto, sempre
há margem para erro, embora a literatura popular e o próprio homem
pareçam confiar plenamente nas leis físicas e no comportamento de
objetos e acontecimentos.
Os acontecimentos e relações das ciências comportamentais sao
muito menos certos. Um químico diz que, se certa quantidade do produto
químico A for juntada a certa quantidade do produto químico B, haverá
uma explosão. A afirmativa e probabilística, embora sua probabilidade
de estar correta (na maioria dos casos) seja muito alta. Os psicologos,
por outro lado, podem dizer que se as crianças forem frustradas elas
mostrarão agressão, mas a probabilidade da afirmativa estar correta não é
tão alta assim. Quando um cientista político diz: “Quem é conservador
vota nos republicanos.”, a afirmativa é empiricamente válida porque as
pessoas com tendências conservadoras quase sempre votam nos republi
canos. Mas a afirmativa tem probabilidades bastante baixas em casos
particulares. Em média, os cientistas políticos provavelmente estejam
corretos. Mas se tentarem predizer quantos votos terá determinado indi
víduo, freqüentemente errarão.
74
A despeito das diferenças de graus de certeza', é importante com
preender que todas as ciências são probabilísticas. O pensamento do
dentista em todos os campos é fundamentalmente o mesmo. Entretanto,
os cientistas discordam radicalmente nos níveis de probalidade que comu-
mente se associam aos fenômenos e relações com que trabalham. Se
flllisermos compreender ciências como a psicologia e a sociologia, é
também importante termos capacidade de pensar e viver em paz com as
ifirmativas probabilísticas. Precisamos entender perfeitamente que cada
liserção, cada afirmativa de relação vem acompanhada de uma “ etique
ta" probabilística. Sempre que dizemos “Se p, então q”, o que dizemos é
"Se p, então provavelmente q”. O que acontece na vida se repete na
Ciência: a certeza é um mito, para sempre fora do nosso alcance.
A estatística é uma filha da probabilidade. Em parte é um instru
mento que mostra aos cientistas em que medida o resultado de suas
pesquisas é seguro, e, assim, quanto suas asserções são dignas de con
fiança. O principal resultado de Clark e Walberg, a diferença média de
realização em leitura entre os grupos experimental e de controle, provou
que sua hipótese sobre o efeito do reforço maciço no aproveitamento
em leitura de crianças carantes negras foi “empiricamente válido” .
("Empiricamente válido" significa que a evidência da pesquisa apoia
uma asserção sobre uma relação.) A única maneira, pelo menos que
Conhecemos hoje, pela qual poderíam avaliar a validade empírica da
afirmativa foi usar o raciocínio estatístico e probabilístico e métodos
estatísticos de avaliação. O que significa isto?
Quando obtemos o resultado de uma pesquisa, queremos saber se
podemos confiar nele. Se repetirmos o experimento várias vezes, obtere
mos os mesmos resultados a cada repetição? Se a resposta for sim, os
resultados são confiáveis. A diferença entre a média de pontos de leitura
OOS grupos de Clark e Walberg é confiável? Podemos acreditar que se
Clark e Walberg tivessem feito o mesmo experimento ou experimento
lemelhante três, quatro ou mais vezes, eles teriam conseguido os mesmos
OU resultados semelhantes: as mesmas ou diferenças semelhantes entre a
média de pontos de leitura do grupo experimental e do grupo de controle?
Um teste estatístico de seus resultados pode responder a esta pergunta.
Embora a finalidade deste livro não permita entrar nos detalhes de tais
testes estatísticos, precisamos ter uma compreensão geral de como estatís
tica e probabilidade “funcionam”, como usam as idéias de acaso e casua-
dade para ajudarem os cientistas a chegarem a conclusões sobre os
É ssultados de suas pesquisas.
Probabilidade e estatística são temas interessantes, intrigantes e até
Hlcinantes. Apesar das concepções errôneas associadas à sua natureza e
uso, ambas estão próximas da realidade porque se assemelham à natureza
c modelo de nossas vidas e penetram a essência de nosso pensamento e
75
comportamento. Tomemos como exemplo uma tomada de decisão.
Constantemente tomamos decisões sobre o que fazemos. Os resultados,
naturalmente, nunca são certos. Somos, então, calculadores quase esta
tísticos e probabilíticos — embora muita gente pudesse se irritar com a
idéia de que suas vidas e decisões têm natureza estatística. Afinal, a
estatística trabalha com números e minha vida não se baseia em números!
Mas nossas vidas são baseadas em números, explícita ou implicitamente.
Sempre há probabilidades numéricas associadas aos resultados de nossos
atos e decisões, embora raramente saibamos quais são essas probabiíi- •
dades.
Eis um paradoxo. A estatística e a probabilidade lidam essencial
mente com incertezas; na pesquisa, entretanto, elas nos ajudam a ter
mais certeza dos resultados que obtemos! Isto não significa que podemos
ter certeza dos próprios resultados, dos resultados em si, mas que pode
mos atribuir graus de certeza aos resultados com bastante precisão. Se fiz
uma experiência com um grupo experimental e um grupo de controle,
por exemplo, e obtive a diferença entre os dois grupos na direção pre
vista, posso garantir que esta diferença seja suficientemente grande para
justificar minha confiança de que é uma “diferença verdadeira” ? Poderei
dizer algo como: “A probabilidade de que a diferença de média de
pontos dos dois grupos não é fortuita, não é devida ao acaso, é alta.
Há apenas uma possibilidade em cem de que a diferença seja devida ao
acaso”. Embora probabilística, é uma afirmativa forte.
Probabilidade
Probabilidade e acaso são dois poderosos conceitos inventados para

ajudar-nos a esclarecer a ordem e a confusão do mundo. São também
conceitos frustradores porque não sabemos ao certo do que estamos
falando quando os discutimos. Isto soa estranho. Parece verdade, entre
tanto, que as idéias aparentemente mais simples transformam-se em
complexas e confusas depois de cuidadoso exame. Probabilidade e acaso
são dois bons exemplos. Ambas são difíceis de definir. Felizmente, em
nosso caso, não há muito problema. Sabe-se muito bem como funcionam
os procedimentos de casualização e probabilidade — e um pouco deste
saber servirá nosso objetivo.
Probabilidade: uma definição
Embora definida no capítulo 2, precisamos agora expandir e elucidar,

aquela discussão. A probabilidade (p) de um evento é o número de casos
“favoráveis” do evento dividido pelo número total de casos (igualmente
76
§!OSsíveis). (“Favorável” significa favorável a um acontecimento cuja
probabilidade estamos avaliando.) Isto é expresso pela equação:
número de casos favoráveis

. p (evento) -------------------------------------------------
número total de casos possíveis
Esta é uma definição teórica ou a priorí, como é chamada.1
Jogue uma moeda uma vez. A probabilidade de dar cara é 1/2, pois
há duas possibilidades: /C , c/. Agora jogue duas vezes. Qual é a proba
bilidade de duas caras? Precisamos tomar cuidado. Há quatro possibili
dades. Da primeira vez pode dar cara ou coroa. Da segunda, cara ou
coroa. O número total de possíveis resultados é 4: [(Ci, C2), (Ci, c2)
(Ci, C2), (ci, c2) ], onde Ci = cara na primeira jogada, c2 = coroa na
gegunda jogada e assim por diante. O denominador da fração de proba
bilidade é 4. Já que há apenas uma possibilidade de duas caras, (Ci, C2),
a probabilidade de duas caras em duas jogadas é de 1/4.
Vamos mudar um pouco e ampliar o problema. Qual é a probabili
dade de sairem três caras em três jogadas? As possibilidade são dadas na
árvore da figura 5.1. As possibilidades de duas jogadas no problema
acima são dadas nos primeiros dois estágios da árvore, a “ Primeira
Jogada” e a “Segunda Jogada” . As probabilidades dos resultados estão
iBsinaladas também: são todas de 1/2. A terceira jogada simplesmente
acrescenta possibilidades. Para listar todos os rèsultados possíveis das três
Ogadas, procure-os nas ramificações do gráfico:
Í »(Ci, Ca, C3), (Ci, C2, C3), . . ., (ci, c2, C3)]. Há oito desses resultados,
c assim o denominador da fração de probabilidade é 8. Portanto, a proba
bilidade de três caras em três jogadas é de 1/8, já que há apenas um
caso de três caras: (Cj, C2, C3).
As probabilidades de outros eventos — qualquer resultado definido
6 chamado um evento — podem ser determinadas com facilidade. O
denominador é sempre 8. Qual é a probabilidade de duas caras e uma
Coroa? A probabilidade é de 3/8, porque há três desses eventos no
|ráfico. (Conte-os. Eles estão marcados na figura 5.1.) Pode-se também
Calcular a probabilidade de qualquer evento multiplicando as probabili-*
í Outra conhecida definição é chamada a posteriori, ou definição de freqüência.

Afirma que, numa série de tentativas, a probabilidade é a razão entre 0 número
de vezes que um acontecimento ocorre e o total do número de tentativas. Aqui
fazem alguns testes, contando o número de vezes que determinado aconteci-
mente ocorre, calculando depois a razão. O resultado do cálculo é a probabili
dade do acontecimento. Usamos as duas definições, mas príncipalmente as de
tipo a priorí.
dades ao longo de qualquer uma das ramificações do gráfico. Por
exemplo, a probabilidade de três caras é: 1/2. 1/2. 1/2 —.1/8. A proba
bilidade de Ci, C2, C3, é 1/2 . 1/2 . 1/2 = 1/8. Neste exemplo, a proba
bilidade é a mesma em cada ramificação porque a probabilidade de C ou
c é sempre 1/2. Em muitos problemas, entretanto, haverá probabilidades
diferentes e o cálculo não é tão simples assim. No próximo exemplo
que estudarmos as probabilidades não serão de 1/2.
O principal problema em cálculos de probabilidade é determinar o
número total de possibilidades, depois de cuidadosa conceituação do pro
blema. Mas por que trabalhar com um problema tão trivial quanto este
jogo de moeda? Nós o escolhemos porque o raciocínio e o método são
semelhantes na maioria dos problemas de probabilidade. Naturalmente
entram outras complexidades nos problemas reais. Por exemplo, con
cluímos que no jogo da moeda as probabilidades de cara e coroa são
iguais. Nos problemas reais isto pode não acontecer. Além disso, há
invariavelmente muito mais possibilidades. Entretanto, as mesmas idéias
permeiam a maioria dos problemas de probabilidade.
Tomemos um exemplo mais realista. Suponhamos que temos uma
amostra de 100 eleitores, 60 democratas e 40 republicanos. Se pusermos
Terceira
jogada
Segunda
jogada 1/2
Primeira 1/2
■C3/
Figura 5.1
78
tm nomes dos eleitores (em pedaços de papel) numa urna, misturá-los
l'i;im e tirarmos um, qual é a probabilidade de sair üm republicano?
f de 40/100 = 0,40. (Costuma-se expressar probabilidades em forma
HCltnal.) Isto é óbvio e não é preciso nenhuma elaboração. Mas suponha
mos que vamos precisar de 30 pessoas para uma pesquisa. Quantos
ilclfflocratas e quantos republicanos vamos ter se tirarmos 30 pedaços
iltk papel da urna? Devemos ter 60/100 x 30 = 18 democratas e
fakA
UJ/100 x 30 = 12 republicanos. Teremos exatamente estes números?
lJi'B/avelmente não. Mas teremos números aproximados deles se mistu-
i.irmos bem os pedaços de papel depois de cada vez que tirarmos.
I)8vc ser algo assim: (18, 12), (19, 11), (20, 10), (17, 13), (16, 14), e por
il vai. Estas são as possibilidades mais prováveis. Se tirássemos 10 demo-
i rtttas e 20 republicanos, ou 1 democrata e 29 republicanos, ficaríamos
ffiulto surpresos. A primeira combinação é improvável, a segunda alta
mente improvável.
Aeaso
Precisamos fazer um desvio na discussão para apresentar uma idéia

básica subjacente à moderna estatística e ao pensamento estatístico: o~5
acaso. Infelizmente não parece possível definir acaso sem ambigüidade.
Uma definição de dicionário — aleatório, acidental, sem rumo ou direção
■ não nos ajuda muito. Sem dúvida os cientistas são muito sistemáticos
i'fn relação à casualidade: escolhem cuidadosamente amostras ao acaso
ir planejam procedimentos casuais em experimentos.
Suponhamos que um ser onisciente possua um enorme livro enci-
■tapédico. Cada acontecimento e cada detalhe de cada acontecimento —
'In passado, de amanhã, depois de amanhã e assim por diante — são
■uidiidosamente anotados no livro. Não há nada desconhecido. Natural-
Bionte não há acaso, porque se alguém sabe tudo não pode haver casuali-
'I 'de. Ê possível adotar a posição de que nada acontece ao acaso, de
ip(9 para cada acontecimento há uma causa. O único motivo de se usar
palavra “acaso” é que os seres humanos não sabem o suficiente. Sob
WLti tspecto, casualidade é ignorância, claro.
Pegando uma deixa deste argumento, podemos definir o acaso de
Utini maneira um tanto desajeitada: eventos são casuais se não podemos
prover seus resultados. Por exemplo, não se conhece um jeito de ganhar
MU jogo de moedas. Se não existe sistema para o jogo que garanta ganhar
ia:" ou perdermos, então, o resultado do jogo é casual. Colocado mais
torrftilmente, casualidade significa que não há lei conhecida, capaz de ser
'■ipressa na linguagem, que descreva eorretamente ou possa predizer os
<'Mnt08 e seus resultados (Kemeny, 1959, pp. 68-75).
Um conjunto de 100 números, de 0 a 9, é dado na tabela 5.1 em
conjuntos de dez cada. Estes números foram tirados de um enorme con
junto de tais números aleatórios. (Esqueça a última linha da tabela por
enquanto.) Estude os números. Você terá dificuldade de encontrar qual
quer forma de regularidade ou sistema neles. Não há números pares ou
ímpares sucessivamente recorrentes; não há seqüências regulares de
números. Eles são, com efeito, imprevisíveis. (Se alguém levar suficiente
mente longe a busca, sempre acabará encontrando alguma coisa).
Resumindo, quando os eventos são aleatórios, não podemos pre
dizê-los individualmente. É estranho, entretanto, podermos predizê-los-
com ótimos resultados no total. Isto é, podemos predizer os resultados
de grande número de eventos. Embora não possamos prever, ao jogar
uma moeda, se vai dar cara ou coroa, podemos, atirando-a mil vezes,
predizer com considerável exatidão o número total de caras e coroas.
Se tirarmos uma amostra de 100 crianças de uma população de 400,
200 meninos e 200 meninas, não podemos predizer se uma determinada
criança será menino ou menina, mas podemos predizer com bastante
exatidão o número total de meninos e meninas em nossa amostra — neste
caso, 50 meninos e 50 meninas — contanto que a amostragem seja
casual e a amostra numerosa.
Uma manifestação importante da segurança de previsão estatística
do comportamento de grandes conjuntos de números é dada na parte
inferior da tabela 5.1. São médias aritméticas. Cada média é calculada
para 10 números aleatórios. Sempre podemos predizer com considerável
exatidão que os valores dessas proporções estarão próximos do “valor
teórico” da média dos números de 0 a 9. Esta média teórica é
Tabela 5.1 Conjunto de 100 números aleatórios, de 0 a 9, e médias calculadas

de subconjuntos dos números.
1. 2 3 4 5 6 7 8 9 10
9 0 8 0 4 6 0 7 7 8
7 2 7 4 9 4 7 8 7 7
6 2 8 1 9 3 6 0 3 9
7 9 9 I 6 4 9 4 7 7
3 3 1 1 4 1 0 3 9 4
8 9 2 1 3 9 6 7 7 3
4 8 3 0 9 2 7 2 3 2
1 4 3 0 0 2 6 9 7 5
3 1 8 8 4 5 2 1 0 3
2 1 4 8 9 2 9 3 0 1
Média 5,0 3,9 5,3 2,4 5,7 3,8 5,2 4,4 5.0 4,9 Média total = 4,56
80
0 + 1 + ••• 9)/10 = 4,5. Observe que seis das 10 médias estão
flcima de 4,5 e quatro abaixo de 4,5.
Só uma, a quarta, 2,4, afasta-se muito de 4,5. Quanto mais números
ae usar para calcular as médias, mais próximas elas provavelmente
ficarão da média teórica. Se, por exemplo, calcularmos a média de todos
OS 100 números na tabela 5.1, teremos 4,56, muito perto de 4,5. Tal
fiomportamento regularmente previsível de grandes conjuntos de números
é muito útil em pesquisa. Dá ao cientista um quadro de referência para
ftvaliar resultados no sentido de que ele possa conferir os resultados
Obtidos confrontando-os com os resultados “teoricamente” esperados ou
baseados no acaso.
probabilidade, acaso e pesquisa comportamental

Pode parecer um salto muito grande entre atirar moedas e números
casuais para o uso da teoria da probabilidade em pesquisa real. E é de
um ponto de vista: os “evento.s” na pesquisa real são muito mais com
plexos. Mas as idéias básicas são as mesmas, ou pelo menos bastante
lemelhantes. Tentaremos mostrar isto com um exemplo hipotético inspi
rado por um experimento psicológico bem conhecido. 2 Vamos então
jfeforçar as idéias voltando ao conceito de acaso.
Suponhamos que eu faça um experimento com três grupos de jovens.
Quero saber, se puder, se a crescente dificuldade de entrar para um
grupo aumenta a atração e valor desse grupo. A hipótese é que a dificul
dade de iniciação dentro de um grupo aumenta o valor do grupo aos
Olhos de seus membros. Suponhamos que alguns suburbanos desejem
gertencer a um clube de campo. O pensamento por detrás do experi
mento é que quanto mais difícil for entrar para o clube — taxa de jóia,
mensalidades altas, uma longa espera na fila de admissão para sócio
0 ser considerado da cor de pele “certa”, da religião “certa” e do
GOnjunto “ certo” de pontos de vista sociais, por exemplo — , mais os
membros valorizarão o clube e o fato de serem seus sócios.
Para testar a hipótese fiz três grupos de indivíduos passarem por
três graus diferentes de dificuldades para pertencerem ao grupo. Vamos
lupor que isto foi feito sob condições cuidadosamente controladas; os
fflembros de um grupo, Ai, submeteram-se a duro sofrimento para
entrarem no grupo, os de outro grupo, A 2, um pouco menos, e os do
terceiro, A3, nenhum sofrimento. No fim do experimento fiz todos os
meus sujeitos experimentais responderem a um instrumento que media
A idéia para este experimento hipotético foi tirada de um experimento real de

Aronson e Mills (1969) no qual foi testada a hipótese acima. Acompanho o
HQuema de Aronson e Mills de perto, mas fabrico os resultados para nosso
objetivo — probabilidades.
o desejo percebido de pertencer ao grupo. Suponhamos que as tres médias
dos três grupos nesta medida fossem, Ai = 5,2; A2 = 4,7; A3 — 3*5.
(Os resultados refletem uma escala com 7 pontos, 1 significando muito
pouca exibição de desejo de entrar para 0 grupo e 7 significando enorme
desejo.) , .,
Essas médias, apoiam a hipótese. Será? Ai, 0 grupo mais sofrido,
teve a média mais alta; A2, que sofreu menos, chegou em segundo lugar;
e A3, que nada sofreu, recebeu a média mais baixa. Mas supondo que
alguém objete, dizendo que este resultado foi casual, que poderia ter
acontecido facilmente se os membros do grupo tivessem tirado os pontos
de um chapéu ou — aliás, a mesma coisa — tivessem respondido ao
instrumento simplesmente escrevendo quaisquer respostas às perguntas.
Como posso saber que estas três médias não são um dos muitos resul
tados que poderíam facilmente ter sido obtidos por acaso? Como posso
“testar” as três médias para avaliar seu suposto afastamento de tais
expectativas baseadas no acaso?
Para acalmar momentaneamente a curiosidade do leitor, mas talvez
não satisfatoriamente, pode ser usada uma técnica estatística conhecida
como. análise de variância para testar com precisão os resultados e seu
afastamento da expectativa baseada no acaso. Suponhamos, entretanto,
que eu não saiba nada a respeito de análise de variância. Mesmo asssim
posso testar a hipótese? Sim, mas não tão bem. Vamos então inventar
um teste. Embora não seja grande coisa, é melhor que teste nenhum e
tem a virtude de demonstrar de maneira simples como funciona e e
aplicada a teoria das probabilidades.
A hipótese apresentada acima implica numa ordem de postos das
médias dos três grupos experimentais. Ela prediz, com efeito, que os
membros de Ai, o grupo que mais sofreu, acharão o grupo muitíssimo
desejável; que os membros de A2, o grupo que sofreu menos, achará
o grupo desejável mas não lhe dará tanto valor quanto Ai; e que os
membros de A3, o grupo que não sofreu, darão o menor valor. Assim é
prevista uma ordem de postos pela hipótese: os pontos de At serão em
média maiores que os de A2 e os de A2, maiores do que os de A3.
Se aceitarmos a média dos grupos como indicativa da avaliação do grupo
sobre ser membro do grupo e deixar Ai, A2 e A3 representarem as médias,
então a hipótese pode ser escrita simbolicamente: Ai > A2 > A3,
onde > significa “maior que” . Então essa ordem de postos é: 1 2 3.
Uma vez que as médias obtidas foram Ai = 5,2: A2 = 4,7 e A3 = 3,5;
a hipótese parece confirmada, como ficou indicado. Mas talvez este
resultado tenha acontecido por acaso.
Aplique a teoria das probabilidades. Quais são as possibilidades.
Queremos testar a hipótese com uma fração, cujo denominador terá um
número que expresse todas as possibilidades. Quantas possíveis ordens
de postos de três médias podem ocorrer? Anote-as:
82
1 2 3
1 3 2
2 1 3
2 3 1
3 1 2
3 2 1
Há seis possíveis ordens de postos. Então o denominador da fração de

probabilidade é 6. O 1 2 3 obtido é um destes. Qual é a probabilidade
^9 ter ocorrido por acaso? Qual é a probabilidade, vendo de outra forma,
de que esta particular ordem de postos, que reflete a ordem de postos
revista pela hipótese, possa ocorrer simplesmente como uma das mãos
5 e um jogo de cartas onde as pessoas recebem cartas marcadas com
1, 2 e 3?
Afinal, não temos maneira de saber ao certo se a ordem de postos
das três médias realmente reflete a influência dos variados graus de seve
ridade de iniciação por que passaram os três grupos. A única coisa que
podemos fazer, se a ordem de postos das médias resultar, como dissemos
que resultaria, é inferir que a hipótese está correta. E a maneira de fazer
isto é avaliar os resultados experimentais obtidos comparando-os com
os resultados que poderíam ter ocorrido por acaso — dando cartas de um
baralho bem embaralhado, por exemplo.
O resultado de nosso experimento hipotético, 1 2 3, concorda com
a hipótese. Este resultado pode ocorrer por acaso uma vez em seis, já
que é uma das seis ordens possíveis de postos. Portanto, a probabilidade
da ordem de postos das médias, 1 2 3, é 1/6 = 0,17. Uma interpretação
deste resultado é que se eu fiz este experimento 100 vezes e a manipu
lação experimental não teve efeito — isto é, as condições de sofrimento,
ou severidade de iniciação não tiveram influência no desejo percebido
de fazer parte do grupo — a ordem de postos 1 2 3 teria ocorrido cerca
de 17 vezes. Nesta base, poderemos dizer que a manipulação experimental
teve algum efeito e que a hipótese ficou confirmada? Dificilmente. Afinal,
não se está muito garantido, quando as possibilidades são 1 em 6, ou 17
em 100, de obter tal resultado apenas pelo acaso. Entretanto, este é um
teste estatístico e me diz alguma coisa sobre os meus resultados.
Este teste não é muito bom, então. Se eu tivesse testado quatro
;rupos e previsto a ordem de postos das médias como 1 2 3 4, e tivesse
{ Ido isto que aconteceu no experimento, então eu teria confiança consi-
fleravelmente maior na validade empírica da hipótese. Isso porque com
atro médias haveria 24 ordens de postos possíveis das médias:
r 2 3 4; 1 2 4 3; 1 3 2 4; 1 3 4 2; e assim por diante até 4 3 2 1.
Assim, a probabilidade de obter 1 2 3 4 é d e l / 2 4 = 0,04, que significa
que há cerca de 4 possibilidades em 100 de obter 1 2 3 4 apenas jior
acaso — e é uma boa margem de segurança. Seu eu disser que minha
hipótese é 1 2 3 4, e é isto que obtenho, posso ficar bastante seguro de
que meu resultado não é casual e que as condições de sofrimento sem
dúvida influenciaram a percepção do desejo de ser membro do grupo.
(Sugere-se que o leitor verifique todas as possíveis ordens de postos para
perceber a validade deste raciocínio.)
Este teste ainda não é muito bom, contudo. Aqui ele foi usado com
um exemplo realístico para ilustrar a idéia de probabilidade. No entanto,
testes estatísticos mais poderosos são baseados em raciocínio semelhante.
A medida que avançarmos, tentaremos mostrar o raciocínio atrás de tais
testes, mesmo que não descrevamos como fazer os testes.
Uma concepção probabilística errônea e independência
Existe no senso comum uma idéia totalmente errônea e confusa das

probabilidades dos eventos. Comumente está contida na expressão “a lei
das médias”, que diz mais ou menos o seguinte: se houver um grande
número de ocorrências de um evento, a probabilidade desse evento será
menor no experimento seguinte. Suponhamos que se jogue uma moeda
cinco vezes, dando cara em todas elas. A idéia de senso comum da
“lei das médias” levaria a acreditarmos que há maior possibilidade de
dar coroa da próxima vez — ou menor possibilidade de dar cara. Mas
não. A probabilidade de cara na próxima jogada é a mesma que nas
jogadas anteriores: 1/2. As probabilidade não mudam sejam quais forem
os resultados anteriores. Diz-se que cada evento é independente.
Que relação tem essa idéia errônea com a compreensão da pesquisa,
com a maneira de os pesquisadores trabalharem e com os resultados esta
tísticos e sua interpretação? Para aplicar as idéias da teoria das proba
bilidades aos dados de pesquisa, deve-se assumir, quase sempre, que as
observações e os- dados resultantes da observação sejam independentes.
Independência significa que a ocorrência de um evento, A, de forma
alguma afeta a ocorrência de outro acontecimento, B. Isto quer dizer
que a probabilidade de B não é afetada por A. “Evento” deve ser inter
pretado de modo amplo. Pode significar qualquer tipo de ocorrência
definida: o lançamento de uma moeda, a ocorrência de caras, a escolha
de um caminho em um labirinto, por um rato, a resposta oral ou escrita
de uma criança a um item de um teste, a manipulação de uma variável
por um cientista.
Não é fácil demonstrar a independência, em parte porque a falta de
independência pode ser muito sutil. Tomemos o exemplo comum de um
84
Ipquisador manipulando duas variáveis ao mesmo tempo para estudar
ICU efeito separado e possivelmente conjunto sobre uma variável depen
dente. Suponhamos que um educador tenha motivos para acreditar que
ÍUétodos diferentes de ensino da leitura funcionem diferentemente com
tipos diferentes de material de leitura. As duas variáveis devem ser
Jtinipuladas ou manejadas de sorte que o manejo de uma não influencie
n Outra por causa do manejo ou manipulação ou por causa da natureza
dos variáveis. Suponhamos que o pesquisador usou dois métodos para o
tnsino da leitura, Ai e Aa, e dois tipos de material de leitura, Bt e B2,
Píespondentes a material difícil e material fácil. Suponhamos ainda que
f> método Ai leve muito mais tempo para aplicar que 0 método A2, e
que 0 espaço de tempo gasto em ensinar reduza a dificuldade de qualquer
lãfiterial de leitura. Haveria, então, uma falta de independência, porque
0 método Ai traz em si, por assim dizer, um fator relacionado com a
dificuldade do material (variável B). Em outras palavras, o método Ai
tanderá a funcionar melhor com material de leitura mais difícil, não por
Causa da natureza do método, mas simplesmente porque exige mais
tempo de ensino do que o método A2. Há, então, falta de independência
entre as variáveis A e B, já que um aspecto extrínseco da varíavel A,
eipaço de tempo de ensino, está relacionado com a variável B, dificuldade
do material.
Outro exemplo de falta de independência encontra-se na mensura-
çfio. Se, digamos, dermos um teste com dez itens a certo número de
grfanças e depois somarmos os pontos de cada criança nos dez itens
para obter 0 total — um procedimento comum — estamos assumindo
ue os dez itens são independentes e suas respostas também indepen-
S entes. Esta suposição é satisfeita razoavelmente em muitos testes e
ffiedidas e o procedimento é útil e válido. Mas suponhamos que pedísse
mos às crianças que numerassem os dez itens por ordem de importância
(OU qualquer outro critério). Os itens e suas respostas já não são mais
pendentes, porque antes que o item 1 seja escolhido como o mais
E jrtante, há 10 escolhas. Depois da primeira escolha, restam nove
! a serem escolhidos. Depois de escolher os nove primeiros itens
festa apenas um — e não há escolha. As respostas a itens posteriores,
om outras palavras, serão afetadas pelas escolhas anteriores. Isto é falta
íllemática de independência. Tal falta de independência afeta a esta
tística e sua interpretação. Isto não quer dizer que a ordem de postos e
ffiétodos semelhantes não possa ser manuseada probabilística e estatisca-
mente. Aliás, mostramos como um simples problema de ordem de postos
pode ser resolvido usando a teoria das probabilidades. Ela simplesmente
Ilustra a falta de independência. Em suma, muitas técnicas estatísticas
MlpCem independência e seu uso e interpretação com fenômenos ou pro-
éédimentos não-independentes pode nos confundir.
Fizemos esta digressão sobre a independência para tentar esclarecer
a concepção probabilística errônea esboçada antes. Os resultados \de
eventos casuais anteriores não afetam os resultados de eventos subseqüen-
tes — ou talvez devéssemos dizer que não devem afetar eventos
subseqüentes. Se a probabilidade de sair cara no primeiro lançamento de
moeda é de 1/2, será de 1/2 no décimo, no vigésimo, no qüinquagésimo,
sejam quais forem os resultados anteriores. Isto acontecerá a não ser
que se tenha feito alguma coisa para mudar a moeda ou o jogo, ou que
tenha havido alguma influência extrínseca atuando, como no experimento
sobre os métodos de ensino da leitura mencionado acima.
Acaso e pesquisa
Agora devemos estar em melhor posição para estudar o acaso e

sua relação com a pesquisa. Por que a idéia de acaso é tão importante
na pesquisa? Como é usada? Como ajuda os pesquisadores? Parte da
resposta já foi dada, mas precisamos continuar. Os resultados dos experi
mentos, por exemplo, têm que ser avaliados. O pesquisador tem que
perguntar: “ Os resultados confirmam a hipótese?” Suponhamos que eu
obtenha médias, num experimento com dois grupos de sujeitos, de 52,40
e 42,25 e que estejam na direção prevista pela hipótese. Devo também
ter um meio de avaliar o “tamanho” da diferença entre eles. Afinal, esta
pode ser uma das muitas diferenças que poderíam ter ocorrido por acaso.
Dificilmente alguém quer basear conclusões científicas em resultados
fortuitos ou ao acaso!
Imagine o que poderia acontecer sob condições puramente casuais.
Isto significa que não há nenhuma certeza; que não há influências siste
máticas em ação, ou, se houver influências sistemáticas, elas estão tão
misturadas que uma anula a outra, por assim dizer. É tudo uma mixórdia.
Se não houvesse nenhuma influências sistemática agindo no experimento
de Clark e Walberg, então a média de pontos nas repetições (replicaçÕes)
do experimento teria flutuado de maneira imprevisível. Tais médias pode
ríam parecer-se com as da tabela 5.2, que mostra as médias dos grupos
experimental e de controle de cinco replicaçÕes hipotéticas do experi
mento, junto com as médias reais obtidas por Clark e Walberg (última
linha da tabela). As médias das primeiras cinco linhas de dados da
tabela foram inventada para parecerem médias calculadas a partir de
números aleatórios cujas magnitudes eram iguais às das médias de Clark
e Walberg.
Nos experimentos 1, 2 e 5, as médias do grupo experimental são
mais altas que as do grupo de controle, mas nos experimentos 3 e 4,
são mais baixas. Além disso, as médias não diferem muito uma da
86
outra. A falta de resultados sistemáticos e a insignificância das diferen
ças entre as médias estão mostradas na coluna denominada “Diferença”.
Tais resultados são característicos de resultados obtidos em bases for
tuitas ou casuais. Compare-os com as médias reais de Clark e Walberg
e a diferença entre elas ( + 4,76). A estatística, então, ajuda-nos a deter
minar ou avaliar se os resultados obtidos “realmente” diferem dos
resultados” que seriam obtidos sob condições de acaso.
Tabela 5.2 Médias de oontos de leitura de cinco replicaçÕes hipotéticas do expe

rimento de Clark e Walberg sob condições de acaso — e médias reais obtidas.
Grupo Grupo
Experimento experimental controle Diferença
1 27,42 26,50 +0,92

2 28,10 26,95 +2,15
3 26,18 27,05 -0 ,8 7
4 27,41 28,56 -1 ,1 5
3 28,64 27,90 +0,74
C la r k e Walberg 31,62 26,86 +4,76
Tabela 5.3 Vinte pares de médias aleatórias e as diferenças entre médias.
M, m2 Diferença M, _m 2 Diferença “
3 1 ,8 4 50,06 1,78 48,87 48,52 0,35

4 6 ,2 0 53,95 — 7,75 53,08 52,94 0,14
4 7 ,6 9 53,61 — 5,92 56,79 46,79 9,72
3 1 ,8 3 49,31 2,52 47,99 48,33 —0,34
13,21 49,16 4,05 49,37 47,29 2,08
4 8 ,8 7 50,22 — 1,35 49,02 55,51 —6,49
4 9 ,6 4 58,36 — 8,72 45,68 52,39 — 6,71
il,3 7 49,57 1,80 47,04 49,95 —2,91
11,07 55,44 — 10,37 53,51 46,00 7,51
4 9 ,2 8 49,43 — 0,15 52,74 47,65 5,09
'' A l últimas três colunas são simplesmente uma continuação das três primeiras.
Um pequeno estudo de diferenças casuais
Vamos explorar um pouco mais o acaso, continuando com a idéia

dt diferenças casuais entre grupos. Ainda estamos falando de uma base
87
casual para avaliar os resultados de dados obtidos na pesquisa. Um
conjunto de 20 pares de médias e as diferenças entre as médias é mos
trado na tabela 5.3. Estas médias foram obtidas por um processo casual.
Um computador gerou 4.000 números aleatórios de 0 a 100. Depois
foram calculadas as médias de 40 conjuntos de 100 números cada um.
Essas médias foram emparelhadas, pondo-se a primeira média com a
vigésima primeira média, a segunda com a vigésima segunda, e assim
por diante.3 As diferenças, sob a coluna “Diferença”, foram calculadas
subtraindo em cada par a segunda média da primeira média.
Concentremo-nos nas 20 diferenças. Elas vão de — 10,37 a 9,72.
Há 9 diferenças positivas e 11 negativas. Isto se aproxima da expectativa
de casualidade, pois com números aleatórios esperamos aproximadamente
igual número de diferenças para mais ou para menos. (Deixemos os
sinais de mais ou de menos por ora, para simplificar a discussão.)
Suponhamos que fizemos um experimento com dois grupos e
obtivemos médias de 52,40 e 42,25. A diferença entre estas médias é
52,40 — 42,25 = 10,15. Usando as diferenças entre as médias da
tabela 5.3 com base casual, desejamos avaliar a chamada “ significância
estatística” da diferença 10,15. Um resultado “estatisticamente signifi-
cante” é o que se afasta “ suficientemente” da expectativa de acaso ou de
uma base casual. Os 10,15 obtidos diferem tanto do acaso? É um resul
tado estatisticamente significante?
Voltemos às diferenças da tabela 5.3. As duas maiores diferenças
são 10,37 e 9,72. Isto significa que 10 por cento (2/20 = 0,10) das 20
diferenças são maiores do que 9. Se quisermos aceitar cerca de 10 por
cento de risco de estarmos errados, podemos dizer que a diferença
obtida no experimento, 52,40 — 42,25 ou 10,15, excede à expectativa
de acaso. (Se tivéssemos levado em consideração os sinais das diferenças,
o risco teria sido menor. Por quê?)
Suponhamos, entretanto, que não estamos satisfeitos com 10 por
cento de risco. Queremos ter mais certeza de que nossa diferença experi
mental de 10,15 seja um afastamento “real” da expectativa casual.
Em outras palavras, queremos diminuir a probabilidade de fazer um
erro e aceitar o que realmente é uma diferença casual como uma “verda
deira” diferença. Assim dizemos que a probabilidade deve ser de 0,05,
ou 5 por cento, em vez de 0,10, ou 10 por cento. Cinco por cento de
20 é 1: 20 x 0.5 = 1. Neste caso tomamos apenas uma diferença, a
mais alta, 10,37. Conforme as diferenças dadas na tabela 5.3, há uma
probabilidade em 20, ou 5 por cento — a probabilidade é 0,05 — de
3 O conjunto completo de 4.000 números e as quarenta médias são dadas em

Kerlinger (1973, pp. 714-718).
88
Obter uma média de 10,37 ou maior, por acaso. Obtivemos a diferença
de 10,15. Já que há só uma diferença tão grande na tabela, podemos
dizer que o resultado experimental obtido, a diferença entre a média
do grupo de controle e experimental, provavelmente não seja resultado
do acaso. Em outras palavras, há apenas uma possibilidade em 20, ou
uma probabilidade de 1/20 = 0,05, de que nossa diferença seja uma
diferença casual. Concluímos, então, que a média do grupo experimental
é estatisticamente maior que a do grupo de controle. Dizemos que a
diferença entre as médias é “estatisticamente significante”.
O leitor deve saber que este procedimento — chamado procedi
mento Monte Cario — não é o meio pelo qual os pesquisadores costumam
avaliar a significância estatística de seus resultados. A demonstração foi
feita apenas para mostrar a natureza do pensamento, para manufaturar,
por assim dizer, uma base casual com a qual avaliar um resultado
Experimental particular. Mas a idéia por detrás dos métodos mais sofisti
cados atualmente usados é muito parecida. Outra falha de nossa
demonstração foi usar apenas 20 pares de médias. Um procedimento
Monte Cario melhor teria usado 2.000 ou 20.000 médias e faria o
Computador emparelhar as médias ao acaso. Entretanto, a essência da
idéia esteve presente: foi avaliado um resultado experimental confron
tando-o com uma base causai.
Populações, amostras, estatísticas
Até agora a discussão focalizou apenas ou' principalmente o uso da

probabilidade e da estatística para avaliar a confiabilidade dos resulta-
Hos da pesquisa. A leitura inteligente e a compreensão da literatura da
pesquisa experimental, entretanto, exige aprendizado relacionado a apli
cações diferentes das idéias estatísticas. Consideremos, portanto, a defi
nição e explicação de certos conceitos importantes usados na maioria
da pesquisa comportamental contemporânea, começando com a própria
Pfcstatística”.
Estatística é a teoria e o método de analisar dados quantitativos
Obtidos de amostras de observações com o fim de resumir os dados e
aceitar ou rejeitar relações hipotéticas entre variáveis. Esta definição
lugere dois propósitos da estatística: reduzir grande quantidades de dados
I forma manuseável e ajudar a fazer inferências seguras a partir de dados
ptitativos. O primeiro propósito vem ilustrado com o seguinte exem-
K . Vamos calcular, digamos, uma média de 100 resultados. Com a
«Juda de uma medida de variabilidade apropriada — uma medida que
IXpresse a dispersão, ou a amplitude dos resultados — esta média
Utpressa a tendência central dos 100 resultados. Em outras palavras,
ela "escreve” um aspecto dos resultados. O primeiro propósito, então, é
89
descrição. Temos pouco interesse nele neste livro. O segundo propósito
é comparativo e inferencial. A média pode ser comparada às médias de
outros grupos. Médias de grupos diferentes, então, podem ser compa
radas com o fim de testar hipóteses e inferir se as hipóteses são ou não
confirmadas. Outras estatísticas além das médias podem ser igualmente
comparadas, naturalmente.
Uma estatística é uma medida calculada de uma amostra, como ficou
claro. Uma estatística é uma medida resumida: ela sumariza, ou expressa
em forma resumida, algum aspecto de uma amostra. A média expressa a
tendência central dos pontos, seu nível geral. Esta propriedade tem
grande utilidade, principalmente na pesquisa experimental, onde freqüen-
temente são comparadas as tendências centrais de grupos de resultados.
Lembre-se que foram comparadas as médias de grupos de reforçamento
maciço e regular no estudo de Clark e Walberg. O chamado desvio
padrão, outra estatística, expressa a variabilidade de um conjunto de
pontos; é uma expressão resumida de quanto é heterogêneo um conjunto
de pontos. Entre outras coisas, usando-a, pode-se avaliar a homogenei
dade ou heterogeneidade de diferentes conjuntos de pontos.
Uma população é um conjunto de todos os objetos ou elementos sob
consideração. Todas as crianças de 8 anos de Genebra, Suíça, são uma
população. Todos os homens de um exército são uma população. Amostra
é uma porção de uma população, geralmente aceita como representativa
da população. Para estudar e testar uma hipótese de Piaget sobre um
aspecto do pensamento das diferenças de 8 anos, podemos tirar uma
amostra de 100 dessas crianças da população de crianças de oito anos
de Genebra. Uma medida calculada dos resultados de todos os membros
de uma população é chamado um valor de população. Se calcularmos
uma média de todos os resultados de teste de inteligência de todas as
crianças de oito anos de Genebra, a média é um valor de população. Se,
entretanto, calcularmos a média da amostra de 100 crianças tiradas
da população, a média é uma estatística. Há muitas estatística, das quais
estudaremos algumas.
As idéias de valores de população e estatísticas e de população e
amostra, parecem confundir as pessoas, parcialmente, imagino eu, porque
a diferença entre elas é às vezes arbitrária, uma questão de definição.
Isto acontece particularmente na pesquisa comportamental porque fre-
qüentemente as populações são inacessíveis — até o recenseamento dos
Estados Unidos não pode cobrir todos os norte-americanos — e porque
as amostras podem ser tratadas como populações para propósitos de
pesquisa. Um exemplo simples é sexo. Homens e mulheres são amostras
de todos os seres humanos. Digamos que a população seja o conjunto
de todos os seres humanos de San Francisco. Os homens e as mulheres
de San Francisco são amostras dessa população. Mas o pesquisador pode
90
ter um bom motivo — seu problema pode incluir só mulheres —■para
estudar as características e comportamento somente das mulheres. As
mulheres de San Francisco, então, tornam-se a população. Agora,
Suponhamos que o pesquisador use um instrumento psicológico destinado
a medir as atitudes em relação às mulheres com todas as mulheres que
vivem em San Francisco. Ele calcula a média e o desvio padrão dos
resultados da medida de atitude de todas essas mulheres. A média e o
desvio padrão são valores de população.
É muito pouco provável, entretanto, que até o pesquisador mais
cuidadoso possa ou queira estudar todas as mulheres de qualquer cidade.
É muito mais provável que ele queira estudar uma amostra de mulheres
escolhidas em uma população. Suponhamos, neste caso, que a amostra
Consista de 700 mulheres de San Francisco. Se o pesquisador aplicar a
escala de atitudes às 700 mulheres e calcular a média e o desvio padrão,
estes serão estatísticos, porque foram calculados a partir de amostras.
O segundo propósito da estatística, ajudar a fazer inferências segu
ras a partir de dados de observação, centraliza-se nas palavras “ inferên-
oia” e “ segura” . Uma inferência é uma proposição ou generalização deri
vada pelo raciocínio, de outras proposições, ou da evidência. Na estatís
tica, as inferências podem ser tiradas de testes do que é chamado hipó
teses estatísticas. Da diferença de médias entre o grupo experimental e o
de controle do estudo de Clark e Walberg, do uso apropriado de um
teste estatístico e do raciocínio, “concluímos” que a média do grupo
experimental é maior que a média do grupo de controle. Isto é, temos
duas estatísticas, duas médias, calculadas dos resultados do grupo experi
mental e do grupo de controle. Subtraímos uma média de outra, neste
caso a média do grupo de controle da média do grupo experimental. Se a
diferença for “suficientemente grande”, o que quer dizer maior do que
Blguns valores concebidos como expectativa baseada no acaso, concluímos
que o grupo experimental obteve pontos mais altos de leitura em média.
Tal uso inferencial da estatística é o núcleo da estatística na pesquisa
Hmportamental contemporânea. A palavra "segura” , citada acima, refe-
e à estabilidade dos resultados obtidos e assim à estabilidade das
K irências feitas a partir dos resultados. Se obtivermos uma certa dife
rença entre as médias dos dois grupos, diferença igual ou semelhante
•parecerá outras vezes se o experimento for várias vezes repetido? Se
tivermos um certo conjunto de frequências em um cruzamento de
Variáveis ou tabulação cruzada, como no exemplo de Miller e Swanson,
no capítulo 1, obteremos padrões semelhantes de frequências — e iguais
ifastamentos das expectativas baseadas no acaso — se o estudo for
repetido? A estatística nos ajuda a responder tais perguntas, dando-nos
lltim meios poderosos de avaliarmos a estabilidade a validade empírica
hJo nossas inferências a partir de dados.
91
Concepção errônea da estatística
É comum encontrarmos concepções errôneas da estatística. Muita

gente acha o assunto desagradável. Ouve-se pessoas educadas dizerem:
“Eu simplesmente não consigo entender a estatística” ; “ Posso lidar per-
feitamente com as palavras, mas quando se fala de estatística. .. ”
Expressões como estas mostram uma alienação profunda em relação a
números e conceitos quantitativos. É verdade que muitas pessoas não
conseguem lidar facilmente com conceitos estatísticos e matemáticos.
Mas a maioria das pessoas instruídas pode e deve ser capaz de trabalhar
com idéias e operações estatísticas — uma vez que tenham motivação
e se esforcem para isso. Podem aprender a se interessar e até se apaixo
nar pelo poder e beleza dos métodos analíticos usados nas ciências com-
portamehtais. Certamente há de chegar o dia em que educadores e leigos
instruídos não mais poderão se dar ao luxo de ignorar ou fugir da
necessidade de entender as idéias básicas por detrás da probabilidade, da
estatística e dos modernos métodos de análise.
O estudo estatístico, sem a compreensão das idéias básicas, é uma
provação dispensável para o espírito — uma chatice e uma carga. Vinte
ou trinta anos atrás havia bons motivos para evitar-se o estudo da estatís
tica. O ensino e os livros enfatizavam os cálculos, as derivações, ou
ambos. Hoje, entretanto, o quadro mudou. O ensino e os livros enfatizam
as idéias e o raciocínio por trás dos cálculos e do pensamento. Nem por
isso o assunto ficou mais fácil. Não vou tentar embrulhar o leitor dizendo
que estatística é fácil. Mas não é tão difícil quanto se pensa. Pode ser
muito bem aprendida e posta em uso prático. E, o que é mais importante,
se estudada de maneira correta, com ênfase constante em idéias básicas,
pode se tornar uma preocupação emocionante.
Infelizmente há uma concepção errônea ainda mais séria que, se
sustentada, pode ser ainda mais prejudicial. Bons professores podem
convencer as pessoas mais medrosas, levando-as a um ponto de compe
tência funcional. Mas pouco ou nada podem fazer, entretanto, com
esta concepção errônea, que é difícil de descrever, talvez por ter diversas
facetas e algo parecido com um fervor religioso. Sua essência parece ser
que a estatística tem pouca ou nenhuma relação e importância para a
“realidade” . Diz-se que os pesquisadores fazem operações complexas e
confusas com números, derivados de formas misteriosas do que as pessoas
dizem, dando conclusões que são distorções da “ realidade” . Por exemplo,
um pesquisador aplica testes de inteligência e realização em crianças,
calcula as médias, compara-os com médias nacionais e descobre que as
médias são mais altas ou mais baixas do que deveríam ser. Mas, diz-se,
estas médias têm pouca relação com a realidade, com a complexidade
e individualidade de crianças reais. São abstrações sem significado, pelo
92
menos no que se refere a cada criança individualmente. Assim, todo o
procedimento é irrelevante à inteligência e realização de crianças verda
deiras. Argumentos semelhantes aplicam-se a toda a amplitude das ope
rações estatísticas.
É claro que este erro de concepção está baseado em idéias imper
feitas dos propósitos e usos da estatística. Todas as estatísticas são abstra
ções. Qualquer estatística em particular pode não corresponder aos resul
tados de um indivíduo em particular. Mas nem deveria! Seus propósitos
São muito diferentes. Adeptos dessa concepção errônea parecem querer
que a estatística mostre a “verdadeira realidade”, que faça alguma coisa
tnágica, enfim. Como toda a criaçao do homem, ela pode fazer apenas o
que lhe foi destinado, e isto sempre se limitou a aspectos especiais de
uma “realidade”. Uma média estatística é apenas uma média estatística,
mais nada. Não pretende ser “igual” a qualquer indivíduo. Mas pode ter
um poder explanatório considerável, até grande, quando usada e interpre
tada adequadamente.
O propósito da estatística, então, não é mostrar a chamada realidade
ou refletir as idiossincrasias dos indivíduos. Antes, seu principal propósi
to é ajudar os pesquisadores a chegarem ao significado de conjuntos de
dados. Assim, é de ajuda indispensável na interpretação de dados. Pode-se
dizer que a estatística disciplina os dados, agindo sobre eles de sorte a se
tirar inferências seguras de observações empíricas. Sem dúvida seria
difícil conceber a pesquisa comportamental moderna sem ela. Natural
mente, há perigos em seu uso. Pode-se ter dados inadequados e se acomo
dar numa espúria sensação de suficiência, mergulhando em cálculos e
Çperações estatísticos. Pode-se generalizar além dos dados e usar a
Estatística para acreditar e fazer os outros acreditarem que tal generali
zação é conveniente e correta quando, de fato, é inconveniente e errada.
A despeito dos perigos e dificuldades, a estatística, a teoria das probabili
dades por trás dela e a idéia fundamental e fecunda de acaso são ferra
mentas úteis e poderosas, cujo grande valor é nossa tarefa apreciar.
93
6. O d e lin e a m e n t o d a p e s q u is a e x p e r im e n t a l:
d e lin e a m e n t o s d e u m a sc v a r iá v e l
O plano e a estrutura da pesquisa são comumente chamados o deli

neamento da pesquisa. Da forma que a usamos aqui, a palavra “delinea
mento” focaliza a maneira pela qual um problema de pesquisa é concei
tuado e colocado em uma estrutura que se torna um guia para a experi
mentação, coleta de dados e análise. Definimos então delineamento de
pesquisa como o plano e a estrutura da investigação, concebidos de
forma a obtermos respostas para as perguntas da pesquisa.
Pesquisa experimental
As modernas concepções do delineamento de pesquisa são baseadas

na pesquisa experimental, que já foi discutida, embora superficialmente.
As características essenciais dos experimentos não foram sistematica
mente definidas nem discutimos os diferentes delineamentos de experi
mentos. Focalizaremos as principais características da pesquisa experi
mental e os principais tipos de delineamentos usados nos experimentos,
neste capítulo e no próximo.
Um experimento é uma pesquisa, onde se manipulam uma ou mais
variáveis independentes e os sujeitos são designados aleatoriamente a
grupos experimentais. Alguns especialistas podem discordar desta defi
nição, dizendo, entre outras coisas, que a designação aleatória não é
absolutamente condição necessária em um experimento. De certa forma,
têm razão. Pode-se fazer um experimento sem se designar aleatoriamente
os sujeitos para os grupos experimentais. O experimento, entretanto, será
muito mais fraco do que outro com designação aleatória. Em todo caso,
deixaremos a definição como está, porque, no sentido estrito, a designa
ção aleatória é um aspecto necessário aos experimentos. (O significado de
“designação aleatória” será discutido depois.)
Suponhamos que vamos pesquisar a idéia de que a privação na
infância afeta o desenvolvimento mental posterior. Temos duas condições
experimentais e 40 ratos. Estes serão designados aleatoriamente a dois
grupos. Podemos fazer isto jogando uma moeda cada vez que escolhermos
um rato. Se der cara, o rato irá para o primeiro grupo; coroa, o rato
irá para o segundo. Aplicaremos um tratamento experimental a um dos
94
grupos, digamos de "privação”, também ao acaso. O outro grupo não
sofrerá “nenhuma privação”. A definição de experimento está satisfeita.
Haverá manipulação experimental e os sujeitos serão designados para
os grupos experimentais ao acaso.
Em princípio não faz diferença onde e como será feito o experi
mento. Muita gente acha que todos ou que a maioria dos experimentos
são feitos em laboratórios. Muitos são, mas muitos não. É até possível,
embora difícil, fazer-se um experimento em uma grande área geográfica.
Muitos experimentos da pesquisa comportamental são chamados experi
mentos de campo. Quer dizer simplesmente, feitos fora do laboratório,
"no campo”. Embora haja diferenças importantes entre experimentos de
laboratório e experimentos de campo, sua concepção essencial é a mesma.
Delineamentos de uma só variável independente (“one-way”)*

O experimento de Aronson e Mills, descrito no capítulo 5, é um
modelo “de mão única” ("one-way”). Isto quer dizer que tem somente
uma variável independente. Os sujeitos foram designados aleatoriamente
para três grupos experimentais, Ai, A2 e A3. Os sujeitos designados para
0 grupo Ai sofreram uma iniciação severa a fim de se juntarem a um
grupo hipotético, os sujeitos do grupo A2 uma iniciação suave e os sujeitos
do grupo A3 não sofreram qualquer tipo de iniciação. A variável mani
pulada, então, foi iniciação ou severidade de iniciação. (Lembre-se que
''manipulação” significa fazer coisas diferentes com grupos diferentes.) *1
O delineamento de experimento se parecería com 0 “modelo” dado
na tabela 6.1. Um delineamento deste tipo mostra simplesmente as con
dições ou manipulações da variável ou variáveis independentes. É empres
tado de um esquema de análise de dados. Isto é, é conveniente dispor os
dados de um experimento em uma tabela como a tabela 6.1 . Neste
caso haveria 20 resultados em cada uma das condições experimentais
incluídas nas colunas da tabela. Tal esquema mostra claramente 0 delinea
mento geral da pesquisa e também sugere a análise dos dados. (Para
mais facilidade e clareza os resultados das variáveis dependentes foram
fllgeridos na tabela.)
* A ex p ressão “ one-way designs”, q u e tra d u z im o s p o r “ d e lin e a m e n to s d e u m a só

Variável in d e p e n d e n te ” , e stá asso ciad a, em inglês, à e x p ressão “ one-way analysis
of variance”, q u e d esigna a a n álise d e v a riâ n c ia co m u m c rité rio d e classific a ç ã o ,
m éto d o esta tístic o asso ciad o a ta is delin eam en to s. (N . d o R e v iso r T éc n ic o )
I U m a co n cep ção e rrô n e a co m u m em relação ao e x p e rim e n to p sico ló g ico é q u e
08 pessoas são m a n ip u la d a s — u m a idéia m u itíssim o d is to rc id a e e rra d a q u e ca u so u
a in d a cau sa p ro b le m a s p a ra os p esq u isad o res em psico lo g ia. E m b o ra seja possível
a n ip u la r pessoas em ex p e rim e n to s, isto n ão tem n a d a a v e r co m a n a tu re z a dos
S [perim entos em a u e se m a n ip u la m v ariáv eis. A m a n ip u la ç ã o em e x p e rim e n to s

le m p re e sim p lesm en te significa fa z e r coisas d ife re n te s c o m g ru p o s d ife re n te s;
n m a n ip u la ç ã o reflete u m a o u m ais v ariáv eis in d e p e n d e n te s.
95
Tabela 6.1 D elin e a m e n to do e x p e rim e n to de A ro n so n e M ills (1959).
S everidade d e iniciação
A2 A3
S evera S uave N enhum a
R esu ltad o s n a v ariáv el d e p e n d e n te (p ercepções do

v a lo r do grupo)
O delineamento do experimento de Clark e Walberg é dado na

tabela 6.2. É um pouco mais simples do que o modelo de Aronson e
Mills, porque há apenas duas condições experimentais, reforçamento
maciço e reforçamento regular. Contudo, os dois modelos têm a mesma
base conceituai.
Os modelos das tabelas 6.1 e 6.2 podem ser chamados delinea-
mentos de uma só variável independente. Não são limitados a duas ou
três condições experimentais: pode haver, de fato, qualquer número
de condições. Isto está expresso na tabela 6.3, onde k variáveis indepen
dentes estão sugeridas. Haveria grupos de sujeitos e assim k colunas de
resultados na variável de dependente na tabela. A análise estatística dos
dados testariam as diferenças previstas pelas hipóteses (e outras) entre
os k grupos.
Se um psicólogo fosse fazer o experimento implicado pela tabela 6.1,
ele escolhería sujeitos adequados e os designaria aleatoriamente a três
grupos experimentais. Um modo eficiente, embora trabalhoso de fazer
isto, é usar uma tabela de números aleatórios. Suponhamos que haja um
total de 60 sujeitos. Designa-se um número de 1 a 60 a cada um dos
sujeitos (de maneira arbitrária). O psicólogo então abre a tabela de
números aleatórios em qualquer página e em qualquer ponto — erguendo
um lápis e deixando-o cair de sorte que o lápis aponte um dos números —
lê e copia os 60 números sem repetição. Os primeiros 20 números formam
um grupo, os segundos 20 outro e os terceiros 20 mais outro. Os números,
então, são designados aos sujeitos de qualquer maneira conveniente (veja
abaixo). Temos, então, três grupos experimentais constituídos de sujeitos
designados aos grupos ao acaso. Logo discutiremos a importância de
fazer as coisas desta forma.
Tabela 6.2 D elin ea m en to do ex p e rim e n to d e C la rk e W a lb e rg (1968).
T ip o s de refo rçam en to
Ax A2
Maciço Regular
R esu ltad o s n a v ariáv el d e p e n d e n te (realização em
leitu ra)
96
Tabela 6.3 Delineamento experimental de uma só variável independente generalizado
C ondições experim entais
Aj A2 As ............................ Ak
trresm tad o s n a v ariáv el d e p e n d e n te
O psicólogo agora designa os três tratamentos experimentais aos

três grupos, ao acaso. Este é outro cuidado que se deve adotar no
procedimento. Evita possíveis preferências do pesquisador. O procedi
mento como um todo é chamado “casualisação”. Depois disto, o pesqui
sador faz o experimento. Neste caso, ele manipula a variável indepen
dente, severidade de iniciação, fazendo os membros de Ai se submeterem
a rigorosa iniciação e os membros de A2 a iniciação menos rigorosa.
Os membros de A3 são o grupo de controle, cujos membros não serão
submetidos a qualquer iniciação; são submetidos a atividades sem relação
com a iniciação. Poder-se-á pedir-lhes que leiam poesia, por exemplo.
(Por que preocupar-se com que façam alguma coisa?)
Depois da manipulação experimental, o psicólogo mede a variável
dependente, as percepções de todos os membros do grupo sobre seu
desejo de fazer parte do grupo. Finalmente, ele analisa os dados, as
medidas da variável dependente e tira conclusões. Já vimos como se faz
isto no capítulo 5: ele determina se as médias dos três grupos são as
previstas pela hipótese.
O delineamento de um experimento e casualização

Precisamos nos aprofundar nas idéias de delineamento e designação
aleatória. A descrição do experimento acima foi apenas um esboço de
todo o procedimento. A seguir focalizaremos a escolha casual e o principal
motivo para usá-la. No capítulo 5, diferenças casuais entre grupos foram
discutidas e ilustradas. Nessa discussão tentamos mostrar a natureza das
diferenças casuais em contraste com as diferenças obtidas experimental
mente. Agora vamos usar as mesmas idéias, mas especificamente para
esclarecer a relação entre o delineamento de experimentos e a designação
aleatória de sujeitos para grupos experimentais.
Todo experimento tem uma idéia fundamental por detrás: testar
o efeito de uma ou mais variáveis independentes sobre uma variável
dependente. 2 Os experimentadores testam implicações de afirmativas
tipo “se p, então q”. Mas vamos tomar o caso mais simples possível.
2 É possível te r m ais d e u m a variável d e p e n d e n te em u m ex p erim en to . A qui,

e n tre ta n to , d arem o s m ais im p o rtâ n c ia a p esq u isas co m u m a v ariáv el d e p e n d e n te
ap en as. M as em o u tro .c ap ítu lo discutirem os p e sq u isa e análise m u ltiv a ria d a p o r
su a crescente im p o rtâ n c ia e n tre as disciplinas co m p o rta m e n ta is.
97
Suponhamos que um educador queira testar a eficácia relativa de dois
métodos de ensino de certas operações aritméticas. A variável indepen
dente é métodos de ensino e a dependente a realização em aritmética.
Digamos que o experimentador disponha de um bom teste de realização
aritmética, a medida da variável dependente. Ele especifica cuidadosa
mente o que fará com os dois métodos de ensino — denominando-os
método A! e método A2. Isto é, ele define operacionalmente Y, a medida
de realização em aritmética e as condições experimentais, Ai e A2. Nada
disto é novo para nós.
Agora, entretanto, ele precisa dar um jeito de preparar dois grupos
de alunos e deve fazer isso de tal forma que possa assumir que, antes
do experimento começar, os grupos sejam estatisticamente “iguais” em
todas as variáveis possíveis que possam afetar a variável dependente,
realização em aritmética. Se ele não puder garantir que os grupos sejam
iguais antes de começar o experimento, as conclusões que tirar depois
serão questionáveis. Se os grupos não forem iguais, então o resultado
final poderá ser devido a outra influência ou influências outras que a
manipulação da variável independente. Suponhamos que a inteligência
afete a realização matemática — o que de fato acontece — e que um
dos dois grupos, sem o conhecimento do pesquisador, tenha crianças
que em média sejam mais inteligentes do que as do outro grupo. Daí,
depois de feito o experimento, suponhamos que a média de realização
aritmética do primeiro grupo seja maior do que a média do segundo
grupo. Esta média mais alta pode ser devida à inteligência superior do
grupo e não à manipulação experimental. Efeitos indesejáveis como este
devem ser controlados se o pesquisador quiser chegar a resultados em
que possa confiar.
Suponhamos ainda que inteligência e sexo afetem a realização em
aritmética. Um meio usado para “equalizar” grupos experimentais, para
controlar efeitos indesejáveis, foi “equalizar” os grupos designando-lhes
sujeitos sistematicamente de sorte que as variáveis indesejáveis ficassem
distribuídas igualmente entre os grupos. No caso particular de sexo e
inteligência, por exemplo, o pesquisador pode medir a inteligência das
crianças com um teste de inteligência e distribuir as crianças de inteligên
cia comparável entre os dois grupos, igualmente. Se ele tiver um total
de seis crianças (muito pouco, claro), e seus QIs forem 121, 119, 106,
109, 94 e 95, ele poderá colocar as de QI 121, 106 e 94 em Ai
e as de QI 119, 109 e 95 em A2. Com isto os grupos ficarão
aproximadamente iguais em inteligência. Depois, poderá distribuir meni
nos e meninas igualmente entre os grupos. Naturalmente ele poderá ter
que mudar a primeira distribuição com base na inteligência, já que é
possível que as medidas de inteligência das meninas sejam maiores (ou
as dos meninos), tornando impossível equilibrar os dois grupos na base
de ambas as variáveis.
98
Este método de designação de sujeitos a grupos está sendo abando-
nado por causa de uma grande limitação: controla apenas duas variáveis,
pteligência e sexo. E as outras variáveis que possam afetar a realização
em aritmética: aptidão numérica, classe social, atitudes e assim por
diante? Tais variáveis continuam sem controle. O que se pode fazer?
pesignação aleatória e casualização
O método de designar sujeitos a grupos experimentais que (teorica

mente, pelo menos) evita as dificuldades que acabamos de discutir é a
dssignação aleatória. Se ha apenas dois grupos, pode-se jogar uma moeda
para escolher cada um dos membros: dando cara, grupo Aij dando
Coroa, grupo At*. Isto deve funcionar se se jogar a moeda adequada-
mente. Mas o método de números aleatórios, já discutido, funciona com
flois, três^ ou qualquer número de grupos. Encontram-se facilmente tabe
las de números aleatórios e, realmente, elas se tornaram indispensáveis
cm muitas operações de pesquisa.3 Os números aleatórios têm a caracte
rística essencial de serem imprevisíveis: se são aleatórios, não há maneira
de prever sua seqüência, se são pares ou ímpares, sua magnitude e
ssim por diante. Assim, eles são usados pelos cientistas para diversas
S Inalidades, que, como discutimos no capítulo 5, quase se resumem
em fornecer uma base casual com a qual comparar resultados obtidos
Ou qualquer tipo de fenômeno observado.
O principio básico dos testes estatísticos, como já sabemos, é:
Comparar os resultados obtidos com os esperados pelo acaso. O uso de
números aleatórios para designar sujeitos para grupos experimentais ao
licaso é baseado no mesmo princípio geral, só que os números aleatórios
s5o usados para designar sujeitos para grupos. Outro exemplo esclarecerá
Isto.
Suponhamos que eu queira fazer um experimento testando três
Olétodos de ensino, Ai, A2 e A3. Ai pode ser um método de exercícios,
um tuétodo de discussão e As um método combinado de exercícios
Discussão. Tenho 30 crianças de quem conheço o sexo e sei o número
de pontos de inteligência. Acredito que inteligência e sexo podem, em
e de si próprios, afetar o resultado — o resultado ou variável dependente,
aqual, digamos, é uma forma de resolução de problemas. Então quero
■> garantir que as possível influências dessas duas variáveis e outras
Kfiáveis possíveis estejam sob controle. Na tabela 6 .4 são dados os
30 pontos e as indicações de sexo, masculino (M) e feminino (F).
Os pontos de inteligência são dados em ordem de postos, do mais alto
t i f t c o n t r a m - s e tab elas d e n ú m e ro s alea tó rio s em vários textos. V eia, p o r exem plo

m e d e c o r e C o c h ra n (1967, p p . 543-546).
ao mais baixo. Os números de 1 a 30 foram designados às crianças e
são dados também na tabela (coluna da esquerda).
Quero ter certeza de que os três grupos são estatisticamente iguais
em todas as variáveis independentes possíveis que possam afetar a solu
ção de problemas. Assim, distribuo as crianças ao acaso usando uma
tabela de números aleatórios. É o mesmo que considerar as 30 crianças
como uma população e tirar três amostras de 10 cada ao acaso. Amostra
gem casual é o método de tirar uma porção ou amostra de uma população
Tabela 6.4 P o n to s d e te ste d e in te lig ê n c ia (p o r o rd em d e postos) e sexo d e 30

cria n ç a s, c o m n ú m e ro s a le a tó rio s a trib u íd o s a todas as crianças.
P o n to N ú m e ro P o n to N ú m e ro
N ú m ero in te l. Sexo c asu al N úm ero in tel. Sexo casual
1 147 F 26 16 108 F 3
2 141 F 13 17 104 M 22
3 137 M 29 18 104 M 23
4 136 F 11 19 103 M 21
5 132 M 19 20 102 M 19
6 128 M 14 21 101 F 5
7 128 M 10 22 101 M 17
8 126 F 27 23 99 F 24
9 .125 F 4 24 95 F 8
10 122 M 6 • 25 94 M 12
11 118 M 30 2o 92 F 18
12 115 F 7 27 90 F 16
13 115 M 2 28 90 M 20
14 110 F 28 29 89 M 25
15 109 F 15 30 87 F 1
de sorte que as amostras possíveis de tamanho n tenham a mesma proba

bilidade de ser escolhida. Há muitíssimas amostras possíveis de tamanho
10 que podem ser tiradas de uma população de 30 (cerca de 30 milhões!)
e todas têm igual probabilidade de ser escolhida — se a amostragem for
casual. Na designação aleatória usamos a mesma idéia e, com efeito,
tiramos três amostras de 10 cada. As primeiras 10 são designadas a um
grupo, as segui das a outro grupo e as terceiras a um terceiro.
Tirei os 30 números aleatórios de uma tabela, restringindo minha
escolha a números de 1 a 30, ignorando quaisquer números acima de 30.
Uma maneira mais. simples e menos trabalhosa seria instruir um computa
dor para gerar 30 números aleatórios. (Uma pessoa levaria 20-30 minu-
100
tos, talvez mais, para fazer isto. Um computador leva um ou dois segun
dos 1 Naturalmente, é preciso que se escreva o programa para dizer ao
fpmputador o que deve fazer. Isto leva mais tempo, mas póde ser usado
para outros problemas semelhantes.) Os números que tirei da tabela,
na ordem em que foram tirados, são dados nas colunas da esquerda da
tabela 6.5 (30, 13, 16, . . .; 4, 25, 2, . . .; 19, 17, 18 . . .). Os três
grupos experimentais foram designados Ai, Aa e As. O QI e sexo de
cada sujeito são dados ao lado dos números aleatórios. Por exemplo, o
rimeiro sujeito da tabela 6.5 foi o décimo terceiro na tabela 6.4.
Í toa olhada na última tabela mostra que este sujeito tinha um QI de 87
C era mulher. O segundo sujeito da tabela 6 .5 era número 13 na tabela
e tinha um QI de 115 e era homem. Os 30 sujeitos, então, foram
distribuídos aleatoriamente a três grupos, junto cora seus QIs e designa-
çfies de sexo.
Será que consegui misturar os sujeitos de sorte a poder assumir
que os grupos sejam estatisticamente “iguais”? Jamais saberei exata-
ffiente, mas posso verificar até certo ponto. Primeiro calculo as médias
dos números dos sujeitos em cada grupo. Estas médias são dadas no
fim da tabela 6.5. São 14,7; 17,5; 14,3. A média dos números de 1 a 30
é 15,5. As discrepâncias são relativamente pequenas: 0,8; 2,0 — 1,2.
Tabela 6.5 Dados da tabela 6.4 rearranjados etn ordem casiial.
Ax a 2 a 3
N úm ero QI Sexo N úm ero Q I Sexo N úm ero Q I Sexo
30 87 F 4 136 F 19 103 M
13 115 M 25 94 M 17 104 M
16 108 F 2 141 F 18 104 M
9 125 F 6 128 M 23 99 F
21 101 F 15 109 F 29 89 M
10 122 M 27 90 F 1 147 F
12 115 F 22 101 M 8 126 F
24 95 F 26 92 F 14 110 F
5 132 M 20 102 M 3 137 M
7 128 M 28 90 M 11 118 M
Mnq™ ~ 14,7 17,5 14,3

Mei 112,80 108,30 113,70 M t = 111,67
lÍM c u lin o 4 5 6 15
Ifoninino .6 5 4 15
101
(Se eu tivesse 50 ou 100 números em cada grupo, provavelmente elas
seriam menores. Por quê?) Segundo, calculo as medias de^ QI. um
cálculo importante porque quero "igualar” a inteligência nos tres grupos.
A média dos 30 QIs é de 111,67. Esta, então, é_a expectativa para cada
grupo. As médias calculadas para os grupos sao de 112,80, 108,3U e
113 70. As discrepâncias da expectativa são — 1,13, 3,3 /, Aoo, sao
pequenas. Finalmente, conto os homens (M) e mulheres (F) dos grupos.
Os números são dados no fim da tabela. Outra vez as discrepancias sao
pequenas. Portanto, a casualização “ aconteceu” : os grupos sao bastante
“iguais” em inteligência e sexo. Assumo que eles também sao iguais
em outras possíveis variáveis influentes.
Este processo de designar sujeitos aleatoriamente^ a grupos experi
mentais é um aspecto importante da casualização. Aqui esta uma detint-
ção um bocado formal e rígida do que acaba de ser ilustrado Casuali-
zacão é a designação de objetos (sujeitos, tratamentos, grupos) de um
universo a subconjuntos do universo de tal maneira que, para qualquer
designação dada a um subconjunto, todo membro doûmverso tem igual
probabilidade de ser escolhido para a designação. Nao ha total garantia
de que a casualização “igualará” os grupos, mas a probabilidade de
igualar é relativamente alta.
Há outra forma de expressar esta idéia, citando um principio fun
cional, o princípio de casualização: já que, em procedimentos aleatórios,
todo membro de uma população tem igual probabilidade de ser escolhido,
membros com certas características distintas — homem ou mulher, al o
ou baixo grau de inteligência, republicano ou democrata, dogmático ou
não-dogmádco, e assim por diante — se selecionados, provavelmente
serão contrabalançados a longo prazo pela seleção de outros membros
da população com a quantidade ou qualidade “opostas da caracterís
tica. Isto não é uma lei da natureza. É simplesmente uma afirmativa
do que acontece mais freqüentemente quando se usam procedimentos de
casualização.
Outra visita a Aronson e Mills

Voltemos ao experimento de Aronson e Mills para reunir as idéias
discutidas e ilustradas neste e no capítulo 5. Agora, entretanto, apresen
taremos o experimento real e alguns de seus resultados. A hipótese
testada foi: a dificuldade de entrar para um grupo aumenta seu valor
aos olhos dos membros do grupo. Por exemplo, muitas organizações
põem dificuldades e barreiras à entrada de novos membros. Tais barreiras
aumentam o valor dos grupos aos olhos de seus membros?
Essa hipótese interessante e talvez um tanto perversa foi testada
102
de maneira engenhosa.4 63 jovens mulheres foram designadas aleatoria
mente a 3 grupos de 21 cada e submetidas a três condições experimen
tais: (1) condição severa, na qual os sujeitos tinham que ler palavras
Obscenas e descrições de atividades sexuais; (2) condição suave, na qual
iffiS sujeitos liam palavras relacionadas a sexo, mas não obscenas; e (3)
©ondição de controle, onde os sujeitos não precisavam fazer nada.
Foi usado um procedimento bastante elaborado. Parte de sua inten
ção era mostrar a filiação ao grupo como pouco atraente. Todos os
Sujeitos tiveram que ouvir a uma suposta discussão dos atuais membros
do grupo que “em geral se dedicavam a uma das discussões mais desinte
ressantes e inúteis que se possa imaginar” (Aronson e Mills, 1959,
p. 179). A variável dependente foi a avaliação da discussão e seus partici
pantes (presumivelmente membros do grupo) pelas moças. Aronson e
Mills acreditavam que os sujeitos dos três grupos avaliariam diferente
mente a discussão e os participantes: a condição severa mais favora
velmente, a condição suave em seguida e a de controle em último lugar,
menos favorável (e realisticamente). Se pudermos aceitar a validade do
raciocínio implícito de Aronson e Mills, que quanto mais altas as avalia
ções da discussão estúpida e de seus participantes mais os sujeitos valori
zavam sua entrada para o grupo, então a hipótese derivada da teoria da
dissonância cognitiva (ver nota de rodapé n.° 4) estava apoiada pela
evidência experimental.
As médias de todas as avaliações da discussão e participantes foram:
condição severa: 195,3; condição suave: 171,1; controle: 166,7. Os
resultados parecem apoiar a hipótese: os sujeitos do grupo da condição
severa avaliaram a discussão e os participantes da maneira mais favo
rável, os da condição suave avaliaram-nos menos favoravelmente e os de
controle menos favorável que todos. Já que os sujeitos foram designados
aos três grupos aleatoriamente, os pesquisadores puderam considerar
entre eles, depois, como devidas à manipulação, às condições diferentes,
os grupos “iguais” estatisticamente antes do experimento e as diferenças
Mas, como sempre, perguntamos: as três médias e as diferenças entre elas
poderíam ter aparecido por acaso? Um teste estatístico que determinou
a significância estatística das diferenças mostrou que as médias obtidas
e as diferenças provavelmente não poderíam ter aparecido por acaso.
Conforme um desses testes, diferenças tão grandes quanto as observadas
poderíam ter ocorrido por acaso menos que uma vez em 100. Ê uma boa
evidência para validade empírica da hipótese.
O modelo básico discutido neste capítulo tem muitas aplicações na
pesquisa comportamental, embora se deva confessar que não tem sido
4 A h ip ó te se d eriv a d a te o ria d a disso n ân cia co g n itiv a ("devida a F estin g er) q u e diz
q u e, q u a n d o id éias o u co m p o rta m e n to s c a u sa m co n flito em u m in d iv íd u o , ele
lu ta rá p a ra re c u p e ra r -o eq u ilíb rio e re d u z ir a “ d isso n â n c ia co g n itiv a” . O le ito r
verá a d isso n ân cia p ro d u z id a n o s sujeitos d o e x p erim en to .
103
muito usada a não ser nesta forma de duas condições. Os pesquisadores
comportamentais, principalmente os psicólogos, parecem preferir o tipo
de modelo discutido no próximo capítulo. Sempre que duas ou mais
condições experimentais de uma variável independente precisam ser com
paradas e estudadas, como no estudo de Aronson e Mills e no de Clark
e Walberg, e possamos supor que as condições experimentais funcionam
na maioria das circunstâncias ou têm efeitos fortes, o delineamento de
uma só variável indenpendente é útil e apropriado.
Esse delineamento tem, entretanto, uma grande limitação. Se a
variável experimental funcionar apenas em conjunção com uma ou mais
variáveis independentes, então, o modelo não é apropriado. No próximo
capítulo, onde consideraremos a pesquisa experimental com mais de uma
variável independente, veremos quando e por que o delineamento de
uma só variável independente pode ser impróprio.
Talvez a coisa mais importante que o leitor possa tirar deste capítulo
seja a aplicabilidade e a força dos procedimentos aleatórios. Uma das
grandes forças dos experimentos é poderem usar casualização. E o único
método defensável inventado para aumentar a probabilidade da validade
dos experimentos e das inferências feitas a partir deles, aumentando a
probabilidade de “igualdade” dos grupos experimentais em todas as
variáveis independentes possíveis. Seu uso dá grande força ao pesquisador
para fazer inferências partindo de dados e chegar a conclusões sobre
teorias e hipóteses.
104
7. D e lin e a m e n t o d a p e s q u is a e x p e r im e n t a l:
d e lin e a m e n t o s f a t o r ia is
O delineamento da pesquisa é a disciplina dos dados. Sua finalidade

implícita é impor restrições controladas às observações de fenômenos
naturais. Um modelo de pesquisa, com efeito, diz ao pesquisador: “Faça
isto e aquilo; não faça isto ou aquilo; cuidado com isto; esqueça aquilo”,
e assim por diante. Em resumo, é uma planta da pesquisa. Se o delinea
mento for bem concebido, o produto resultante da pesquisa tem maior
probabilidade de ser válido empiricamente e merecer atenção científica
séria. Sem conteúdo — boa teoria, bons problemas, boas hipóteses — o
delineamento de qualquer pesquisa é vazio. Mas sem forma, sem estru
tura adequadamente concebida e criada para os propósitos da pesquisa,
pouca coisa de valor pode ser realizada.
A elegância e força do moderno delineamento de pesquisa e a idéia
de que delineamento é a disciplina dos dados tornam-se muito mais visí
veis em delineamentos fatoriais — o tipo de delineamento que estudare
mos neste capítulo. Sua elegância se mostrará à medida que estudarmos os
exemplos. Sua força emana de dois propósitos principais da pesquisa:
dar respostas às perguntas da pesquisa e controlar as fontes de influência.
A maioria dos experimentos nas disciplina comportamentais do
lllício do século usava apenas uma variável independente e apenas duas
condições experimentais. Este era o “modelo clássico” de pesquisa, um
grupo às vezes chamado grupo experimental e outro chamado grupo de
Controle. Além disso, os sujeitos não eram designados aleatoriamente aos
grupos. Já vimos que a idéia de duas condições experimentais pode ser
facilmente expandida para mais de duas condições. Isto, entretanto, ainda
é o caso de uma variável independente. Só foram aumentadas as condi
ções experimentais, não as variáveis. No experimento de Aronson e Mills,
por exemplo, foram usadas três condições experimentais, mas estas consti
tuíam apenas uma variável independente.
Na década de 30 iniciou-se uma revolução na conceituação de
delineamento de pesquisa e na análise estatística. Foi introduzida mais
de uma variável independente. Muitos desses delineamentos acabaram
lendo chamados delineamentos fatoriais.1 Eles consistem essencialmente
1 Delineamentos fa to ria is n ã o d ev em ser c o n fu n d id o s com an álise fa to ria l. V am os
•X im ln ar an álise fa to ria l m ais ad ian te.
em modelos experimentais em que duas, três ou mais variaveis indepen
dentes são usadas simultaneamente para estudar seus efeitos^ conjuntos
ou separados em uma variável dependente. Foi uma abertura incnvel na
pesquisa comportamental porque tornou possível o estudo de hipóteses e
problemas complexos de pesquisa. Tais delineamentos tinham mintas
vantagens, sendo as três mais importantes: puderam ser testadas e formu
ladas teorias mais sofisticadas; problemas mais realistas puderam ser
investigados; e pôde-se estudar a influência conjunta de variaveis.
Um exemplo de delineamento fatorial1

Um grupo de psicólogos sociais está preocupado com o problema do
preconceito. O que fazer quando alguém, digamos, um amigo, um colega
de trabalho, faz uma observação intolerante sobre judeus (ou católicos,
protestantes, pretos, italianos ou qualquer outro grupo.). \ oce discute
com ele, diz que ele está errado, dá-lhe uma lição de moral. Ou talvez
não faz nada? É provável que, se ficar quieto, você esteja apoiando e
reforçando o preconceito, porque na verdade você está afirmando normas
que apoiam o preconceito com seu silêncio. Vamos concordar, então,
que você tem que dizer alguma coisa. O que poderá ser? O que tena
melhor efeito? . . , . „„„
Há muito tempo os apelos religiosos e morais vêm sendo usados por
padres, ministros e rabinos. “ Não é cristão dizer uma coisa dessas :
“ É .incompatível com os judeus ser moralmente preconceituoso , e assim
por diante. Por outro lado, hã uma escola de pensamento que acredita
que os apelos morais-religiosos são inúteis. Afinal, eles parecem nao
ter tido grande efeito no passado. Os que adotam esta escola de pensa
mento acham, antes, que uma abordagem mais pragmática possa ajudar.
Por exemplo, mostrar a uma pessoa que faz uma observação preconcei
tuosa, como o preconceito fere a todos nós, como pode se voltar contra
qualquer grupo, como embaraça a democracia, e assim por diante.
Para testar qual desses tipos de apelo funciona mais, no sentido ás
persuadir ou convencer as pessoas a não mais fazerem observações
preconceituosas, os psicólogos sociais podem, naturalmente, fazer um
experimento como o de Clark e Walberg. Resolvem chamar um apelo
“Apelo Moral” . Em vez de se limitarem a apelos religiosos, os morais
incluirão outros argumentos morais, por exemplo: “Ê errado falar assim
sobre judeus (pretos, católicos, e assim por diante) ; Devemos tratar
os outros como a nós mesmos”. Deram ao outro apelo, ao descrito acima,
o nome de “Apelo Pragmático”.
Esta é a condição mínima para um experimento. Os sujeitos podem
ser designados aleatoriamente para dois grupos e de alguma forma
2 A idéia p a ra este exem plo foi tira d a de u m ex p erim en to fe ito p o r C itro n , C h e in
e H a rd in g (1950).
106
experimentarão os dois tipos de apelo. Suas reações a estereótipos de
membros de grupos minoritários podem ser obtidas, e a diferença entre
as médias dos dois grupos pode ser avaliada quanto à significância
^statística. O paradigma deste experimento aparece na parte superior
esquerda da tabela 7.1 (A, na tabela). É o já familiar delineamento de
dois grupos.
Mas suponhamos que os psicólogos sociais tenham motivos para
acreditar — em bases teóricas ou experimentais — que a maneira de
expressão usada ao fazer tais apelos faça uma diferença. Isto é, que
acreditem que um apelo inflamado tenha mais efeito do que outro calmo
e objetivo. Eles poderão, naturalmente, testar a crença ou hipótese, num
experimento separado. O paradigma de tal experimento é o mesmo que o
do primeiro, tabela 7.1 (A). Está na parte superior direita da tabela (B).
É possível, naturalmente, que cada um desses experimentos possa
ser feito. E podem apresentar diferenças grandes entre as médias. Os
psicólogos sociais, entretanto, não estão interessados na idéia de experi
mentos separados. Têm outra, muito mais interessante: “Por que não
fazer os dois experimentos ao mesmo tempo e estudar os efeitos separados
dos apelos, assim como do modo de expressão, e também estudar e avaliar
seus efeitos conjuntos sobre a variável dependente?” Assim eles fazem.
) paradigma ou modelo do delineamento de tal experimento é dado
na parte inferior da tabela 7.1 (C). Este modelo permitirá três testes
em um único experimento. O primeiro teste avaliará os Apelos, Moral e
Pragmático. O segundo avaliará os Modos,-de Expressão, Inflamado e
WÊabela 7.1 C o n stru ção d e u m m odelo fa to ria l dois-por-dois.

(A) (B)
A pelos M odo de expressão
M o ral P ragm ático In flam a d o C alm o
Ai Ai Bi Bi
M edidas d a variável M edidas d a variáv el
^ e p e n d e n te d ep en d en te
(C)
A pelos
M oral P rag m ático
Ai A»
AiBi
In flam a d o
M odo d e Bi m ed id as da
expressão -------------- v a riá v e l ------------
C alm o depe rtdcnte
Bs
• AiBi AiBi
Calmo. Estes dois testes têm a mesma forma. É como se fossem feitos
dois experimentos separados e avaliadas as diferenças entre os dois
grupos, em cada experimento. • . .
O terceiro teste é mais interessante. Serve para avaliar a interação,
o trabalho mútuo das duas variáveis independentes em seu efeito conjunto
sobre a variável dependente. Significa avaliar o efeito da variável A em
diferentes níveis da variável B. É possível, por exemplo, que o apelo
moral seja mais eficiente do que o pragmático apenas quando feito em
tom inflamado. Ou pode ser que o pragmático seja mais eficiente do que
o moral quando feito em tom calmo. Quando uma variável independente
tem efeitos diferentes em diferentes níveis ou aspectos de outra variável
independente, este efeito diferencial chama-se interação. Diz;-se que duas
variáveis interagem para afetar uma variável dependente. Os delinea-
mentos fatoriais podem ter mais de duas variáveis independentes e,
portanto, é possível estudar mais de uma interação, mas vamos nos
restringir em geral ao caso de duas variaveis independentes.
A idéia de testar várias hipóteses em um experimento e uso do
tipo de delineamento para fazer isto, mostrado na tabela 7.1 (C), influen
ciaram fortemente a pesquisa científica comportamental. E não e a toa.
É uma maneira elegante, eficiente e poderosa de fazer as coisas. Precisa
mos, então, examiná-la muito cuidadosamente. Ao fazer isso, vamos nos
lembrar de que os princípios que discutimos até agora são os mesmos
aqui: casualização e designação aleatória, avaliação dos efeitos de
variáveis independentes sobre variáveis dependentes e a solução dos
problemas de pesquisa usando delineamentos de pesquisa e testes estatís
ticos. Vamos voltar ao nosso experimento hipotético para ilustrar as
idéias básicas
Os psicólogos sociais designaram 15 indivíduos ao acaso a cada
célula da tabela 7.1 (C), num total de 60 sujeitos. Havia, naturalmente,
quatro grupos correspondentes às quatro células da tabela (C). Para
abreviar a conversa sobre o experimento e para enfatizar a ^ função
dupla” de cada célula da tabela, as designações A e B foram inseridas
nos cantos da tabela 7.1: AiBt, A2B1, A1B2, A2B2. A, naturalmente,
representa a variável Apelos e B, Modos de Expressão. Ai e A2 e Bi e B2
representam as categorias de A e B. Ai e A2 são Apelo Moral e Apelo
Pragmático; Bi e B2 são Modo de Expressão Inflamado e Modo de
Expressão Calmo. Estamos mais interessados, porém, nas designações
conjuntas. . n
A,Bi é a junção, ou intersecção, das variáveis A e B no ponto Ai e üi,
a saber a célula da esquerda superior denominada A1B1. 3 A2B1 é a
3 P a ra o le ito r q u e conh ece algo so b re a te o ria dos c o n ju n to s, A i e As p o d e m ser

co n sid erad o s com o p artiçõ es do co n ju n to A , e Bi e B» p a rtiç õ e s d o co n ju n to B.
A 1B1, B,B2) e assim p o r d ia n te , são in tersecções dos co n ju n to s A e B, o u , em g eral,
108
Junção das variáveis A e B no ponto A2Bi , a célula superior direita.
As duas células restantes são, igualmente, as outras duas junções de
A e B. Vamos imaginar que foi feito o experimento. Os pesquisadores
puseram os sujeitos de cada grupo a examinar duas pessoas que discutiam
lObre judeus. Uma delas fez observações depreciativas a respeito dos
Judeus. A outra respondeu tentando mostrar à primeira por que não
devia falar daquele jeito. As respostas da segunda, entretanto, diferiam
de quatro maneiras e cada uma correspondia às quatro células da tabela
7,1 (C). Os sujeitos designados para a célula superior esquerda, A1B1,
ÍUviram-na usar o apelo moral, dito de maneira inflamada, e os da célula
inferior esquerda, A1B.2, ouviram-na usar o apelo moral dito de maneira
Calma. Os sujeitos da célula superior direita, A2B1, ouviram-na usar 0
ftpelo pragmático em tom inflamado e, finalmente, os da célula direita
Inferior, A2B2, ouviram o apelo pragmático dito em tom calmo. Dois dias
depois de feito o experimento, foram medidas as atitudes dos sujeitos em
felação aos judeus. (Os detalhes de procedimento usados no experimento
e como as atitudes foram medidas, não nos preocuparão aqui.)
É necessário observarmos três pontos importantes em relação a
este experimento e aos delineamentos fatoriais em geral. Primeiro, dois
jjíperimentos estão incluídos em um. Um deles testa a relação entre modo
de apresentação e a variável dependente e o outro, a relação entre apelos
e a variável dependente. Segundo, com a designação aleatória dos sujeitos
aos quatro grupos (as quatro células), e o cuidado ao fazer o experi
mento, pode-se assumir que os dois tratamentos — apelo e modo de
gpresentação — são independentes um do outro. Embora a independência
tenha sido amplamente discutida no capítulo 5, sua importância justifica
maior elucidação. As duas variáveis são ortogonais entre si. “ Ortogonal”
quer dizer em ângulo reto, o que significa que as variáveis são inde-
gftndentes, justificando considerar um experimento como dois. Nem
tómpre é fácil entender isto, mas é muito importante. Quando duas
Sfariáveis são independentes uma da outra, são não-correlacionadas. Se
Udéssemos calcular a correlação entre elas, obteríamos zero ou próximo
zero. Isto significa que o efeito de cada uma delas, na variável depen-
Í pode ser considerado e avaliado separadamente. Se a correlação
entre elas não fosse zero, fosse 0,50, por exemplo, não seriam indepen
dentes; parte do efeito de uma delas sobre a variável dependente podería
le dever à outra.
O terceiro ponto é o mais interessante. Se na realidade as duas
«fiáveis independentes funcionam juntas de algum jeito, para afetarem
a Variável dependente, este efeito pode ser estudado e avaliado. Suponha-
A f ) B. AiB, p o d e ser esc rito Ai f l Bi, A ,B , p o d e se r escrito A i n B, e igual-

fte n te p a ra os o u tro s dois su b c o n ju n to s, q u e p o d em se r c o n sid erad o s p artiçõ es
tU las.
109
mos que os psicólogos sociais não estejam realmente interessados nas
variáveis independentes separadamente. Eles acham que não foi apenas
o apelo que fez efeito, mas os apelos combinados com os modos de
apresentação. Eles acham especificamente, que o apelo moral funciona
apenas quando apresentado de forma inflamada, que fazer um apelo
moral de maneira calma e racional é inútil; é preciso emoção para passar
convicção. (Como prova o sucesso de pregadores fundamentalistas e de
políticos demagogos.) Inversamente, acreditam que o apelo pragmático
exige tom calmo e racional de apresentação, para surtir efeito. Esta
linha de raciocínio é mais interessante e, naturalmente, mais complexa.
Está sendo adotada a chamada hipótese de interação: as duas variáveis
interagem para afetar a variável dependente.
Vamos fabricar alguns resultados para ilustrar diferentes resultados
possíveis do experimento. Aí então veremos como as perguntas da
pesquisa podem ser respondidas pelos dados obtidos no experimento.
A tabela 7.2 contém 4 resultados dos vários possíveis. As entradas
numéricas são médias. Assumimos que a variável dependente, atitude em
relação aos judeus, foi medida numa escala de 7 pontos, com 7 indicando
uma atitude altamente positiva e 1 uma atitude altamente negativa.
As médias grifadas são as significativamente diferentes.' Por exemplo,
em ( I ) , 6 e 4 estão grifados, o que significa que M a i é significativamente
maior do que MA2 (indicado na parte inferior dos dados por Ai > A2, Ai
é maior do que A2). As diferenças entre as médias A e B, consideradas
separadamente, são chamadas efeitos principais. Se, por exemplo, M a i é
comparada a MA2, isto é um efeito principal — da variável A.
As quatro estruturas, ou subtabelas, não são cruzamentos, que já
foram estudados quando examinamos os dados do estudo de Miller e
Swanson, em forma de freqüências e porcentagens. Eles mostram simples
mente um meio conveniente de apresentar o delineamento e os dados
de um estudo e análise fatorial. O 6 da célula A1B1 de (I) é uma média
calculada com os pontos de atitude dos 15 sujeitos da célula. O 4 na
parte de baixo da tabela é a média calculada com os 30 sujeitos da
coluna A2. As outras médias foram calculadas da mesma forma. Os dados
de um delineamento fatorial são quase sempre apresentados desta forma
prática e rapidamente interpretável. Os efeitos das variáveis separadas —
neste caso, apelos e modos de apresentação, ou A e B — assim como os
efeitos conjuntos podem ser vistos claramente colocando as variáveis uma
contra a outra desta forma.
Os dados em (I) indicam que o apelo moral, Ai foi muito maior
que o apelo pragmático, A2. Obviamente não houve diferença entre as
médias de modo de apresentação (5 e 5) e, portanto, nenhuma diferença
entre Bi e B2. Os dados em (II), por outro lado, indicam uma diferença
grande entre apresentação inflamada e calma, Bi e B2, e nenhuma dife-
110
Tabata 7.2 Quatro conjuntos de possíveis resultados obtidos em um modelo de
Qpirlmento fatorial fictício (médias)a.
(I) (II)
Moral pragmático Moral pragmático
Ai A2 Ai A2
Inflamado A 1B1 A2B! Inflamado AiB, A2B2

5 Bi 6 6
6 4
1 calmo 6 4 5 Calmo 4 4
B. A,B2 A 2B2 Ba A,B2 A2B2
6 4 5 5
A, > Az B, A2
(III) (IV) .
Moral pragmático Moral pragmático
Ai A2 Aj Ai
Inflamado A,B, A2B, Inflamado A,B, A2Bi

B> 6 4 5 Bl 6 4
Calmo 5 5 5 Calmo 4 6
Ba A,B2 A 2B2 Ba A,B2 A 2B2
5,5 4,5 5 5
A,Bi A 2B1 A,B, )> A 2B1
A 2B2 > A 1B2
6 As entradas nas células e nas margens são médias. Médias grifadas indicam
diferenças significativas.
rença entre apelo moral e apelo pragmático, Ai e A2. No primeiro caso,

estes dados indicariam que o apelo moral é mais eficaz do que o
(pragmático em influenciar atitudes em relação aos judeus, não importa
He que maneira seja apresentado. No segundo caso, 0 modo de apresen
tação, inflamado, teve mais efeito do que 0 modo calmo, sem importar
0 tipo de apelo. Naturalmente, os exemplos não são realistas. Provavel
mente as médias não sejam números redondos como estes e muito menos
iguais [(as médias 5 e 5 em (I) e (II)]. Em todo caso, eles ilustram os
pontos essenciais.
Os dados de (III) são mais interessantes. Indicam que os apelos
ílioral e pragmático diferem significativamente apenas quando apresenta
dos de maneira inflamada. Os dois apelos são iguais quando apresentados
Êalmamente. Este é o fenômeno da interação, já discutido. Lembre-se de
que a interação acontece quando os efeitos de uma variável independente
são diferentes em níveis diferentes de outra variável independente. Neste
caso, as variáveis A e B “interagem” não porque A afete simplesmente
a variável dependente, como em (I), mas porque A afeta a variável
dependente, dependendo do nível em que B esteja. Em outras palavras,
o efeito de A depende de B; A deve interagir com B p araser eficiente.
Há muitos exemplos de interação na vida. O sucesso de alguns homens
parece depender das mulheres com quem se casam. Para outros homens,
não importa: progridem não importa com quem tenham se casado.
O preconceito contra judeus, embora muito forte, manifesta-se, digamos,
apenas em épocas de crise. O preconceito e o tipo de situação social
interagem então.
O exemplo (IV) é o mais interessante. Os dados indicam que os
apelos moral e pragmático são significativamente diferentes com as duas
abordagens, inflamada e calma, mas em direções opostas. O apelo moral,
Ai, é mais eficiente do que o apelo pragmático, A2, sendo apresentado
de maneira inflamada, Bi; mas o apelo pragmático, A2, é mais eficaz
do que o apelo moral, Ai, apresentado de maneira calma, B2.
Deve ficar claro para o leitor que estamos tratando aqui com
situações muito mais complexas do que as de delineamento e análise de
uma só variável independente do último capítulo. São testados dois ou
mais efeitos principais, assim como possíveis interações de variáveis
independentes. Deve também ficar claro que a abordagem fatorial é formi
dável. Em experimentos pode-se reproduzir mais aproximadamente a
verdadeira complexidade das situações reais. Este é um grande passo
intelectual na pesquisa e análise.
Os delineamentos fatoriais têm várias formas, algumas das quais
muito complexas. Além do delineamento relativamente simples 2 x 2 qúe
já discutimos, pode-se ter delineamentos com. duas variáveis indepen
dentes, mas com mais condições experimentais. (“2 x 2” significa “duas
condições vezes duas condições”, ou cada variável A e B tem duas
condições experimentais.) Por exemplo, duas condições multiplicadas por
quatro condições, ou três condições por cinco. Estas estão resumidas na
bibliografia como 2 x 3 e 2 x 5 (leia-se “dois por três” ; “ três por cinco”).
Tais delineamentos são usados freqüentemente, especialmente em pes
quisa psicológica e educacional.
Ê possível ter-se três ou mais variáveis independentes em delinea
mentos fatoriais. Pode-se ter, por exemplo, duas condições por duas
condições por quatro condições, ou 2 x 2 x 4. O mais simples destes
delineamentos, 2 x 2 x 2, é freqüentemente usado em experimentos psico
lógicos. Embora poderosos e muitíssimo interessantes, estes delineamentos
não irão ocupar-nos aqui. Deveria observar-se,.entretanto, que com três
variáveis independentes e um delineamento fatorial são possíveis sete
testes: os três efeitos principais e quatro eteitos de interação! Se o leitor
pretender ler a bibliografia da pesquisa, é necessário que ele tenha algum
112
(Conhecimento de tais delineamentos e sua análise. Recomenda-se, então,
o estudo de um bom texto de planejamento estatístico (por exemplo,
fêidwards, 1972).
Há um grande número de outros delineamentos experimentais usado
nas ciências comportamentais. Não vamos estudá-los neste livro, não
|>orque não tenham importância, mas por causa de nossa ênfase em
idéias conceituais básicas e em complexidades técnicas. O leitor achará
útil a discussão excelente, mas um bocado difícil, de Campbell e Stanlev
(1963).
Exemplos de pesquisas com delineamentos fatoriais
Vamos tentar dar mais vida ao assunto citando três estudos nos
guais acha-se finamence ilustrada a força do delineamento e da análise
fatorial. Embora às vezes seja difícil encontrar bons exemplos de certas
outras técnicas, absolutamente não é difícil encontrar usos do delinea
mento fatorial de bons a excelentes, principalmente em pesquisa psico
lógica. Os psicólogos perceberam rapidamente as virtudes — e talvez a
Qualidade estética — do delineamento fatorial para implementar seus
propósitos teóricos e experimentais.4
Além da lei de Parkinson
Em 1957, Parkinson expôs sua famosa lei: “ O trabalho se expande

|a ra preencher tempo disponível. Em outras palavras, se as pessoas
fiverem tempo no trabalho encontrarão trabalho para preencher o tempo”.
Num experimento interessante, Aronson e Gerard (1966) testaram uma
gjariação da lei de Parkinson: indivíduos que têm excesso de tempo para
lermirar uma tarefa em uma ocasião perderão mais tempo para fazer
tarefa semelhante em ocasiao subseqüente do que indivíduos que tiveram
o mínimo de tempo na primeira tarefa. Esta hipótese tem implicações
Jyrpreendentes e pertubadoras — se confirmada. Deriva vagamente de
uma teoria da aprendizagem (Guthrie, 1935) que diz que uma combina
rão de estímulos acompanhando um movimento tenderá, à repetição dos
Égtímulos a ser acompanhada pelo movimento. No caso presente, se o
§ujeito passa muito tempo fazendo alguma coisa em uma ocasião, ele
fenderá a passar muito tempo também em ocasiões subseqüentes.
do motivo para usar extensivamente o delineamento fatorial em psicologia

é devida à ênfase nos experimentos e experimentação. A psicologia social é um
pom exemplo: a moderna psicologia social é virtualmente psicologia social expe-
..tal Naturalmente há muitas exceções, algumas delas excelentes. Os exemplos
lerão dados em futuros capítulos.
113
Aronson e Gerard deram também uma breve explicação teórica (no
fim de seu relato) derivada da teoria da dissonância cognitiva (Festinger,
1957). Esta teoria diz, em parte, que se alguém faz alguma coisa que seja
incongruente com, digamos, a percepção de si mesmo ou da situação, sen
tirá um desconforto psicológico ou “dissonância cognitiva” . Em relação à
afirmação de Parkinson, se uma pessoa gasta mais tempo do que o
necessário em uma tarefa, isto criará dissonância cognitiva porque o
excesso de tempo gasto é incongruente com uma avaliação realista e
correta do tempo necessário para cumprir a tarefa. Para reduzir a disso
nância cognitiva, a pessoa precisa aumentar a importância e a complexi
dade da tarefa: “Afinal, é muito importante; leva tempo” . Conseqüente-
mente, ela poderá perder o mesmo tempo ou até mais da próxima vez
que fizer tarefa semelhante ou a mesma.
As variáveis independentes foram tempo, incentivo e sexo. Vamos
nos preocupar apenas com tempo; incentivo, sexo e todas as interações
não eram significantes. Metade dos sujeitos recebeu 5 minutos para
fazer uma tarefa; a outra metade recebeu 15 minutos. A tarefa, que era
extremamente fácil, exigia apenas 5 minutos. Consistia em escolher vários
argumentos de uma lista e colocá-los em uma sequência lógica. Mais
tarde pediu-se aos sujeitos que preparassem uma palestra de 2 minutos
sobre atletismo e que gastassem o tempo que precisassem para prepararem
um discurso convincente. A variável dependente era o tempo gasto pelos
sujeitos a prepararem o discurso (em segundos). Metade dos sujeitos
recebeu também um incentivo para terminar mais cedo, para contraba
lançar “o efeito de excesso de tempo” . Esta variável não era significante,
como fora indicado.
Os sujeitos na condição excesso de tempo (15 minutos) gastaram
uma média de 468 segundos na segunda tarefa, enquantos os sujeitos do
mínimo de tempo (5 minutos) gastaram uma média de 321 segundos na
segunda tarefa. Esta diferença foi estatisticamente significante. A evi
dência, então, indica que os sujeitos do grupo excesso de tempo sem
dúvida levaram tempo demais para terminarem a tarefa.
O leitor poderá querer saber se este resultado é generalizável, isto é,
se ele se aplica a outras pessoas em situações reais de trabalho. Diz-se
freqüentemente que experimentos, como estes são triviais, porque têm
pouca ou nenhuma aplicabilidade além do laboratório. Deve-se ter em
mente, entretanto, que a finalidade do experimento — e da maioria de
tais experimentos — foi testar uma implicação de uma teoria. E isto se
conseguiu com sucesso. Sua intenção não foi fazer mais do que isso.
Se os pesquisadores quisessem saber alguma coisa a mais em relação à
sua aplicabilidade em outras situações, ele teriam feito mais pesquisas
em outras situações com amostras representativas de pessoas. Este ponto
freqüentemente mal entendido será discutido novamente no próximo
capítulo.
114
Raça, sexo e admissão a faculdades
Falta direção teórica a muito da pesquisa educacional porque é a

pesquisa aplicada que se dirige para resolver problemas particulares de
pesquisa que não desenvolveram bases teóricas. O estudo que vamos
considerar agora (Walster, Cleary & Clifford, 1971) é um exemplo
excelente dessa pesquisa aplicada. Tem várias virtudes, duas das quais
são sua hábil manipulação de variáveis usualmente não-manipuláveis e
sua grande possibilidade de generalização. Um aspecto metodológico
interessante foi a unidade de análise do estudo: em vez de indivíduos, <
escolas, que formaram uma amostra casual das escolas norte-americanas.s
O estudo foi dirigido no sentido de descobrir uma resposta para um
problema social e educacional difícil, complexo e importante: a discri
minação na admissão as universidades. Walster e associados perguntaram:
“As faculdades discriminam candidatas (mulheres)? Discriminam (contra
ou a favor) candidatos negros?” Selecionaram aleatoriamente 240 facul
dades nos Estados Unidos e enviaram pedidos de admissão preparados a o
cada uma dessas escolas. Usaram um delineamento fatorial 2 x 2 x 3 O
As variáveis independentes eram sexo, raça e nível de capacidade. Estas ífJ)
K
variáveis são interessantes e incomuns porque são todas experimentais U>.Í
ou manipuladas. Comumente estas variáveis são não-experimentais, ou
''ariá eis atributos — variáveis que não podem ser manipuladas.
Mas Walster e outros manipularam-nas de maneira inteligente e imagina
tiva, embora simples. 6
Prepararam um formulário-guia para admissão à universidade, que
procurava responder a todas as perguntas que a instituição pudesse fazer.
Estes formulários foram enviados às 240 escolas escolhidas ao acaso.
(Foram escolhidas aleatoriamente em um guia de escolas.) Cada formu
lário era enviado por um candidato supostamente legítimo. Um quarto*l
O leitor deve confiar em que a seguinte proposição é correta: O uso de seleção

iieatoria (de indivíduos ou instituições) permite ao pesquisador assumir que a
f f u u - r j j T que a amostra seia representativa é substancial. Assim é alta a
probabilidade de que os resultados obtidos em tais amostras sejam aproximada
mente aphcaveis a população da qual foi tirada tal amostra. Esta conclusão
■Ho ap "-S para amostras grandes. Em palavras mais simples, isto significa que
|i mostras aleatórias grandes possibilitam ao pesquisador generalizar para as popu-
liiçoes de onde as amostras foram tiradas. Entretanto, o pesquisador jamais poderá
ter certeza. Poderá apenas assumir que suas amostras são representativas porque
te na proposição enunciada acima. Para maiores detalhes, veja Kerlinger
P973, capitulo 7, especialmente pp. 118-122).
enât*zar um ponto, entretanto. Os bons experimentos exigem, além
fle conhecimento e competência, habilidade, imaginação e até criatividade. O expe-
Bmento de Walster e colegas é um bom exemplo. Suas idéias parecem simples,
S Spois de conhecidas. Que eu saiba, não fora feito ainda um experimento contro-
Ido para testar preferencias em admissões.
115
deles indicava que o candidato era homem branco, outro quarto homem
preto, outro mulher branca e o último mulher negra. Al em disso,
incluíram-se três níveis de capacidade do candidato. Na verdade, havia
então três variáveis independentes, raça, sexo e capacidade e 12 tipos
de formulários, correspondentes a um delineamento fatorial. 2 * 2 x .
As 240 escolas foram designadas aleatoriamente às 12 células do modelo.
Havia, então, 20 escolas por célula. Á principal variável dependente era
aceitação ou rejeição do suposto candidato: uma escala de cinco pontos,
partindo de rejeição direta (1) a aceitação com apoio oú oferecimento de
ajuda financeira (5). Foram incluídas outras variáveis dependentes e inde
pendentes, também, mas não vamos nos preocupar com elas.
Os pesquisadores esperavam que os homens fossem preferidos as
mulheres e pretos a brancos. (Na época do estudo as escolas estavam
procurando alunos pretos.) Estavam errados. A análise de variância fato-
rial mostrou que os efeitos principais de raça e sexo não eram significa
tivos, nem a diferença entre médias de brancos e pretos (3,38 e 3,18).
Foi descoberta uma interação muito mais interessante e não antecipada,
aliás. Isto está apresentado na tabela 7.3, que mostra as médias dos
homens e mulheres (resultados médios na variável aceitação, homens e
mulheres) de acordo com os três níveis de capacidade.
Estude cuidadosamente esta tabela: é importante metodologica e
socialmente. As médias dos três níveis de capacidade foram significativa
mente diferentes. Mas isto é uma descoberta não muito importante, já que
reflete meramente o costumeiro hábito de rejeitar candidatos de capaci
dade inferior. A diferença entre a média de homens e mulheres de 3,41
e 3,15 não foi significativa. Evidentemente não houve discriminação
global com base em sexo. A interação de capacidade e sexo em seu efeito
conjunto na aceitação, entretanto, foi estatisticamente significante. Para
interpretar a interação, podemos omitir as médias do nível médio de capa
cidade (3,48 e 3,48), já que são iguais. As médias de alta capacidade são
3,75 e 4,05, não muito diferentes. No nível ato de capacidade não há
discriminação de sexo. Veja, agora, as médias de baixa capacidade, 3,00
e 1,93. Esta diferença relativamente grande é o principal motivo para a
interção significativa. Evidentemente os candidatos homens de baixa
Tabela 7.3 Médias da variável aceitação em faculdades por sexo e nível de

capacidade: estudo de Walster, Cleary e Clifford.
Capacidade
Alta Média Baixa
Masc. 3,75 3,48 3,00 3,41

Sexo
Fem. 4,05 3,48 1,93 3,15
3,90 3,48 2,47
116
Capacidade são significativamente mais aceitos do que as mulheres de
baixa capacidade. A discriminação parece ser exercida sobre o nível
baixo de capacidade. Os autores afirmam que esta descoberta concorda
com a observação feminista de que apenas mulheres excepcionais podem
transcender estereótipos sexuais e serem julgadas objetivamente. Mulhe
res de capacidades mais modestas são julgadas primeiro como mulheres
— e assim como “inferiores.”
Este é um excelente exemplo da força do delineamento fatorial e da
utilidade de estudar interações. Provavelmente não teria sido possível
revelar a descoberta importante e interessante deste estudo sem a idéia
de interação das variáveis independentes em seu efeito sobre uma variável
dependente.
Deflagração de hostilidade, agressão deslocada e anti-semitismo
Berkowitz (1959), ao estudar a relação entre deslocamento de

agressão e anti-semitismo, perguntou se pessoas preconceituosas têm mais
probabilidade de reagir à frustração com agressão deslocada do que
pessoas não-preconceituosas. Esta é uma hipótese de interação muito
interessante baseada em duas linhas de teoria psicológica. Uma linha
pode ser chamada teoria da frustração-agressão, que é baseada na idéia
geral de que frustração conduz à agressão (Dollard e outros, 1939). Outra
linha teórica, de origem psicoanalítica, diz que, sob certas circunstâncias,
as pessoas deslocam sua agressão. Deslocar agressão significa re-direcio-
nar agressão, daquilo que possa tê-la causado para outra coisa talvez sem
relação com a fonte de agressão. Não precisamos elaborar todos os
detalhes do raciocínio teórico. É suficiente dizer que, em muitos casos,
os judeus se tornam alvo de agressão, sem haver relação necessária
entre a fonte de agressão e o al\o, os judeus.
Berkowitz usou este raciocínio para tentar explicar a agressão contra
os judeus. Seu experimento foi inteligente e eficiente. Foi mais que
isto: foi, e ainda é, um casamento sofisticado entre a teoria e a metodo
logia e mostra o bom resultado de unir as duas satisfatoriamente. (Entre
tanto, tem um defeito. Veja nota de rodapé número 7.) Ele dividiu 48
mulheres em dois grupos baseando-se nos seus resultados em uma medida
de anti-semitismo. Cada um desses grupos foi então dividido em dois,
baseados em impulso (drive) agressivo, mas vamos deixar de lado esta
variável de controle, em nome da simplicidade. A variável experimental
jnanipulada foi a deflagração de hostilidade. Com um grupo experimen
tal, o pesquisador usou de sarcasmo, de depreciação do desempenho dos
Sujeitos e questionou a capacidade de os estudantes fazerem seu trabalho
escolar. O grupo sem hostilidade foi tratado de maneira neutra. Cada
pujeito foi emparelhado com um aliado do pesquisador, com quem teria
117
que resolver um problema. Foi perguntado aos sujeitos se gostavam ou
não do parceiro por meio de pontos que iam de 0 (“sim, definitiva
mente”) a 23 (“ definitivamente não”). Esta medida de apreciação era a
variável dependente. A previsão era de que os sujeitos mais anthsemitas
exibiríam mais agressividade deslocada induzida pela hostilidade provo
cada do que os sujeitos menos anti-semitas. Isto deveria ser mostràdo
pela menor apreciação pelos parceiros de trabalho por parte dos sujeitos
de alto grau de anti-semitismo. Esta é, então, uma hipótese de interação:
a deflagração de hostilidade deve funcionar diferentemente nos diferen
tes graus de anti-semitismo.
As médias de apreciação pelo parceiro, como função da deflagração
de hostilidade, A, e anti-semitismo, B, são dadas na tabela 7.4. Nenhum
dos efeitos principais foi em e de si próprio significativo. Sua interação,
entretanto, foi significativa. Quando foi despertada a hostilidade, indi
víduos com alto grau de anti-semitismo reagiram como mais agressividade
deslocada (menos apreciação pelo parceiro) do que indivíduos com
baixo grau de anti-semitismo. A hipótese de interação ficou apoiada —
uma descoberta de importância tanto prática quanto teórica.*7
Tabela 7.4 Médias de pontos estima-por-parceiro, relacionada à hostilidade e

anti-semitismo, estudo de Berkowitz (1959)a.
Com deflagração Sem deflagração

de hostilidade de hostilidade
A Á2
Alto anti-semitismo
b2 18,4 14,2
Baixo anti-semitismo
Bs 12,2 16,3
a Quanto mais alto o resultado, menor a apreciação pelo parceiro. Os efeitos

principais não foram significativos; a interação foi.
Um retrospecto conceituai
Nos capítulos anteriores foi fortemente enfatizado o objetivo da

ciência como teoria e explicação. A explicação foi descrita em parte
7 O ponto questionável do estudo me foi mostrado por meus alunos da Universi

dade de Amsterdã. Eles disseram que deveria haver uma diferença significativa
entre Ai e A2 em Bi, mas não em B2. O leitor pode ver, entretanto, que a diferença
prevista entre Ai e A2 aparece em Bi, mas apareceu também uma diferença impre
vista e na direção oposta em B2. Não parece haver uma razão teórica para tal
diferença em B2. O leitor poderá lucrar refletindo sobre este problema.
118
como especificando as relações entre as variáveis. Agora temos ferra
mentas conceituais e metodológicas para nos ajudar a compreender
melhor como os cientistas comportamentais tentam explicar os fenômenos.
Eles separam as variáveis entre dependentes e independentes, usando a
gegunda para explicar a primeira. A explicação mais simples possível
consiste em relacionar uma variável independente com uma variável
dependente. Exemplos disto são os estudos de Clark e Walberg, Aronson
® Mills. O leitor encontrará muitos exemplos semelhantes na bibliografia.
A base conceituai do delineamento e análise de tais pesquisas é um
anunciado da forma “ se p, então q” . Não importa haver dois grupos
gxperimentais, como no estudo de Clark e Walberg, ou mais de dois
grupos, como no de Aronson e Mills, a concepção de explicação é a
mesma.
Mas as explicações às vezes são mais complexas, como no estudo de
Walster, Cleary e Clifford, no de Berkowitz e no de Aronson e Gerard.
Mais de uma variável independente é usada para estudar a variável
dependente. No caso mais simples, a concepção subjacente é “se p, então
q, sob a condição r”. Esta é a base conceituai de muitos estudos publica
dos. Muitos outros estudos, entretanto, usam base conceituai mais com
plexa: eles avaliam os efeitos separados e combinados de mais de duas
variáveis independentes sobre uma variável dependente. A base concei
tuai é “se p, então q, sob as condições r, s, e t”. Este exemplo tem quatro
variáveis independentes: p, r, s e t. Não importa quantas variáveis sejam
usadas e como estejam simbolizadas, a abordagem básica é a mesma:
o efeito de uma ou mais variáveis independentes sobre uma variável
dependente é estudado.
119
8. P e s q u is a e x p e r im e n t a l e n ã o - e x p e r im e n t a l
/■
A maioria dos exemplos de pesquisas reais que resumimos e discuti

mos nos capítulos anteriores foi experimental: as de Clark e Walberg,
Aronson e Mills, Walster, Cleary e Clifford e outras. Apenas o estudo
de Miller e Swanson, descrito no capítulo 1, foi não-experimental. Há um
bom motivo para esta preocupação: a pesquisa experimental pode ser
considerada o ideal da ciência porque as respostas a questões de pesquisa
obtidas em experimentos são no total mais claras e menos ambíguas do
que as respostas obtidas em pesquisas não-experimentais. Mas há um
grande corpo de pesquisas importantes e significativos que é não-experi
mental, ou pesquisa ex post facto, como foi denominada. Pode-se até
argumentar que a pesquisa ex post jacto é mais importante que a pesquisa
experimental. A posição tomada neste livro parece ser, mais razoável: os
dois tipos de pesquisa são importantes e necessários. Ambos têm valor.
Ambos devem ser feitos.
Neste capítulo vamos examinar as principais características da pes
quisa experimental e não-experimental e as principais diferenças entre as
duas. A tarefa não será fácil porque será preciso explorar com alguma
profundidade a diferença entre as conclusões obtidas na pesquisa experi
mental e não-experimental. Felizmente já discutimos a experimentação e
podemos usar o que aprendemos. Começaremos reexaminando a pesquisa
experimental e usando uma série de estudos experimentais de Milgram
para estimular e ilustrar a discussão.
Os experimentos de Milgram sobre obediência e autoridade
Milgram (1974), interessado nos fenômenos de obediência e autori

dade, mostrou que pessoas de diversos níveis de formação farão coisas
moralmente condenáveis a outras pessoas, sob o comando de uma autori
dade respeitada e claramente designada. Escolhi a pesquisa de Milgram
para ilustrar a natureza e força dos experimentos, não pela excelência
do delineamento mas porque os resultados foram surpreendentes, difíceis
de acreditar e vão contra a moralidade aceita. Para acreditarmos nos
resultados de Milgram, deveremos ter muita fé nos meios pelos
quais ele foram obtidos. Isto significa que devemos estudar sua metodo
logia cuidadosa e ceticamente.
120
Milgram fez diversas perguntas relacionadas e desejava respostas
empíricas: “Que fatores influenciam a disposição do indivíduo para
obedecer a uma autoridade?”, “ Como a autoridade afeta a obediência?”,
“Se o indivíduo que der ordens a uma pessoa tiver status de autoridade,
isso a compele a maior obediência?”, “ Por que indivíduos aceitam
ordens que os compelem a comportamentos ‘imorais’, comportamentos
que infligem sofrimento a indivíduos desprotegidos?”, “Quando as
pessoas obedecem a uma ordem que atenta contra a moralidade comum,
como elas reagem psicologicamente, como justificam seu comportamen
to?” É um conjunto formidável de perguntas a que poderemos responder
apenas parcialmente.
O procedimento experimental foi o seguinte: duas pessoas chegam
ao laboratório de psicologia para trabalharem juntas em um estudo de
memória e aprendizagem. Uma será o “professor” e a outra o “ aluno” .
O verdadeiro sujeito experimental será o professor. Ele é avisado de
que a finalidade do experimento é estudar os efeitos da punição na
aprendizagem. O aluno — sempre a mesma pessoa, um ator que recebeu
instruções de como reagir — está sentado em uma cadeira, braços
amarrados para evitar movimentos e com um eletrodo preso ao pulso.
O pesquisador diz ao aluno que ele aprenderá uma lista de pares de
jpalavras. Se fizer um erro, levará um choque. O professor observa tudo
isso e é levado para a principal sala experimental e instruído sobre como
usar um impressionante gerador de choque, que tem um painel de 30
chaves rotuladas de 15 a 450 volts, e também etiquetas com as palavras
“Choque leve” e “Perigo — choque violento”. .
O professor então recebe a ordem de “ensinar” o homem da outra
sala, lendo pares de palavras — dia bonito; caixa azul; e assim por
diante. Nos testes de aprendizado, o professor lê as palavras-estímulo e
em seguida quatro respostas prováveis, por exemplo: azul: céu, tinta,
caixa, lâmpada (Milgram, 1974, p. 19). O aluno escolhe a resposta que
acha correta apertando um de quatro botões. Se a resposta for correta,
o professor vai para o conjunto seguinte. Se estiver incorreta, deve
aplicar um choque no aluno. O professor receberá ordem de aplicar
§hoques cada vez mais fortes a cada resposta incorreta. Se o sujeito fizer
$ erguntas, deve ser informado de que os choque podem ser muito dolo
rosos mas que não causam danos permanentes aos tecidos. (Na verdade,
0 aluno não recebeu um choque sequer.)
Depois de iniciados o ensino e aprendizado e durante o experimento,
0 sujeito, talvez perturbado por ter que aplicar choques em outra pessoa,
ferguntou ao pesquisador se deveria continuar a fazer aquilo. O pesquisa
dor estimulou-o com um entre quatro comandos: “ Por favor, continue” ;
"O experimento exige que você continue”; “É essencial que você con-
tinue” e “Não há outra escolha, você tem que continuar” . Estes coman
dos eram dados em seqüência e apenas se o sujeito se recusasse a obe
decer.
O aluno-cúmplice do pesquisador deu sempre o mesmo conjunto de
respostas ou reações ao procedimento. Não teve a menor reação até o
choque de 75 volts, quando soltou um leve gemido. Aconteceu a mesma
coisa com os choques de 90 e 105 volts, mas aos 120 o aluno gritou
que os choques eram dolorosos. Aos 135 volts a “vítima” gemeu dolo
ridamente e aos 150 gritou pedindo para ser solto e que se recusava
a continuar. Reagiu de maneira semelhante mas com maior intensidade
aos choques subseqüentes e aos 180 volts gritou que não podia suportar
a dor. Aos 270 volts gritava em agonia e aos 300 recusou-se a continuar
dando respostas.
O sujeito (o professor) a esta altura — e anteriormente — pedia
orientação ao pesquisador, que o instruiu a considerar ausência de res
posta como falta de reação e a continuar o experimento. Depois dos
330 volts não .se ouviu mais nada do aluno.
A questão é: até onde os sujeitos vão? Chegarão aos 450 volts?
Ou se recusarão a uma certa altura? Eles obedecerão ou desobedecerão?
Este é o núcleo do experimento. Milgram variava as instruções para dife
rentes grupos de indivíduos. Por exemplo, ele manipulou a proximidade
do aluno com o professor, predizendo que, quanto mais distante o aluno
ficasse do professor, choques mais fortes o professor aplicaria. Usou
também outras variações de controle. Um grupo de sujeitos, por exemplo,
passou por um experimento com o pesquisador (a autoridade) ausente.
Com outro grupo foi feito o experimento num prédio de escritórios de
uma cidade distante da Universidade de Yale, onde foi feita a maioria dos
outros experimentos. Isso foi para controlar o possível efeito de autori
dade de uma universidade de prestígio (veja abaixo).
Os experimentos, então, usaram diversas variáveis independentes e
uma variável dependente, obediência, medida pelo nível de choque os
sujeitos antes de concluírem a série de choques ou até se recusarem a
continuar participando do experimento.
Os resultados desafiam o senso comum e violam a moralidade
comum.1 No primeiro experimento, onde a proximidade foi a variável
independente, 26 dos 40 sujeitos na situação básica remota continuaram
os choques até o máximo de 450 volts! (Lembrem-se de que as chaves
1 Não vamos comentar a ética desses experimentos controvertidos e assustadores

que suscitaram muitas controvérsias entre os cientistas sociais. Ver o excelente
resumo dos comentários de Milgram (1974, pp. 193-202) sobre as questões éticas
levantadas por esta pesquisa.
122
de 275 a 450 volts estavam indicadas com a etiqueta “ Perigo — choque
violento” e que as voltagens numéricas e as designações verbais estavam
claramente indicadas.) Cinco sujeitos deram 300 volts antes de desistirem
e oito aplicaram entre 315 e 360 volts. A maioria foi, então, muito
obediente, e todos, no mínimo, aplicaram choques mesmo acreditando
que eram violentos. Entretanto, quanto mais próximos estavam de suas
“vítimas”, menos obedeciam. Entretanto, um número considerável deu o
tratamento completo às vítimas.
É tentador estudar as implicações psicológicas deste notável estudo.
Meu principal objetivo, entretanto, ao citá-lo com tantos detalhes, não é
psicológico, mas metodológico. Quero que o leitor perceba claramente
que estamos tratando de um assunto altamente controvertido, difícil e
discutível, e confiar nos resultados também é difícil. Quero ilustrar
o fato de que, outras coisas mantidas constante, um experimento inspira
maior confiança do que um estudo ex post jacto. Se os resultados de
Milgram forem empiricamente válidos — e, apesar de certas fraquezas
metodológicas, parecem ser — encontramo-nos diante de um fato muito
perturbador relativo a muitas pessoas: elas ferirão cruelmente outras
pessoas obedecendo a uma autoridade reconhecida e a despeito de seus
escrúpulos morais. E não são monstros hitleristas; ao contrário, são na
maioria pessoas decentes e moralmente sadias, que normalmente jamais
sonhariam em agredir outras pessoas. Podemos então confiar nos resul-
tados(? (Parece que a resposta é “Sim”.)
A maioria das pessoas, quando indagadas sobre o que elas ou outras
pessoas fariam em tal situação, afirma que nem elas nem os outros
aplicariam choques às vítimas ou que o fariam apenas com choques
fracos. É este precisamente o objetivo de Milgram e parte do significado
psicológico central de sua descoberta: gente decente e bondosa compor-
ta-se cruelmente dada as circunstâncias apropriadas — e a principal
circunstância é a autoridade. Então, podemos acreditar nele? Eu aplicaria
choques em uma pessoa a mando de outra e apesar dos protestos da
vítima?
Controle
Em geral pode-se acreditar mais nos resultados obtidos em pesquisas

experimentais do que nos resultados de outras fontes de conhecimento.
Colocando de forma diferente, dada a competência e dada a satisfação
dos padrões e critérios científicos, pode-se acreditar mais nos resultados
dos experimentos do que nos resultados de outros tipos de pesquisa.
Este é o motivo primordial por que a pesquisa experimental é tão impor
tante e.por que os cientistas, podendo escolher, provavelmente farão
fxperimentos. O experimento científico é uma das maiores invenções de
todos os tempos. É também a fonte mais segurâ de conhecimentos e de
compreensão dos fenômenos naturais, outras coisas mantidas constantes.
Os motivos não são difíceis de compreender. O principal e central
é expresso pela palavra “controle”. Num experimento bem conduzido, o
controle e relativamente grande. Mas o que significa “controle” em um
contexto experimental? Basicamente significa a definição, delimitação,
restrição e isolamento das condições da situação de pesquisa de maneira
a maximizar a confiança na validade empírica dos resultados. As possi
bilidades de explanações alternativas dos fenômenos em estudo são mini
mizadas.
No caso de Milgram, o enunciado básico testado foi: "Se autori
dade, então obediência”. Poder-se dizer que esta afirmativa, empirica-
mente válida, significa em parte que outras afirmativas explanatórias
plausíveis e possíveis não são válidas empiricamente. Por exemplo, é
possível que a atmosfera de prestígio e a proximidade da Universidade
de Yale tenham conduzido à obediência? Para responder a esta questão,
Milgram fez o experimento em um despretensioso prédio de escritórios
em outra cidade. Os resultados foram virtualmente os mesmos. Logo, não
era a proximidade que levava à obediência.
Um explicação alternativa possível da obediência dos sujeitos, mais
sutil, era a obrigação contratual. Os sujeitos foram contratados pelo
pesquisador para abdicarem de um pouco de sua liberdade em benefício
do avanço do conhecimento científico. Perceberam também que a vítima
fora contratada. Tanto professor quanto aluno tinham, portanto, que
honrar suas obrigações contratuais. Os sujeitos foram, portanto, obedien
tes. Milgram eliminou isto salientando uma fórmula de desobrigação que
professor e aluno assinavam. Durante a assinatura, o aluno afirmou que
tinha um problema cardíaco e que queria parar com o experimento
quando lhe conviesse. O pesquisador resmungou concordando aparente
mente. Assim, o “ contrato” tornou-se mais importante. Aos 150 volts o
aluno protestou, mas o pesquisador não lhe deu ouvidos e ordenou ao
professor que continuasse da maneira usual. Desta forma, o “contrato”
não estava sendo obedecido pelo pesquisador. Fez alguma diferença?
Se o contrato tinha força, os sujeitos deveríam então parar de obedecer.
Mas não; continuaram a obedecer ao pesquisador. Como mostraram os
resultados e como diz Milgram, “ a doutrina do contrato social é uma
frágil determinante do comportamento” (Milgram, 1974, p. 66).
Mas, testar explicações ou hipóteses alternativas, uma forma pode
rosa e indispensável de controle científico (Platt, 1964), não é uma
prerrogativa exclusivamente experimental. Tal teste pode ser e é feito
em pesquisa não-experimental. Entretanto, é mais característico e mais
exeqüível na pesquisa experimental que na pesquisa não-experimental,
124
porque os pesquisadores podem ter controle quase total sobre o que
podem fazer e como o fazem.
Definição e características dos experimentos
Em um capítulo anterior ficou dito que o experimento tinha duas

características essenciais: manipulação de variáveis independentes e
casualização. Ficou claro também que casualização não é absolutamente
essencial em um experimento, embora muito desejável. O verdadeiro
significado da qualidade essencial da casualização na definição é simples
mente que a casualização pode ser usada apenas em experimentos. Como
veremos mais adiante, a designação aleatória é completamente impossível
em pesquisa não-experimental.
Um experimento é um estudo no qual uma ou mais variáveis inde
pendentes são manipuladas e no qual a influência de todas ou quase
todas as variáveis relevantes possíveis não pertinentes ao problema da
investigação é reduzida a um mínimo. Nos chamados experimentos de
laboratório — em contraste com os experimentos de campo — os pesqui
sadores fazem isto isolando a pesquisa em uma situação física delimi
tada e manipulando e medindo variáveis sob condições cuidadosamente
especificadas e controladas.
Naturalmente tudo isso se resume numa segurança relativamente
maior de que as variáveis independentes do estudo de pesquisa possam,
se eficientes, agir sobre as variáveis dependentes sem a "contaminação”
de outras influências ou variáveis. Foi isso que Milgram fez. Controlou
cuidadosamente a situação experimental de laboratório para poder ter
segurança relativamente maior de que a autoridade do pesquisador
pudesse, se eficiente, operar sobre a variável dependente, obediência,
sem ser contaminada por outras variáveis.
Deve ter ficado claro que situações experimentais, principalmente
em laboratórios, são ambientes fechados e restritos nos quais há precisão
relativamente alta de manipulação e mensuração. A necessidade ou utili
dade de situações tão confinadas na pesquisa vem da maior confiança
em seus resultados, da flexibilidade que o pesquisador tem para testar
os vários aspectos dos problemas de pesquisa, à vontade, e, intimamente
relacionada e muitíssimo imoortante. da capacidade de testar vários
pspectos da teoria, à vontade. Já discutimos o aspecto confiança nos
gXperimentos. O aspecto flexibilidade precisa de elaboração. Assim como
o aspecto testagem de teoria.
Um aspecto importante da pesquisa de Milgram em obediência,
já salientado, foi a variação de condições experimentais com o fim de
íliminar explicações alternativas do fenômeno obediência. A hipótese
em teste era: “Se autoridade, então obediência” . Se a validade empírica
desta hipótese é apoiada pela pesquisa, isto é evidência da\ validade
empírica das idéias de Milgram sobre a relação entre autoridade e obe
diência. Mas há outras explicações plausíveis. Somente quando essas
outras explicações forem mostradas como empiricamente inválidas,
poderá o pesquisador confiar totalmente na sua afirmativa “se-então”
original.
Isso foi essencialmente o que Milgram fez, embora não exatamente,
e é um aspecto metodológico forte de sua pesquisa. Ele usou o aspecto
flexibilidade da pesquisa experimental para variar variáveis independen
tes e para eliminar outras explicações possíveis ou variáveis indepen
dentes e assim reforçar sua afirmativa básica ou hipótese. Por exemplo,
se é verdade que é a autoridade do pesquisador que compele à obediên
cia, então, outras fontes prováveis de influência, além do pesquisador,
devem ser eliminadas. Lembre-se de que uma delas foi o ambiente
de prestígio da Universidade de Yale. Milgram eliminou isso fazendo a
pesquisa em outro ambiente sem prestígio ou status. Outras explicações
plausíveis foram igualmente testadas, como já vimos. A questão é que,
na maioria das situações experimentais, tal testagem variada e frutífera é
possível e necessária.
Veremos então parte da teoria de Milgram que explica suas desco
bertas. Pessoas que entram numa situação de autoridade mudam interna
mente e isso é mostrado por uma mudança de atitude. A pessoa que
entra em uma situação de autoridade suspende seus próprios objetivos
por um tempo e age como agente executivo dos desejos e ordens de
outros (Milgram, 1974, pp. 132-154). Milgram chama ao estado da
pessoa estado agêntico (agentic State), a condição em que está uma
pessoa quando se percebe como agente dos desejos e ordens de outra.
Uma idéia-chave aqui é que quando a pessoa se encontra em estado
agêntico seus próprios valores, atitudes e motivações ficam suspensos, ou
pelo menos subordinados, e ela pode comportar-se e se comportará como
não pode e não se comportaria em seu “próprio estado”. Ela se vê como
irresponsável por seus atos e pode até agir cruelmente com outros.
Munido de uma “boa” teoria, o pesquisador pode deduzir algumas
ou muitas conseqüências da teoria. Se é verdade que as pessoas em estado
agêntico perdem seu sentido normal de responsabilidade, então, pode-se
fazer um experimento para ver se isto se verifica. Pode-se dar um jeito
de produzir o estado agêntico em um grupo de pessoas por instruções
experimentais, e depois medir seu sentido de responsabilidade compa
rado a, digamos, o sentido de responsabilidade de outro grupo fora do
estado agêntico.
Outro experimento implicado pela teoria podería ser simplesmente
comparar a obediência de grupos sob diferentes “intensidades” do
126
estado agêntico. Outro experimento pode ainda ser variar a força e
legitimidade da autoridade do experimentador. Provavelmente a profun
didade do estado agêntico e o grau de obediência dos sujeitos podem
ser afetados diferentemente por diferentes forças e níveis de legitimidade
da autoridade.
Chama-se a essas possibilidades experimentais “flexibilidade” . Essa
característica dos experimentos, junto com a .capacidade de manipular
variáveis, de casualizar sujeitos e condições e chegar a um controle
relativamente firme e cerrado sobre a operação das variáveis constitui
um método muito poderoso de testar teorias e hipóteses e aumentar o
conhecimento. Isto não significa que todos os experimentos aumentam
significativamente o conhecimento. Sem dúvida, muitos são mal conce
bidos e mal executados. Não há garantia de validade ou valor, em
outras palavras, só porque um estudo é experimental. Mas o potencial
está presente. Antes de estudarmos a pesquisa ex post jacto, será bom
examinarmos tanto os pontos fortes como os pontos fracos dos experi
mentos, mas especialmente dos experimentos de laboratório.2
Forças e fraquezas da pesquisa experimental
Para esboçarmos a força da pesquisa experimental, vamos primeiro

recapitular os pontos mostrados acima. A força básica da pesquisa
experimental está no controle relativamente alto da situação experimental
e conseqiientemente das possíveis variáveis independentes que possam
afetar as variáveis dependentes. Isto significa que as relações podem
ser estudadas isoladas da cacofonia do mundo exterior; as relações
“puras” podem ser estudadas. Uma segunda força é que as variáveis
podem ser manipuladas sozinhas ou em conjunto com outras variáveis.
O leitor já pode, a esta altura, estar convencido da força da manipulação
de variáveis. Terceiro, as situações experimentais são flexíveis no sentido
de que muitos e variados aspectos da teoria podem ser testados quase à
vontade. Freqüentemente, a única restrição é o limite da habilidade.
Ainda não foi mencionada uma quarta força dos experimentos:
os experimentos podem ser “replicados” com ou sem variações. Alguns
dos experimentos, na série de experimentos de Milgram foram replica-
ções. Tornou-se quase uma regra na pesquisa comportamental: replicar
todos os estudos. É muito mais fácil replicar pesquisa experimental do
que não-experimental, porque grande parte da situação de pesquisa se
2 Grande parte da discussão será também aplicável a experimentos de campo.

Para uma discussão rriais completa, veja Festinger e Katz (1953).
127
encontra sob o controle do pesquisador. Infelizmente, poucos estudos
são replicados.
“Replicação” é um termo mais amplo que “repetição’! ou “dupli
cação”. Significa repetir um estudo, mas geralmente com variações. Num
sentido estrito, a duplicação simples jamais é possível, porque são usados
sujeitos diferentes, pode ser acrescentada uma variável, outra pode ser
excluída, a replicação terá que ser feita em outra ocasião, quando as
condições podem ter mudado e o local da pesquisa pode, e muitas vezes
deve, sèr mudado. Em todo caso, se as relações obtidas são as mesmas
ou semelhantes sob replicação, sua validade empírica fica reforçada.
A replicação do experimento básico de Milgram, longe da Universidade
de Yale, é um exemplo deste fortalecimento da validade empírica dos
resultados da pesquisa.
Os experimentos têm fraquezas. Uma delas é que as variáveis inde
pendentes dos experimentos de laboratório raramente têm muita força
se comparadas à força de variáveis “naturais” fora do laboratório.
O experimento de Milgram parece ser uma exceção. A maioria dos
estudos experimentais, entretanto, não tem a força dramática dos estudos
de autoridade-obediência. Isso é uma desvantagem porque torna difícil
descobrir os efeitos de tais variáveis. Sem dúvida, as relações que existem
realmente podem não ser descobertas, confundindo talvez cs cientistas
em relação ao verdadeiro estado de coisas em um campo definido.
Quando um pesquisador estuda os efeitos da repetição sobre a memória,
pode ser muito difícil detectar tais efeitos, especialmente a curto prazo.
Um motivo para a precisão e a estatística aperfeiçoada do laboratório
encontra-se na necessidade de detectar os efeitos de variáveis indepen
dentes fracas.
A experimentação é frequentemente criticada com base em duas
acusações relacionadas: artificialidade e falta de generalidade. Ê difícil
saber se a artificialidade dos expèrimentos é realmente uma fraqueza.
Há muito pouca dúvida de artificialidade. Sem dúvida, já que variáveis
manipuladas são inventadas, são quase por definição “artificiais”. Por
outro lado, muitas vezes é incrível até que ponto os experimentos podem
ser tornados realísticos. Leia o livro de Milgram e veja se pode acusar
seus experimentos de artificiais. Um ponto mais sutil é que uma certa
quantidade de artificialidade faz parte natural da experimentação. Pesqui
sadores sofisticados naturalmente sabem disso. Eles acreditam também
que, por causa da artificialidade e efeitos fracos, se uma relação for
percebida em um laboratório, é substancial a probabilidade dé que, outras
coisas mantidas constantes, a relação será mais forte em situações mais
realistas. Muitos pesquisadores pouco ligam à artificialidade. Dirão que
estão testando teoria e que não têm interesse em aplicações de sua
pesquisa. Sua posição é bem colocada. Muito freqüentementé, pesquisas
128
consideradas teóricas e não práticas vierain a produzir resultados com
consequências práticas de longo alcance (veja Comroe & Dripps, 1976;
■Deutsch, Platt, & Senghaas, 1971; Townes, 1968). Voltaremos a este
problema no fim do livro.
Em geral os resultados de experimentos de laboratório não podem
ser generalizados além do laboratório. Só porque certos resultados foram
obtidos em laboratórios não se pode dizer que resultado idêntico ou
semelhante ocorrerá fora do laboratório — embora possa, e muito bem.
Deve-se mostrar, através de pesquisas posteriores, que os resultados se
aplicam ao campo. Isto falan do num se n tid o estrito . Fica-se intrigado com
a pesquisa de Milgram e com algumas outras enérgicas pesquisas de labo
ratório. As descobertas de Milgram são aplicáveis a escolas, corporações,
igrejas, exércitos e outros grupos? Não se pode dizer enquanto não se
fizer mais pesquisa. Minha opinião é que Milgram apresentou um forte
argumento, mas a pesquisa precisa ser estendida a situações de campo.
(Mas como fazer isso?) Ê possível que a relação entre autoridade e
obediência possa ser furada quando estudada em certos tipos de situações
reais.
Ao pensar na aplicabilidade da experimentação de laboratório à
vida real, deve-se ter em mente que o objetivo básico da experimentação
não é descobrir o que acontecerá ou ò que funcionará em situações de
vida. O objetivo básico é estudar as relações e testar hipóteses derivadas
da teoria sob condições cuidadosamente controladas e limitadas. Sem
dúvida, muita pesquisa — um exemplo claro é a medicina — é feita em
laboratório, principalmente para determinar o que aconteceu ou o que
acontecerá. Por exemplo, tal ou tal método de terapia surtirá efeito?
Embora muitíssimo útil, tal experimentação, cientificamente falando, é
periférica à base conceituai da experimentação científica. Se esta inter
pretação assaz purística está ou não completamente correta não é, entre
tanto, importante. O que importa é não esperarmos que a experimentação
em laboratório faça o que não foi encarregada de fazer: generalizar
para situações de vida real.
Talvez o leitor compreenda tudo isso melhor se focalizarmos rapida
mente outra crítica relacionada a experimentos e experimentação na
pesquisa comportamental. Freqüentemente afirma-se que os experimen
tos de laboratório são triviais. Há pouca dúvida de que muitos experi
mentos são triviais. É importante saber, contudo, o que o crítico está
dizendo. Ele está dizendo que os experimentos são artificiais, e com isso
quer dizer que não são a própria vida. Assim, são triviais. O núcleo da
crítica é que os experimentos não têm generalidade. Seus resultados não
se aplicam a pessoas reais em situações de vida real.
O argumento é mais fundamentalmente irrelevante do que errôneo
porque os experimentos e seus resultados não foram feitos para serem
129
aplicados à vida real, como ficou dito há pouco. O experimento é uma
invenção especializada cujo propósito está quase totalmente divorciado
da vida real. Seu propósito é especificamente ficar separado e prbtegido
do “barulho” exterior. Seu propósito científico é estudar as relações e
testar as proposições derivadas da teoria no ambiente menos contami
nado que se possa conseguir. Seu propósito não é melhorar as condições
humanas e sociais. Portanto, uma crítica com base na possibilidade de
generalização é, rigorosamente falando, irrelevante. É como criticar
alguma coisa por não ser o que não pode ser de forma alguma.
Pesquisa não-experimental
Ninguém conhece exatamente quais são as proporções da pesquisa

experimental e não-experimental na pesquisa comportamental. Pode ficar
claramente dito, entretanto, que muito da pesquisa não-experimental tem
alto significado e importância, assim como muito da pesquisa experi
mental é significativo e importante. Nenhum tipo de pesquisa pode ou
deve gozar de qualquer monopólio de validade e prestígio. Não há nada
inerentemente meritório em se fazer tanto pesquisa experimental quanto
não-experimental, como tais. Pesquisam-se problemas de interesse e
alguns problemas podem ser experimentais, enquanto outros não.
Pesquisa não-experimental, ou ex post íacto, é aualquer pesquisa
na qual não é possível manipular variáveis ou designar sujeitos ou
condições aleatoriamente. Fazem-se inferências e tiram-se conclusões
tanto em pesquisa experimental quanto não-experimental, e a lógica
básica da investigação é a mesma. Mas as conclusões não são empirica-
mente tão fortes na primeira quanto na segunda. Explicar completamente
esta afirmativa seria difícil e enfadonho. Vamos nos contentar, então,
com uma explanação menos completa baseada na idéia de controle, discu
tida anteriormente.
A base da estrutura pela qual o cientista opera é relativamente
simples. Ele faz perguntas assim: “Como x está relacionado com y?”,
“Sob que condições x afeta y, x sendo uma variável independente e y
uma variável dependente?”, “ Ou como Xi, X2 e xs afetam y — ou
mesmo yi e ya?” Ele, então, formula a hipótese de que x influencia y de
tal ou qual maneira, esperando-se que a hipótese derive de uma teoria.
Colocado mais sucintamente, ele apresenta afirmativas na forma de “se p,
então q” e testa a validade empírica das afirmativas de alguma forma.
Não há a menor diferença entre pesquisa experimental e pesquisa
não-experimental nesta forma básica de raciocínio. A diferença funda
mental está no controle de p, as variáveis independentes. Nos experi
mentos, os p podem ser manipulados à vontade do pesquisador. Suponha-
130
mos, por exemplo, que eu esteja interessado em relações equitativas em
geral e especificamente em como as pessoas lidam psicologicamente com
a inequidade.3 Posso formar grupos diferentes de indivíduos e fazer os
grupos sofrerem' formas ou quantidades diferentes de inequidade. Isto é,
eu manipulo equidade ou inequidade. É uma forma de controle porque
as diferenças em eqüidade entre os grupos vêm inteiramente de mim.
Elas não acontecem “lá fora”, por assim dizer. Um bom exemplo, com o
qual já estamos familiarizados, é o experimento de Aronson e Mills no
qual três grupos de mulheres jovens foram sujeitas a diferentes graus de
iniciação desagradável antes de supostamente se juntarem a um grupo.
Na pesquisa ex post facto, a manipulação de variáveis independen
tes não é possível. Esta é a característica fundamental da pesquisa não-
experimental: variáveis independentes chegam ao pesquisador como esta
vam, já feitas. Já exerceram seus efeitos, se os havia. Se eu estivesse
estudando como as pessoas lidam psicologicamente com a inequidade e
minha pesquisa fosse não-experimental, eu não poderia fazer grupos
diferentes de indivíduos sofrerem inequidade em graus diferentes, à
vontade. Eu provavelmente teria que procurar encontrar grupos dife
rentes de indivíduos que já tivessem provado a inequidade e depois
estudar como eles lidam psicologicamente com ela. A diferença entre a
abordagem experimental e não-experimental é grande, então. Aliás, a
diferença é tão grande que temos abordagens muito diferentes, problemas
de pesquisa e graus diferentes de confiança nas inferências que fazemos
dos dados de pesquisa.
Nos experimentos, já que temos controle virtual das variáveis inde
pendentes e da situação na qual as variáveis independentes operam,
podemos ter mais certeza — nunca total, claro — de que variações
concomitantes observadas numa variável dependente são devidas à
influência das variáveis independentes. Em estudos que não são experi
mentos, nossa confiança, outras coisas mantidas constantes, deve ser
menor, principalmente por causa da falta de controle manipulativo das
Variáveis independentes.4 Em muitas pesquisas não-experimentais obser-
3 Este exemplo vem da chamada teoria e pesquisa dá eqüidade (Berkowitz

& Walst r, 1976). Os estudos de Milgram sobre obediência podem ser conceituados
no quadr< de referências da teoria da eqüidade, embora aparentemente Milgram
não o tenha feito.
Ú Alguns pesquisadores e autores parecem crer que a diferença fundamental entre
icsou . experimental e não-experimental é que na primeira podem ser feitas
inferências causais, enquanto na segunda não. Isto está simplificado demais. Estri
tamente falando, nenhum tipo de pesquisa pode afirmar que uma coisa causa
outra. O máximo que se pode dizer é que tal ou qual relação existe e que é de
Uil ou [uai natureza. A questão, entretanto, é realmente acadêmica, já que não há
tiecessidade' de fazermos afirmativas causais em ciência. As afirmativas denomi
nadas condicionais, tipo se p, então q, que não têm implicações causais, são
Suficientes.
vamos y, a variável dependente e depois “voltamos” para encontrar
o x ou os xx que provavelmente tenham influenciado y. Alguns exemplos
poderão esclarecer o significado disto. \
O fumo e o câncer do pulmão
A pesquisa da suposta relação entre o fumo e o câncer do pulmão

engendrou muita controvérsia. Muitos não-fumantes estão absolutamente
convictos de que o cigarro causa o câncer do pulmão e citam pesquisas
que parecem apoiar sua convicção. Muitos fumantes não se convencem —
talvez porque nao desejem ser convencidos. Quais são os fatos? Parece
haver pouca dúvida de que, como ficou dito, haja uma relação estatística
entre o fumo e o câncer do pulmão. Mais simplesmente, muitas pesquisas
descobriram que o câncer é mais comum entre fumantes que entre
não-fumantes. Há, então, um acordo nas descobertas. Mas pode-se con
cordar com a conclusão que é, não nos esqueçamos, “o cigarro causa
câncer de pulmão”?
Primeiro, vamos nos desembaraçar da palavra “causa” . Os cientis
tas não usam essa palavra principalmente porque é virtualmente impossí
vel, estritamente falando, dizer que uma coisa causa outra — e sustentar
a afirmação. Sempre há a possibilidade de a suposta causa de alguma
coisa não vir a ser a causa real. Vejamos um exemplo meio ridículo.
É fácil verificar que quando chove contam-se mais guarda-chuvas do
que quando não chove, exceto, talvez, em Londres. Portanto, os guarda-
chuvas causam chuva! O exemplo só é ridículo porque é muito óbvio e
porque sabemos as causas da chuva. O exemplo câncer/fumo é mais
sutil. Tem, entretanto, os mesmos aspectos do exemplo guarda-
chuva/chuva. Difere apenas em não sabermos o que causa o câncer dos
pulmões e o fumar cigarros parecer uma causa plausível.
Suponhamos que possamos reunir' um enorme grupo de pessoas
como amostra aleatória, digamos, do povo de um país ou de parte do
país. Dividimos o grupo em três subgrupos ao acaso. Instruímos os
membros de um grupo a fumar dois maços de cigarros por dia, cuidando
para que eles realmente fumem. Pedimos aos membros do segundo
grupo que fumem um maço por dia. Os membros do terceiro grupo ficam
proibidos de fumar. Este “ experimento” continua durante 10 anos, ao
fim dos quais medimos a variável dependente, a presença do câncer de
pulmões ou mesmo a morte pelo câncer. Deixando de lado duas ou três
dificuldades técnicas no delineamento da pesquisa, poderiamos ter consi
deravelmente mais confiança no resultado do que poderemos ter no resul
tado de um estudo ex post facto. Tais experimentos, naturalmente, são
im p ossíveis por motivos óbvios. Então vamos abandonar a pesquisa sobre
132
câncer pulmonar e fumo? De forma nenhuma. Mas estamos tolhidos pela
principal dificuldade da pesquisa não-experimental.
É possível que o cigarro não seja realmente uma “causa” do câncer
pulmonar? Vamos imaginar que houvesse um síndrome psicológico,
chamado “discombulismo”, e que as pessoas discombulistas fossem alta
mente propensas ao câncer pulmonar. Suponhamos que os discombulistas,
além de outras características — hiperatividade, nervosismo, insônia,
temperamento volúvel e uma leve paranóia — tivessem uma forte predis
posição a contrair câncer pulmonar e fumassem cigarros, violentamente.
Em outras palavras, o discombulismo é a causa básica do câncer, não o
cigarro. Fumar é simplesmente uma característica concomitante. Acontece
aparecer no síndrome discombulístico. O pesquisador, não sabendo nada
a respeito do discombulismo, nota repetidamente a presença do câncer
entre pacientes que fumam demais. A correlação entre câncer e fumo é,
naturalmente, alta, e o pesquisador é conduzido a acreditar que o fumo
causa o câncer de pulmões.
Fantástico? Um pouco. Mas não impossível, certamente. O fato é
que a pesquisa não-experimental é mais vulnerável a conclusões errôneas
do que a pesquisa experimental.
A natureza das variáveis na pesquisa não-experimental
Num mundo científico comportamental perfeito, os pesquisadores

sempre deveríam poder extrair amostras aleatórias, manipular variáveis
jndependentes e designar sujeitos a grupos aleatoriamente. Pena, pois
nem sempre as três coisas são possíveis, e na pesquisa ex post facto as
últimas duas jamais o são. Mas isto não significa que tal pesquisa não
seja importante e significativa. Longe disso.
Uma das principais diferenças entre os dois tipos de pesquisa está
na natureza das variáveis. A pesquisa não-experimental lida com
Variáveis que, por natureza, não são manipuláveis: classe social, sexo,
Inteligência, preconceito, autoritarismo, ansiedade, aptidão, realização,
Valores, e assim por diante. Quem estiver interessado, por exemplo,
em autoritarismo e preconceito, ou inteligência, classe social e realização,
ou em classe social e valores, deve fazer (geralmente) pesquisa não-
gxperimental. Enfrentará problemas mais difíceis de inferência do que
quem estiver interessado em problemas que incluam variáveis mani
puláveis.
Todas as variáveis que são características de gente — chamemos
Variáveis de status — não são manipuláveis comumente. Tomemos inteli
gência. Não se pode dizer a um grupo de indivíduos: “Sejam inteligen
tes” e a outro grupo: “Não sejam inteligentes”. As pessoas trazem
muitas variáveis de status para as situações de pesquisa. E as diferenças
entre pessoas com tais variáveis já estão relativamente fixadas.5
\ ■
Estudos não-experimentais
Dos muitos estudos de pesquisa não-experimental publicados,

escolhemos três como exemplos. São altamente significativos, teórica e
praticamente. O primeiro a ser discutido tornou-se famoso e fonte de
muita controvérsia educacional.
Igualdade de oportunidades educacionais
No maior estudo de pesquisa educacional feito nos Estados Unidos,

Coleman, Campbell, Hobson, McPartland, Mood, Weinfeld e York
(1966) tentaram responder a um significativo número de perguntas a
respeito da desigualdade educacional nos Estados Unidos. Duas dessas
perguntas eram: '‘Qual é a extensão da desigualdade na educação norte-
americana?” Isto é, há diferenças nas oportunidades e nos recursos esco
lares ao alcance de grupos majoritários e minoritários e qual e a extensão
dessas diferenças? (Uma das respostas foi que a grande maioria das
crianças norte-americanas freqüenta escolas segregadas e que as crianças
negras são as mais segregadas.) Do ponto de vista deste livro, uma
questão mais interessante foi: “Qual é a relação entre a realização dos
estudantes e o tipo e qualidade das escolas que eles freqiientam?
Foram estudados mais de 600.000 alunos de terceira, sexta, nona e
décima-segunda séries em cerca de 4.000 escolas. O método básico de
observação foi um questionário respondido por inspetores, diretores,
professores e alunos. A enorme quantidade de dados foi analisada por
métodos muito complicados. Havia mais de 100 variáveis agrupadas em
categorias maiores, tais como variáveis de ambiente familiar, variáveis
da escola e variáveis do professor. As análises principais concentraram-se
na realização das crianças, e, com bastante coragem e competência,
tentou-se descobrir influências maiores e menores na realização.^
Os resultados foram surpreendentes. Em geral, as variáveis de
ambiente familiar foram muito importantes para estabelecer o aproveita-
s Vale notar que muitas variáveis — por exemplo, ansiedade, autoritarismo,

atmosfera de grupo, coesão de grupo, agressão — podem ser tanto variaveis mani
puláveis como variáveis medidas. Isto não significa, entretanto, que sejam as
mesmas. Ansiedade manipulada e ansiedade medida provavelmente não sao a
mesma variável, embora devesse haver, naturalmente, alguma relaçao substancial
entre elas. ■>
134
mento das crianças — aliás, mais importantes do que qualquer outro
conjunto de variáveis, com exceção, talvez, das atitudes das crianças
(sentido de controle do ambiente, por exemplo). As variáveis da escola
— diferenças entre escolas em instalações, currículo e corpo docente —
não foram tão responsáveis pelas diferenças em realização quanto as
variáveis de ambiente familiar ou as de atitude. Esta foi a descoberta
mais controvertida, que vem sendo debatida e mal entendida. Muita
gente concluiu incorreta e apressadamente que o relatório Coleman afir
mava que as escolas e suas instalações, currículos e corpo docente não
eram importantes! É uma conclusão absurda, que ilustra uma das dificul
dades de interpretar os complexos resultados da pesquisa. Uma interpre
tação mais aproximadamente correta — e “correta” apenas no contexto
do estudo — é que as variáveis de escola não são muito responsáveis
pelo aproveitamento depois das variáveis de ambiente familiar. Explicar
esta afirmativa adequaoamente levar-nos-ia muito longe técnica e concei-
tualmente. Vamos, portanto, abandonar esta explicação e outras desco
bertas e vamos nos concentrar na natureza não-experimental do estudo.
O estudo de Coleman usou, ao máximo, técnicas modernas de
pesquisa de maneira competente e deu ao povo dos Estados Unidos
uma informação sobre as condições da educação no país que continuarão
sendo debatidas por mais uma década. Devemos compreender, entre
tanto, que é pesquisa ex post facto. Aqui as dificuldades se tornam
dramáticas porque as conclusões da pesquisa podem afetar importantes
decisões políticas em educação.
Consideremos a conclusão mencionada: as 'variáveis escolares con
tribuem menos para a previsão do aproveitamento do que as variáveis
de ambiente familiar. Há pouca dúvida de que esta conclusão seja
empiricamente válida na pesquisa de Igualdade. Mas consideremos a
possibilidade — certamente remota — de ser possível fazer grandes
estudos nos quais as variáveis escolares possam ser sistematicamente
manipuladas e avaliados seus efeitos sobre a realização. O resultado
poderia ser muito diferente porque a designação aleatória (de classes,
digamos) para as condições experimentais e a manipulação de variáveis
Independentes podem conduzir a resultados menos ambíguos. Saberia
mos, em outras palavras, que as influências de outras variáveis inde-
fpendentes foram minimizadas. Coleman e outros analisaram os dados
de maneira a aproximarem as descobertas de uma abordagem experi-
ental (através da chamada regressão múltipla e métodos relacionados),
Ê as de forma alguma isto é a mesma coisa. A influência de outras
possíveis variáveis independentes é difícil de controlar, e só o “controle
tatístico” é possível em contraste com os poderosos controles experi-
E entais de manipulação, casualização e isolamento.
E stu d o d e ig u aldade e lib e rd a d e
Numa série rara de estudos sobre valores, Rokeach (1968) juntou

as abordagens e x p o s t ja c to e experimental. Vamos nos concent|rar aqui
apenas em uma parte da pesquisa e x p o st ja c to , e que é característica
de grande parte deste tipo de pesquisa.
Rokeach fez com que um certo número de grupos e uma amostra
nacional ordenassem dois conjuntos do que denominou valores instru
mentais e terminais — um a v id a co n fo rtá vel, segurança fam iliar, igual
d a d e, sa b e d o ria (terminais); a m b ic io so , capaz, in d ep en d en te, a fetu o so
(instrumentais). D ois dos valores terminais, lib e rd a d e e igu aldade, foram
considerados particularmente importantes porque eram aparentemente a
chave de diferenças fundamentais no panorama de valores sociais e
políticos. U m dos conjuntos de resultados de Rokeach é dado na
tabela 8 . 1 .
Tabela 8.1 Postos médios de liberdade e igualdade de diferentes grupos.
Brancos Negros Estudantes

desempregados desempregados calvinistas
Policiais
(50) (141) (28) (75)
Liberdade 1* 3 10 8
Igualdade 12 9 1 9
a 1 é o posto mais alto, 12 o mais baixo. No corpo da tabela encontram-se as

médias dos postos designados por cada grupo. Por exemplo, o posto médio desig
nado a igualdade por 141 brancos desempregados foi de 9 comparado ao posto
médio de 3 atribuído a liberdade.
Parece q ue os quátro grupos são muito diferentes ao avaliarem

os valores de ig u a ld a d e e lib erd a d e. Os policiais dão grande valor à
lib e rd a d e e valor m uito baixo à igu a ld a d e, enquanto que negros desem
pregados fazem quase o contrário (1 0 para lib e rd a d e e 1 para ig u a ld a d è)\
Evidentemente os valores sociais de policiais e negros, pelo menos neste
exem plo, são dramaticamente diferentes.
É bem típico da pesquisa e x p o s t ja c to estudar as relações deter
minando se grupos, selecionados sobre uma base relevante ao problema
em estudo, possuem quantidades diferentes de uma variável dependente
(lembre-se da pesquisa do câncer de pulmão). N o exem plo acima,
Rokeach escolheu quatro grupos diferentes, provavelmente porque espe
rava que seus valores fossem diferentes em seu instrumento de mensu-
ração. Policiais e càlvinistas, por exem plo, são m ais conservadores que
136
outros grupos e não são fam osos por apoiarem a igualdade. Negros,
por outro lado, apóiam fortem ente a igualdade. Brancos desempregados
provavelmente não colocarão a igualdade em grau alto. Se os valores
Obtidos aparecem como se esperava, isto é evidência favorável à teoria
explícita ou implícita e à validade do instrumento de mensuração.
Os efeitos da privação
N estes dois últim os exem plos iremos examinar rapidamente abor

dagens tanto experimentais quanto não-experimentais ao m esm o assunto
ou relação: os efeitos da privação no desenvolvimento posterior. Tais
efeitos são muito importantes teoricamente e importantíssimos pratica
mente. São importantes teoricamente porque compreender os efeitos da
privação é compreender m ais o desenvolvim ento e processos de desen
volvim ento e aprendizado em geral. Consideremos as seguintes pergun
tas: Como a privação na infância afeta o desenvolvimento mental futuro
e a aprendizagem futura? Os efeitos da privação são reversíveis? Como
os programas corretivos podem contrabalançar os efeitos da privação?
H á m uitos anos atrás Goldfarb (1943) estudou os efeitos da vida
institucional sobre crianças. Estava interessado no efeito da vida insti
tucional, o qual ele assumia ser, entre outras coisas, uma falha no desem
penho intelectual. Comparou a inteligência de crianças adolescentes que
haviam passado seus primeiros três anos em uma instituição com a inteli
gência de adolescentes que não passaram seu s.três primeiros anos em
uma instituição. Descobriu que a média de inteligência do grupo insti-
ÉÜcional era substancialmente m ais baixa do que a média do “ grupo de
Controle”, o não-institucional. Fez também várias comparações em outras
variáveis com resultados semelhantes.
A s fraquezas do estudo são óbvias e não precisamos perder muito
tempo com elas. Vamos nos preocupar apenas com sua natureza ex post
facto e as conseqüentes dificuldades relativas em interpretar seus resul
tados. Este estudo foi escolhido entre muitos outros semelhantes porque
foi citado por Berelson e Steiner (1964) em seu livro enciclopédico sobre
pesquisa de comportamento humano. Vamos supor que o estudo tenha
sido feito im pecavelm ente e examinar apenas suas descobertas como
pesquisa ex post facto.
Ê possível que crianças que viveram em instituições tenham grau
d e inteligência inferior à de crianças que não viveram em instituições
porque provavelmente tenham pais de inteligência inferior? Vejamos
outra possibilidade. É bastante sabido que o status de classe social está
0 —iado à inteligência: crianças de status social inferior tendem a ter
medidas de inteligência inferiores às de crianças de status de classe ixédia.
137
Não é provável que crianças que viveram em instituições vivam mais
tarde em áreas de classes inferiores? Assim sendo, a diferença observada
em inteligência pode ser devida Iargamente ao ambiente de classe infe
rior, que é menos orientado verbal e culturalmente do que o ambiente
de classe m édia.6
Esta mesma pesquisa poderia ter sido feita experimentaímente? Ê
concebível, mas dificilmente possível. Pode-se tomar uma grande amostra
de crianças recém-nascidas e designar metade delas a instituições, aleato
riamente. A outra metade ficará com sua família. Os controles serão
• usados cuidadosamente. Depois de um período de anos, a média de
inteligência dos dois grupos será comparada. Ê evidente a impossibili-
' dade de tal procedimento com crianças. Devemos, portanto, tomar as
coisas como estão e estudá-las — de modo ex posl fado. Agora vamos
examinar uma abordagem experimental ao problema da privação.
Durante alguns anos os pesquisadores da Universidade da Cali
fórnia, em Berkeley, estudaram os efeitos posteriores da privação em
' animais (Bennett, Diamond, Krech & Rosenzweig, 1964). A especifici
dade de suas pesquisas foi o exame físico e a mensuração de partes do
cérebro e de secreções químicas do cérebro feitos de modo relativamente
direto. A pesquisa deve ser classificada entre as poucas pesquisas compor-
tamentais mais significantes de nossa época. A simples façanha técnica
de medir os prováveis efeitos da privação sobre a fisiologia do cérebro é
impressionante. Os pesquisadores, entretanto, fizeram mais do que isto.
Só um de seus estudos será resumido a seguir
Bennett e outros (1964) basearam-se na hipótese de que uma expe
riência diferencial muito cedo na vida dos animais levará a mudanças
quantitativas no cérebro. Usaram, em um estudo, três grupos experi
mentais de ratos: Complexidade Ambiental e Treinamento (CAT), Condi
ção Isolada (Cl) e Condição Social (CS). Em CAT, de 10 a 12 animais
foram abrigados durante a amamentação em grandes gaiolas com equipa
mento “interessante” com que podiam brincar e que podiam usar.
Foi-lhes permitido também sair todos os dias das gaiolas para brincar e
explorar. Em Cl (isolados), os animais foram mantidos sozinhos em
gaiolas numa sala silenciosa, onde não nodiam ver nem tocar outros
animais. Os ratos do grupo de controle (CS) foram mantidos sob condi
ções comuns de colônia, três em cada gaiola, e expostos a atividades na
sala, mas sem tratamento especial. (Foi feito um tipo de casualização
6 D evem os te n ta r m a n te r as coisas e q u ilib ra d a s. H o je , um e stu d o co m o o de

G o ld fa rb p o d e ria se r m e lh o r d irig id o , p rin c ip a lm e n te m e d in d o o u tra s v ariáv eis
p ossiv elm en te re le v a n te s e c o n tro lan d o -as e sta tistic a m e n te . Is to é, su a p ro v áv el
in flu ên cia seria a v a tia d a e n e u tra liz a d a , ou “ s u b tra íd a ” d o s re s u lta d o s , u sando-se
c o n h ecid o s m é to d o s estatísticos.
138
na etapa de análise.) O estudo inicial foi replicado um certo número de
vezes, mas somente o ambiente enriquecido (CAT) e o ambiente empo
brecido (Cl) foram usados nas replicações.
Essas condições foram mantidas durante 80 dias. Os animais foram
então mortos e seus cérebros analisados. Amostras de várias partes do
cérebro foram medidas, pesadas e analisadas suas secreções químicas.
Os anatomistas que fizeram as análises não sabiam a que grupos experi
mentais pertenciam os animais.
Os resultados foram incríveis. Havia diferenças enormes de peso
do córtex cerebral entre os ambientes enriquecido e o empobrecido.
0 peso médio em miligramos do córtex total dos ratos estudados durante
P período de 1960 a 1963 foi de 700 (CAT) e 669 (Cl). A diferença
foi estatisticamente significativa. Evidentemente, as experiências enrique
cidas alteraram o peso do córtex dos ratos. Uma "análise de controle”
do resto dos cérebros dos animais não mostrou diferenças significativas.
Foi o córtex cerebral que aumentou de peso em relação ao resto do
cérebro.
Os pesquisadores de Berkeley mediram uma certa enzima nos cére
bros dos animais e encontraram diferenças entre os grupos que viriam
apoiar as descobertas relativas ao peso. Mediram também a espessura'-
M Ç\
do córtex dos ratos: os córtices dos ratos de experiência enriquecida
estavam cerca de 6 por cento mais espessos do que os dos ratos na
condição de isolamento.
A evidência experimental, então, confirmou a hipótese do ambiente
enriquecido. Testes de hipóteses alternativas — idade dos animais e
tensão de isolamento, por exemplo — não mudaram as descobertas.
Parece haver pouca dúvida de que a experiência enriquecida tem efeitos
físicos fundamentais sobre o cérebro — pelo menos em ratos, sob as
Condições do laboratório de Berkeley. Esses resultados serão aplicáveis
ao cérebro e condições humanas? Ninguém sabe.7 Por motivos óbvios
não se pode fazer pesquisa experimental semelhante com sujeitos huma
nos. Futuros progressos técnicos em tecnologia e pesquisa cerebral pode
rão possibilitar isso. Mas até alcançarmos tais progressos, a pergunta não
pode ser respondida de maneira não-ambígua. Os pesquisadores, usando
seres humanos como sujeitos e interessados em efeitos da vida real, como
os efeitos de ambientes de gueto, devem fazer principalmente pesquisas
ex post jacto, nas quais indivíduos desenvolvidos fora e dentro do gueto
im p o rta n te le m b ra r q u e estes re s u lta d o s n a d a d iz e m so b re in telig ên cia ou

2 * “ caracte rístic a s. D e m o n stra m a p e n a s q u e a m b ie n te s e n riq u e c id o s o u defi-
Cientes te m efeitos físicos so b re os c éreb ro s d o s a n im ais. T a is d e sc o b e rta s, e n tre
tanto sao fu n d a m e n ta is e ric a m e n te sugestivas p a ra p esq u isa com seres h u m a n o s
9 p a ra to d o o p ro b le m a de p riv a ç ã o e sua m elh o ria.
possam ser comparados em questões de inteligência, aptidão-, realização
e outras variáveis relevantes — com as concomitantes dificuldades ex
post jacto. j
A discussão acima poderá nos deixar um pouco desanimados. As
bases do conhecimento humano, do comportamento, processos e institui
ções humanas parecem frágeis. De certa maneira, são. De outra, não.
Realmente, não há necessidade de desespero*. Muito pelo contrário.
Uma das condições de aumento de esperanças é a replicação. Se um
estudo for replicado, encontrando-se os mesmos resultados ou resultados
semelhantes, nossa fé e confiança nos resultados aumentam. Se o estudo
for novamente replicado e forem obtidos os mesmos resultados, nossa fé
e confiança aumentam enormemente, porque as possibilidades de obter
mos os mesmos resultados três vezes ao acaso são menores do que a
probabilidade de obtermos os mesmos resultados duas vezes.
Outra condição que reforça as pesquisas científicas e nossa con
fiança nelas é quando os resultados experimentais e não-experimentais
coincidem. Embora seja difícil calcular as probabilidades, há pouca
dúvida de que a convergência da evidência da pesquisa — evidência
mantida por abordagens e estudos diferentes — reforce a validade
empírica das descobertas da pesquisa. O exemplo experimental dos efeitos
do ambiente de privação sobre o cérebro dos ratos e o exemplo não-
experimental dos efeitos do ambiente do gueto sobre o desenvolvimento
mental das crianças do gueto ilustram perfeitamente essa afirmação.
Os dois tipos de pesquisa são muito diferentes e talvez nem diretamente
comparáveis. Mas se o resultado de ambas parece indicar que ambientes
empobrecidos têm efeitos suficientemente fortes para serem detetados
com segurança, então fica reforçada a confiança na hipótese da privação
ambiental.
Dedicamos bastante tempo e espaço tentando esclarecer as dife
renças entre pesquisa experimental e ex post jacto. Descobrimos que
a lógica básica é a mesma: ambos os tipos de pesquisa buscam a validade
empírica de enunciados tipos "se p, então q”. Mas também descobrimos
que elas fazem isto muito diferentemeníe, porque na pesquisa éx post
jacto não é possível manipular variáveis independentes nem designar
aleatoriamente sujeitos e tratamentos a grupos experimentais. A dife
rença é profunda e significativa. Outras coisas mantidas constantes e em
geral, as conclusões obtidas na pesquisa ex post jacto não pisam em
terreno firme como as conclusões obtidas em pesquisa experimental, por
causa do inevitável controle menor sobre os efeitos de variáveis inde
pendentes e da situação de pesquisa. (A falha é compensada às vezes
pelo maior realismo e efeitos mais fortes, entretanto.)
Muito problemas nas ciência comportamentais são problemas ex
post jacto e requerem pesquisa ex post jacto simplesmente porque as
140
variáveis independentes não são manipuláveis. Os pesquisadores cujc
principal interesse se concentra na natureza da inteligência ou na estru
tura dos valores e atitudes, por exemplo, precisam conformar-se com a
pesquisa não-experimental. Sua natureza não-experimental faz a pesquisa
menos significativa, menos científica? Em todo caso, ambos os tipos
de pesquisa devem e deverão ser feitos e o estudante de ciência e
pesquisa comportamental deve compreender as forças e fraquezas de
ambas.
Adendo
A posição adotada neste livro é que um experimento requer, no

mínimo, dois grupos experimentais. Esses dois grupos podem ser designa
dos como “experimental” e de “controle”, ou A, e A2, ou de outra
maneira conveniente. Os dois grupos são dois aspectos de alguma
variável. Se a variável, por exemplo, for reforçamento, então os dois
grupos podem ser “reforçamento regular” e “reforçamento casual”, ou
reforçamento maciço” e “reforçamento regular”, como no estudo de
Clark e Walberg. Naturalmente, um experimento pode ter mais de dois
grupos experimentais. Lembre-se de que o de Aronson e Mills tinha
tres. E no capitulo 7 aprendemos que e possível e aconselhável fazer
experimentos fatoriais, nos quais se usa mais de uma variável inde
pendente.
A base da exigência de no mínimo dois.grupos experimentais é
muitíssimo importante. Um “verdadeiro” experimento deve ter no míni
mo uma comparação (veja Campbell & Stanley, 1963, p. 6). Sem dúvida,
em qualquer estudo tem que haver ao menos uma comparação. Digamos
•que um pesquisador deseje aumentar a habilidade de resolver problemas
por um método especial. Ele usa o método com um grupo de estudantes,
talvez sua própria classe, e observa, depois que o usou, que a solução
de problemas do grupo melhorou. Embora este procedimento seja satis
fatório para demonstrações práticas, é inadequado cientificamente. O
motivo e o trabalhado neste capitulo: com apenas um grupo não há
sfcgurança de que algo além do método do pesquisador não tenha influen
ciado e ajudado a melhorar a capacidade de resolver problemas.
Por - exemplo, o mero fato de ensinar alguma coisa aos alunos
no que se refere a resolver problemas pode ter um efeito salutar. Ou o
método usado pelo pesquisador pode simplesmente ter sido um bom
Veículo para seu estilo pessoal de ensino, e foi seu estilo pessoal de
ensino que ajudou na solução de problemas, e não o método. Qualquer
método que o pesquisador, como professor, achasse adequado funcio
naria da mesma forma. Além disso, é muito provável que a habilidade
141
de os sujeitos resolverem problemas tenha melhorado çomo resultado de
sua exposição ao problema. Ou, depois de um certo período de tempo,
os sujeitos poderíam ter melhorado com qualquer método; sua compre
ensão dos vários aspectos da solução de problemas pode ter amadurecido.
Pode bem ter sido o método que tenha ajudado na solução de
problemas, mas jamais isso poderá ser dito sem ambigüidade enquanto
não for usado pelo menos mais um grupo. Aí então, pode-se comparar
os resultados obtidos com o método com os resultados obtidos sem o
método ou com outro método — com todas as outras condições mantidas
iguais.
Em resumo, um delineamento de pesquisa tendo apenas um grupo
experimental é sempre insatisfatório teoricamente. Se eu disser ao pes
quisador que não foi o método que melhorou a solução de problemas
mas, antes, que foi sua personalidade e entusiasmo, para os quais o
método funcionou como veículo, o que ele poderá dizer? Nada! Pelo
menos nada convincente. Se ele tivesse usado um segundo grupo experi
mental, cujos membros tivessem todos as mesmas condições do primeiro
grupo, menos o método, e os resultados favorecessem o primeiro grupo,
então o pesquisador teria uma base sólida para me responder. Ele pode
ría dizer: "Não, não foi minha personalidade nem meu entusiasmo,
porque eu também ensinei o segundo grupo e tentei fazê-lo exatamente
do mesmo jeito que fiz com o primeiro grupo. Portanto, a diferença
de resultado entre os grupos deve ser creditada ao método”.
Embora o argumento ainda tenha fraquezas, é muito mais forte
dò que era. Virtualmente todas as conclusões científicas, então, exigem
comparações. A função das comparações é isolar o efeito da variável
independente crucial, por assim dizer. Isto significa, essencialmente,
mostrar que alguma outra influência não produziu o efeito observado;
apenas a influência prevista na hipótese o produziu.
A despeito desta exigência óbvia de reforçar a inferência, há um
considerável corpo de pesquisa no qual, com efeito, é usado apenas
um grupo. Em algumas pesquisas sobre reforçamento, por exemplo, os
efeitos do reforçamento são avaliados, reforçando-se um grupo de ani
mais. As respostas dos animais são observadas para avaliar o efeito do
reforçamento. Em algumas pesquisas sobre a memória, um estímulo,
como iluminação, pode ser variado, e os efeitos das variações na memo^
rização de letras pelos mesmos sujeitos pode ser medido. Não afirmamos
aqui que tal pesquisa seja incorreta. Um dos métodos importantes de
ciência, por exemplo, é determinar funções (equações matemáticas), que
expressem as relações exatas entre estímulos e respostas. E na pesquisa
de reforçamento em animais, dificilmente se discute se é o reforçamento
— algum tipo de alimento, por exemplo — que produz as respostas.
Há pouco perigo de confusão quanto ao efeito da variável independente.
142
A maioria de outras pesquisas nas ciências comportamentais, entretanto,
não é controlada tão simples e facilmente.
Os estudos de Milgram descritos neste capítulo aproximam-se do
limite da definição de experimento. Note que todos os sujeitos experi
mentais, em qualquer “experimento", receberam o mesmo tratamento:
todos receberam a mesma instrução para administrar choques. A defi
nição de experimento, portanto, não foi satisfeita pela situação experi
mental básica, mas pelas variações introduzidas: o pesquisador presente
ou não presente: fazer o experimento em outro local que a Universidade
de Yale; distância entre professor e aluno.
O essencial deste adendo é que a definição básica e o significado da
palavra “experimento” não são as únicas definições e significados da
palavra em uso atualmente. A posição tomada neste livro, entretanto, é
que no mínimo uma comparação se faz necessária — isto é, um mínimo
de dois grupos experimentais---- para um experimento se tornar um
“verdadeiro” experimento. Isso necessariamente não elimina a possível
adequação de definições mais limitadas em algumas situações. Simples
mente determina o que se acredita ser um padrão adequado para se
fazerem inferências de dados experimentais.
143
9. O b s e r v a ç ã o e m e n s u r a ç ã o d e v a r iá v e is
Os cientistas “observam” fenômenos; eles “fazem observações”.

O que significa dizer “fazem observações”? A expressão é vaga. Signi
fica que o cientista comportamental olha para as pessoas e o que elas
fazem, forma impressões de seu comportamento e conclui alguma coisa
sobre o comportamento observado? Sim e não. Quando se diz que os
cientistas fazem observações, significa basicamente que eles medem
variáveis ou juntam informação necessária para medir variáveis. Natural
mente, deve haver mais coisa aí — impressões subjetivas, intuições,
compreensão — mas basicamente a finalidade de observar alguma coisa
em ciência é medi-la. E a coisa é medida de sorte a poder ser relacionada
com outras variáveis.
Um pesquisador manipula uma variável independente, digamos,
reforçamento, dando aos membros de três grupos experimentais três
tipos de reforçamento a fim de “observar” seus diferentes efeitos sobre
a memória. Neste caso as observações são de comportamentos que podem
ser assumidos como refletindo a memória. A finalidade das observações
é obter medidas da variável depedente, memória, de sorte que o pesqui
sador possa avaliar quantitativamente os efeitos dos diferentes reforça-
mentos. O pesquisador pode “observar” que a memória dos três grupos
é diferente, uma espécie de sensação subjetiva ou palpite. Tais sensações
e palpites são importantes em ciência mas não são suficientes. Precisa
mos saber quanto de memória, o quanto de alguma coisa.
Um pesquisador, fazendo um trabalho não-experimental, encon
tra-se geralmente “observando” duas ou mais variáveis: quase sempre
no mínimo uma variável dependente e muitas vezes uma ou mais
variáveis independentes. Vamos examinar um problema sobre os pro
váveis efeitos do conflito de papéis sobre a eficácia da execução de
atividades relacionadas a esse papel. Getzels e Guba (1954), num estudo
sobre oficiais militares e seu desempenho de papel, previu que quanto
maiores fossem os conflitos em que se encontrassem, menor seria sua
eficácia no desempenho do papel, no caso, como professores. Eles previ
ram também que oficiais de carreira passavam por conflitos maiores
quando tinham que ser professores por um certo período de tempo do
que oficiais não interessados em fazer carreira (porque a subida de
144
patente entre os oficiais depende muito mais de funções de comando
que de funções de ensino). Eles seriam, portanto, menos eficazes como
professores do que os oficiais não interessados em fazer carreira.
Getzels e Guba mediram o conflito dos oficiais com uma escala espe
cialmente elaborada para a pesquisa. Verificaram também a validade da
escala comparando as médias das notas de diferentes escolas da Força
Aérea, variando em grau de envolvimento com assuntos militares. Como
previram, quanto mais militar a escola, menor o conflito e vice-versa.
Tiveram também que “observar” o desempenho no ensino e a eficiência.
Isto foi conseguido, fazendo os oficiais professores darem notas de
eficiência uns aos outros. Em outras palavras, Getzels e Guba “obser
varam” conflito e eficiência de ensino. O que fizeram, na realidade,
foi “medir” ambas as variáveis. O que significa isto?
M ensuração
Mensuração é a atribuição de algarismos a objetos ou eventos de

acordo com regras (Stevens, 1951). Eis um excelente exemplo de defi
nição vigorosa, no sentido de ser simples, geral e não embígua. Se desejar
medir alguma coisa, faça um conjunto de regras que especifiquem como
atribuir algarismos a objetos. Como todas as definições gerais, esta não
especifica nada sobre as qualidades ou virtudes de determinado processo
ou instrumento de mensuração. Um teste ou escala (veja capítulo 2) pode
ser bom ou mau. Se nos permite atribuir algarismos a objetos definidos
sistematicamente, então é mensuração. Isto é enfatizado aqui porque a
distinção entre o que é mensuração e a qualidade dos instrumentos de
mensuração ficou confusa em algumas discussões de mensuração psico
lógica. O fato de alguns instrumentos de mensuração terem sido questio
náveis não significa que todos o sejam, ou que a mensuração psicológica
seja questionável.
Para compreender a definição de mensuração, lembremo-nos da
discussão de conjuntos, variáveis e relações nos capítulos 2 e 4. Uma
"relação” ficou definida como um conjunto de pares ordenados, nos
quais os símbolos ou números de um conjunto eram sistematicamente
emparelhados com símbolos ou números de outro conjunto. (Veja figu
ras 4.1, 4.2, 4.3 e 4.4.) A definição de mensuração implica relações,
isto é, um processo de mensuração é sempre uma relação, com os objetos
(pessoas ou grupos, por exemplo) sendo medidos vindo primeiro e os
algarismos usados na mensuração vindo em segundo lugar. Para tornar
tudo isso concreto, vamos recordar um exemplo usado no capítulo 4,
onde duas variáveis, discriminação e violência, foram relacionadas.
Medindo discriminação
Para estudar esta relação, um pesquisador tem que ‘‘observar’’ tanto
a discriminação quanto a violência, sendo a primeira a variavel inde
pendente e a última a variável dependente. Ele está testando a hipótese
de que grupos discriminados numa sociedade mostrarão violência. Além
disso, quanto maior a discriminação, maior a violência. Para observar
as duas variáveis e estudar a relação, ele deve medir as variaveis. Isto
significa que ele deve atribuir a diferentes grupos em uma sociedade,
números diferentes, os números diferentes refletindo graus diferentes de
discriminação e violência.1 Como poderá fazer isto?
Vejamos só uma das variáveis, discriminação. Suponhamos que o
pesquisador peça a três psicólogos, especialistas em preconceito e mino
rias, que classifiquem, em uma escala de sete pontos, o grau geral de
discriminação sofrido no momento por sete grupos. (Ele incluirá os
ingleses como critério, ou grupo de comparação, assumindo que o povo
inglês ou o povo de origem inglesa seja o que menos tenha sofrido
discriminação.) As médias dos três especialistas para os sete grupos estão
dadas na figura 9 .1 , num diagrama igual ao que usamos para exempli-
Figura 9.1
1 É importante a distinção entre um algarismo e um número. Um algarismo é um

símbolo da forma 1, 2, 3 ... ou I, II, III ... Não tem sentido quantitativo
a não ser que receba tal sentido; é apenas um símbolo que pode ser usado para
rotular objetos. Quando um algarismo recebe um sentido quantitativo, como nas
médias usadas na figura 9.1, torna-se um número.
146
ficar relações.2 Os valores da figura 9 .1 indicam que os juizes acredi
tavam que os negros sofriam a maior discriminação (6,1), índios ameri
canos vindo em segundo lugar (5.7) chegando aos ingleses, que, como
se esperava, sofreram a menor discriminação (1,3).
A figura representa uma relação porque tem um conjunto de pares
ordenados. É também mensuração, já que os números (classificações
MWídias) foram atribuídos a objetos (grupos) de acordo com regras. As
regras incluíram a especificação da escolha dos especialistas, ou juizes, a
escala numérica usada, de 1 a 7, e a variável medida, discriminação.
É uma “boa” mensuração? Ainda não sabemos. Pode ser e pode não ser.
Nò capítulo 4, foi usada ordenação em postos, em vez de pontos
numa escala. Apesar de isto mudar a natureza do procedimento de
Ür-nsuração, principalmente os números usados para serem atribuídos aos —3
gfojetos, não representa mudança na concepção de mensuração como
numerais atribuídos a objetos conforme regras. Ê aconselhável estudar 3
UNlVEftSSÍM
outro exemplo de mensuração antes de continuarmos a discussão.
M ed in d o in teligên cia
Dificilmente existe coisa mais controversa na pesquisa comporta-

mental contemporânea que a mensuração de inteligência. Alguns a rotu
laram como uma grande façanha, uma das maiores dos nossos tempos.
(Eu concordo.) Alguns críticos, entretanto, condenaram-na por não medir
realmente a inteligência, afirmando às vezes que a inteligência em si
não pode ser medida, ou condenaram-na por ter efeitos nocivos e perni
ciosos sobre crianças, especialmente crianças de grupos minoritários.
Embora aqui não seja lugar para examinarmos toda essa controvérsia,
talvez seja possível esclarecermos no mínimo seu aspecto de mensuração.
“ inteligência”, naturalmente, é um conceito, ou constructo, alta-
mente abstrato. Assim, não é de mensuração fácil. Antes que possa ser
Ifiedida, será necessário, primeiro, concordar com alguma definição ope-
Mcional de inteligência. (Será dificílimo, talvez impossível, contudo,
jSonseguir que mesmo os especialistas concordem com uma definição
jperacional.)
Lembre-se de qüe uma definição operacional especifica a atividade
do pesquisador ao medir uma variável. Inteligência, claramente, pode ser
uma variável, já que uma variável é um símbolo ao qual se atribuem alga-
* Eite exemplo é livremente baseado em um famoso estudo de estereótipos de

Kitz e Braly (1935).
147
rismos. (Veja capítulos 2 e 3 e note a similaridade de definições de
“variável” e “mensuração”.) “Inteligência” é o símbolo.
Pode-se pensar em maneira diferentes de medir inteligência. Pòde-
mos pedir a especialistas que observem um grupo de indivíduos e que
atribuam notas e eles, correspondentes às quantidades percebidas de inte
ligência. Ou, mais provavelmente, podemos usar um teste de inteligência
aceito e testado, como por exemplo o famoso teste Stanford-Binet. Este
teste, com as instruções que o acompanham, constitui uma definição
operacional de inteligência. Os números fornecidos pelo teste — chama
dos quocientes de inteligência ou QIs, com alguns testes — serão atri
buídos aos indivíduos e provavelmente refletirão as diferentes magnitu-
des de suas inteligências. Volte à figura 4.2, onde cinco pessoas, Marie,
[acob e outros receberam números que eram notas de testes de inteli
gência: 131, 127 e assim por diante. No capítulo 4 estávamos ilustrando
uma relação. Mas a figura também representa mensuração.
Há pouca dúvida de que algumas medidas de inteligência não são
adequadas. Há pouca dúvida igualmente de que mesmo as melhores
medidas de inteligência não são válidas em algumas situações. Por exem
plo, se vários membros de um grupo de indivíduos cuja inteligência
esteja sendo medida eventualmente ficam doentes durante o teste,
lançam-se dúvidas sobre os resultados da mensuração. Ou se um grupo
de crianças foi criado em um lugar distante onde tenha havido pouca
estimulação cultural, as medidas usuais de inteligência não serão válidas
no sentido de medir a “verdadeira” inteligência das crianças. (Provavel
mente sejam válidas, entretanto, como medida do que se chama sua
“inteligência funcional”, ou sua capacidade de competir num ambiente
classe média americano.) Isto entretanto não significa que medir inteli
gência não seja realmente mensuração ou que inteligência não possa ser
medida. Sem dúvida, a maioria dos psicólogos concorda que inteligência
pode e tem sido medida com grande sucesso.
Fidedignidade
Estude os números da tabela 9.1 cuidadosamente. Considere que
eles são o resultado de uma tarefa de julgar, ou dar notas, entregue a
quatro juizes que foram instruídos para julgar cada um de cinco geren
tes de escritórios quanto à competência ao dirigir um conjunto de tarefas
administrativas. Os cinco gerentes foram, individualmente, observados
por quatro juizes. Os julgadores usaram uma escala de sete pontos, 6
significando altíssima competência e 0 competência muito baixa. Uma
das primeiras perguntas que fazemos em qualquer procedimento de
mensuração é: Quão fidedigno é?
148
iTabela 9.t Notas dadas por quatro juizes à competência de cinco pessoas —
fidedignidade alta.
Juizes
Pessoas a b c d Soma Média
1 6 6 5 4 21 5,25
2 4 6 4 3 17 4,25
3 4 4 5 2 15 3,75
4 3 1 3 1 8 2,00
5 1 2 2 0 5 1,25
D efin içã o e n a tu reza d a fid e d ig n id a d e
Em termos de senso comum, fidedignidade significa estabilidade,

predizibilidade, confiabilidade, consistência. Uma pessoa fidedigna é
aquela com quem se pode contar; podemos prever o que ela fará.
Uma pessoa não-fidedigna é aquela cujo comportamento não podemos
prever, com quem não podemos contar. Seu comportamento flutua muito
e flutua de maneira imprevisível. Dizemos que tal pessoa “não é fide
digna”. Dizemos, por outro lado, que a pessoa previsível “é fidedigna.”
Parte dq essência da fidedignidade é, pois, variabilidade. Em geral,
se o desempenho de uma pessoa varia muito de momento para momento,
nós a colocamos na categoria de “não-fidedigna” . Em outras palavras,
ela varia imprevisivelmente. Não sabemos o que esperar.
Outra maneira de expressar fidedignidade e falta de fidedignidade
é pelas palavras “exatidão” ou “precisão”. Se alguém tem uma arma,
quer que essa arma seja exata; deve atingir o alvo seja onde for —
admitindo, naturalmente, que um bom tiro é acertar o alvo. Neste caso
podemos falar sobre a fidedignidade da arma e a fidedignidade da pessoa
que a maneja. Estamos mais interessados na primeira.
Um teste é semelhante a uma arma em seus propósitos.. Qüando me
dimos atributos, capacidades e realizações humanas, queremos medir as
quantidades verdadeiras” dos atributos que o indivíduo possua, Ê como
atingir um alvo com uma arma. Com um teste queremos atingir o atri
buto. Se a arma atinge o alvo consistentemente — os tiros se concentram
perto, ou no centro do alvo; se não se espalharem — dizemos que é
fidedigna. Igualmente com as medidas sociológicas e psicológicas. Se elas
atingem o alvo, são fidedignas. Mas o que significa "atingir um alvo”
para um teste?
Na moderna teoria dos testes assume-se que cada indivíduo medido
em alguma variável tem uma “verdadeira nota” na variável. Já que
niniguém pode saber qual é a verdadeira nota de qualquer indivíduo, é
usado o seguinte raciocínio. Se o pesquisador puder medir a mesma
pessoa com o mesmo teste,'um grande número de vezes, e a média de
todas as notas em todas as tentativas for calculada, essa média seria uma
estimativa da verdadeira nota. Mas o indivíduo geralmente é testado
uma só vez. Como podemos saber ou até estimar qual é a verdadeira
nota? Não podemos, mas uma estimativa da fidedignidade do teste pode
ser obtida através de certos procedimentos estatísticos, que usam as
notas de um certo número de indivíduos para fornecer estimativas
estatísticas.
Mensuração fidedigna e não-fidedigna: dois exemplos
Agora, voltemos aos dados da tabela 9.1. Queremos saber até onde
as notas dos juizes à competência dos gerentes são fidedignas. Neste
exemplo fictício, a fidedignidade é muito alta. Cada um dos quatro
juizes chegou aproximadamente à mesma ordem de postos para os cinco
gerentes. Lembre-se que o que queremos é uma estimativa da competên
cia de cada um dos gerentes. Não estamos interessados nos juizes. Sua
tarefa é aumentar a fidedignidade das notas globais dos gerentes, assim
como classificá-los. Se somarmos as notas em cada linha e depois calcu
larmos as médias das notas de cada pessoa (por exemplo, para a pessoa 1:
(6 + 6 + 5 + 4)/4 = 21/4=5,25), temos um conjunto de médias para cada
pessoa. Perguntamos: Quão próximas estão estas médias das “verdadeiras
notas” ou “da verdadeira classificação” da competência de cada indi
víduo? É possível obter uma resposta apenas aproximada.
Este meio aproximado de determinar a fidedignidade das classifi
cações é baseado em todas as classificações e todas as médias calculadas
a partir das classificações dos quatro juizes. Se os indivíduos classificados
diferem em competência — se os indivíduos não diferirem no que
estiver sendo medido, a fidedignidade não pode ser realmente calculada
— então, as médias da coluna denominada “Média” deveríam diferir.
Quanto mais diferirem, maior a fidedignidade. Se o procedimento de men
suração for bom, então aproximadamente a mesma ordem de postos da
médias das classificações deve aparecer em mensurações subseqüentes,
assumindo-se que os juizes sejam especialistas e competentes. Observe
que as ordens de postos dos cinco indivíduos tendem a ser a mesmas
para cada juiz. Por exemplo, a notas dos juizes a e b das cinco pessoas
tendem a caminha juntas: foram feitas avaliações altas do indivíduo 1
(6 e 6) e baixas do indivíduo 5 (1 e 2). As avaliações dos indivíduos
2, 3 e 4 não são inconsistentes com estas avaliações extremas.
150
Igualmente, se examinarmos as classificações dos juizes c e d, nova
mente encontramos correspondência geral nas classificações. Tal concor
dância produzirá classificações médias (coluna denominada "média”)
que diferem claramente umas das outras, desde que, naturalmente, os
indivíduos realmente difiram uns dos outros em competência. Quanto
maiores estas-diferenças, mais alta a fidedignidade, outras coisas manti
das constantes.
Sem dúvida o leitor ainda está um pouco confuso. Vamos então
inventar uma situação altamente contrastante. Suponhamos que todo o
procedimento de julgamento tenha sido não-fidedigno. Suponhamos que
os juizes não soubessem comc apreciar a competência e, além disso, que
tenham sido descuidados. Quase certamente tal situação resultaria em
um conjunto de classificações de baixa fidedignidade. Damos um exem
plo na tabela 9.2. Os números (classificações) da tabela são números
aleatórios, gerados por um calculador programável.
Tabela 9.2 Notas dadas por quatro Juizes à competência de cinco pessoas —
fidedignidade baixa.
Juizes
Pessoas a b c d Soma Média
1 2 5 6 1 • 14 3,50
2 5 2 6 4 17 4,25
3 2 3 1 5 11 2,75
4 3 1 3 2 9 2,25
S 6 3 4 4 17 . 4,25
■B»-------■------
Se pudermos saber por que esse conjunto de classificações não é

fidedigno e por que o conjunto da tabela 9.1 é, estaremos no caminho
certo para entender a fidedignidade. Vamos estudar primeiro as colunas
dos indivíduos. Sabemos que os cinco diferem em competência —: uma
Suposição segura: a maioria das pessoas difere em quase tudo. As classi
ficações deveríam ser diferentes. Se os juizes estão capacitados a julgar
a competência, então, suas classificações deveríam ser mais ou menos
as mesmas. Ou seja, suas classificações do mesmo indivíduo deveríam
concordar aproximadamente. É difícil ou impossível encontrar muito
acordo na tabela 9.2. Ê como se os julgadores fizessem apreciação de
quatro características não relacionadas. Ou, mais perto da verdade, é
como se eles tivessem feito suas apreciações ao acaso.
151
Veja agora as classificações da tabela 9 1. Há uma concordância
geral entre os quatro conjuntos de classificações, como já observamos.
Se o juiz a dá à pessoa 1 uma nota alta, o mesmo fazem os juízep b, c
e d — acontecendo o mesmo para os quatro juizes nas notas baixas.
Há, em outras palavras, uma alta concordância entre os julgadores. Na
medida em que as classificações concordam, elas são fidedignas.
Outra diferença, talvez mais sutil entre as duas tabelas, está nas
médias das pessoas. (As médias dos itens, embora importantes em algu
mas situações, não são importantes aqui. Em geral, elas não afetam a
fidedignidade tanto quanto as médias das pessoas.) Os dois conjuntos
de médias foram reproduzidos na tabela 9.3. A primeira diferença a
notar é que as médias de 9.1 são mais variáveis que as médias de 9.2.
As amplitudes, que são índices — embora grosseiros — de variabilidade,
são 5,25 — 1,25 = 4, para 9.1 e 4,25 — 2,25 = 2, para 9.2. Já que
as notas de 9.2 eram na realidade números casuais, então, as cinco
médias de 9.2 deveríam ser quase as mesmas. (Por quê?) A amplitude
refletiría, naturalmente, esta falta de variabilidade.
Vamos voltar e examinar a tabela 5.1, um conjunto de 100 números
arranjados em grupos de 10. Examine as médias dadas nas tabelas 5 .2
e 5.3, também calculadas a partir de números aleatórios. Passe os olhos
pelas discussões das três tabelas. Observe, na tabela 5.1, que as 10
médias são muito parecidas. A expectativa baseada no acaso é 4,56,
a média total. Já que as 10 médias são médias de números aleatórios,
elas devem ficar bem próximas dessa expectativa baseada no acaso. Os
números aleatórios, por definição, não são fidedignos. São números sem
sistema ou regularidade, e fidedignidade significa, entre outras coisas,
que os números são sistemáticos; eles mostram regularidade.
Uma definição de fidedignidade pode ser dada negativamente: fide
dignidade é falta de “erro” em um conjunto de medidas. O “ erro” aqui
significa, com efeito, flutuações casuais, ou aleatórias. “Erro” é a varia
bilidade, as flutuações das medidas, não devidas ao que quer que esteja
sendo medido. Na medida em que um conjunto de medidas tem tal
variabilidade, não é fidedigno. (Tal variabilidade não deve ser confun
dida com a variabilidade dos indivíduos, há pouco discutida, uma varia
bilidade que reflete diferenças entre indivíduos. Veja abaixo.) Os núme
ros aleatórios, naturalmente, refletem apenas um ir e vir, subir e descer,
uma variabilidade não sistemática.
As médias dos cinco especialistas, “ Grupo Experimental”, tabela
5.2, são muito parecidas com as médias da tabela 9.3, “baixa fidedigni
dade.” Não são muito diferentes. E não deveríam ser: foram calculadas
de números aleatórios. Igualmente, as médias da tabela 5.3 nãc são
muito dissemelhantes. Mas as médias da tabela 9.3, “Alta Fidedigni
dade”, diferem tanto quanto podem, se compreendermos que as médias
152
sfio sempre menos variáveis do que os números dos quais são calculadas.
A amplitude maior provavelmente reflita mais exatamente as diferenças
individuais em competência das cinco pessoas, cuja competência está
eendo medida. Se as médias se assemelham a médias calculadas a partir
de números aleatórios, então provavelmente serão iguais entre si; não
diferirão muito. Se obtivermos números numa situação real de mensu-
ração que se assemelhem a números aleatórios, então, sua fidedignidade
será baixa. Eles não podem refletir com exatidão as diferenças individuais
das pessoas medidas.
Tabela 9.3 Médias das pessoas tiradas das tabelas 9.1 e 9.2.
Alta Baixa
Pessoas fidedignidade Pessoas fidedignidade"
(tabela 9.1) (tabela 9.2)
1 5,25 2 4,25
2 4,25 5 4,25
3 3,75 1 3,50
4 2,00 3 2,75
5 1,25 4 2,25
* As médias da tabela 9.2 foram rearranjadas em ordem de postos de magnitude,

para enfatizar a diferença entre os dois conjuntos de classificações.
Uma forma mais fácil, embora incompleta, de considerar a fidedigni

dade é como estabilidade. Suponhamos que os quatro juizes dessem
notas por competência uma segunda vez, digamos, dois meses mais
tarde. Assumindo que nos dois meses nada tenha acontecido que mudasse
a competência dos gerentes, as classificações médias que recebessem
deveríam ser aproximadamente as mesmas da segunda e da primeira vez.
Na medida em que forem as mesmas, as notas serão fidedignas. Na
medida em que forem diferentes, na primeira e na segunda vez, as notas
serão não-fidedignas. Se fosse calculada uma espécie de índice que refle
tisse a similaridade dos dois conjuntos de notas, este índice seria deno
minado coeficiente de fidedignidade. Quando tais índices são calculados
e relatados na bibliografia, são chamados coeficientes de fidedignidade de
teste-reteste.
Pode-se também calcular os coeficientes de fidedignidade para os
dados das tabelas 9.1 e 9.2. São chamados coeficientes de consistência
Üíiterna. Os dois coeficientes para as tabelas 9.1 e 9.2 são 0,94 e 0,01.
Os coeficientes de fidedignidade como estes variam de 0 a 1,00, 0 indi-
153
cando fidedignidade muito baixa (“nenhuma” fidedignidade) e 1,00 indi
cando fidedignidade perfeita. As notas da tabela 9.1 , então, são alta
mente fidedignas, enquanto que as da tabela 9 .2 não oferecem nenhüma
fidedignidade.
O exempo usado para ilustrar a fidedignidade vem usando classifi
cações provavelmente porque são mais fáceis de compreender do que se
usássemos um teste e itens de teste. O mesmo raciocínio, entretanto, se
aplica aos testes. Substitua simplesmente “juizes” por “itens”. As pessoas
classificadas são as mesmas; a única diferença é que agora serão “testa
das” em vez de “avaliadas.” Isto é, qualquer teste ou escala consiste
em certo número de itens, cada um destinado a medir a mesma coisa,
assim como os juizes deviam avaliar ou medir a mesma coisa. Por
exemplo, suponhamos que temos que medir autoritarismo. Podemos usar
a conhecida escala F. Aqui estão dois dos itens (Adorno e outros, 1950,
pp. 255-257):
Obediência e respeito à autoridade são as virtudes mais importantes
que uma criança deve aprender,
A ciência tem seu lugar, mas há muitas coisas importantes que
jamais poderão ser compreendidas pela mente humana.
Os sujeitos respondem a estes itens numa escala de acordo-desacordo.
Quanto mais concordarem, mais autoritários acredita-se que sejam.
São usados muito mais que dois itens. (Em geral, quanto mais
itens, maior a fidedignidade, contanto que todos meçam a mesma coisa
e a meçam igualmente bem.) Se os dois itens dados acima medem a
mesma coisa, devem produzir aproximadamente a mesma ordem de
postos para os indivíduos. Se isto ocorrer, então, a escala de dois itens
será fidedigna. Do contrário, não é fidedigna. O mesmo raciocínio é
estendido aos vários itens de um teste ou escala. Se tivéssemos 40 itens
em um teste de inteligência, cada um deles seriam um “juiz” : produzirá
ordem semelhante de postos de inteligência entre os indivíduos.3
Por que a fidedignidade é importante?
Antes de poderem ser qualquer outra coisa, as medidas de variáveis

devem ser fidedignas. Devemos saber, por exemplo, que estamos medindo
acuradamente a competência, pois que adianta medir uma variável se
3 Note, entretanto, que itens individuais são muito menos fidedignos do que testes
inteiros. Entretanto, itens de fidedignidade relativamente baixa podem, quando
usados em número suficiente, produzir um teste ou escala fidedigna. É um
aspecto ou princípio útil, que torna possível obtermos testes fidedignos de caracte
rísticas humanas.
154
não nos aproximarmos da “verdadeira” nota dos indivíduos (ou objetos)
medidos? É um dos principais motivos para se fazer a mensuração.
Temos que confiar nos resultados obtidos. Devemos saber, por exemplo,
que se medirmos a competência ou a criatividade ou ainda a dominância
ou inteligência de um grupo, obteremos as mesmas notas ou notas
semelhantes em uma mensuração subseqüente dos mesmos indivíduos.
Isto significa, entre outras coisas, que obteremos as mesmas ordens de
postos das notas, ou parecidas.
Vejamos a relação entre duas variáveis, inteligência e competência.
Digamos que queiramos saber o papel que a inteligência desempenha
em certa espécie de competência. Se uma ou ambas as medidas de inte
ligência e competência não forem fidedignas, então não será possível
determinar com exatidão de que maneira estão relacionadas — ou “ corre
lacionadas”, como se diz. A magnitude da relação pode ser alta, mas se
uma ou ambas as medidas não forem fidedignas, a relação calculada
será baixa, simplesmente por falta de fidedignidade. Se aceitarmos a
magnitude da relação calculada pelo seu valor aparente, vamos nos
desviar seriamente. Suponhamos que a magnitude da relação tenha sido
UNlVEf
realmente alta, mas a medida de competência não seja fidedigna e que
não saibamos que não era fidedigna. Podemos acreditar que a relação
entre inteligência e competência seja baixa ou nula. Podemos então
concluir que inteligência tem pouco a ver com o tipo de competência
que estávamos tentando medir. Tal conclusão seria, naturalmente, errada.
Igualmente, no uso prático de medida de variáveis, a fidedignidade é
um aspecto indispensável da mensuração. Que ádianta um teste de inte
ligência de crianças que não seja fidedigno? Que adianta uma medida
de atitudes em relação a grupos minoritários que não seja fidedigna?
Se os testes e as escolas não forem fidedignos, as predições que fazemos
com eles — e eles são instrumentos de predição, assim como medidas
de variáveis — são inúteis ou piores que inúteis, pois podem nos
desviar de conclusões relativas a habilidades e atributos dos indivíduos
que estamos medindo, assim como a relações entre as habilidades e
atributos.
Validade
A fidedignidade é um problema praticamente resolvido. A teoria

da fidedignidade dos instrumentos de mensuração psicológica e socio
lógica está bem desenvolvida e amplamente compreendida.4 Princípios
* Veja excelentes discussões em Guilford (1954) e Nunnally (1967).

para a prática e como colocar os princípios em prática estão, igualmente
bem compreendidos. Os psicólogos e sociólogos sabem construir instru
mentos de mensuração de substancial fidedignidade. Sabem, por exejnplo,
que quando um teste ou escala é curto demais, provavelmente não será
fidedigno, que os itens devem ser expressos sem ambigüidade (exceto
em casos especiais), e que deve haver estímulos de amplitude adequada
para capturar a amplitude dos atributos humanos. Em outros tempos,
havia uma desculpa para um estudo ter um ou mais instrumentos de baixa
fidedignidade, ou então, não mencionar nada sobre fidedignidade. Este
tempo passou, embora ainda continuem existindo restos dessas práticas.
Não há mais qualquer desculpa para baixa fidedignidade. É, em resumo,
um problema prático e teórico amplamente resolvido.
Infelizmente, não acontece o mesmo com a validade, que apresenta
problemas muito mais profundos e difíceis do que a fidedignidade,
em parte porque as idéias de validade são relativamente novas e em
parte porque validade é um problema muito mais complexo. Os psicólo
gos e sociólogos mal se davam conta da validade, anos atrás. Felizmente,
a atenção de todos vem se focalizando neste importantíssimo aspecto
dos problemas de mensuração e de ciência comportalmente, e já foi
feito um grande progresso na sua compreensão, senão no seu domínio
prático.
Definição e natureza da validade
Freqüentemente define-se a validade com a seguinte pergunta:

“Você está medindo o que pensa que está medindo?” Se assim, sua
medida é válida; se não, não é válida. A ênfase aqui é dada no que
está sendo mensurado. Suponhamos que um grupo de professores de
estudos sociais elabore um teste para medir a compreensão dos alunos
de certos conceitos sociais: justiça, igualdade e cooperação, por exemplo.
Os professores desejam saber se os alunos compreenderam e podem
aplicar as idéias. Mas elaboram um teste contendo apenas itens fatuais
sobre instituições contemporâneas. O teste então não é válido para a
intenção que tinham em mente. Pode ser um bom teste de conhecimento
fatual, mas não medirá a compreensão de conceitos sociais. Para um
teste ser válido, no sentido mais elementar e talvez fundamental da
palavra, deve medir o que o pesquisador deseja e pensa que está
medindo.
Há mais de um tipo de validade. Embora não possamos nos apro
fundar nos tipos e definições diferentes de validade neste livro, devemos
tentar investigar as principais definições, pois elas nos ajudarão, a com-
156
preender a abordagem científica geral à observação do comportamento
e à mensuração de variáveis. Por sua vez, esta compreensão nos dará
melhor fundamento para avaliarmos algumas controvérsias fundamentais
sobre mensuração que importunam tanto os cientistas quanto os leigos.
T ip o s d e va lid a d e
Pesquisadores e práticos usam testes muitas vezes apenas para

prever um futuro desempenho. Provavelmente os teste sejam mais usados
para isto. Os professores, por exemplo, desejam conhecer a capacidade
e aptidão das crianças com o fim de prever seu futuro desempenho e
realização. A ênfase no uso de tais testes, por escolas e outros estabeleci
mentos, está mais na previsão da capacidade e desempenho atuais e
futuros do que em medir variáveis. Embora interesse o que o teste irá
medir, o interesse central não é este. O principal é que o teste meça
satisfatoriamente o que foi considerado essencial para o bom desem
penho na escola ou no trabalho. Chegou-se mesmo a afirmar que, se um
teste conseguir predizer com sucesso algum critério, não vem ao caso
o que ele estiver medindo! Em todo caso, um teste é considerado válido
se predisser com sucesso algum critério. Tal validade era denominada
v a lid a d e p re d itiv a ; mais recentemente passou a ser denominada v a lid a d e
re la tiv a a o c rité rio (c riterio n -rela ted v a lid ity ).
Outra forma de validade é chamada v a lid a d e d e c o n teú d o , que é
dirigida à substância ou ao conteúdo, do que está sendo medido. Se os
professores que aplicaram o teste para medir a compreensão dos concei
tos sociais perguntassem a colegas, depois de estudarem o teste, se acha
ram que ele realmente medirá a compreensão de conceitos sociais, esta
riam fazendo uma pergunta de validade de conteúdo. Validade de con
teúdo está assim estreitamente relacionada à questão: “Você está
medindo o que pensa que está medindo?”
Um terceiro tipo de validade, chamado v a lid a d e d e c o n stru cto ,
ffirovavelmente é o mais significativo e importante, pelo menos do ponto
l e vista deste livro. Quando os pesquisadores investigam a validade de
constructo de uma medida, estão mais interessados na propriedade psico
lógica ou outras propriedades que o instrumento mede. Estão interessados
na variável sob consideração, ou, mais exatamente, no constructo ou
Constructos subjacentes à variável. Validades relativas ao critério e de
conteúdo são comparativamente fáceis de compreender. Validade de
Constructo não é fácil, por estar inserida em uma grande área do quadro
de referências da pesquisa e da metodologia. Como sempre, um exemplo
pode ajudar a esclarecer o que queremos dizer.
157
Medindo dogmatismo
A escala F, mencionada anteriormente, pretende medir o autori

tarismo. Foi construída com base em teorias sócio-psicológicas e psica-
nalíticas bastante complexas. Tem havido muita discussão relativa à
validade da escala, discussão que envolve também a validade das
teorias em que a escala foi baseada. A discussão foi realmente relativa
à validade de constructo da escala.
Rokeach (1960), contestando até certo ponto a validade da escala F
como medida de autoritarismo, construiu sua própria escala, a escala D,
para medir dogmatismo. Ele também usou raciocínios teóricos. Uma de
suas críticas à escala F era que ela media somente o autoritarismo de
direita, apenas tendências fascistas. (O “F” da escala refere-se a Fascis
mo”.) Desta forma ela é limitada, se omite o autoritarismo da esquerda.
Sua validade como medida geral de autoritarismo é, portanto, questio
nável. Com sua escala D, Rokeach pretendia medir o dogmatismo, que
inclui autoritarismo tanto de esquerda quanto de direita.
A escala D consiste de um número de itens que Rokeach acreditava
iriam medir um bitolamento (closed-mindedness), um modo de pensar
associado a uma ideologia, sem levar em conta seu conteúdo. No centro
deste pensamento está a idéia de que as orientações ideológicas dos
indivíduos estão relacionadas às suas personalidades, comportamentos e
processos de pensamento. (Esta idéia foi assumida também pelos autores
da escala F.) Dois entre os muitos exemplos que podem ser dados são
que o dogmatismo está relacionado com a intolerância e a obstinação.
Rokeach fez uma série de investigações com o fim de testar tanto suas
idéias quanto a validade de suas escalas.
Por exemplo, um dos meios usado freqüentemente para validar
testes e escalas é o método dos grupos conhecidos. Neste método, apli
ca-se um instrumento a pessoas com características “ conhecidas” e
prediz-se a diferença entre grupos. Vimos este método no capítulo 8,
quando examinamos o estudo de Rokeach sobre as diferenças entre poli
ciais, brancos desempregados e estudantes calvinistas e suas reações a
idéias sociais de liberdade e igualdade. Rokeach, como dissemos acima,
acreditava que o núcleo do dogmatismo estava no bitolamento. Assim,
ele fez professores e alunos de pós-graduação selecionarem alunos e
amigos qua acreditavam não-bitolados e bitolados. A escala D diferen
ciou com êxito os dois grupos. Aplicou também a escala a grupos reli
giosos diferentes; os resultados gerais apoiaram suas análises. Outro
teste da validade da escala foi o estudo de Rokeach sobre a relação
entre dogmatismo e solução de problemas em situações diferentes de
quaisquer outras encontradas na vida cotidiana. Novamente suas idéias
foram confirmadas.
158
Em outras palavras, o trabalho de Rokeach foi dirigido tanto para
a teoria por trás da escala D quanto para as propriedades da escala,
um exemplo claro de validação de constructo. “Validação de constructo”
talvez seja uma expressão mais exata do que “Validade de constructo”
para expressar o que está envolvido. O pesquisador tenta de várias
formas obter provas que apoiem a teoria por trás de uma medida assim
como sobre a medida. É um processo divergente e convergente no qual
as deduções da teoria são testadas de maneiras diferentes com a idéia
de que a evidência de testes diferentes convergirá para a validade da
medida. A validação de constructo é, então, essencial à própria ciência
em seus testes de deduções e implicações derivadas da teoria. É uma
importante conquista da mensuração e da pesquisa comportamental, uma
conquista que está revolucionando a mensuração psicológica e socio
lógica. 5
M ensuração em perspectiva 5
A mensuração pode ser o calcanhar de Aquiles da pesquisa compor
ÍV iV i
tamental. Freqüentemente planeja-se e executa-se cuidadosamente uma
investigação, com pouquíssima atenção à mensuração das variáveis da
pesquisa. Eis um caso interessante que demonstra a falta de preocupação
com a fidedignidade. Um pesquisador planejou um conjunto elaborado
de experimentos para testar uma teoria de atitudes. A cadeia de racio
cínio das implicações experimentais da teoria parecia válida. Se é
verdade, como prevê a teoria, que isto e aquilo 'são assim, então aconte
cerá isto e aquilo. O procedimento experimental foi cuidadosamente
planejado e executado para testar as deduções. Foram feitas predições
estatísticas específicas sobre as diferenças entre grupos experimentais.
Nenhuma das predições resultou como fora predito! Sem dúvida, virtual
mente nenhuma das diferenças eram estatisticamente significativas. O
conjunto de experimentos foi um fracasso completo. Foi como se os
números analisados fossem números aleatórios. Por quê? Por que a
teoria era falha? Por que o experimento foi mal conduzido? Por que
os sujeitos foram mal escolhidos?
O verdadeiro motivo parecia ser a mensuração da variável depen
dente. O pesquisador passara grande parte de sua vida profissional
dizendo aos alunos que, para medir adequadamente uma variável, era
5 O primeiro avanço real provavelmente tenha vindo de um artigo de Cronbach

e Meelh (1955), no qual foram elaboradas as idéias básicas por trás da validade
dê constructo. A validade de constructo foi oficialmente reconhecida como um
tipo central de validade pela American Psychological Association em seu manual
dc testes e aplicação de testes (American Psychological Association, 1966).
159
necessário usar um certo número de itens para medir a variável. Depen
der de um ou dois itens, como fazem muitos pesquisadores, é loucura
porque se sabe muito bem, e pode ser facilmente demonstrado, que um
ou dois itens simplesmente não oferecem segurança suficiente para justi
ficar seü uso. Se for feito um experimento e for medida a variável
dependente com apenas um ou dois itens, haverá uma alta probabili
dade de que, mesmo se existirem diferenças significativas entre os dois
grupos, estas não serão detectadas simplesmente porque a medida da
variável dependente não será suficientemente fidedigna para “pescar” as
diferenças! Se havia diferenças verdadeiras entre os grupos experimen
tais, como fora predito, elas não tinham grande probabilidade de serem
detectadas.6
Todos os campos da realização humana têm sua dose de mitologia
e absurdo. A mensuração, infelizmente, é particularmente sobrecarre
gada por ambos. Parte da causa são as atitudes negativas em relação à
mensuração psicológica. Mas a ignorância e os mal-entendidos provavel
mente tenham a maior parte. Uma das maiores dificuldades parece ser a
má compreensão do objetivo básico da mensuração. Acredita-se, por
exemplo, que os psicólogos medem as pessoas, e que não se pode medir
pessoas. É verdade que não se pode medir as pessoas. Mas os cientistas
na realidade não medem as pessoas nem dizem que medem (pelo menos
não deviam dizer que medem). Eles medem variáveis, assim como nos
experimentos eles não manipulam pessoas, mas variáveis. Eles medem,
sim, o comportamento das pessoas, os indicadores observáveis de
constructos hipotéticos, como inteligência e dogmatismo. Ninguém pode
medir inteligência diretamente. “ Inteligência” é um constructo usado
para resumir um conjunto incrivelmente complexo de comportamentos
que têm a característica comum de serem “inteligentes.” Acreditar que
os psicólogos medem pessoas, então, é ingenuidade. Criticar a mensuração
porque ela não mede pessoas é ingênuo também.
Sem dúvida, todo procedimento de mensuração, mesmo de variáveis
relativamente “simples”, é altamente indireto, complexo e freqüente-
mente difícil. Em vista dessas dificuldades, o êxito dos cientistas compor-
tamentais em medir variáveis comportamentais é notável. E tem sido um
êxito, apesar dos críticos que afirmam ter sido um fracasso. Eis algumas
variáveis que têm sido medidas com êxito: inteligência, aptidões (verbal,
numérica e assim por diante), atitudes (em relação a uma variedade de
objetos), introversão, coesão (de grupos), necessidades, classe social,
autoritarismo, dogmatismo. Podemos enumerar muitas outras. Isto não
significa que a mensuração de tais variáveis seja perfeita, ou que poderá
6 O pesquisador foi o autor deste livro.
160
vir a ser perfeita. Ao contrário, vem carregada de dificuldades, sendo
a maior de todas, naturalmente, a validade. Mas os cientistas, principal
mente os psicólogos, conhecem as limitações e as dificuldades e são geral
mente muito cuidadosos em suas avaliações e no uso de testes e escalas
e seus resultados.7
Como qualquer outra coisa, os testes e medidas devem ser usados
com cautela e discrição. Quando falamos de mensuração em ciências
comportamentais, colocamo-nos em nível muito diferente do que quando
falamos de mensuração em ciências naturais. Devemos ter sempre muito
cuidado em verificar a fidedignidade e validade de nossas medidas.
Devemos entender que os chamados erros de mensuração desempenham,
infelizmente, um grande papel em nossas medidas. Em ciências naturais,
há muito menos problemas de fidedignidade; consegue-se geralmente um
alto grau de precisão e exatidão com a ajuda de poderosos instrumentos
de mensuração. Validade é mais um problema, mas nem de perto o
problema que há com variáveis como inteligência, ambiente familiar,
atmosfera escolar, atitudes em relação a estrangeiros, criatividade e assim
por diante. Contudo, mensuração é mensuração nas ciências naturais e
nas ciências comportamentais. A definição básica e os procedimentos
gerais são os mesmos. Não é menos legítimo e científico medir as atitudes
e opiniões das pessoas, por exemplo, do que medir a circunferência da
terra ou a força dos terremotos. Se existem variáveis, elas são potencial
mente mensuráveis, embora os graus de precisão, exatidão e validade
variem amplamente.
Um dos pontos interessantes de parte da crítica à mensuração, principalmente

da mensuração psicológica, é que se critica de forma a parecer dizer que os
psicólogos não conhecem as dificuldades e fraquezas dos testes e escalas psicoló
gicos. Os críticos dizem, por exemplo, que os testes não podem medir seres
flumanos e sua complexidade, que “inteligência real” e "criatividade real” não
podem ser medidas e que geralmente não se pode confiar em mensuração psico-
P F f a; AS aflrra.at.lv?s., lmP*icam que os psicólogos não têm consciência das difi-
BUidades e que e mutil ate pensar em medir o comportamento das pessoas e suas
Wracteristicas. Os fatos geralmente são muito diferentes.
10. Investigação sociológica, levantamentos
e análise de freqüências *
F.m nossa preocupação com os pontos principais da pesquisa com-

portamental, negligenciamos diversos tópicos que um estudo completo
teria que incluir. Dois ou três desses tópicos — tipos de pesquisa e
métodos de observação, por exemplo — serão discutidos no Apêndice.
Devemos considerar agora, entretanto, uma forma muito importante de
investigação comportamental e um tipo de análise comum e importante.
Na falta de melhores rubricas, chamaremos à forma de investigação
“investigação sociológica”, e ao tipo de análise “análise de freqüências” .
Investigação sociológica
Da forma usada neste capítulo, “investigação sociológica” é um

, termo amplo que significa um conjunto de formas relacionadas de inves
tigação não-experimental dirigidas para o estudo das relações entre
“variáveis sociais”. Da forma usada aqui, a investigação sociológica é
feita principalmente, mas não exclusivamente, por sociólogos e inclui
diversas variáveis caracterizadas por sua orientação social: status social,
preferência política, preferência religiosa, afiliação a associações, escolari
dade, renda, ocupação, raça, sexo e assim por diante. Estas “variáveis
sociais” são atributos de indivíduos (ou grupos) que têm a característica
comum de serem membros de grupos sociais grandes e pequenos e assim
de serem compartilhados por muitos ou pela maioria dos indivíduos. Por
exemplo, todos nós temos ocupações, renda, sexo, preferência religiosa,
e assim por diante, e elas nascem, pelo menos em parte, de nossa partici
pação em diversos grupos. São o material básico de uma grande parte da
investigação sociológica.
Não quero implicar que os sociólogos usem apenas essas variáveis
e que os psicólogos ou os economistas não as usem. Sem dúvida, ultima
mente os sociólogos vêm usando cada vez mais “variáveis psicológicas”
e os psicólogos vêm usando “variáveis sociológicas” — e é assim que
deve ser. Estou usando os termos “investigação sociológica” e “variáveis
sociais” em parte por conveniência e em parte por eles refletirem a
162
realidade da pesquisa. Outro motivo é por termos que nos dirigir a um
grande corpo de estudos variados que parecem ter as características
comuns de usar variáveis sociológicas, ser não-experimentais, dirigir-se
freqüentemente para problemas sociais importantes e usar um conjunto
de técnicas analíticas relacionadas. Muitas dessas pesquisas foram chama
das “levantamentos” {survey research) ou “estudos de campo” .
Para sermos mais concretos, vejamos os sumários de quatro inves
tigações sociológicas. O fato de incluírem “variáveis psicológicas” não
muda sua natureza basicamente sociológica.
O estudo de Stouffer: tolerância e intolerância
Neste grande e importante estudo, Stouffer (1955) questionou, entre

outras coisas, tolerância e os chamados correlatos de intolerância,1 Para
obter as respostas às questões, Stouffer entrevistou duas amostras alea
tórias de pessoas dos Estados Unidos. (Entrevistar é uma forma poderosa
de obter informação muito usada na investigação sociológica.) Uma das
perguntas feitas por ele estava voltada para a relação entre tolerância
e liderança na comunidade. Colocando de maneira diferente, a questão
pretendia estudar a diferença em tolerância entre os líderes e os cidadãos
comuns. A pergunta era a seguinte: “ Se uma pessoa quisesse fazer uma
conferência em sua comunidade contra igrejas e religiões, ela deveria
ter permissão para falar ou não?” Parte dos dados obtidos em uma das
amostras nacionais é dada na tabela 10.1.
Tabela 10.1 Respostas à questão sobre tolerância de não-conformidade religiosa,

estudo de Stouffer (1955). *
Resposta
Sim Sem opinião Não
Líderes da comunidade 66% 1% 33%

Grupo representativo nacional 37% 3% 60%
3 Estes dados foram obtidos pelo Instituto Norte-Americano de Opinião Pública.

São fornecidos na forma de porcentagem,
1 “Correlatos” são variáveis relacionadas a outras variáveis de interesse e são

usadas geralmente para "explicar” uma variável ou variáveis de interesse. Por
exemplo, o pesquisador pode estar interessado no comportamento do eleitor. Para
tentar compreender este comportamento, ele estuda as preferências religiosas, polí
ticas, o sexo, e status social de, digamos, eleitores em uma importante eleição. Em
outras palavras, ele relaçiona essas variáveis sociológicas, ou “correlatos”, a como
as pessoas votam.
As respostas à questão de Stouffer parecem claras, se lermos correta
mente a tabela. Há uma relação entre posição na comunidade e tole
rância: os líderes da comunidade parecem ser consideravelmen|e mais
tolerantes do que os cidadãos médios: 66 por cento dos líderes disseram
Sim, deve-se permitir a conferência, mas apenas 37 por cento dos
cidadãos comuns disseram Sim. (Observe que as porcentagens de Sim,
as porcentagens de Não e as porcentagens de Sem Opinião somam, em
cada linha, 100%.)
Miller e Swanson revisitados
No capítulo 1 foi citado um estudo de relação entre classe social

e tipo de criação de crianças (Miller e Swanson, 1960). Uma das relações
específicas estudada foi entre classe social dos pais e tempo de desmame
das crianças. Miller e Swanson entrevistaram 103 mulheres das classes
média e operária, em Detroit. Perguntaram às mães, em uma parte do
estudo, quando desmamaram seus filhos. As respostas das mães, dadas
na tabela 1.1, estão reproduzidas aqui, na tabela 10.2. Nesta tabela
São dadas freqüências aas respostas e as porcentagens, calculadas em
cada linha.
A relação entre as duas variáveis é evidente. De fato, as porcen
tagens são muito semelhantes em suas magnitudes às porcentagens de
Tabela 10.2 Classe social e tempo de desmame, estudo de Miller e Swanson (1960).
(reprodução da tabela 1.1) a.
Classe social Desmame
Cedo Tarde
33 22 55
Classe média
(60%) (40%)
31 48
17
Classe operária
(35%) (65%)
50 53 103
* As entradas principais nas casas são freqüências; as entradas entre parênteses

são porcentagens calculadas pelas linhas. Veja nota de rodapé da tabela 1.1.
164
Stouffer.2 As mães de classe média desta amostra desmamaram seus
filhos mais cedo que as mães de classe operária. (Veja mais detalhes
na discussão do capítulo 1.)
V alo res o rie n ta d o s p a ra pesso a s e escolh a ocu p a cio n a l
Há alguns anos, os professores abandonavam o ensino, causando

assim difíceis problemas de pessoal em muitos distritos escolares. Por que
abandonavam o ensino? (Usamos o tempo passado porque se presume,
mas naturalmente pode não ser verdade, que os professores já não aban
donem o ensino como antigamente por causa da mudança na necessi
dade de professores na última meia década.) Rosenberg (1955) lançou
lguma luz indireta no problema quando perguntou aos estudantes em
1950 e 1952 se gostariam de se tornar professores. Ele determinou
também se eram orientados para pessoas (se queriam trabalhar com
gente em vez de com coisas; ajudar os outros) ou “não-orientados para
pessoas”. Uma das relações relatadas por ele está na tabela 10.3.
Tabela 10.3 Valores orientados para pessoas e mudança de escolha ocupacional. 1952.
Continuaram Abandonaram
professores o ensino
Orientados para pessoas 57% 43%

Nao-orientados para pessoas 19% 81%
As porcentagens na tabela parecem dizer que professores não-orien

tados para pessoas tendem a deixar o ensino. Os números em que a
tabela se baséiá são comparativamente pequenos (um total de 108 pro
fessores) e o estudo é muito mais limitado do que os estudos de Stouffer
e de Miller e Swanson. Mostra, entretanto, as características da investi
gação sociológica que estão sendo ilustradas: uma variável, Continuaram
* As porcentagens são usadas às vezes em tabelas como esta porque “trans-

_ ” as freqüências das duas linhas em uma escala comparável baseada em
100. Já que as somas das freqüências nas linhas, 55 e 48, são desiguais, é mais
difícil _“ver" a relação estudando simplesmente as freqüências. Quando as fre-
Jências são transformadas em porcentagens, entretanto, a relação se toma mais
S ira. Quanto mais diferem as somas das freqüências das linhas e das colunas,
mils útil se toma a transformação em porcentagens. Discutiremos isto mais adiante.
Vlji Kerlinger (1973, cap. 10) sobre princípios e prática de construir e interpretar
M l tabelas e análises.
165
Professores ou Abandonaram o Ensino. (Escolha Ocupacional) é uma
variável sociológica, que é estudada em relação a uma variável psico
lógica, Orientado para Pessoas e Não-Orientado para Pessoas. As res
postas da amostra foram analisadas em uma tabela de porcentagens
(calculadas a partir das freqüências).
Efeitos duráveis da escolarização
O último estudo citado nesta seção não pode ser exatamente chama
do levantamento ou estudo de campo. £, entretanto, o que está sendo
chamado neste capítulo, investigação sociológica. Ê também um exemplo
de um novo,tipo de estudo que cada vez mais está sendo feito, à medida
que arquivos de dados vão sendo construídos abrangendo os resultados
de muitos estudos. Hyman, Wright e Reed (1975) desejavam respostas à
pergunta extremamente importante, mas raramente formulada empirica-
mente: “Que duração têm os efeitos da educação formal?”
Uma das grandes dificuldades em estudar os efeitos.de longo alcance
da escolarização e de programas ou mudanças sociais é a dificuldade
que os pesquisadores têm em seguir as pessoas ao longo do tempo. Os
estudos que seguem as pessoas através do tempo chamam-se estudos
longitudinais. Se quisermos avaliar os efeitos de longo alcance das
escolas e da escolaridade, devemos estudar as pessoas quando estão na
escola, logo após saírem da escola e em momentos posteriores. Mas esta é
uma das espécies de pesquisa mais difíceis de fazer por diversas razões
práticas e técnicas que não podemos citar aqui. Ê suficiente dizer que
há pouca evidência empírica longitudinal na questão dos efeitos duráveis
da escolarização.
Hyman e seus colegas resolveram, o problema da dificuldade em
responder à sua pergunta sobre os efeitos duráveis da escolarização,
fazendo análise secundária de dados coletados em diversos levantamentos
nacionais. Com efeito, eles combinaram e compararam os resultados de
vários levantamentos relacionados com a sua pergunta. Isto é, extraíram
informação sobre o nível de escolaridade de milhares de norte-americanos
de 54 levantamentos, com um total de cerca de 80.000 indivíduos.
Os levantamentos foram feitos durante o período de 1949 a 1971. Foram
escolhidos de modo a agruparem-se em tomo de quatro pontos no tempo,
permitindo.uma aproximação aos estudos longitudinais. O leitor, cuja
acuidade crítica, deve estar bem desperta com nosso estudo anterior, verá
neste estudo, seus problemas e resultados, um ótimo exercício de inter
pretação crítica.
Na tabela 10.4, alguns resultados do estudo de Hyman e outros
são dados de forma muito sumarizada e condensada. Estes resultados são
166
Tabela 10.4 Nível de escolaridade e porcentagens médias de conhecimento acadê-
mico de quatro grupos de idade nos anos 60, estudo e Hyman e outros (1975). *
Sr-----------------
Nível de escolaridade
Idade Primeiro grau Segundo grau Universitário

completo completo
25-36 36% 42% 71%
37-48 31 41 75
49-60 28 53 64
61-72 52 55 62
No corpo da tabela são dadas porcentagens médias, cada uma calculada a

parto de tres porcentagens associadas a itens individuais de conhecimento. Os
»a casa superior esquerda, por exemplo, significam que uma médl? de
j í pessoas . e de escolaridade de primeiro grau e na faixa d:, idade
de 25-36 conseguiram responder às perguntas de conhecimento.
bem típicos dos vários resultados apresentados em seu livro.'A tabela

expressa principalmente a relação entre a quantidade de escolarização
com0 ^variável independente (Nível de Escolaridade) e o conhecimento
de três tópicos de informação: sabe o número de mandatos que um
presidente pode servir; sabe a extensão do mandato dos senadores;
sabe a extensão do mandato dos membros da Câmara dos Deputados.3
Outra variável da tabela e idade, que tem as quatro categorias indi
cadas.
Hyman e outros desejavam estudar a relação entre quantidade de
escolarização e conhecimento posterior de uma grande variedade de
conhecimentos . Estavam também fortemente interessados nos efeitos
duráveis da êscolarização. A influência da escola persiste através do
tempo? As “sementes do conhecimento plantadas há muito tempo. . .
se desfazem com o tempo ou persistem através de todas as vicissitudes
através da experiência até a velhice”? (Hyman e outros, 1975, p. 29)
A abordagem longitudinal é ideal para um tal problema; estudar o
conhecimento das crianças na escola, seguindo-as pelo tempo, medindo
seu grau de conhecimento em pontos diferentes de tempo, levando
também em conta a quantidade de escolarização recebida. É uma abor-
Í«gem difícil e mesmo impossível por motivos de custo, perda dos sujei-
>s e outras influencias possíveis sobre o conhecimento e sua aquisição.
íUEstes três itens e as entradas na tabela foram escolhidos entre muitas tabelas
"■melhantes, quase que arbitrariamente. A maioria dos itens usados pelos levanta-
intos, entretanto, foram semelhantes quanto a serem conhecimento funcional
operadas através do tempo. A maioria dos estudos sobre os efeitos da
escolarização é feita em um ponto do tempo. A relaçao pode, natural
mente, ser estudada desta forma, mas os resultados nada nos dizem a
respeito dos efeitos da escolarização através do tempo.
Hvman e outros, numa excelente tentativa de “simular» o aspecto
longitudinal, usaram dados de levantamentos nacionais e categorizaram
os dados obtidos durante diferentes períodos de tempo pela categori
“ Idade», dada na tabela 10.4. Nela há quatro grupos de idade, ou seja:
25-36 37-48 49-60 e 61-72. Os autores argumentaram que os eteitos
da escolarização seriam mostrados pelo conhecimento, aumentado com a
escolarização aumentada e que os padrões de diferenças seriam
mos ou semelhantes em diferentes grupos.
Pela tabela 10.4 ficou claro que a resposta principal dos autores
ficou respondida: da escola primária até a universidade, a quantidade de
conhecimento aumenta e aumenta de forma parecida nos quatro grupos
(diferentes níveis de idade). Esta descoberta repete-se monotonamente
nas tabelas de Hyman e outros. Raramente se vê tal consistência de
resultados e demonstração de poder de “replicação», se se puder chamar
os diferentes níveis de idade e os vários testes de conhecimento, rep
cações. -
A pergunta incômoda volta sempre, entretanto: “Podemos acreditar
nos resultados? É possível que esses resultados fortes sejam espúrios no
sentido de que não é a escolarização que gera maior conhecimento quant
mais alto se chega no sistema educacional, mas uma outro variavel ou
variáveis?» , , . A .
Consideremos a inteligência. É possível que o nível de «iteligencia
diferente dos participantes da amostra produziu as diferenças observad
em percentagem nos três níveis de escolaridade? Parece bastont^ plJ 3 a í
supor que indivíduos mais inteligentes sobem mais no sistema escol
do q u e indivíduos menos inteligentes. Se for este o caso, sem duvida
os resultados da tabelá 10.4 (e outros semelhantes) levam a conclusão
errada. Não é a escolarização, mas a inteligência que influencia. Ou,
talvez mais exatamente, é a educação e m t e h g e n c i a . ^
(1975 P 294) usaram a frase certa que expressa a dificuldade frustrante
que os analistas de resultados de pesquisaenfrentamprmcipalmemeem
pesquisa não-experimental: “terrível indetermmancia’ . N aR ataenm
neste estudo há outras variáveis que contribuem para a tem yd indeter
minância. Vamos nos concentrar rapidamente apenas em inteligência. ^
Hvman e outros controlaram variáveis concorrentes e explicações
concorrentes de forma competente. Sem dúvida eu recomendo seu livro
ao leitor como modelo de raciocínio cuidadoso, objetividade cientifica
exposição clara e o uso de material de pesquisa de arquivo para testar
questões práticas importantes. Usa também profusamente o raciocínio
de hipóteses alternativas que já encontramos em capítulos anteriores, mais
especialmente no capítulo 9 sobre pesquisa experimental e não-experi-
mental. Vamos dar uma rápida olhada, entretanto, no que talvez seja a
parte mais fraca de Hyman e outros, isto é, nos argumentos sobre inte
ligência.
Os autores dizem que a variável que se desejaria poder controlar é
a inteligência, medida durante a infância, antes que os resultados dos
testes pudessem ter sido influenciados pela escolarização. Mas tais
medidas necessárias ao controle direto, dizem eles, estão além do alcance
de qualquer pessoa; os sujeitos do levantamento já estão adultos, tarde
demais para medir inteligência antes da influência da escolarização. (A
escolarização, naturalmente, tem uma forte influência sobre a inteligên
cia medida através de testes.) Reciprocamente, a mensuração da inteli
gência de crianças vem cedo demais para medir ós efeitos duráveis da
escolarização.
Para apoiar seu argumento de que a inteligência não produziu os
efeitos por eles relatados, eles usaram argumentos opostos. Primeiro,
as características sociais e biológicas tiveram sua influência diminuída
como critérios de seleção escolar. Mais e mais crianças têm alcance à
educação nos últimos anos. A inteligência deveria, portanto, ter um
grande papel em determinar a realização. Segundo, padrões antigos,
mais rigorosos, de desempenho acadêmico nas escolas do país, foram
relaxados. Assim, estudantes de gerações mais recentes conseguem prosse
guir na sua formação e subir mais no sistema èducacional, embora sua
inteligência seja mais limitada. O primeiro argumento, então, diz que a
inteligência desempenha um papel maior e o segundo diz que desem
penha um papel menor. Hyman e outros afirmam que os dois argumen
tos levam à conclusão de que a contribuição da inteligência deve ter
mudado com o tempo. Portanto, se for descoberto, como ocorreu em sua
análise, que os efeitos da educação não variam através de períodos de
tempo e grupos de idade, então, inteligência não é a explicação. Eles
citam também resultados de outros estudos em que, segundo afirmam, a
influência geral da inteligência sobre a realização educacional é modesta
(uma conclusão possivelmente duvidosa).
Minha conclusão é que os resultados de Hyman e outros são empiri-
camente válidos, tendo em vista a magnitude dos efeitos — as diferenças
de porcentagens — e sua notável consistência através do tempo. Mas
ainda estou preocupado com a possibilidade de que uma parte substan
cial dos efeitos observados seja devida à inteligência. A conclusão mais
exata provavelmente seja que tanto inteligência quanto escolaridade
tenham influências substanciais e conjuntas duradouras sobre o conhe
cimento. Eu teria gostado de ver a inteligência controlada. Mas isto não
era diretamente possível. Mesmo assim os pesquisadores fizeram o
máximo que puderam nas circunstâncias. 4 Pode-se mesmo dizer que suas
“análises de controle” (veja especialmente o capítulo 3) são exèmplos
excelentes de controle na análise de materiais e problemas difíceis e
controvertidos. De fato, todo o estudo é um ótimo exemplo de investi
gação sociológica cuidadosa e competente.
Levantamentos
Nos levantamentos, pequenas e grandes populações são estudadas

através de amostras para descobrir a incidência relativa, a distribuição e
inter-relações de variáveis psicológicas e sociológicas. Os levantamentos
são parte da pesquisa sócio-cientííica e têm influenciado fortemente a
pesquisa nas ciências comportamentais. Têm sido usados principalmente,
mas não exclusivamente, para descobir o que existe e como existe no
ambiente social de um grupo, uma área geográfica ou política e mesmo
um país inteiro. Uma de suas principais virtudes, principalmente para
administradores, líderes do governo, dos negócios e da política, é sua
surpreendente capacidade de fornecer informação exata sobre popula
ções inteiras usando amostras relativamente pequenas. A tecnologia dos
levantamentos — e formas relacionadas de investigação — encontra-se
altamente desenvolvida. A sociedade moderna tem uma arma poderosa
para colecionar fatos e testar teorias e hipóteses.
Os estudos de Stouffer e de Miller e Swanson são ambos levanta
mentos. Stouffer estudou seu problema usando duas amostras aleatórias
grandes (mais de 2.400 casos cada) de todos os Estados Unidos. Miller
e Swanson entrevistaram uma amostra aleatória da população de Detroit.
Hyman e outros usaram resultados obtidos em um certo número de
levantamentos por amostragem, como também são chamados, para res
ponder suas perguntas. Estes estudos usaram a forma de pesquisa em
larga escala principalmente para estudarem relações. Os autores não
estavam interessados em levantamentos como arma descritiva, mas como
instrumento para descobrir e testar relações. Esta ênfase em levantamen
tos aumentou recentemente. Muitos, talvez a maioria dos levantamentos,
entretanto, têm sido o que se denominou levantamentos descritivos.
4 Minha dúvida aumenta, entretanto, pelo que Hyman e outros (1975, p. 25)
dizem, a respeito de um rápido teste de inteligência (vocabulário) aplicado em
um dos levantamentos usados por eles. Os adultos escolarizados tiveram notas
mais altas. Em outras palavras, há uma relação positiva entre inteligência e efeitos
da escola. Em pesquisa, principalmente em pesquisa educacional, muitas vezes se
deseja que todas as pessoas tenham exatamente a mesma inteligência!
170
Os levantamentos descritivos procuram determinar a incidência e
distribuição das características e opiniões de populações de pessoas,
obtendo e estudando as características e opiniões de amostras pequenas
e presumivelmente representativas de tais populações. São usadas ampla
mente pelo governo, pelas firmas e organizações. O propósito básico das
levantamentos usados desta forma não é científico, mas antes orientado
para a ação e para diretrizes de ação. Entretanto, os levantamentos des
critivos têm tido efeitos muito fortes sobre a pesquisa comportamental
em geral, principalmente através de seu procedimento sofisticadíssimo
de amostragem e entrevista. Já discutimos amostragem aleatória e suas
características. Para fins práticos é altamente desejável que as amostras
estudadas sejam representativas. Desejamos dizer que o resultado obtido
em um estudo de grande escala é representativo. Se a amostra for sem
dúvida representativa, então, os resultados obtidos por meio dela podem
ser generalizados para toda a população. Se 80 por cento de uma amostra
respondem favoravelmente a uma questão sobre uma possível diretriz
do governo, por exemplo, aCredita-se que, se se fizesse a mesma pergunta
a todas as pessoas de um país, um estado, uma cidade ou uma organi
zação, perto de 80 por cento delas seriam favoráveis.
Há várias maneiras de tirar amostras para fins de levantamento,
mas a única que dá uma razoável garantia geral de ser representativa é
alguma forma de amostra aleatória. Frequentemente os levantamentos
usam o que se denomina procedimento de amostragem aleatória estrati-
ficada, que mostrou várias vezes ter uma alta probabilidade de ser
representativa.
A tabela 10.5 contém evidências notáveis e asseguradoras da
representatividade de grandes amostras aleatórias de todos os Estados
Unidos. O método consiste em verificar a incidência de características
sociológicas prontamente disponíveis de uma amostra com as mesmas
características obtidas no censo mais recente — ou com outra fonte
de confiança de tais dados.
Tabela 10.5 Comparações de dados de amostras com dados do censo; estudo de

Stouffer (1955).
Característica Levantamento Censo
Meio urbano 66,0% 64,0%

Masculino 46,6 47,7
Negro 8,9 9,2
Universidade 17,1 15,4
Segundo grau 45,4 43,5
Escolaridade primária (ou nenhuma) 37,5 41,1
A comparação das porcentagens da amostra e do censo na tabela
10.5 mostra estreito acordo. Os cálculos da amostra, com exceção da
escola primária, estão dentro dos 2 por cento dos cálculos do censo.
Verificações semelhantes em outros levantamentos mostram cálculos de
amostras da incidência de tais características na população aproximan
do-se bastante dos cálculos do censo.5 No estudo de Stouffer foram
comparadas as porcentagens obtidas em resposta a questões diferentes
em duas amostras aleatórias independentes dos Estados Unidos. Na tabela
10.1 reproduzimos as respostas de líderes e não-líderes da comunidade
a uma pergunta sobre tolerância em relação à não-conformidade reli
giosa. As porcentagens relatadas na tabela foram as obtidas em apenas
uma das amostras de Stouffer. As porcentagens obtidas nas duas amos
tras, entretanto, estavam todas dentro de 3 por cento ou menos uma
da outra. Nas seis porcentagens da tabela 10.1, as diferenças entre
elas e as da segunda amostra foram 2, 1, 3, 1, 1 e 0 pontos de porcen
tagem. Esta é uma demonstração muitíssimo convincente da força do
levantamento por amostragem. É muito mais convincente ainda quando
se considera que os tamanhos das amostras usadas nos levantamentos
são de menos de 3.000 indivíduos, e em geral consideravelmente menos.
Os levantamentos e formas relacionadas de investigação são impor
tantes tanto para os objetivos científicos de estudar relações quanto para
objetivos de ação prática e orientados para a tomada de decisões, mas
particularmente para o último. Exemplos de levantamentos para objetivos
científicos já foram dados neste capítulo. (A ênfase deste livro em ciência
e em pesquisa comportamental científica ditou tais exemplos.) Vamos
mencionar apenas um exemplo de uso prático de levantamentos orienta
dos para a fixação de diretrizes.
Desde .1946 o Survey Research Center, da Universidade de Michi-
gan, vem conduzindo levantamentos sobre o estado financeiro do consu
midor para o governo federal. Seu objetivo foi variado, mas um objetivo
geral parece ter sido o de fornecer ao governo federal e às partes inte
ressadas informações exatas sobre o verdadeiro e futuro comportamento
econômico do povo norte-americano, para que o governo pudesse formu
lar as diretrizes econômicas para equilibrar ou prevenir, por exemplo,
perturbações econômicas de natureza perniciosa.6 Os levantamentos
s O leitor curioso pode perguntar: pode-se confiar nos cálculos do censo? Afinal,
as cifras do censo, embora presumivelmente valores de população, têm um número
de fontes de erro que reduzem sua exatidão ideal. Há alguns até que dizem que
confiam mais nos cálculos das amostras que nas cifras do censo. Em todo caso,
as cifras do censo são geralmente bastante exatas. E, afinal, é preciso usar
alguma coisa para verificar os cálculos das amostras!
6 Para um breve relato destes levantamentos e outros estudos aplicados, veja
Likert e Hayes (1957). i
172
anuais foram, evidentemeníe, altamente eficazes e forneceram informação
nacional exata sobre a renda e suas fontes, poupança, dívidas, bens de
consumo, intenções do consumidor e assim por diante.
Levantamentos de interesse para os pesquisadores comportamentais
têm focalizado pessoas e fatos vitais relacionados a elas, suas crenças,
opiniões, atitudes, valores, motivos e comportamentos. Apesar de que a
habilidade na realização de entrevistas, bem como o uso de formulários
cuidadosamente planejados predominam nos levantamentos, usam-se
também outros métodos de observação. Em resumo, o levantamento é
uma forma de investigação sociológica (com fortes implicações psico
lógicas, naturalmente) amplamente usada, especialmente para metas
práticas e de formulação de diretrizes, e que influenciou a pesquisa com-
portamental principalmente com seu procedimento de entrevista e amos
tragem, como já foi mencionado. Os resultados foram, notavelmente,
exatos e generalizáveis. Podemos confiar em tais resultados, se obtidos
através de amostragem aleatória feita pelas melhores organizações espe
cializadas em levantamentos. Vamos dirigir nossa atenção agora para
uma forma de análise comum e importante que é usada em levanta
mentos e em outras formas de investigação sociológica.
Análise de freqüências
Foram apresentados vários exemplos de análises de freqüências

anteriormente, sem explanação técnica. Estas .explanações não foram
dadas porque os exemplos nos pareciam tão óbvios que não achamos
necessária uma explanação. Por que não antecipar a explanação? Porque
a prevalência de tais análises exige compreensão dos princípios envolvi
dos. Alem disso, precisamos equilibrar nossa preocupação anterior com
analise que usa estatísticas de tendência central e variabilidade.
Uma freqüência é simplesmente uma contagem de alguma coisa.
Se tivermos uma amostra de 300 indivíduos e contarmos homens e mulhe
res, estes números são freqüências. Mais exatamente, freqüência é o
número de indivíduos em uma de duas ou mais categorias ou classes.
Se tivermos 152 mulheres e 148 homens na amostra, 152 e 148 são
freqüências, números que caem nas duas categorias, homens e mulheres.7
Em pesquisa, as tabulações de diversas categorias e as freqüências nelas
7 Os dicionários dão uma definição diferente. Dizem que freqüência é a razão

entre o numero que está em uma classe ou categoria e o número total que está
sendo classificado; no exemplo acima, 152/300 e 148/300 seriam freqüências.
Na verdade, estas são. "freqüências relativas”. Usamos a definição mais simples
para evitar confusão. F
observadas são chamadas distribuições de freqüencici. São essas distri
buições de freqüência que aparecem geralmente em publicações popula
res. Mas elas não nos interessam; geralmente não expressam relações
entre variáveis.
Cruzamentos e cálculo de porcentagem
O que nos interessa é estabelecer as distribuições de freqüência em

oposição. Tais distribuições geralmente são pequenas, isto é, com poucas
categorias. Quando assim fazemos, elas são chamadas cruzamentos ou,
mais tecnicamente, partições cruzadas. A tabela 10.2 traz um cruza
mento. Observe que as duas variáveis, classe social e desmame, estão
colocadas uma contra a outra. Isto é, as células da tabela expressam a
co-ocorrência das duas variáveis. As freqüências nas células “ expressam”
a relação entre as duas variáveis. Falando claramente, descobrimos que
33 mães que eram de classe média desmamaram cedo, 22 desmamaram
tarde e assim por diante. Esta é a forma mais simples de cruzamento,
duas células por duas células, que expressam a relação mais simples
possível.
As tabelas 10.1 e 10.3 também contêm cruzamentos dois por dois,
mas as freqüências foram convertidas em porcentagens para realçar a
força das relações nas tabelas. O cruzamento da tabela 10.4, também
em forma de porcentagem, é, na realidade, quatro cruzamentos. Cada
linha é mais uma replicação do que uma categoria de uma variável
— com metade de uma categoria, nível de escolaridade, omitida. (Os 36
por cento na primeira célula significam que 36 por cento dos que
foram à escola primária, no grupo de idade 25-36, sabiam as perguntas
de conhecimentos. Isto implica, naturalmente, que 64 por cento não as
sabiam. As tabelas de cruzamento são freqüentemente truncadas desta
maneira.)
A conversão das freqüências de uma tabela em porcentagens é feita
para facilitar “ver a relação” e avaliar sua força. A regra para conversão
é: “ Calcule as porcentagens da variável ou variáveis independentes para
a variável dependente” . ®Por exemplo, na tabela 10.2, a variável inde
pendente é classe social e a variável dependente é desmame. Portanto, as
porcentagens são calculadas ao longo da linhas (33/55 = 0,60 = 60 por
cento e assim por diante). Na tabela 10.1, a variável independente é
liderança de comunidade, ou líderes e não-líderes, e a variável depen
dente é tolerância, ou respostas Sim ou Não a questões sobre não-confor-*
8 Há uma razão estatística por trás desta regra. Veja Kerlinger (1973, pp. 162-166)
para a explicação técnica. Damos uma explicação não-técnica mais adiante.1
174
midade religiosa. Observe como a força da relação se mostra clara
mente nas duas tabelas. Se as porcentagens fossem calculadas de outra
forma, pelas colunas, a direção da relação ficaria expressa incorreta
mente e talvez levasse a conclusão errada. Tais tabelas calculadas incorre
tamente já foram publicadas. (Não importa se as porcentagens forem
calculadas por linhas ou por colunas, contanto que a regra de calcular
da variável independente para a variável dependente seja seguida.)
Um exemplo de possível cálculo incorreto de porcentagens
Tentando ajudar a desenvolver a compreensão do leitor quanto a

problemas, relações, análises e inferências, vamos discutir agora um
problema sutil e interessante em conexão com o que provavelmente seja
uma análise incorreta contida em um importante relatório do governo
sobre desordens civis (Report of The National Advisory Committee on
Civil Disorders, 1968). Em 1967, o Presidente Lyndon Johnson nomeou
uma comissão para investigar e estudar os distúrbios raciais que estavam
ocorrendo nas cidades norte-americanas. Sua ordem executiva dizia:
“A Comissão investigará e fará recomendações a respeito de: (1) As
origens dos grandes distúrbios recentes em nossas cidades, incluindo as
causas e fatores básicos que levaram a tais distúrbios. . . ” (ibidem,
p. 534). A partir de um levantamento feito em Newark, foram obtidas
as respostas dos participantes (P) e das pessoas não-envolvidas (NE) nos
distúrbios à questão: “Às vezes eu odeio os brancos”. A tabela apresen
tada pela Comissão é dada na tabela 10.6 (ibid., p. 176).
As porcentagens dadas na tabela foram calculadas da participação
em distúrbios, como uma variável, para a atitude em relação aos brancos,
putra variável (indicada pelo acordo ou desacordo com a afirmação),
rode ser mostrado, a partir da teoria das probabilidades, que porcenta
gens são realmente o ciue se chama probabilidades condicionais (Kerlin-
ger, 1973, pp. 164-165) cujo enunciado correto é derivado do problema
original de pesquisa. O problema original de pesquisa, neste caso, deriva
da ordem do Presidente. Se as causas dos distúrbios são o problema,
como ficou indicado na ordem, então o enunciado se p, então q, é; se p,
então distúrbio, com distúrbio sendo a variável dependente. O p repre
senta as causas investigadas. Mas na tabela 10.6 a forma como as
porcentagens foram calculdadas faz p distúrbios e q atitude, o que inverte
as variáveis independente e dependente. As porcentagens na tabela, em
outras palavras, implicam na afirmativa: “ se distúrbio, então atitude”
ou “se perturbador, então atitude negativa para com os brancos”.
A afirmativa não é desarrazoada, mas não parece estar de conformi
dade com o problema enunciado pelo Presidente Johnson. Parece expli-
Tabela 10.6 Resposta dos participantes era distúrbios (P) e pessoas não-envolvidas
(NE) à questão: “ Às vezes eu odeio os brancos”, Relatório dos Distúrbios Civis.
P (N = 105) N E^N = 126
Concordo 72,4% 50,0%

Discordo 27,6% 50,0%
100,0 % 100,0 %
car as atitudes, mas não os distúrbios. O que se deseja dos dados é uma
resposta à questão: “Qual é a probabilidade de distúrbios, dada a atitu
de?” Pode ser mostrado que essa probabilidade é obtida calculando-se
as porcentagens (mais exatamente, as proporções) das freqüências origi
nais através das linhas. As freqüências originais das quatro células da
tabela foram obtidas das freqüências de P e NE (105 e 126) dadas pela
comissão. As porcentagens, então, foram calculadas da atitude para os
distúrbios, ou nas linhas. Estas porcentagens estão na tabela 10.7 (os
valores foram arredondados). São equivalentes a dizer: “Se atitude, então
distúrbio”.
Tomando essas porcentagens como probabilidade, lê-se, por exem
plo: “A probabilidade de distúrbios, dada a concordância com a afirma
tiva: ‘Às vezes eu odeio os brancos’, é 0,55 (ou 55 por cento)”. Ê óbvio
que essas probabilidades ou porcentagens contam uma história diferente
da do relatório da Comissão. Nesta tabela toma-se importante o desa
cordo com a afirmativa. Dado o desacordo com a afirmativa, a probabili
dade é de 0,68 de que indivíduos não se envolverão. Dado o acordo, a
probabilidade é de 0,55 de que os indivíduos participarão dos tumultos.
Mais importante, as porcentagens ou probabilidades na tabela 10.7 estão
em consonância com as ordens do Presidente; as da tabela 10.6 parecem
não estar em consonância com elas.
Este exemplo é particularmente difícil porque, neste caso, podem
ser oferecidos argumentos razoáveis para ambos os métodos de calcular
as porcentagens, já que a atribuição e objetivo da comissão foram, entre
tanto, determinar por que ocorriam as perturbações, o peso do argumento
parece cair para o lado do cálculo de porcentagens da tabela 10.7 e
contra o da tabela 10.6. O enunciado correto do problema, na forma
“se p, então q”, é: se atitude, então perturbação e não se perturbadores,
então atitude.
O exemplo foi explanado mais extensamente para dar ao leitor algo
mais que a oportunidade de um rápido olhar para um problema de
análise e interpretação interessante e importante. Pode-se ter ganho
também maior compreensão da análise de cruzamentos simples. O pro
blema substantivo é importante tanto teórica quanto praticamente. O
176
Taòe/a 10.7 Respostas de participantes em distúrbios (P) e pessoas não-envolvidas
(NE), com porcentagens calculadas por linhas. F envolvidas
NE
Concordo 55% 45% 100%

Discordo 32% 68 % 100%
“ °md0 Premente à Comissão é quase equivalente a estabelecer um

problema cientifico: O que causou os distúrbios raciais?” Isto é, sem
duvida, um desafie) para os psicólogos e sociólogos criarem uma teoria
para explicar a violência racial, a tensão racial e as atitudes raciais
assim como _determinar os fatos do preconceito e da discriminação!
Creio que nao preciso enfatizar a importância do problema.
Outras formas de análise de freqüências e cruzamento
só ^ ruzamentos têm várias formas e modelos. Até aqui examinamos

so o tipo mais simples com apenas duas variáveis, uma independente
e uma dependente, e duas células para cada variável. Outras formas
sao possíveis, naturalmente: 2 x 4, 3 x 4, e assim por diante. É possível
também ter-se mais de duas variáveis. Além de três, entretanto — duas
vanaveis independente e uma dependente — torna-se difícil e proble
mática a analise e a interpretação. Há também outros modelos e tabelas
Um modeio frequente omite parte da participação. Isto é, em vez de
tabelas completas que exprimam todos os aspectos das variáveis
omitem-se uma ou mais células. A tabela 10.4 é um exemplo. As por
centagens relatadas sao apenas metade da história. Por exemplo, no nível
de idade 25-36, 36 por cento dos que tiveram escolaridade primária
tiveram o conhecimento acadêmico testado. E a percentagem dos que
nao tiija m conhecimento acadêmico? Neste caso, naturalmente, 64 por
cento. Esta implícito. Se o leitor compreender os princípios básicos, mais
facil se torna ler e mterpretar a maioria das tabelas de freqüência e
porcentagem.
Investigação sociológica: uma rápida perspectiva
É facilmente possível escrever um livro inteiro sobre o que foi

A r e? gaÇã° s1?CÍ0lÓgÍCa‘ Aliás’ tais livros foram escritos.
A abordagem adotada neste livro, entretanto, enfatiza a pesquisa experi
mental e a mensuraçao de variáveis contínuas às expensas da ênfase na
177
investigação sociológica, porque tal abordagem provavelmente esteja mais
próxima da natureza da ciência, como em grande parte do estudo experi
mental e não-experimental de relações. Quando possível e conveniente,
a experimentação deveria ser feita em laboratório e no campo, pelos moti
vos dados anteriormente. Quando possível, as variáveis deveriain ser
medidas usando escalas de valores que pudessem ser atribuídas aos obje
tos medidos. Isso não significa que a pesquisa não-experimental não seja
importante e necessária. Não significa também que a mensuração que
permita apenas contagem9 — como a contagem de Stouffer de respostas
Sim e Não (tabela 10.1), ou a contagem de Hyman e outros de números
de indivíduos em diferentes níveis de escolaridade (tabela 10.4) — não
seja necessária e importante. Em suma, ambas as abordagens são
necessárias e indispensáveis na pesquisa comportamental.
A investigação sociológica, então, é uma parte extensa e muito
importante da pesquisa comportamental contemporânea. Pode-se até dizer
— e certamente seria dito por alguns pensadores — que é mais impor
tante do que a investigação experimental. Considere os levantamentos
e os estudos em larga escala como o relatório Coleman, Igualdade de
Oportunidades Educacionais. Pode-se dizer ou mesmo tomar por implíci
to que, por haver menos controle e menos certeza de inferência, a
pesquisa não seja importante? Um dos objetivos deste livro é ajudar o
leitor a compreender a tela enorme onde está pintada a pesquisa experi
mental e a riqueza e variedade de cores que os cientistas comportamen-
tais usam na pintura. Foram dados grandes passos científicos neste século,
principalmente na conceitualização de problemas de pesquisa e na meto
dologia. A investigação sociológica fez e continuará a fazer parte impor
tante, ativa e criativa do esforço geral.
9 Alguns especialistas consideram que contar objetos incluídos em categorias não

é propriamente mensuração. Outros dizem que é mensuração, chamada mensu
ração nominal. Tomo a última posição por causa da definição de mensuração
como a atribuição de algarismos a objetos de acordo com regras. Atribuem-se,
com efeito, l’s e 0’s a indivíduos. A regra é: se um indivíduo pertence a uma
categoria, atribua 1; se não, atribua 0. Um exemplo é sexo: atribua 1 para
masculino, 0 para feminino (ou vice-versa).
178
11. A a b o r d a g e m m u lt iv a r ia d a :
r e g r e s s ã o m ú lt ip l a e p a r t iç ã o d a v a r iâ n c ia
A realização de crianças na escola tornou-se foco de intensa atenção

da pesquisa. Psicólogos, sociólogos, economistas e educadores estão
fazendo estudos e análises tentando compreender e prever a realização.
A realização sempre foi, naturalmente, mais ou menos estudada. Hoje,
entretanto, a abordagem é o que pode ser chamada multivariável, ou
multivariada. “Multivariada” significa “muitas variáveis” . Tornou-se de
conhecimento geral entre os cientistas comportamentais que quase qual
quer fenômeno tem muitas determinantes e não apenas uma ou duas.
A realização de crianças na escola é um grande exemplo. Assim, se
quisermos compreender e poder prever a realização, devemos estudar de
alguma forma os efeitos de muitas variáveis sobre a realização. Sem
dúvida, se quisermos compreender qualquer fenômeno complexo psico
lógico, sociológico ou educacional, devemos freqüentemente abordar o
problema de maneira multivariada.
Uma divergência técnica: partição da variância
Para podermos falar inteligentemente sobre a abordagem multiva

riada aos fenômenos e dados comportamentais, precisamos compreender
uma idéia relativamente simples mas àltamente técnica, a partição da
variância. Se medirmos a realização verbal de crianças com algum tipo
de teste, obteremos uma nota de realização verbal para cada criança.
As notas serão diferentes umas das outras; em geral haverá diferenças
individuais consideráveis. Algumas crianças vão se sair muito bem e
vamos supor que tiveram grande realização. Outras nem tanto e vamos
acreditar que não tiveram a realização que desejaríamos. As notas
variam; em outras palavras, mostram variabilidade ou, mais tecnica
mente, variância.
Variância .significa duas coisas em pesquisa; primeiro é usada como
termo geral para expressar a variabilidade das características de indi
víduos e objetos, para expressar as diferenças nas características. Dizem
os pesquisadores: “A variância de realização naquela escola é maior que
a variância de realização nesta escola”. Significa que as diferenças de
179
realização entre alunos da primeira escola é maior que as diferenças de
realização na segunda. Mais •especificamente, a amplitude das notas de
realização na primeira escola é maior que a amplitude das notas de
realização na segunda escola. Este significado de variância é geralmente
associado a diferenças individuais entre crianças em características psi
cológicas. Pode também ser associado, entretanto, a diferenças entre
objetos e grupos. Diz-se, por exemplo, que as notas médias de realização
de classes, ou escolas, diferem. Aqui estamos falando sobre as variâncias
de classes e escolas. A idéia de diferenças individuais, então, é geral,
desde que definamos “individual” de maneira ampla.
O segundo significado ou uso de variância é mais sutil e mais
técnico, mas muitíssimo útil, como veremos. Aqui os pesquisadores
falam sobre a quantidade de variância em uma variável dependente
sendo “devida a” ou “explicada por” uma manipulação experimental
ou por outras variáveis. Por exemplo: “A manipulação de autoridade
explicou 20 por cento da variância das medidas de obediência”. Supondo
que houvesse dois grupos experimentais, a afirmativa significa que a
diferença média entre os dois grupos — ou a variância entre os dois
grupos — foi “responsável” por 20 por cento da variância total das
medidas da variável dependente, obediência.
Um enunciado mais complexo que reflete este segundo significado
da variância e seu uso é: “A inteligência foi responsável pela maior
parte da variância de realização. As atitudes das crianças e seu ambiente
familiar foram também responsáveis por substanciais porções da variân
cia. As variáveis escolares foram responsáveis apenas por uma pequena
porção da variância”. Este enunciado especifica a influência na variabili
dade de uma variável dependente, realização, de quatro variáveis inde
pendentes: inteligência, atitudes, ambiente familiar e variáveis escolares.
O enunciado sobre a manipulação de autoridade como sendo res
ponsável por 20 por cento da variância de obediência é um enunciado
univariado: só uma variável independente, autoridade, afeta a variável
dependente, obediência. O enunciado mais complexo especifica a influên
cia sobre a variabilidade de uma variável dependente de quatro variáveis
independentes. Ê uma afirmativa multivariada: diz-se que mais de uma
variável independente influencia uma variável dependente.1
Naturalmente encontramos tais problemas em capítulos anteriores.
Por exemplo, os delineamentos experimentais fatoriais foram discutidos no
capítulo 7. Aqui e ali em outros capítulos foram mencionados problemasi
i Esta afirmativa não é bem exata. “Multivariada", estritamente falando, refere-se

a mais de uma variável independente e mais de uma dependente. Neste livro
consideraremos qualquer situação em que haja duas ou mais variáveis indepen
dentes e uma ou mais variáveis dependentes como multivariadas.
180
Biultivariados. A variação f a variância foram também discutidas. Agora
pfecisamos ir mais adiante e mais a fundo.
^ Vamos examinar a realização de crianças do ponto de vista de
Variância. Queremos conhecer as principais influências sobre a realização
escolar, e obtivemos em uma pesquisa com 300 crianças, digamos, seis
medidas de variáveis consideradas de influência sobre a realização. Preci
samos estudar as relações bastante complexas entre, por um lado, a reali
zação verbal medida por um teste compreensivo de realização verbal, e,
por outro, inteligência, motivação, atitude em relação à escola, ambiente
familiar classe social e sexo. Admitimos que dispomos de medidas válidas
c fidedignas de todas as variáveis.
Primeiro, consideremos a figura 11,1, que se acredita representar
0 efeito apenas da inteligência sobre a realização. A área total do círculo
representa a variância total das notas dos testes de 300 crianças do nono
ano, digamos. Sabemos que uma porção desta variância total, que repre
senta as diferenças individuais das crianças no teste de realização, é
devida a diferença na inteligência das crianças. Isto é, algumas crianças
realizam mais e melhor porque têm inteligência superior; algumas não
realizam tanto nem tão bem porque têm menos inteligência. A porção
da variância "devida” a inteligência é representada na figura pela área
sombreada. 2 Ela ocupa cerca de um terço da área do círculo. É bastante
realfstico: muitas vezès a inteligência é responsável por toda essa variân
cia de realização verbal. Se considerarmos a área total do círculo igual
Variância
devida à
Inteligência
130%)
Variância de
realização
Figura 11.1
2 Expressões que implicam “causa” são difíceis de evitar. Por exemplo, expressões
como devido a” “variância explicada por”, “influências” e outras têm pelo menos
umi ligeira conotação causai. Não é intencional, todavia. É um subproduto da
piguagem, que é sempre rica em atribuições causais. Voltaremos mais tarde a
Hlta diticuldade.
a cera por cento, podemos mostrar aproximadamente quanto da variância
de realização é “explicado” por inteligência e pelas outras variáveis.
Neste caso, a inteligência é responsável por cerca de 30 por cento.
Sabemos, naturalmente, que a inteligência não é a única variável
de influência. A área maior, nao sombreada, expressa a variancia nao
explicada pela inteligência (70 por cento). Se soubéssemos mais sobre
realização, poderiamos sombrear mais o círculo. Aliás, se tivéssemcs
conhecimento completo — se conhecéssemos todas as influências sobre
a realização — poderiamos sombreá-lo inteiro. Provavelmente jamais
poderemos conhecer todas as influências. Sem dúvida, raramente pode
mos sombrear mais da metade do círculo quando falamos sobre reali
zação. Em todo caso, tomemos outras variável, ambiente familiar. Na
figura 11.2 a variância de realização devida ao ambiente familiar é
mostrada. É cerca de 10 por cento da variância total, digamos.
As figuras 11.1 e 11.2 expressam os efeitos separados de inteli
gência e ambiente familiar. Se essas duas variáveis fossem completa
mente independentes ou não relacionadas uma com a outra — se a
magnitude da relação entre elas fosse zero — então a situação quanto à
variância se parecería à da figura 11.3. A área sombreada total ocupa
30% + 10% = 40% da área total e as duas áreas sombreadas não
se sobrepõem. Se é satisfeita a condição de independência (a falta de
superposição na figura), então pode-se dizer que 40 por cento da variân
cia de realização são devidos à inteligência e ambiente familiar, juntos.
No melhor de todos os mundos de pesquisa possíveis, as variáveis
independentes seriam independentes uma das outras ou não-correlacio-
nadas. (Naturalmente não é por serem independentes umas das outras
Variância
explicada por
ambiente familiar
( 10%)
Variância de
realização
Figura 11.2
182
Variância de
ambiente
familiar
( 10% )
Variância de
Inteligência
(30%)
Variância de
realização
Figura 11.3
que elas são chamadas “ independentes”.) Isto é, a magnitude de suas

relações seria zero. É difícil explicar claramente essas idéias sem detalhes
técnicos, especialmente detalhes técnicos sobre o assunto “correlação”
e os cálculos de coeficientes de correlação ou relação. Vamos então
conciliar e desviar a discussão um pouco para discutirmos correlação e
coeficientes de correlação de maneira não-técnica. Nossas discussões
anteriores de correlação, embora suficientes para as discussões de antes,
não são suficientes agora para nos permitir discussão mais complexa.
Correlação, coeficientes de correlação e variância compartilhada
No capítulo 4, as relações foram discutidas e ilustradas. Ficou visto

que uma relação é um conjunto de pares ordenados e que é possível
calcular a direção e a magnitude das relações. (Sugerimos que o leitor
leia novamente a seção do capítulo 4 “Direção e Magnitude das Rela-
Çõcs”.) A variação simultânea de dois conjuntos de medidas produz
correlação, positiva ou negativa, com magnitudes variando de — 1,00
até 0 a +1,00, +1,00, indicando uma correlação positiva perfeita, ■—
—1,00, uma correlação negativa perfeita, e 0 "nenhuma correlação” ou
falta de correlação. Estas três magnitudes de correlação ficaram ilustra
das com números simples na tabela 4.1. As magnitudes situadas entre
estes valores extremos são muito mais prováveis de ocorrerem: 0,06; 0,42;
— 0,28 e assim por diante.
O leitor agora precisa aceitar novamente o que segue como certo
porque o cálculo estatístico e a prova matemática não fazem parte deste
livro. É preciso também que ele ou ela tenha um pouco de paciência.
(Provavelmente valerá a pena.) O símbolo r é usado para significar
coeficiente de correlação. Por exemplo, r = 0,70 significa que a correlação
entre duas variáveis é 0,70. Se r = 0, não há variação conjunta ou conco
mitante entre duas variáveis. Não se pode dizer nada sobre uma
variável a partir do conhecimento de outra variável. Pode-se dizer que
as duas variáveis são "independentes”. Se a correlação entre inteligência
e realização fosse zero, não se poderia predizer nada sobre a realização
das crianças a partir de suas notas nos testes de inteligência. Se for
calculada a correlação entre dois conjuntos de números aleatórios, o
coeficiente de correlação se aproximaria de 0.
Uma aplicação importante da idéia de independência neste sentido
foi introduzida por uma “dica” dada no capítulo 7, onde foram discuti
dos os delineamentos fatoriais de pesquisa. Diz-se que as variáveis inde
pendentes manipuladas em delineamentos fatoriais são independentes,
significando que sua correlação é zero — por definição, já que os sujei
tos são designados às células de tal delineamento ao acaso. Esta é uma
propriedade altamente técnica dos experimentos, cuja discussão completa
devemos abandonar, Ê bastante dizer que significa que os efeitos de
tais variáveis independentes podem ser avaliados e interpretados inde
pendentemente uns dos outros. Isto significa que podemos falar sobre
o efeito da variável A, sem termos que levar em conta a variável B,
e vice-versa.
Os coeficientes de correlação (as chamadas correlações momento-
produto, que são as mais usadas) têm uma bonita propriedade que
realça sua interpretação. Se o coeficiente de correlação entre duas
variáveis for elevado ao quadrado, o coeficiente elevado ao quadrado
indica a variância que as duas variáveis compartilham. No capítulo 4
esta variância compartilhada foi chamada covariân cia . Por exemplo, se
a correlação entre inteligência e realização é 0,60, então a variância
compartilhada é indicada por (0,60) 2 = 0,36, que significa que as duas
variáveis têm 36 por cento de sua variância em comum. Na figura 11.1
a variância de realização devida a inteligência foi dada como 30 por
cento. Este é realmente um coeficiente, de correlação elevado ao quadra
do, e pode ser interpretado como porcentagem ou proporção. (Podemos
calcular facilmente o coeficiente original invertendo o procedimento: tire
a raiz quadrada da porcentagem [a proporção]: v Ó ,3 0 = 0,55. O
coeficiente de correlação entre inteligência e realização, neste caso,
é 0,55.)
E x p lica n d o a variân cia qu a n d o as v a riá veis

in d ep en d en tes são correlacion adas
Novamente, se as variáveis independentes não são correlacionadas

(r = 0), é relativamente fácil analisar e interpretar as pesquisas cõm
184
mais de uma variável independente. Sob tais condições simples e “puras”
podem-se calcular os coeficientes de correlação entre cada uma das
variáveis independentes e a variável dependente, somar os r 2 separados
e concluir quanto da variância total de realização é explicado pelas
variáveis independentes. Na figura 11.3, por exemplo, soma-se 0,30 +
0,10 = 0,40; ou 40 por cento da variância é explicada. Pode-se ainda
falar inequivocamente sobre as contribuições separadas à variância de
realização das duas variáveis independentes: neste caso das duas
variáveis independentes, 30 por cento e 10 por cento.
O mesmo raciocínio e cálculos podem ser aplicados a todas as seis
variáveis independentes mencionadas anteriormente — contanto que as
seis variáveis sejam independentes entre si. Uma situação hipotética,
mostrando os coeficientes de correlação entre cada uma das seis variáveis
independentes e realização, é mostrada na figura 11.4. Embora o exem
plo seja fictício, as porcentagens de variância indicadas não são irrealis
tas, embora sejam provavelmente grandes demais comparadas às propor
ções de variância obtidas em pesquisas verdadeiras. A questão é a adição
das variâncias sob a condição de independência e a interpretação das con
tribuições separadas à variância de realização. A variância total explicada
é 0,30 -f- 0,10 + 0,08 + 0,10 + 0,06 -j- 0,02 = 0,66, ou 66 por
cento da variância de aproveitamento é explicada pelas seis variáveis.
A grande dificuldade neste não-melhor-dos-mundos-da-pesquisa,
entretanto, é que variáveis independentes como estas são quase sempre
correlacionadas, e às vezes substancialmente. (Daremos exemplos de
pesquisas reais mais adiante.) Por exemplo, há uma correlação positiva
entre inteligência e ambiente familiar. Suponhamos que seja r = 0,30,
Ambiente familiar
( 0 ,10)
teligência
,30)
Sexo
( 0 ,02)
Ftyura 11.4
185
um número não irrealista. Então inteligência e ambiente familiar têm
algum a coisa em comum ( r 2 = [0,30] 2 = 0,09), o que significa natu
ralmente que elas não são independentes uma da outra. Isto quer dizer
que a suposição de independência das variáveis independentes aceita
antes é falsa, que por sua vez significa que as interpretações dos dados
feitas antes são também falsas!
Olhe a figura 11.5, onde está esboçada a nova situação de correla
ção das três variáveis. As correlações entre inteligência e realização, e
entre ambiente familiar e realização são ainda as mesmas. Mas agora a
correlação entre inteligência e ambiente familiar já não é mais zero,
como na figura 11.3, mas 0,30. Isto, na figura 11.5, é equivalente a
0,302 = 0,09, ou 9 por cento das variâncias de inteligência e ambiente
familiar são compartilhados. Não podemos mais falar sobre o efeito da
inteligência sobre a realização sem levar em conta até certo ponto o
ambiente familiar. Em outras palavras, quando há correlações maiores
que zero (ou menores que zero) entre as variáveis independentes, a
interpretação dos resultados da pesquisa é mais difícil e complexa.
Representar a situação da figura 11.4, quando as variáveis são
correlacionadas, é difícil. Tal figura não apenas se torna confusa por
causa das superposições das variâncias: a verdadeira situação (as corre
lações entre as variáveis e suas covariâncias) pode ultrapassar e ultra
passa as duas dimensões da superfície do papel. Vamos abandonar, pelo
menos temporariamente, os diagramas e mudar de assunto, mas sem
abandonar o tema principal.
Ambiente
familiar
( 0 , 10)
realização
Figura 11.5
186
Regressão múltipla
Muitos especialistas podem considerar o assunto de regressão múlti

pla — a análise fatorial e outras abordagens e métodos multivariados —
Pão apropriados para um livro como este. Afinal, o propósito do livro é
introduzir o leitor à pesquisa científica comportamental de forma con
ceituai e não-técnica. A resposta é simples: não é possível compreender
a moderna pesquisa comportamental sem compreender as abordagens
multivariadas e as idéias por trás delas. Mais ainda, um livro sobre
pesquisa comportamental que não leve em consideração tais abordagens
e técnicas analíticas tão importantes como regressão múltipla e análise
fatorial seria imediatamente obsoleto. Estas abordagens são importantes
demais para serem negligenciadas. Desempenham um papel por demais
ativo e funcional nas cenas contemporâneas e futuras da pesquisa com
portamental. Em todo caso, enfrentamos a tarefa de compreender essas
metodologias complexas sem muita elaboração técnica. Talvez a melhor
maneira de fazer o trabalho seja aquela que já usamos muito: através
de um exemplo real de pesquisa seguido de explanações das idéias por
detrás do pensamento e análise.
Predizendo a realização na escola secundária:

o estudo de Holtzman e Brown
Tem havido vários estudos sobre sucesso e fracasso na escola

secundária e na universidade. São os geralmente chamados estudos predi-
tivos: os pesquisadores predizem a realização no secundário e na univer
sidade usando diversas variáveis independentes como indicadores predi-
tivos. Por exemplo, inteligência e média global do 2.° grau (a média de
todas as notas que o estudante recebe no 2.° grau) são bons indicadores
preditivos no sentido de que explicam porções substanciais da variância
de sucesso e falta de sucesso na escola. (Lembre-se de que a variância
da variável dependente significa diferenças entre estudantes, neste caso,
gligamos, as diferenças refletidas pelas notas no segundo grau.) Em tais
pesquisas um procedimento comum é administrar duas ou mais medidas
aos estudantes — ou usar medidas já administradas pelo sistema escolar
— e correlacioná-las com uma medida de sucesso, real ou presumido,
no trabalho acadêmico. Através de um procedimento estatístico, calcu
la-se o “ efeito” combinado ou conjunto das variáveis independentes
lobre a variável dependente. Ê também feita geralmente uma tentativa
de avaliar as contribuições de cada uma das variáveis independentes.
Bssim como combinações de variáveis independentes. O primeiro passo é
pjnparativamente simples; o segundo é mais difícil e arriscado.
A predição do sucesso na escola às vezes é conseguida parcialmente
usando-se como indicador preditivo alguma medida de aptidão acadêmica,
ou medida geral de capacidade para o trabalho escolar. Holtzman e
Brown (1968) usaram uma tal medida com 1.648 alunos da sétima série.
Usada sozinha, a medida explicou 37 por cento da variância das notas
no secundário. A predição, então, da variável independente, aptidão
acadêmica, para a variável dependente, notas, teve sucesso no sentido
de que uma porção substancial da variância de notas no secundário foi
compartilhada com a variável preditiva, aptidão acadêmica. Esta é uma
descoberta comum na pesquisa educacional: testes de habilidade geral,
tais como testes de inteligência, testes de aptidão geral (principalmente
de aptidão verbal) e testes de aptidão acadêmica predizem bem para o
sucesso escolar.
A abordagem preditiva é, entretanto, muito mais sofisticada do que
isto. Há muito se sabe que é necessário bem mais para a realização
escolar do que capacidade intelectual, por mais importante que seja.
Há anos, então, os pesquisadores educacionais têm usado outras medidas
para melhorar a predição. Vamos supor que temos dois testes e que
saibamos que cada um deles prediz bastante bem o sucesso escolar.
Poderemos colocá-los juntos na forma do exemplo mostrado na figura
11.3 e melhorar a predição? Se um teste, um teste de capacidade geral,
é responsável por 30 por cento da variância de sucesso escolar e um
segundo teste é responsável por 10 por cento, poderemos somar as duas
porcentagens para obter a quantia total de variância explicada por ambos
os testes? Se os dois testes preditores são independentes um do outro —
se r 12 (o coeficiente de correlação entre os testes 1 e 2) é 0, em outras
palavras — a resposta é Sim. Mas se os dois testes não forem indepen
dentes um do outro, então as duas porcentagens não podem ser somadas
de maneira simples. Tal situação foi mostrada na figura 11.5, onde as
variáveis independentes eram correlacionadas positivamente e assim
compartilhavam variância entre si, assim como com a variável depen
dente.
No estudo de Holzman e Brown, o teste de aptidão acadêmica
explicou 37 por cento da variância das notas no secundário. Holztman
e Brown usaram também uma medida complexa de hábitos de estudo e
atitudes, que sozinha foi responsável por 30 por cento da variância de
notas do segundo grau. Mas a aptidão acadêmica e os hábitos de estudo
e atitudes também compartilharam variância, uma porção da qual foi
também compartilhada com as notas. Há dois problemas principais.
Ambas as variáveis explicam que porção da variância de notas? Em que
cada variável contribui independentemente da outra variável? Por causa
da natureza comparativamente não-ténica de nossa discussão, podemos
responder apenas à primeira questão — mesmo assim, apenas de um
188
modo geral. A resposta à segunda questão é bastante complexa. Vamos
tentar, de qualquer maneira, dar uma resposta aproximada.
V ariância com partilh ada, a equ ação d e regressão m ú ltip la e

p eso s d e regressão
A situação de variância compartilhada, dos dados de Holtzman e

Brown, é representada aproximadamente na figura 11.6. Cada círculo da
figura representa a variância da variável designada (por extenso). O
círculo inferior esquerdo, por exemplo-, representa a variância da aptidão
acadêmica. A variável dependente, o fenômeno a ser explicado (ou
predito) é representado pelo círculo Realização no Curso Secundário.
Os outros dois círculos representam os predítores. Na medida em que a
área da realização escolar é invadida pelos outros dois círculos, a predi
ção é feita com êxito. A área superposta sombreada, denominada AA e
RCS, representa a variância compartilhada pelas variáveis Aptidão Acadê
mica e Realização no Secundário (média de notas). A porção sombreada
HEA e RCS representa a variância de Hábitos de Estudos e Atitudes e
Realização no Secundário. A área duplamente hachuriada representa a
parcela da variância de Realização no Secundário explicada ou predita
pelas duas^ variáveis independentes “ trabalhando juntas’'. Ê esta parcela
da variância de Realização no Secundário que a aptidão acadêmica e os
hábitos de estudo compartilham. Para fins preditivos é, por assim dizer,
redundante. Representa também parte da correlação total entre Aptidão
Acadêmica e Hábitos de Estudo e Atitudes. (Observe que há também
uma pequena porção da superposição entre as duas variáveis indepen
dentes que não faz parte da variável dependente; é a pequena área em
branco abaixo da área duplamente hachuriada.)
HEA e RCS
AA e RCS
AA. HEA e RCS

Figura 11.6
189
A análise de regressão múltipla analisa eficiente e prontamente
situações como esta. Primeiro, calcula-se uma chamada equação de
regressão. Pode ser também chamada equação de predição. Com duas
variáveis independentes, a equação fica assim:
Y’ = a + bi Xi -}- ba X2
Valerá a pena o leitor perder tempo e se dedicar a compreender esta
equação. É teórica e praticamente importante e útil. Y’ representa a
variável dependente, ou pode representar a nota predita para qualquer
indivíduo da amostra estudada, a pode ser desconsiderada: é uma
constante usada para ajustar os valores calculados produzidos pela
substituição de valores apropriados na equação. Xi e X2 representam
os valores ou notas nas duas variáveis independentes, bi e l>2 são chama
dos coeficientes de regressão. Expressam os pesos relativos das duas
variáveis independentes na predição. (Mas veja abaixo).
Os X’s — Xi, X2, . . XK — são notas nas variáveis 1, 2 . . . k.
Isto é, se tivéssemos duas variáveis independentes, como na equação
acima, e 200 sujeitos, cada um dos sujeitos teria 2 notas, uma em
Xi e uma em X2. Um coeficiente b expressa o peso que uma determinada
variável independente tem na situação de regressão, “bi Xi” significa
que qualquer valor de qualquer indivíduo na variável independente 1 é
pesado (multiplicado) por bi. “b2 X2” e, se houvesse mais variáveis
independentes, outros b ’s e X’s, têm significado semelhante. Um coefi
ciente baixo significa que a variável à qual 0 coeficiente está ligado
recebe menor peso na equação. Um alto coeficiente, naturalmente, tem
0 significado oposto.
Suponhamos que tenha sido calculada uma equação de regressão
a partir de um conjunto de dados:
Y’ = 0 ,1 0 + 0 ,6 8 X i + 0,39X 2
Os pesos b de 0,68 e 0,39 indicam que os valores Xi terão peso maior

que os valores X2. Isto significa que Xi é realmente mais importante
que os valores X2 na predição? Não podemos dizer com clareza. A inter
pretação dos pesos de regressão em geral não é tão simples e fácil.
Certamente, se a questão acima ficou usada para predizer o valor Y de
qualquer indivíduo baseado no conhecimento de suas notas nas variáveis
1 e 2, Xi recebería peso maior que X2. Isso, entretanto, nem sempre
significa importância maior.
Tomemos dois casos, digamos os indivíduos 7 e 41 numa amostra
de 50 pessoas. Seus valores de Xi e X2 são (2,4) e (10,5), respectiva
mente. Então, substituindo na equação de regressão:
Indivíduo 7: 0,10 + (0,68) ( 2) + (0,39) (4) = 3,02
Indivíduo 41: 0,10 + (0,68) (10) + (0,39) (5) = 8,85
190
Os valores preditos, ou Y’, dados os dois conjuntos de valores de
Xi e X2, são 3,02 e 8,85. O indivíduo 41 recebe um valor consideravel
mente mais alto em Y’ porque sua nota em Xi é alta e Xi tem mais
peso (0,68) do que X2 (0,39). O oposto é verdadeiro, embora muito
menos precisamente, para o indivíduo 7; sua nota mais alta (4) é X2,
que pesa menos que Xi.
Equações de regressão, tais como a dada acima, permitem a melhor
previsão possível partindo-se de determinados conjuntos de dados.
Nenhuma outra equação ou método (por exemplo, pode-se simplesmente
somar os valores Xi e X2 para descobrir os valores de Y’) oferecerá
predição tão boa.
Se fossem usados números aleatórios em vez de notas verdadeiras
de teste, então a predição seria inútil por que as correlações entre
Xi e Y e X2 e Y estariam próximas de zero. Na medida em que Xi e X2
se correlacionam com Y, a predição será “boa” . As “melhores” predições
são obtidas quando as variáveis independentes, Xi, X2, . . , XK, estão
alta ou substancialmente correlacionadas com Y, a variável dependente,
e as correlações entre as variáveis independentes são baixas. Quanto
mais altas as correlações entre as variáveis independentes, menos as
variáveis sucessivas contribuirão para a predição, e mais difícil e
ambígua será a interpretação.
O que a análise de regressão múltipla faz essencialmente é estimar
os pesos relativos dos coeficientes de regressão a serem ligados aos X’s,
tomando em consideração as relações (correlações) entre os X’s e Y e
entre os X’s. Por exemplo, na equação de regressão dada acima, 0,68
indica a influência relativa de Xi sobre Y, levando em conta a correlação
de Xi com Y e a correlação entre Xi e X2.
Na equação de regressão dada acima, os b’s foram os coeficientes
de regressão. Se as variáveis independentes forem medidas com diferentes
escalas de mensuração — por exemplo, os valores Xi podem ter dois e
três algarismos e os valores X2 podem ter apenas um algarismo — haverá
dificuldade de interpretação, porque um b pode ser maior ou menor que
outro simplesmente por causa da escala de mensuração. Alguns pesqui
sadores preferem portanto usar uma forma de peso de regressão padroni
zado chamada pesos beta, ou /3’s. Tais pesos de regressão geralmente
são calculados rotineiramente por programas de computador e têm certas
virtudes interpretativas. (Têm fraquezas também.) Mais importante, eles
podem ser comparados um com outro.3 Se calcularmos os betas do
estudo de Holtzman e Brown, obteremos a seguinte equação:
3 Na equação e exemplo dados anteriormente, falamos como se os b’s fossem

’s. Isto foi permissível porque Xi e X: tinham a mesma escala de mensuração.
fm muitas situações, entretanto, isto seria difícil ou até impossível.
y’ = 0,40xi + 0,49x2
Observe que não há termo constante, a, e que y’ e xi e X2 aparecem
em letras minúsculas. As letras minúsculas são usadas aqui em lugar de
outros símbolos usados comumente, para simplificar. Eles significam,
com efeito, valores transformados de sorte a serem comparáveis. Aparen
temente, as duas variáveis têm coeficientes de regressão semelhantes;
têm aproximadamente pesos iguais na equação. Obteríamos os mesmos
valores y’ relativos somando simplesmente as medidas xi e x% porque
nenhuma das variáveis possui muito mais peso que a outra.
Avaliando efeitos: o coeficiente de correlação múltipla
Talvez nos seja mais útil, compreensível e interessante perguntar:

“ Quão boa é a predição?” O leitor de estudos sobre pesquisa comporta-
mental contemporânea encontrará freqüentemente uma estatística impor
tante, R, o coeficiente de correlação múltipla. Lembre-se de que um
coeficiente comum de correlação, r, expressa a magnitude da relação
ou correlação entre duas variáveis, X e Y. Expressa o quanto Y varia
com a variação em X, o “caminhar junto” dos valores de X e Y. Expressa
também quão bem Y pode ser predito a partir de X. Aprendemos
também neste capítulo que se r for elevado ao quadrado, r2, isto
expressa a quantidade de variância compartilhada por X e Y. O uso e
interpretação de R são semelhantes. R, o coeficiente de correlação
múltipla, expressa a magnitude da relação entre, por um lado, a melhor
combinação possível de todas as variáveis independentes, e, por outro,
a variável dependente. Suponhamos que vamos calcular com a equação
de regressão os Y’s ou Y’ preditos, para todos os membros de um
grupo cujas notas em vários testes estejam sendo analisadas com
regressão múltipla. Já temos suas notas na variável dependente, Y. Agora,
se calcularmos a correlação, r, entre os dois conjuntos de notas, o (Y*)
predito e o (Y) observado, obteremos o coeficiente de correlação
múltipla, R.
Já examinamos a natureza de r 2, o quadrado do coeficiente de
correlação, e aprendemos que expressa a variância compartilhada por X
e Y. Se fizermos a mesma coisa com R e obtivermos, R 2, podemos inter
pretar a relação mais complexa de forma similar. R 2 expressa a variância
compartilhada por Y e Y’. Mais útil para nós, R 2 expressa a quantidade
de variância de Y, a variável dependente, explicada pela combinação de
regressão de todos os X’s, as variáveis independentes. A figura 11.4
expressava uma situação hipotética e não-realística da quantidade de
variância das notas de realização explicada por seis variáveis indepen
dentes, assumindo-se que todas as correlações entre todas as variáveis
192
independentes fossem zero. A figura 11.5 expressava a variância de
realização explicada por duas variáveis independentes, mas as duas
, variáveis independentes eram, elas mesmas, correlacionadas. É muito
difícil desenhar tal figura com três ou mais variáveis independentes,
tentando representar visualmente todos os r2s. É niuito possível fazê-lo,
entretanto, se usarmos o raciocínio Y e Y ’ que acabou de ser discutido.
A análise de regressão múltipla sempre fornece um R e um R2.
R2 é um índice da quantidade máxima de variância de Y explicada por
todos os X’s, como já ficou dito. Suponhamos que temos uma variável
dependente, realização em leitura, (Y), e duas variáveis independentes,
aptidão verbal (Xi) e motivação de realização (X2). (Motivação de reali
zação é uma medida de quanto o estudante está orientado no sentido
de melhorar na escola.) Suponhamos ainda que a equação de regressão é
a dada acima e que R2 é 0,51. Este R2 é a porcentagem da variância
de realização em leitura devida à melhor combinação estatística possível
de aptidão verbal e motivação de realização. A situação é mostrada na
figura 11.7.
O círculo total representa a variância de Y, realização em leitura,
a variável dependente. A parte sombreada do círculo indica, como sem
pre, a variância de Y explicada por uma combinação de Xi e X2, aptidão
verbal e motivação de realização. A parte em branco indica a variância
da Y não explicada por Xi e X2. É chamada variância residual. Neste
caso é 100 — R2, ou 1,00 — 0,51 = 0,49 ou 49 por cento da variância
de Y. (0,51 é subtraído de 1,00 porque 1,00 é o maior valor que R2
pode ter.) Parte da variância residual é variância de erro, erros casuais
e erros de mensuração. Mas pesquisas futuras usando outras variáveis
Variância de Y
não explicada
por Xi e Xz
Variância de Y
(total do círculo)
Figura 11.7
independentes podem ser capazes de reduzir esta variância residual. Por
exemplo, se acrescentássemos medidas de aptidão aritmética, classe social
e ambiente familiar à análise de regressão, a área sombreada sem dúvida
aumentaria, diminuindo a parte em branco. Em outras palavras, a
predição de realização em leitura melhoraria, e a quantidade de vanancia
desconhecida seria assim diminuída.
Dois estudos
Embora a regressão múltipla tenha sido muito usada em pesquisa

comportamental, pode-se dizer com segurança que seu uso apenas come
çou. Certamente tem sido muito menos usada do que a análise^ de
variância, às vezes em casos onde devesse ser usada em lugar da análise
• de variância. Em geral, a análise de variância é apropriada para dados
' experimentais. A regressão múltipla, entretanto, é apropriada tanto para
dados experimentais quanto para não-experimentais. É admiravelmente
conveniente à análise de dados mistos, dados de pesquisa em que uma ou
mais variáveis tenham sido manipuladas e também na qual haja uma
ou mais variáveis-atributos. Por isso foi chamada de abordagem geral,
ou método geral de análise de dados (quando há uma variável depen
dente).
Apresentamos resumos de duas pesquisas onde foi usada a regressão
múltipla como principal ferramenta analítica. Como veremos, a regressão
múltipla se adaptou admiravelmente aos problemas dos estudos. Sem
dúvida, é difícil imaginar qualquer outra abordagem. Os dois estudos
são muito diferentes em sua substância e propósito, mas compartilham
uma característica importante: ambos usaram variáveis ecológicas ou
ambientais para explicar fenômenos importantes. Ilustram também um
certo número de itens que tentamos estabelecer sobre a abordagem
multivariada em geral e sobre a regressão múltipla em particular.
Marjoribanks: ambiente, etnia e capacidade mental
Marjoribanks (1972), num estudo competente e imaginoso de

influências sobre a capacidade mental, usou um método para medir o
que denominou pressão ambiental, ou influência do ambiente. Havia
oito “forças ambientais” : pressão para realização, pressão para inte
lectualidade, pressão para a independência e assim por diante. Cada
força ambiental era medida com vários' itens chamados características
ambientais. Por exemplo: a pressão para a realização tinha, entre outros,
os seguintes itens: a expectativa dos pais para a educação da criança,
as próprias aspirações dos pais e a valorização das realizações educa-
194
cionais. O instrumento era administrado em entrevistas nas casas das
crianças. Em resumo, foi medido o ambiente de aprendizado da casa
com o instrumento, sob a suposição de que o ambiente familiar da
criança tinha poderosa influência sobre sua capacidade mental e reali
zação.
Marjoribanks desejava estudar a influência das forças ambientais
sobre o desenvolvimento entre cinco grupos étnicos canadenses: índios,
canadenses franceses, judeus, italianos do sul e protestantes anglo-saxões.
A variável dependente do estudo era desenvolvimento mental; foi medida
por quatro subtestes de um conhecidíssimo teste de capacidade mental,
o SRA, Teste de Capacidades Primárias: Verbal, Numérica, Espacial,
W4
Raciocínio. Assim, havia na realidade quatro variáveis dependentes, ou
quatro aspectos da variável dependente básica, capacidade mental. Havia
(X I
duas variáveis independentes: força ambiental e grupo étnico, ou etnia.
tvv
A pergunta básica, então, foi: “Como a força ambiental e a etnia afetam
o desenvolvimento mental?” Marjoribanks desejava saber como cada
variável independente afetava separadamente o desenvolvimento mental
e como afetavam o desenvolvimento mental em conjunto.
A amostra consistiu de 37 famílias, 18 de classe média e 19 d
classe inferior de cada grupo étnico, ou um total de 185 famílias.
Os cinco grupos étnicos diferiam significativamente nos perfis das quatro
capacidades mentais. As maiores diferenças estavam na capacidade
verbal, como já era de se esperar. Estamos mais interessados, entretanto,
na análise de regressão múltipla de Marjoribanks, na qual as caracterís
ticas aditivas (e subtrativas) de R2 foram usadas. Vamos examinar os
resultados de capacidade verbal e de capacidade de raciocínio.
O R que expressava a correlação entre capacidade verbal, por
um lado, e a combinação de ambiente e etnia, por outro, foi 0,78.
Isto é, a correlação entre os Y’ previstos, fornecidos pela equação de
regressão que incluía as duas variáveis independentes, ambiente e etnia,
e os Y’s obtidos, as notas verdadeiras de capacidade verbal, foi 0,78.
Elevando esse R ao quadrado, Marjoribanks obteve R2 = 0,782 = 0,61.
Isto foi interpretado como antes: 61 por cento da variância de capaci
dade verbal foram explicados por etnia em combinação com o ambiente,
uma porção substancial da variância. Aparentemente, podemos dizer
que os fatores ambientais e participação no grupo étnico '■— as diferenças
entre os grupos étnicos — têm uma forte influência na capacidade
verbal. E é certamente uma informação importante e valiosa. Diz-nos
pouco, entretanto, das “influências” separadas das duas variáveis.
Marjoribanks então calculou as análises de regressão separadas, uma
entre capacidade verbal e ambiente e outra entre capacidade verbal e
etnia. Os R2 foram: 0,50 para capacidade verbal e ambiente e 0,45 para
capacidade verbal é etnia. Para obter estimativas das influências sepa-
radas de cada uma dessas variáveis, ele subtraiu seus R2’s obtidos separa
damente do R2 obtido das duas juntas. O último, lembre-se, era 0 61.
Portanto, o efeito separado do ambiente é calculado subtraindo o R de
etnia, ou 0,45, de 0,61: 0.61 — 0,45 = 0,16. Assim, 16 por cento da
capacidade verbal era explicada apenas pelo ambiente. O efeito separado
da etnia foi obtido de maneira semelhante: o R2 de ambiente ioi
subtraído do R2 de ambiente e etnia: 0,61 — 0,50 = 0,11. Assim,
11 por cento da variância de capacidade verbal foi explicado pela etnia,
ou participação no grupo étnico.
Este procedimento aparentemente complexo é até bem simples.
Calcula-se o R2 do efeito conjunto das duas variáveis. Isto fornece a
variância total de capacidade verbal devida a ambas as variáveis
trabalhando juntas, por assim dizer. Subtrai-se, então, por sim vez, os
R2 devidos a cada variável. Isso mostra os cálculos de influencia de
cada variável livres da influência de outra variável. E a variância do
efeito conjunto de ambas as variáveis que ainda não foi explicado.
Afinal os efeitos separados do ambiente e etnia somam apenas a:
0,16 + 0,11 = 0,27. Assim, sobram: 0,61 — 0,27 = 0,34. Este R
é a parte da variância total resultante tanto do ambiente quanto da etnia,
e que é devido a ambas as variáveis trabalhando evidentemente juntas
sem poderem ser separadas. Em outras palavras, as duas variáveis tem
influências separadas e uma influência conjunta que não pode ser
desmembrada.
No que se refere à melhor predição de capacidade verbal, a análise
acima não importa. Marjoribanks pode dizer simplesmente que 61 por
cento da variância de capacidade verbal são devidos a ambiente e etnia,
e em futuras situações podemos usar ambas — e outras, talvez para
predizer capacidade verbal. A explicação científica, entretanto, exige
mais que isso. Queremos conhecer as influências relativas de variáveis
independentes em seus efeitos sobre uma variável dependente. Queremos
explicar com maior profundidade e detalhes possíveis o fenômeno de
interesse e não apenas predizê-lo. Marjoribanks, em sua análise, preten
deu tanto a predição quanto a explicação. Vou tentar expressar estas
idéias de uma maneira um tanto diferente.
Alguns resultados da análise de regressão múltipla de Marjoribanks
foram dados na tabela 11.1. Das quatro variáveis dependentes, apenas
as análises de capacidade verbal e de capacidade de raciocínio estão
incluídas na tabela. As variâncias totais de ambas as capacidades juntas,
Ambiente + Etnia, são 0,61 para capacidade verbal e 0,22 para capaci
dade de raciocínio. O 0,61 é a proporção (ou porcentagem) da variancia
de capacidade verbal resultante do ambiente e da etnia. A cifra compa
rável para capacidade de raciocínio é 0,22, muito menos. Estas podem
ser consideradas as variâncias “totais” explicadas, e desejamos calcular
196
bs contribuições separadas das duas variáveis independentes, ambiente
0 etnia. O ambiente responde por 0,50 da variância da capacidade
verbal. A etnia responde por 0,45 da variância. As cifras comparáveis
para capacidade de raciocínio são 0,16 e 0,08. Portanto, vamos nos
concentrar em capacidade verbal para reforçar a discussão anterior.
As proporções 0,50 para ambiente e 0,45 para etnia não são,
entretanto, estimativas “puras” das contribuições à variância de capaci
dade verbal dessas variáveis porque uma parcela de cada proporção de
variância é compartilhada pela outra variável independente. Portanto,
essa parte devida à outra variável deve ser subtraída da contribuição
conjunta de ambas as variáveis. Estes restos são indicados por A — B e
A — C na tabela. A — B = 0,11, por exemplo, significa: da contribui
ção “total” conjunta do ambiente e da etnia (A), 0,11, ou 11 por cento,
restara depois de subtrairmos o efeito do ambiente, ou 0,61 — 0,50
= 0 , 11.
Se voltarmos a usar os círculos das figuras anteriores, as coisas po
dem ficar claras. Na figura 11.8 usamos o método de descrição de variân
cia da figura 11.6. O círculo superior representa a variância de capaci
dade verbal, os dois inferiores as variâncias de ambiente e etnia. A área
sombreada entre capacidade verbal e ambiente representa 0,50 da
tabela 11.1 e a área sombreada entre capacidade verbal e etnía repre
senta os 0,45 da tabela 11.1. A área demarcada com linhas mais escura à
esquerda representa a variância de capacidade verbal devida ao ambiente
apenas (0,16), enquanto que a área semelhante à direita representa a
variância de capacidade verbal devida a etnia, apenas (0,11). Observe
Tabela 11.1 Variâncias explicadas por ambiente e etnia, estudo de Marjoribanks

(1972) *.
Variável Variável
dependente independente R*
p-------------------------------------------------------------------------------------
Capacidade verbal Ambiente + Etnia (À) 0,61
Ambiente (B) 0,50
Etnia (C) 0,45
Efeito da etnia apenas = A —B = 0,11
Efeito do ambiente apenas = A — C = 0,16
Capacidade de raciocínio Ambiente + Etnia (A) 0,22
Ambiente (B) 0,16
Etnia (C) 0,08
Efeito da etnia apenas = A — B = 0,06
Efeito do ambiente apenas = A — C = 0,14
* Esta tabela foi derivada das tabelas 5 e 6 de Marjoribanks. £ um pouco dife

rente de suas tabelas.
Figura 11.8
também que uma porção substancial da variância de capacidade verbal é

devida a ambas as variáveis em conjunto (a área duplamente sombreada).
Assim, as duas influências trabalham juntas em uma grande extensão;
não podem ser separadas (0,34: 0,50 — 0,16, ou 0,45 — 0,11). Há
também variância compartilhada pelo ambiente e etnia que não está
relacionada à capacidade verbal (a área em branco compartilhada por
elas).
Considerando os valores da tabela 11.1, podemos chegar a duas ou
três conclusões. Tanto o ambiente quanto a etnia parecem ter consi
derável “influência” sobre a capacidade verbal, especialmente quando
“trabalham juntos” (34 por cento). Suas contribuições em separado,
embora não enormes, são apreciáveis (11 por cento e 16 por cento).
A “influência” do ambiente independente da etnia parece ser maior
que a “influência” da etnia independente do ambiente (16 por cento
versus 11 por cento). Análise semelhante pode ser aplicada à capacidade
de raciocínio. Notamos especialmente que ambiente e etnia não são evi
dentemente nem de perto tão fortemente relacionados à capacidade de
raciocínio como a capacidade verbal. Não e difícil compreender esta
importante descoberta. Deixamos para o leitor deduzir o motivo.
Discutimos este exemplo detalhadamente por causa da importância
e significância do assunto em si e por causa da importância da análise
de regressão. Um método de análise que pode desemaranhar influências
complexas desta forma é muito valioso. Além disso, examinamos seu uso
com apenas duas variáveis independente. É também aplicável com mais
de duas variáveis independentes, embora a análise e interpretação
tornem-se muito mais complexas, difíceis e às vezes até imprecisas.
(Marjoribanks sabiamente escolheu tratar suas oito medidas ambientais
como uma variável independente em sua análise — depois de estabelecer
198
primeiro que eram todas, em substância, positivamente relacionadas,
indicando que todas estavam medindo mais ou menos a mesma coisa.)
0 leitor deve também ficar alerta. Como todos os métodos de análise
estatística, este revela apenas as estimativas dos valores dos R2. Às vezes
os R2’s podem ser tendenciosos e enganosos. Analistas e pesquisadores
competentes não usarão os R2’s sozinhos em suas análises e interpre
tações. Usarão também coeficientes de regressão, as correlações originais
de onde os R2’s emergem, outras estatísticas e resultados de outros
pesquisadores.
Talvez, acima de tudo, os pesquisadores serão extremamente cuida
dosos em fazer afirmativas causais. Embora tenhamos usado expressões
como “explicada por” e “efeitos”, implicações causais, embora talvez
inevitáveis por causa de conotações de linguagem, não foram intencio
nais. Na pesquisa de Marjoribanks, é particularmente importante ater-se
a esta orientação. Quando falamos da influência da etnia na capacidade
verbal, por exemplo, certamente pensamos na influência que o grupo
étnico exerce sobre a criança em sua capacidade verbal — por motivos
óbvios. Mas a afirmativa de pesquisa mais exata é que há diferenças de
habilidade verbal entre, digamos, canadenses anglo-saxões e canadenses
franceses. Mas essa é uma diferença funcional em capacidade na língua
inglesa. Não queremos dizer que ser anglo-saxão de alguma forma
“causa” uma melhor capacidade verbal em geral do que ser canadense
francês. A maneira mais segura de raciocinar provavelmente seja pèla
afirmativa condicional tão enfatizada neste livro: “ Se p, então q”, com
uma relativa ausência de implicação causai.
Cutright: análise de regressão e correlações altas
A análise e os resultados de um estudo feito por Cutright (1963)

pode aumentar nossa compreensão de uma abordagem multivariada a
problemas científicos e práticos. Pode também nos alertar para uma
dificuldade particular de interpretação que ocorre freqüentemente na
investigação sociológica. Ilustrará também interessante mensuração das
Chamadas variáveis ecológicas.
Cutright desejava estudar o desenvolvimento político de 77 nações.
Em vez de usar indivíduos ou pequenos grupos, como unidade de análise,
Cutright usou países inteiros. Para isso, ele construiu uma medida com
plexa de desenvolvimento político dando pontos diferentes aos países
por seu relativo desenvolvimento nos ramos executivo e legislativo do
gpverno, por exemplo, um ponto por ano em que uma nação tinha um
Chefe executivo eleito por voto direto em eleição competitiva. A medida
fesultante era a variável dependente. As variáveis independentes eram
também medidas complexas — de comunicação, urbanização, educação
e agricultura.
As correlações entre cada uma das variáveis individuais e a variável
dependente, desenvolvimento político, eram altas: de 0,69 a 0,81 (uma
era negativa e alta também). Mas as correlações entre as variáveis inde
pendentes eram mais altas ainda: 0,74 a 0,88. Isto apresenta um
problema em análise de regressão múltipla. Lembre-se de que a situação
ideal de predição é altas correlações entre as variáveis independentes e
a variável dependente e baixas correlações entre as variáveis independen-,
tes. (Marjoribanks contornou este problema combinando as variáveis'in
dependentes em uma única variável independente, depois que uma análise
separada mostrou que as oito variáveis de ambiente eram mais ou menos
medidas da mesma variável básica, como indicado anteriormente.)
Quando as correlações entre as variáveis independentes são substanciais,
surgem problemas técnicos que tornam a interpretação dos resultados
difícil e ambígua. Cutright tinha bastante consciência do problema e
interpretou cuidadosamente seus resultados.
Em todo caso, o coeficiente de correlação múltipla, R, era 0,82 e
R2 era 0,67. Mas o R2 (na verdade r2) entre desenvolvimento político e
apenas uma de suas variáveis independentes, comunicação, foi 0,65!
Assim, as variáveis independentes adicionais acrescentavam apenas 0,02
à predição de desenvolvimento político! Cutright não estava contente,
entretanto, apenas com esta alta predição. Usando raciocínio de regressão,
ele conseguiu interpretar o desenvolvimento político de nações indivi
duais. Sua idéia, basicamente, era predizer o desenvolvimento esperado
de cada nação, usando a equação de regressão calculada. Isto é o mesmo
que calcular os Y’s preditos, ou Y’s discutidos anteriormente, usando a
informação obtida sobre as variáveis independentes. Ou seja, para cada
nação ele substituiu os valores que obteve de cada variável independente
para aquela nação e então calculou Y \ o valor esperado baseado na
equação.
Por exemplo, vamos supor que ele obteve os seguintes valores de
X para determinado país: 7 para comunicação, 6 para urbanização, 6
para educação e 2 para agricultura. E suponhamos que a equação de
regressão calculada de todos os dados fosse:
Y' = 9,0 + 0,82Xi + 0,74X2 + 0,60X3 - 0,65X4
Então, o Y predito, ou Y \ seria:
Y5 = 9,0 + (0,82) (7) + (0,74) (6) + (0,60) (6) - (0,65) (2) = 21,48
Suponhamos ainda que o valor obtido de Y, a nota de desenvolvimento
político, foi 14,50. Cutright então podia raciocinar que 0 desenvolvi-
200
E S poIítlc<? da ”ação sob anáIise era mais baixo do que se esperava
^ d e v e ria ^ lS X M e Comu™ a&°>Jurbanização, educação e agricultura,'
21 4R m * f bt d ?ma n°ta de desenvolvimento político de cerca de
f v 4? ' ^ asÍ 01 p°ns,deravelmente mais baixa, 14,50. Em todo ca«o o
de. Cutrigbt é bom exemplo de pesquisa sócio-científlca
contemporane3 sobre um fenômeno interessante e importante, o desenvol-
^ ^ maneÍra “ “ Uise de
12. A abordagem multivariada:
análise fatorial
Quando penso em análise fatorial, duas palavras me vêm à mente:

“curiosidade” e “parcimônia” . Parece ser um par muitíssimo estranho —
mas não em relação à análise fatorial. Curiosidade quer dizer querer
saber o que existe em um lugar, como funciona, por que está ali e por
que funciona. Significa também o desejo ou a vontade de penetrar as
coisas, de saber o que há por trás delas. Os cientistas são curiosos.
Querem saber o que existe e por que existe. Querem saber o que há por
detrás das coisas. E querem fazer isso da maneira mais parcimoniosa
possível. Não querem uma explanação elaborada quando não é
necessário. A explicação mais simples possível é a melhor — embora
nem sempre: a este ideal podemos chamar o princípio da parcimônia.
Para explicar as coisas, precisamos tentar reduzir as massas de
informação e fenômenos que nos rodeiam a forma e tamanho manejável.
Nos nossos esforços para explicar os fenômenos tentamos reduzir os
domínios amplos e confusos das variáveis, por exemplo, a domínios
menores e mais compreensíveis. Suponhamos que estamos trabalhando
em uma área de interesse e temos à nossa frente centenas de variáveis
que talvez se relacionem à área de interesse. Uma centena de variáveis
é demais; não podemos realmente agarrar tantas variáveis. Será possível
reduzir-lhes o número? Sabemos por exeperiência que muitas das cem
variáveis são correlacionadas entre si. É possível descobrir quais das
variáveis estão correlacionadas com iguais outras, e o quanto estão
correlacionadas? Por esta informação, é possível combinar, juntar de
alguma forma as variáveis correlacionadas umas com as outras ou
agrupá-las para “criar” variáveis novas e em menor número?
Suponhamos que tudo isto seja possível. Criar variáveis novas e
em número menòr satisfará minha curiosidade original em relação à .
coisa que me deixou curioso? Certamente a redução de variáveis ou do
número de variáveis parece parcimoniosa. Se tivermos, digamos, 12
variáveis em vez de cem, temos uma situação mais parcimoniosa. Pelo
menos achamos e esperamos. Por que insistimos em parcimônia? É tão
importante?
Em geral os cientistas acreditam que a explicação mais simples, mais
parcimoniosa, é a melhor explicação. Isto porque, se deixarmos as
202
explicações e razões se multiplicarem, vamos terminar em confusão, ou
com uma situação tão complexa que não poderemos dominá-la. Mas parte
de tudo isso é questão de fé. Temos fé em que haja geralmente uma
explicação mais simples para a maioria dos fenômenos. O fato de isso
nem sempre ser verdade não muda a fé. Em todo caso, buscar explicações
mais simples, e depois testar suas implicações, são preocupações científi
cas fortíssimas.
Um dos mais poderosos métodos já inventados para reduzir a com
plexidade de variáveis a maior simplicidade é a análise fatorial. Análise
fatorial é um método analítico para determinar o número e natureza das
variáveis subjacentes a um grande número de variáveis ou medidas.
Ajuda o pesquisador, com efeito, a saber que testes devem ficar juntos
— quais os que virtualmente medem a mesma coisa, em outras palavras,
e o quanto medem a mesma coisa. As “variáveis subjacentes”, nesta defi
nição, são chamadas ‘‘fatores". Alguém chamou a análise fatorial a rainha
dos métodos analíticos. Por quê? Vamos tomar um exemplo famoso, inte
ligência e sua natureza, para tentar compreender esta invenção notável e
a definição dada acima. Inteligência é um bom exemplo por. causa de seu
interesse intrínseco, prático e -teórico, e porque muito se conhece a
seu respeito agora — embora grande parte ainda continue um mistério.
Antes de começarmos esta discussão, vamos fazer uma digressão para
definir certos termos e' expressões comumente usados na análise fatorial
e na análise multivariada.
Uma digressão definicional
Como ficou indicado, um fator é uma variável subjacente e não-

observada que presumivelmente “explica” testes, medidas ou itens obser
vados. Na próxima seção deste capítulo damos um exemplo de análise
fatorial de testes de inteligência. Três dos testes medem três aspectos da
inteligência verbal: Sentenças, Vocabulário e Completamento. Desco
briu-se que estes testes medem uma coisa em comum. O estudo do
conteúdo dos testes parece indicar que o algo subjacente que é medido é
capacidade verbal. “Capacidade Verbal”, então, é um fator.
Mais precisamente, um fator é um constructo, uma entidade hipo
tética, uma variável não-observada, que se supõe estar subjacente a
testes, escalas, itens e, de fato, medidas de qualquer espécie. Houve
controvérsias quanto aos fatores e análise fatorial, tuna boa parte origi
nada da suposta “realidade” dos fatores. Deixemos claro que a única
“realidade” que possuem os fatores reside em explicarem a variância de
variáveis observadas, tal como se revela pelas correlações entre as
variáveis.
Uma palavra que aparece freqüentemente em análise fatorial e
análise multivariada em geral é “ matriz”. Sem dúvida, a álgebra das
matrizes, álgebra que usa matrizes em vez de símbolos individuais, é
uma ferramenta importante na matemática da análise multivariada. Uma
matriz é uma ordenação retangular de números — embora possa haver
matrizes formadas de outros símbolos também. As matrizes podem,
virtualmente, ter qualquer dimensão: 2 x 2 (leia “ dois por dois”),
3 x 20, 15 x 15 e assim por diante. O primeiro número geralmente
representa o número de linhas e o segundo, o número de colunas.
Uma matriz 7 x 3 , então, tem sete linhas e três colunas. A matriz da
tabela 12.1 é uma matriz 8 x 3. A matriz da tabela 12.2 é uma matriz
de correlações 6 x 6 , freqüentemente simbolizada por R. As matrizes
de correlações são simétricas porque a metade inferior abaixo da diagonal
que vai da esquerda superior para a direita inferior e a imagem especular
da metade superior. O tipo de matriz dado na tabela 12.1 e chamado
matriz de cargas fatoriais ou coeficientes fatoriais.
A expressão “carga fatorial” ocorre freqüentemente. Uma matriz de
cargas fatoriais é um dos produtos finais da analise fatorial. Uma carga
fatorial é um coeficiente — um número decimal, positivo ou negativo,
geralmente menor que 1 — que expressa o quanto um teste ou variável
observada está “carregado” ou “ saturado” em um fator. Na tabela 12.1,
as colunas são os fatores, como veremos, e as linhas, os testes ou as
variáveis observadas. O teste Sentenças, por exemplo, está “carregado
0,66 em Verbal (o primeiro fator), enquanto sua carga em Número (o
segundo fator) é apenas de 0,01. Diz-se que as matrizes fatoriais são
rotadas ou não-rotadas. Não precisamos definir o que significam estes
termos. Ê suficiente dizer que as soluções finais de análise fatorial
quase sempre exigem matrizes ou soluções rotadas. As cargas fatoriais
serão definidas mais completamente adiante.
Para nossos propósitos, uma estrutura fatorial é (geralmente) uma
matriz fatorial rotada que mostra a “estrutura”, padrão, ou configuração
dos fatores e variáveis. (“Estrutura fatorial” também tem um significado
técnico que não vamos necessitar em nossa apresentação conceituai.)
Em geral, isto significa quais testes ou variáveis estão carregados em
quais fatores. A tabela 12.1 mostra uma “estrutura fatorial”. Assim
também a tabela 12.4. Mas um gráfico pode também mostrar uma
estrutura fatorial. Nas figuras 12.3 e 12.4 são mostradas estruturas
fatoriais.
O leitor não deverá se preocupar muito se não entender completa
mente o significado destes termos. Eles irão se tomando mais claros à
medida que formos avançando no capítulo. Agora, vejamos a inteligência
abordada através da análise fatorial.
Inteligência e sua natureza
Sempre soubemos que há diferenças enormes na maneira pela qual

as pessoas lidam com problemas. Algumas resolvem-nos rápida, eficiente
e profundamente. Outras não são tão rápidas e eficientes. A amplitude
é enorme: vai desde indivíduos capazes do mais alto grau de compre
ensão intelectual e domínio do pensamento abstrato a indivíduos quase
incapazes de qualquer pensamento abstrato. Em um capítulo anterior
dissemos que, do ponto de vista da pesquisa, seria muito mais simples
se as pessoas tivessem a mesma inteligência, se não houvesse diferenças
individuais de capacidade mental. Mas a dura verdade da existência de
grandes diferenças em capacidade intelectual está aí, e não vai desa
parecer.
Um dos problemas mais difíceis e intrigantes que os psicólogos
modernos enfrentam é a natureza da inteligência. O que é inteligência?
É uma capacidade única, unitária, que todos nós possuímos em grau
menor ou maior? Ou não é “algo”, simplesmente. É um conjunto —
de capacidades mais ou menos relacionadas? A experiência de séculos
produziu argumentos para ambos os pontos de vista — e para outros.
Tais argumentos, entretantos, não são cientificamente satisfatórios. Há
evidência científica sistemática em relação à natureza da inteligência?
Felizmente, há uma grande quantidade de evidência científica. Além
disso, foram feitos grandes avanços em sua mensuração. Paradoxalmente,
entretanto, os psicólogos ainda estão longe de saber com exatidão o
que é inteligência. Sem dúvida, nem podem concordar em uma definição
de inteligência. Isso, entretanto, não é de forma alguma raro em ciência.
Podem ser feitos grande avanços, aumentar o conhecimento e diminuir
a ignorância, embora um problema básico que iniciou a investigação
científica ainda não esteja resolvido.
Um exemplo de pesquisa: Thurstone
No início deste século, houve muita teorização, especulação e

pesquisas sobre a natureza da inteligência (Guilford, 1967). A natureza
é altamente significativa, teórica e praticamente. O conhecimento cientí
fico da natureza da inteligência pode fazer avançar enormemente a
compreensão psicológica dos processos mentais humanos (e animais).
E assim tem sido. Os efeitos oráticos, também, podem ser enormes.
Mas nosso interesse está no método principal de análise usado para
estudar inteligência: análise fatorial. Tentemos compreender a análise
fatorial primeiro estudando a pesquisa de inteligência feita por um dos
grandes psicólogos deste século, Leon Thurstone.
Thurstone acreditava que a inteligência fosse um conjunto de capa
cidades fundamentais separadas mas relacionadas. Depois de conside
rável trabalho criando testes, aplicando-os a muitas crianças e analisando
os resultados, concluiu que havia um certo número de entidades subja
centes a muitos dos testes que ele criara e aplicara às crianças: Percepão,
Número, Fluência de Palavras, Verbal, Espaço, Memória, Raciocínio.
Com efeito, ele propôs uma teoria da estrura da inteligência e o funda
mento da teoria eram essas entidades, ou “fatores”, como ele e outros
as chamaram.
Para esclarecer isto, vejamos os testes da tabela 12.1. Em um
estudo, Thurstone e sua mulher (Thurstone & Thurstone, 1941) apli
caram 60 testes de vários tipos — vocabulário, adição, subtração, multi
plicação, leitura ao espelho, grupos de letras, reconhecimento de figuras,
etc., — a 710 alunos de oitava série. Em pesquisa anterior, Thurstone
Tabela 12.1 Testes selecionados de Thurstone e matriz fatorial rotada \
Testes Verbal Número Percepção
Sentenças 0,66 0,01 0,00

Vocabulário 0,66 0,02 -0 ,0 1
Completamento 0,67 0,00 -0 ,0 1
Adição 0,01 0,64 0,01
Multiplicação -0 ,0 3 0,67 0,01
Identificação de números 0,06 0,40 0,42
Faces 0,04 0,17 0,45
Leitura ao espelho -0 ,0 2 0,09 0,36
a As entradas na tabela são chamadas cargas fatoriais. Podem ser interpretadas

como coeficientes de correlação.
descobrira que análises apropriadas mostravam que certos conjuntos de

testes se agrupavam. Eram correlacionados positivamente, em outras
palavras. Na medida em que dois testes se correlacionem positivamente,
nessa medida (outras coisas mantidas constantes) eles medem a mesma
coisa. Suponhamos que temos três testes e que suas intercorrelações
sejam ri2 = 0,70, ris = 0,64, r2a = 0,57. Os testes são vocabulário,
leitura e escrita de sentenças e completamento de sentenças (quando
apresentadas com palavras omitidas). Qual é o elemento comum nestes
testes? O que que os faz se correlacionarem tão substancialmente?
Thurstone concluiu que era uma capacidade básica associada ao aprendi
zado verbal e materiais verbais. Denominou-a “Verbal” ou “ Capacidade
Verbal”.
206
A tabela 12.1 dá apenas uma pequena parte dos resultados de
Thurstone e Thurstone. Para ilustrar, escolhi apenas três dos seus sete
fatores: Verbal, Número e Percepção. Para o que queremos agora,
entretanto, eles são suficientes. Os nomes de oito dos 60 testes
de Thurstone e Thurstone aparecem no lado esquerdo da tabela. Os
números no corpo da tabela são como coeficientes de correlação e são
chamados “cargas fatoriais”. (Veja definição dada anteriormente.) Quan
to maior o número que acompanha um teste — por exemplo, o teste
Vocabulário tem 0,66 sob Verbal, 0,02 sob Número e —0,01 sob
Percepção — mais o teste está associado ao fator. Estas cargas indicam
que o teste Vocabulário percente ao fator Verbal e não aos fatores
Número ou Percepção.
Examine as cargas sob Verbal. Os três testes mencionados acima
têm as cargas substanciais de 0,66, 0,66 e 0,67. Os outros cinco testes
tê cargas próximas de zero (0,01, — 0,03, e assim por diante). Um ana
lista deverá concluir que estes testes têm alguma coisa em comum —
lembre-se de nossas discussões anteriores sobre correlações, correlações
ao quadrado e variância compartilhada. Os três testes medem alguma
coisa em comum. Se as cargas fossem 1,00, 1,00 e 1,00 (pouquíssimo
provável), o analista concluiría que estariam medindo a mesma coisa
perfeitamente. Se as cargas fossem 0,00, 0,00 e 0,00 (também impro
vável), ele concluiría então que não estariam medindo a mesma coisa.
Já que o elemento ou elementos comuns aos três testes que têm
cargas substanciais estão claramente associados a palavras, o analista
pode concluir aue o “fator” básico comum é capacidade verbal, Assim,
é denominado “Verbal”. Raciocínio semelhante aplica-se aos cinco testes
restantes e dois fatores. Os testes Adição, Mutiplicação e Indefinição
de Números têm cargas substanciais de 0,64, 06,7 e 0,40 no segundo
fator. Eles compartilham processos mentais associados a operações
numéricas. Assim, o fator é chamado “Número”.
Dois dos testes, Faces e Leitura ao Espelho, têm cargas no terceiro
fator, Percepção, e em nenhum outro. O teste Identificação de Números,
entretanto, tem carga no terceiro fator e também no segundo. Isto quer
dizer que é um teste mais complexo. Pode-se dizer que faz parte das
essências da Percepção e do Número. Tais casos ocorrem freqüentemente
em investigações de análise fatorial.
Alguns elementos de análise fatorial
Se for aplicado um teste duas vezes à mesma amostra de indivíduos,

a correlação entre os dois conjuntos de notas deveria ser 1,00. Jamais é
1,00, entretanto, devido aos inevitáveis erros de mensuração. Mas
207
deverá ser alto, se o teste for fidedigno. Se dois testes medirem a mesma
coisa, digamos capacidade verbal, a correlação entre eles, depois de
aplicados à mesma amostra de indivíduos, deverá ser alta, ou pelo menos
substancial. Embora todos os itens possam ser diferentes — dois testes
diferentes de vocabulário, por exemplo — todos eles mais ou menos mos
tram um aspecto da capacidade verbal. Portanto, os indivíduos deveríam
respondê-los de maneira semelhante e deveríam ser classificados pelos
dois testes quase da mesma forma.
Por outro lado, a correlação entre dois testes que medem coisas
muito diferentes, digamos, capacidade verbal e dogmatismo, deveria
ficar próxima de zero. Não há relação sistemática entre os dois conjuntos
de notas fornecidas pela mesma amostra de indivíduos. Naturalmente,
se houve uma relação no momento desconhecida entre capacidade verbal
e dogmatismo — e bem pode haver — então deve haver alguma corre
lação, positiva ou negativa, maior que zero entre os dois testes. Pode ser
que pessoas mais verbais sejam mais dogmáticas. No momento, entre
tanto, não conhecemos nenhum motivo para que haja uma correlação
entre as duas variáveis.
Estas duas condições de correlação estão expressas na figura 12.1.
Cada círculo representa a variância de um teste, como já se fez anterior
mente. (Aconselhamos o leitor a rever rapidamente os capítulos 4, 9 e
principalmente 11. A compreensão da análise fatorial pode ser matsrial-
mente ajudada pela compreensão das relações, correlações, mensuração
e variância compartilhada). Consideremos a situação do diagrama rotu
lado (A). CVi representa Capacidade Verbal 1, o primeiro teste de capa
cidade verbal; CV2 naturalmente representa o segundo teste. Os dois
círculos, cada um representando a variância de seu teste, se sobrepõem
em uma grande área. A situação é comparável à da figura 11.6 do
Figura 12.1
208
capítulo 11, só que aquela figura era mais complexa. No caso presente,
a correlação é cerca de 0,90 porque a maior parte das variâncias dos
dois testes é compartilhada: cerca de 80 por cento (r2 = 0,902 — 0,81).
Isto quer dizer que provavelmente os dois testes estão medindo a mesma
coisa, capacidade verbal.
A situação na figura 12.1. (B) é bem diferente. Nenhuma variância
é compartilhada. A correlação entre os dois testes, capacidade verbal
(CV) e dogmatismo (D) é zero. Eles medem coisas muito diferentes.
As duas condições representadas na figura 12.1 mostram com que
os analistas fatoriais trabalham, a saber, variância compartilhada e os
limites dentro dos quais eles trabalham: entre correlação alta ou substan
cial e correlação zero. Eles procuram descobrir as unidades que formam
a base dos testes e medidas estudando e analisando as correlações entre
os testes, e, partindo das correlações, as variâncias compartilhadas.
O método de análise fatorial possibilita-lhes descobrir as variâncias com
partilhadas dos testes e medidas e determinar as relações entre as diversas
variâncias compartilhadas. Esta conversa é bastante abstrata. Vamos ser
mais concretos e específicos.
Um exemplo fictício, mas não irrealista
Suponhamos que, como Thurstone e muitos outros, eu esteja inte

ressado em “fatores” de capacidade mental. Eu não acredito que capa
cidade mental seja uma coisa unitária, um poder intelectual geral evi
dente em todo o pensamento e ação humanos. Antes, eu suspeito que
haja um número de facetas ou aspectos diferentes de inteligência e
que os indivíduos difiram enormemente em várias dessas facetas. Mas sei
também que há um limite: deve haver um número relativamente pequeno
de facetas e eu quero conhecê-lo. (Uma tarefa difícil, sem dúvida!)
Em nome da simplicidade, suponhamos que o mundo psicológico
da inteligência seja bidimensional, mas que ninguém saiba. Vamos supor
que uma cientista queira compreender a natureza da inteligência humana
e que seja especialista em mensuração psicológica, e que ela acredita
que o “mundo” psicológico da inteligência tenha mais de uma dimensão.
Vamos supor ainda que ela seja radical em sua crença de que quase todos
os psicólogos acreditem que a inteligência seja unidimensional e que,
se se puder entender qual seja a “natureza” dessa dimensão è assumindo
a competência apropriada, os psicólogos podem medir a inteligência e
poderão, com o tempo, entender e conhecer muita coisa a respeito dela.
Antes de continuarmos com o modelo bidimensional , é importante
conhecer as implicações do mundo unidimensional da inteligência. Veja-
mos primeiros os testes de inteligência. Suponhamos que houvesse seis
testes de inteligência publicados. Se dermos ou aplicarmos todos os
seis testes a um grande número de pessoas, digamos 300, e depois calcu
larmos as correlações entre todos os testes, como seriam a,s correlações?
Seriam parecidas com as correlações dadas na matriz de correlações da
tabela 12.2. Todas as correlações são positivas e substanciais. Todos os
seis testes evidentemente medem a mesma coisa, e já que são testes^ de
inteligência, estão medindo inteligência. Os analistas fatoriais diriam
que há um fator a ser derivado da matriz de correlação da tabela 12.2.
Em outras palavras, fizemos uma análise fatorial inspecionai ê con
cluímos, porque todas as correlações entre os testes eram positivas e
substanciais — e todas mais ou menos no mesmo grau de magnitude —-
que há um fator nos dados. E esta conclusão combina com a idéia
anterior de que a inteligência habita um mundo psicológico unidimen-
sional.
Mas tomemos agora um mundo psicológico bidimensional. Como se
pareceria uma matriz de correlação obtida em um mundo como esse?
Vamos voltar à nossa psicóloga radical que acredita que o mundo psico
lógico da inteligência seja bidimensional. Ela crê que todos os testes de
inteligência criados até agora são insatisfatórios porque habitaram um
mundo unidimensional. Poderíam ser satisfatórios se a inteligência fosse,
realmente, unidimensional. Ela acredita, entretanto, que não seja; que e
bidimensional! A “realidade” de seu mundo da inteligência e muito
diferente da “realidade” da crença geral de outros psicólogos. Como
poderá demonstrar sua crença e provar que a crença geral está errada?
Ela acredita que a “entidade” subjacente dos seis testes da tabela
12.2 seja capacidade verbal, já que o estudo cuidadoso dos testes mostra
que todos os seis usam predominantemente itens verbais. Isto é, todos
Tabela 12.2 Correlações entre seis testes em um mundo de inteligência unidi-

mensional.
Testes
1 2 3 4 5 6
1,00 0,62 0,59 0,81 0,67 0,50

1
2 0,62 1,00 0,47 0,72 0,52 0,49
0,59 0,47 1,00 0,69 0,61 0,53
3
4 0,81 0,72 0,69 1,00 0,47 0,41
5 0,67 0,52 0,61 0,47 1,00 0,52
6 0,50 0,49 0,53 0,41 0,52 1,00
210
eles exigem conhecimento verbal, manipulação verbal e raciocínio verbal.
Como seria a matriz das correlações se a metade dos testes exigesse um
tipo diferente de conhecimento, manipulação e raciocínio, digamos,
conhecimento numérico e matemático? A psicóloga prepara três novos
testes, um para medir o conhecimento matemático, outro para manipu
lação matemática e o terceiro para raciocínio matemático. Ela administra
esses teste e três dos testes verbais a uma amostra de pessoas e inter-
correlaciona os seis testes.
Se a crença geral de que inteligência é unidimensional estiver
correta, então a matriz correlações que a psicóloga obtiver deverá ser
muito semelhante à da tabela 12.2; isto é, todos os seis testes deverão
estar positiva e substancialmente correlacionados uns com os outros.
Mas se a crença da psicóloga, de que a inteligência é bidimensional,
estiver correta, então como deveria ser a matriz de correlações? Na
tabela 12.3, à esquerda, é dada uma “matriz-alvo”. Pode ser também
Tabela 12.3 Matriz-alvo e matriz obtida de correlações seis testes de inteligência."
Matriz-alvo b Matriz obtida c
1 2 3 4 5 6 1 2 3 4 5 6
1 1,00 X X 0 0 0 1,00 0,71 0,64 0,15 0,05 0,02

2 1,00 X 0 0 0 1,00 0,58 0,06 0,11 0,01
3 1,00 0 0 0 1,00 0,14 0,05 o;io
4 1,00 X X - 1,00 0,59 0,68
5 1,00 X 1,00 0,64
6 1,00 1,00
* Os testes 1, 2 e 3 são testes verbais; os testes 4, 5 e 6 são testes matemáticos.

b x: correlação substancial positiva predita; 0: correlação predita 0 ou perto de 0.
0 As correlações grifadas são as preditas na matriz-alvo.
chamada “matriz-hipótese”, porque expressa essencialmente o que a

psicóloga supôs. Os testes 1, 2 e 3 são testes verbais; os testes 4, 5 e 6
são testes matemáticos. As cruzes representam as correlações substan
ciais hipotéticas, e os zeros representam as correlações de zero ou próxi
mas de zero.1 À direita da tabela 12.3 é dada a matriz de correlações
que ela realmente obteve. As correlações grifadas — 0,71, 0,64, 0,58 e
1 Na realidade, não se podem esperar correlações zero com medidas de capacidade,

(porque a maioria delas é correlacionada positivamente, pelo menos atá certo
ponto. Usamos um tipo esquematizado de exposição, entretanto, para esclarecer as
Idéias básicas por trás da análise fatorial.
assim por diante — são as preditas como substanciais pela matriz-alvo.
Todas as outras correlações deveríam estar próximas de zero.2
Evidentemente a crença ou hipótese da psicóloga está correta.
Os testes 1, 2 e 3, os testes verbais, estão positiva e substancialmente
correlacionados uns com os outros: ri2 = 0,71, m = 0,64 e r-at == 0,58.
Os testes 4, 5 e 6, testes matemáticos, estão igualmente positiva e
substancialmente correlacionados: r« = 0,59, r-ie = 0,68 e rse = 0,64.
E, mais importante, crucial mesmo, as correlações entre os testes 1, 2 e 3
por um lado, e os testes 4, 5 e 6, por outro, são todas baixas ou próximas
de zero.
A evidência da tabela 12.3 é fortíssima. Vamos sendo obrigados a
crer na validade empírica da teoria da psicóloga. Um único estudo
jamais seria suficiente; provavelmente seja apenas sugestivo. Se forem
feitos estudos mais cuidadosos e controlados e os resultados forem
semelhantes, então a crença é mais obrigatória ainda, Se a teoria da
psicóloga continuar firme sob a crítica construtiva e esforços deliberados
de mostrá-la incorreta através de pesquisa rigorosa planejada especial
mente para demoli-la, poderemos então ficar compelidos a aceitar a teoria
e sua validade. O ponto pertinente a este capítulo é que as tentativas de
usar a evidência empírica para apoiar a teoria exigiam análise fatorial —
ou algum método comparável — porque a hipótese em estudo é estrutu
ral ou pode até ser chamada espacial: em vez de uma dimensão ou
fator de inteligência, há dois.
O exemplo tem aspectos bastante importantes para nos fazer parar
para examiná-los rapidamente. O mais importante tem duas facetas.
Primeiro, uma vez que atualmente sabemos que a inteligência tem mais
de duas dimensões ou fatores, nenhuma das teorias está correta. A primei
ra teoria diz, com efeito, que há uma dimensão ou fator de inteligência.
A segunda teoria diz que há dois. Segundo, embora nenhuma das teorias
esteja correta, uma é mais “correta” do que a outra, no sentido de que
está mais próxima da “verdade”, mais próxima da “ realidade” empírica.
Assim tem sido a história da ciência: melhores aproximações da “ verda
de”, sem contudo jamais chegar a ela.
Uma abordagem quantitativa e espacial da análise fatorial
As matrizes de correlação das tabelas 12.2 e 12.3 forneceram a

evidência para as conclusões alcançadas no exemplo acima. Todo o nosso
2 São dadas apenas as partes superiores das matrizes. Isto é possível porque as
matrizes são simétricas, i.é., suas metades inferiores (abaixo da diagonal da es
querda superior à direita interior), se ciadas, mostrarão as imagens especulares da
metade de cima das matrizes (acima da diagonal).
212
6 523 14
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
Figura 12.2
raciocínio foi baseado nas correlações daquelas tabelas. Os exemplos

foram simples; foram deliberadamente preparados para o objetivo, da
maneira mais simples possível. Geralmente as matrizes de correlação
não são tão favoráveis, nem as teorias e hipóteses tão simples. Em grande
parte, tais matrizes são complexas demais para serem interpretadas direta
mente. Sua complexidade e tamanho — um estudo das correlações entre
20 testes ou variáveis, número não muito grande na moderna pesquisa
comportamental, é o estudo de 190 correlações! — proíbem a interpre
tação direta. As correlações e os fatores dizem realmente a mesma coisa,
naturalmente, mas as correlações geralmente não podem ser tomadas em
sua totalidade, enquanto os fatores freqüentemente podem. A análise
fatorial, assim, reduz a complexidade das correlações originais da tabela
12.2, por exemplo, ao ponto onde podemos representar os testes, como
nas figuras 12.2 e 12.3. O comprimento da linha na figura 12.2 foi
arbitrária e convenientemente igualado a 1,00, para que cada teste tenha
um índice de sua posição na linha ou dimensão, sendo os valores do
índice todos os valores possíveis entre 0 e 1,00, inclusive.3
Para obter os valores representados na linha, as correlações da
tabela 12.2 foram analisadas fatorialmente. Em nosso estudo anterior
desta matriz de correlação, aprendemos que havia apenas uma dimensão
ou fator. Um dos propósitos da análise fatorial foi determinar o valor
que teria cada teste na única dimensão da figura 12.2. Os resultados
da análise fatorial continham os seguintes valores para os testes de
1 a 6: 0,87; 0,75; 0,77; 0,87; 0,74; 0,62. (Não precisamos nos preocupar
com os cálculos realizados.) Seus lugares na linha ou dimensão da figura
12.2 são indicados por setas com os números dos testes afixados. Os seis
valores são altos e semelhantes — neste exemplo artificial e improvável.
Os seis valores são cargas fatoriais, índices que mostram o grau
de relação entre cada teste e a suposta dimensão subjacente ou fator.
Em outras palavras, são as correlações entre cada teste e o fator. Quanto
mais alta a carga fatorial, mais o teste reflete ou mede o fator, mais
3 Estritamente falando, os valores nossíveis deveríam incluir os valores negativos.

Para maior simplicidade, vamos ignorar temporariamente os valores negativos.
De qualquer maneira,' eles não são importantes no estudo da inteligência, já que
quase todas as correlações entre os testes de inteligência são positivas.
213
“representa” o fator, por assim dizer. Cargas iguais ou maiores que 0,40
(às vezes 0,30; às vezes outro critério) são consideradas suficientemente
grandes para merecerem interpretação. Obviamente, todas as cargas
neste exemplo são substanciais. Isso era de se esperar porque todas as
correlações entre os testes foram substanciais. Não percamos mais tempo
com este exemplo tão simples. Em vez disso, voltemos ao exemplo mais
realístico de duas dimensões da tabela 12.3.
Decidimos anteriormente, pela simples inspecção das correlações da
tabela 12.3, que havia duas dimensões ou fatores, porque os testes 1, 2
e 3 estavam correlacionados uns com os outros e não com os testes
4, 5 e 6 e que os testes 4, 5 e 6 estavam correlacionados uns com os
outros e não com os testes 1, 2 e 3. É como se tivéssemos um conjunto
de testes para medir a inclinação religiosa e outro conjunto para medir
aptidão musical. (Supomos que a inclinação e a aptidão não sejam rela
cionadas.) Vamos nos aprofundar mais. A análise fatorial é essencial
mente um método para determinar o número de fatores existentes em
um conjunto de dados, para determinar quais testes ou variáveis perten
cem a quais fatores e em que extensão os testes ou variáveis “pertencem
a” ou estão “ saturados com” o que quer que seja o fator. Se analisarmos
fatorialmente a matriz de correlação da tabela 12.3, obteremos final
mente uma tabela como a dada na tabela 12.4.
Tabela 12.4 Solução final da análise fatorial dos dados da tabela 12.3.
Testes Aa B Tipo de teste
1 0,83 0,07 Verbal

2 0,79 0,06 Verbal
3 0,71 0,11 Verbal
4 0,07 0,77 Matemático
5 0,02 0,74 Matemático
6 -0 ,0 2 0,81 Matemático
“ As cargas iguais ou maiores que 0,40 são consideradas significativas. Estão

grifadas.
Os dois fatores mencionados na tabela e denominados A e B são

“fatores” ou "dimensões” no sentido de que os três testes verbais per
tencem a um fator e três testes matemáticos pertencem ao outro fator.
Antes sabíamos disto, naturalmente; os dados da matriz de correlação
original estavam tão claros que podíamos facilmente “ver os fatores” :
eles foram indicados pelo padrão das correlações maiores e menores.
214
Na maioria dos casos de pesquisa real, com mais variáveis correlacio
nadas de maneira complexa, não é possível “ver os fatores” como acon
teceu na tabela 12.3. Em outras palavras, os dados da tabela 12.4
demonstram o óbvio, o que já sabemos. Foi por isso precisamente que
o exemplo foi manufaturado: para demonstrar o óbvio numa tentativa
de mostrar o que é análise fatorial e o que faz.
Repetindo, se as cargas fatoriais são grandes ou substanciais, aceita
mos que os testes ou variáveis com os quais estão associadas estão “em”
aquele fator. Dizemos que o teste está “ carregado” em um fator. Por
exemplo, os testes 1, 2 e 3 estão “carregados” no fator A, e os testes
4, 5 e 6 estão “carregados” no fator B. Mas as cargas dos testes 1, 2 e 3
no fator B são baixas e insubstanciais e as cargas dos testes 4, 5 e 6
no fator A são baixas e insubstanciais. Em análise fatorial, tanto cargas
altas quanto baixas são importantes na interpretação. Pode-se até dizer
que a situação “ideal” seria a que possuísse cargas fatoriais altas e baixas
e sem valores intermediários. Embora raramente ocorram tais situações,
é bom lembrá-las porque elas definem fatores nítidos relativamente não
relacionados uns com os outros.
A interpretação da tabela 12.4 é fácil. Já que 1, 2 e 3 são testes
verbais, e têm altas cargas no fator A, e já que os testes 4, 5 e 6 têm
cargas baixas em A, o fator é obviamente um fator verbal. Nós o
B (Matemático)
1.0
0,6 -
0,5 -
0,4 -
0,3 -
A (Verbal)
-0,4 - 0,3 -0,2 -0,1 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
- 0,1 -
- 0,2 -
-0,3 -
-0,4 - .
I iíiura 12.3
chamamos, então, "verbal”. Análise e raciocínio semelhante se aplicam
ao fator B. Nós o chamamos “Matemático”. Para esclarecer mais ainda
o que diz a tabela 12.4, vamos representar. Isto foi feito na figura 12.3.
Dois eixos, A e B, foram colocados em ângulo reto. Lembre-se de que
dissemos que os eixos são ortogonais um ao outro. Os valores empa
relhados de A e B da tabela 12.4 são então representados, simplesmente.
Por exemplo, o 0,83 do teste 1 em A e o 0,07 do teste 1 em B são
representados pelo ponto indicado por "1” no gráfico da figura 12.3.
Os cinco pares restantes são representados de modo similar.4
Os blocos, 1, 2, 3 e 4, 5, 6, aparecem claramente. Estão dentro de
um círculo, no gráfico. Os testes 1, 2 e 3 estão bem próximos entre si e
também próximos de A, e altos em A ; os testes 4, 5 e 6 estão próximos
e altos em B. E, muito importante, os dois blocos estão distantes um
do outro. Um é tipo A e o outro tipo B. Os dois fatores e os testes que
os. “definem” são tipos de entidades muito diferentes. Quando eu examino
os três testes de A, para descobrir sua “natureza”, o que é, eu vejo que
todos os três testes são verbais. Quando eu examino os testes B, por
outro lado, descubro que eles compartilham operações, processos e com-
preeensão matemática.
Este exemplo, naturalmente, é muitíssimo simplificado. A maioria
dos domínios nas ciências comportamentais tem mais de dois fatores.
Dificilmente estudaríamos apenas seis testes. As verdadeiras correlações
e matrizes de correlação raramente são tão favoráveis como esta com a
bela estrutura ortogonal que é a figura 12.3. Geralmente, então, o
4 A justificativa para estabelecer os dois eixos nos quais representar as cargas

fatoriais como foi feito na figura 12.3 baseia-se no procedimento matemático que
extrai ou calcula os fatores ou cargas fatoriais. A natureza do método é tal que
cada fator extraído é independente de todos os outros fatores extraídos. Isto signi
fica que os fatores extraídos estão todos em ângulo reto, uns em relação aos outros.
(Substancialmente, por sua vez, isto significa que os fatores são independentes, ou
entidades diferentes.) Assim, se desejarmos representar as cargas fatoriais, nós
podemos fazê-lo usando eixos em ângulo reto, ou "ortogonais’' um ao outro.
Deveria ficar enfatizado que os fatores e as cargas fatoriais da Tabela 12.4
e representados na figura 12.3 são “rotados”. O método de extração fornece
fatores e cargas “não-rotados”, e suas magnitudes geralmente não são prontamente
interpretáveis. O que a rotação faz, aliás, é colocar o máximo possível de cargas
próximas aos eixos que representam os fatores. Observe que, na figura 123, os
pontos representados estão todos próximos dos eixos A ou B. N a solução original
nãoã-rotada esses pontos estavam bastante afastados dos eixos. Por que os pontos
devem ficar próximos dos eixos? Quanto mais próximos os pontos estiverem dos
eixos, maior a magnitude das cargas naquele eixo; e, já que o segundo eixo é
ortogonal ao primeiro, mais baixa ficará a carga no segundo eixo. Note que os
testes 1, 2 e 3 estão próximos e assim altos em A e ao mesmo tempo, baixos
em B, e igualmente os testes 4, 5 e 6 estão perto e assim altos em B e baixos
em A. Em resumo, os fatores e cargas rotados dão solução fatorial mais parci-
moniosa e interpretável do que cargas e fatores não-rotados.
216
R
Cl.
f-w
quadro não é tão claro; é mais nebuloso. De fato, o exemplo é irrealístico

porque testes verbais e matemáticos sempre são positivamente correla
cionados. Na verdade, todos os testes de capacidade são correlacionados
positivamente e tais correlações positivas tornam os resultados das
análises fatoriais menos claros e menos fáceis de serem interpretados.
Se, por exemplo, os testes 1, 2 e 3 da tabela 12.3 estivessem positiva e
substancialmente correlacionados com os testes 4, 5 e 6, então o gráfico
da figura 12.3 seria semelhante ao da figura 12.4. Observe que os
dois blocos estão mais próximos do que estavam. Estão, também, um
pouco distantes dos eixos. Quanto mais altas forem as correlações entre
os dois tipos de testes, mais próximos estarão os blocos.
O raciocínio acima, com apenas duas dimensões, se generalizou
prontamente para mais de duas, ou k dimensões. Para a maioria das
pessoas é fácil visualizar duas dimensões. Muitas podem também lidar
com três. Mas quase ninguém pode visualizar quatro ou mais dimensões.
Entretanto, a análise fatorial extrai habitualmente 4 e mais fatores de
matrizes de correlação e mostra os resultados- de tais análises. Ê facil
mente possível ter 10 fatores em um estudo, com todos eles ortogonais
uns aos outros, isto é, virtualmente independentes uns dos outros, pelo
menos no sentido técnico. Por ser totalmente impossível visualizar 10
dimensões ortogonais, não quer dizer que nossa compreensão dos fatores,
seu significado e sua interpretação, diminuam!
217
Exemplos de análise fatorial em pesquisa
A discussão até aqui foi separada da realidade da pesquisa, a não

ser pela breve referência anterior a Thurstone e seus estudos da inteli
gência. Na verdade, toda nossa discussão tem sido estreita demais porque
focalizou-se exclusivamente em inteligência e na análise fatorial dos resul
tados de testes de inteligência. Mas a análise fatorial foi usada com uma
ampla variedade de medidas: aptidões, atitudes e valores, traços de
personalidade, variáveis ambientais, padrões culturais, traços de honesti
dade e até caixas e xícaras de café! Agora resumiremos e estudaremos
três estudos que empregam análise fatorial, precedidos de uma discussão
das tentativas em larga escala feitas por Guilford e seus colegas para
testar uma ambiciosa teoria sobre a estrutura da inteligência. Foram
escolhidos os três estudos por sua variedade e possível interesse
intrínseco.
, Os estudos de Guilford sobre a estrutura do intelecto
Como já ficou indicado, há várias teorias sobre a estrutura da

inteligência — “estrutura” significando, aproximadamente, fatores e suas
relações. Em um extremo está a teoria que afirma que inteligência é
uma dimensão ampla, chamada inteligência geral. Virtualmente nenhum
psicólogo aceita teoria tão simples, embora muitos aceitem a idéia de
um fator amplo de inteligência geral mais outros fatores. Em um capítulo
anterior, vimos que Cattel (1963), desenvolveu uma teoria na qual duas
“inteligências” gerais são propostas: inteligência cristalizada e inteligên
cia fluida.
Talvez a mais radical das teorias sobre a inteligência, e certamente
uma teoria controvertida e heuristicamente frutífera, seja o modelo da
estrutura de intelecto (EI) proposto por Guilford (1956, 1967). Guilford
diz, com efeito, que há muitos fatores de inteligência e especifica qual
deve ser sua natureza. A teoria é realmente uma organização de fatores
em um complexo sistema de categorias consistindo de três tipos amplos
de categorias mentais: operação, produto e conteúdo. Guilford colocou
esses três princípios organizadores, ou estruturais, em um grande cubo
consistindo em muitos cubos formados pelas intersecções das subclasses
do três princípios estruturais gerais.
Esta descrição abstrata talvez não nos ajude muito a compreender
a idéia básica de Guilford. Vamos tomar o cubo simplificado da figura
12.5, que pretende representar uma teoria estrutural altamente simplifi
cada de inteligência como a de Guilford. (Não há “realidade” nesta figura.
Ê apenas uma conveniência intelectual.) A figura é o cubo mais simples
218
Figura 12.5
• ■U
possível, consistindo e m 2 x 2 x 2 = 8 cubos. Cada dimensão do cubo

foi dicotomizada e rotulada AB, I II e 1 2. A e B representarão verbal
e numérico, I e II perceptual e memória, e 1 e 2, relações e implicações.
Estes três tipos de capacidade intelectual são chamados, respectivamente,
conteúdo, operação e produto. uí a
Pode-se usar o cubo da figura 12.5 — o cubo de Guilford é muito?;
mais complexo, naturalmente — como um modelo da estrutura da inte
ligência, ou do intelecto. Cada cubo do modelo representa um fator.
Por exemplo, AI1 seria um fator com o conteúdo A, operação I e
produto 1. Já que há 8 cubos, há 8 fatores. Em outras palavras, o cubo é
um modelo teórico que pode ser usado para criar testes. Por exemplo,
pode-se escrever três testes para cada célula do cubo, num total de
24 testes. Estes testes podem ser aplicados em um grande número de
crianças, podem ser intercorrelacionados e analisados fatorialmente.
A validade empírica do modelo se apóia nos resultados da análise
fatorial. Existem realmente 8 fatores, e sua natureza corresponde à
natureza “predita” pelo modelo? Além disso, e muito importante, fatores
até agora não descobertos podem ser preditos pelo modelo. Suponhamos,
por exemplo, que o modelo tenha um cubo que descreva um tipo de
operação ou capacidade mental não encontrados até o momento. Por
que não redigir três ou quatro testes para medir a natureza do fator
predito, aplicá-los com outros testes a uma amostra conveniente, analisar
219
fatorialmente os resultados e ver depois se testes novos aparecem juntos
em um novo fator? Foi isso que Guilford e seus colegas fizeram, muitas
vezes com ótimos resultados. Uma dessas descobertas, ou talvez confir
mações, é o conjunto de fatores que se acreditava estarem, e que até
certo ponto se descobriu estarem, associados à criatividade. Foi desco
berto, por exemplo, que uma diferença importante entre as capacidades
de pensar é o pensamento convergente e o pensamento divergente e que
o último está relacionado com a criatividade. (Pensamento convergente é
tipo comum de raciocínio analítico dedutivo. Pensamento divergente está
associado com a elaboração, originalidade, flexibilidade, criatividade e
respostas fluentes e variadas.)
Como foi destacado antes, a análise fatorial foi usada com as
aptidões, atitudes, traços de personalidade e até variáveis de ambiente.
Além do mais, não é necessário que as correlações que sejam analisadas
fatorialmente sejam calculadas apenas a partir de testes. Nos últimos anos
a análise fatorial vem sendo cada vez mais usada com itens, para deter
minar os fatores num único teste ou escala. Tem sido usada também
para analisar fatorialmente as correlações entre as pessoas. Daremos
exemplos das duas possibilidade depois.
Em outras palavras, o método é mais que um método; é também
uma abordagem no sentido de que busca e identifica relações subjacentes
entre as variáveis. Neste contexto, os testes são variáveis, os itens são
variáveis e até pessoas são variáveis. Os exemplos que serão resumidos
representam, cada um, diferentes aspectos da abordagem da análise
fatorial a problemas e dados. No primeiro exemplo os pesquisadores
buscam os fatores por trás da atitude em relação aos pretos. No segundo
exemplo, pessoas foram tratadas como variáveis e analisadas fatorial
mente. E no terceiro e último estudo a ser resumido, os fatores subja
centes a atitudes sociais foram estudados principalmente para testar
uma teoria estrutural de atitudes.
Atitudes raciais: o estudo de Woodmansee e Cook
A maioria das pessoas provavelmente concebe o preconceito racial

como um fenômeno unidimensional. Indivíduos que diferem no grau de
suas atitudes em relação aos pretos, por exemplo, fazem-no numa série
contínua de gostar-desgostar. Esta é uma visão muito simplificada. Na
verdade, as atitudes em relação aos pretos ou a qualquer grupo étnico
são complexas. Há facetas diferentes no gostar ou desgostar de pretos,
judeus, russos, norte-americanos ou qualquer outro grupo. O estudo
científico das atitudes, portanto, exige o uso de algum método ou aborda
gem que ajude os cientistas comportamentais a determinar o que são essas
220
facetas. O estudo que vamos examinar agora é um excelente exemplo
dessa abordagem.
Woodmansee e Cook (1967), num conjunto de estudos sobre o pre
conceito contra os negros, mostraram inegavelmente que tais atitudes são
multidimensionais. Sem dúvida, qualquer concepção simplória de atitu
des étnicas como unidimensionais tem pouquíssimo apoio da análise
fatorial da pesquisa de atitude. Em seus estudos, os dois propósitos
principais de Woodmansee e Cook eram determinar os componentes
(fatores) de atitudes raciais, em particular atitudes em relação aos pretos,
e construir uma escala válida e fidedigna, ou, mais exatamente, construir
um conjunto de escalas para medir tais atitudes.
Em seu primeiro estudo, eles administraram uma escala de atitudes
existentes, de 120 itens, a 593 estudantes universitários norte-americanos
brancos, do Nordeste, Meio-Oeste e Sul. No segundo estudo, revisaram a
escala de atitudes com base no resultados do primeiro estudo e adminis
traram a escala a 609 estudantes semelhantes. O terceiro estudo se
concentrou em melhorar mais ainda a escala, obter evidência da fide-
dignidade e validade da versão final da escala e continuar a investigação
dos fatores subjacentes às atitudes em relação aos pretos.
Vamos nos concentrar nos resultados da análise fatorial de Wood
mansee e Cook. Eles encontraram 11 fatores. O quadro multidimensional
que eles oferecem é interessante e importante tanto científica quanto pra
ticamente. Vamos ter em mente, quando lermos o que se segue, que cada
fator pode ser um modo diferente de perceber os negros, reagir a eles,
de ter crenças em relação a eles. Mas antes de irmos mais adiante,
precisamos ver o que são realmente os fatores. Tem havido muito
mistério em relação aos fatores e análise fatorial. Algumas coisas que já
foram ditas serão necessariamente repetidas, mas tal repetição pode nos
ajudar a compreender fatores.
Uma digressão explanatória: o que são fatores?
O que é um fator, no sentido mais comum? Um fator pode ser

encarado como refletindo uma determinada ordenação dos itens de uma
escala ou teste, ordenação essa com a qual aproximadamente concorda
um número suficiente de pessoas de uma amostra que respondeu à escala.
Pode ainda ser encarado como um subconjunto dos itens de um teste ou
escala, subconjunto esse que é respondido de maneira semelhante por
um número suficiente de pessoas. Eis um exemplo simples. Suponhamos
que seis pessoas tenham que classificar quatro itens de atitude social
em uma escala de seis pontos; elas aprovarão ou desaprovarão as idéias
Sociais implicadas pelos itens através de notas de 1 a 6, 1 indicando
221
pouquíssima aprovação e 6 forte acordo ou aprovação. Os itens serão
palavras soltas e frases curtas que se descobriu serem capazes de medir
atitudes sociais com validade e fidedignidade. São elas, igualdade para as
mulheres, controle de natalidade, propriedade privada, negócios. Deseja
mos descobrir os fatores subjacentes à escala de atitudes de quatro itens.
(Não se esqueça de que naturalmente usaríamos muito mais itens
e pessoas.)
As seis pessoas responderam à escala como fora indicado, resultando
nas médias ou pontos dados na tabela 12.5. A pessoa 3, por exemplo,
desaprovou, ou pelo menos não aprovou, igualdade para as mulheres e
controle de natalidade. Deu a cada um deles a nota relativamente baixa
de 2. Por outro lado, aprovou fortemente propriedade privada e negócios;
deu-lhes 5 e 6 respectivamente. Faça um confronto entre a pessoa 3 e a
pessoa 6, que mostraram padrões opostos: aprovação de igualdade para a
mulher e controle de natalidade e relativa desaprovação de propriedade
privada e negócios. Estes provavelmente sejam os exemplos mais claros
da tabela. Os outros membros da amostra deram respostas mais compos
tas e menos claras.
Tabela 12.5 R esp o stas d e seis p essoas a q u a tro iten s d e a titu d e s o c i a l'.
Ite n s
1 2 3 4
Ig u a ld a d e p / C o n tro le da P ro p rie d a d e
Pessoas as m u lh eres n a ta lid a d e p riv a d a N egócios
1 1 2 4 2
2 1 3 2 2
3 2 2 5 6
4 5 6 5 5
5 6 5 3 4
6 6 6 2 1
“ O s n ú m ero s n a ta b e la são as n o ta s das seis pessoas p a ra os q u a tro re fe re n te s

em um a escala d e 1 a 6, 1 in d ic a n d o m u ito p o u c a a p ro v a ç ã o e 6 in d ic a n d o
fo rtíssim a ap ro v a ç ã o .
Observe agora que os valores das colunas igualdade para as mulheres

e controle da natalidade “caminham juntos”: quando há um valor alto na
primeira coluna, geralmente há um valor alto na segunda e a mesma
coisa para os valores baixos. As colunas propriedade privada e negócios
também tendem a “caminhar juntas”, embora não tão claramente como
as notas nas duas primeiras colunas. Isto significa, então, que igualdade
para as mulheres e controle da natalidade estão positiva e substancial
mente correlacionadas. As correlações são 0,91 e 0,81. As correlações
222
Wltre as notas das colunas 1 e 3 e 1 e 4 e entre 2 e 3 e 2 e 4 parecem
ser baixas; é difícil e mesmo impossível, perceber padrões regulares de
^caminhar juntas”.
As correlações entre os pares de referentes foram calculadas; estão
na tabela 12.6. As correlações formam um padrão muito claro, semelhan
te ao padrão da tabela 12.3, onde foram mostradas as correlações entre
seis testes de inteligência. Igualdade para as mulheres e controle da natali
dade estão altamente correlacionadas, como nossa inspeção anterior nos
levou a crer. Propriedade privada e negócios estão também altamente
Tabela 12.6 M atriz d e co rre la ç õ e s en tre q u a tro iten s d e a titu d e social.
Ig u a ld a d e p a ra C o n tro le d a P ro p rie d a d e
as m u lh eres n a ta lid a d e p riv a d a N egócios
Ig u a ld a d e p a ra
as m u lh e re s 1,00 0,91 - 0 ,1 5 0,04
C o n tro le d a
n a ta lid a d e 0,91 1,00 —0,23 - 0 ,1 1
P ro p rie d a d e
p riv a d a - 0 ,1 5 - 0 ,2 3 1,00 0,81
N egócios 0,04 - 0 ,1 1 0,81 1,00
correlacionados. Evidentemente temos dois tipos diferentes de referentes:

a amostra de pessoas respondeu a eles bem diferentemente. Entretanto, as
correlações entre 1 e 3, 2 e 3 e entre 2 e 3 e 2 e 4 são todas baixas, a
maioria baixa e negativa.
À primeira vista, a matriz de correlação da tabela 12.6 significa
que há dois fatores separados e distintos, e vamos chamá-los A e B. Em
A há dois itens, igualdade para as mulheres e controle da natalidade,
e em B há dois itens, propriedade privada e negócios. Parece haver
pequena relação entre os dois fatores, a julgar pelas correlações baixas,
próximas de zero, entre os referentes de A e os referentes de B ( —0,15,
0,04, —0,23, e —0,11). Diz-se que os fatores são não-correlacionados,
independentes ou ortogonais. São duas entidades separadas e distintas.
Se fizéssemos uma análise fatorial da matriz de correlação da tabela 12.6,
obteríamos o mesmo tipo de estrutura fatorial que vimos na tabela 12.4
e na figura 12.3.
Os fatores não são mais do que isso. Eles são definidos pelas corre
lações entre os testes ou escalas. Se os resultados dos indivíduos em itens
ou testes “caminham juntos”; então, na medida em que haja correlações
substanciais entre éles, está definido um fator. A natureza dos fatores é
definida pelos pesquisadores através de um estudo dos testes, escalas ou
itens com cargas altas nos fatores. O resultado final de uma análise
fatorial das correlações da tabela 12.6, a matriz fatorial rotada, é dado
na tabela 12.7. Por esta tabela o pesquisador pode tentar deduzir qual é
a natureza dos dois fatores. Neste caso, embora a evidência seja frágil —
só quatro itens, com dois carregados substancialmente em cada um dos
dois fatores — não é difícil deduzir que o fator A é um fator liberal,
já que suas duas cargas altas serão associadas a dois itens, igualdade para
as mulheres e controle da natalidade, que expressam idéias geralmente
adotadas por liberais. Dispondo de evidência consideravelmente maior,
então, poderiamos chamar ao fator “liberalismo”. Os itens com cargas
substanciais no fator B, propriedade privada e negócios, expressam idéias
adotadas geralmente por conservadores. Podemos muito bem, então,
chamar ao fator “ conservadorismo”.
Tabela 12.7 M a triz fa to ria l ro ta d a : re su lta d o d e a n á lise fa to ria l d a m a triz d e

c o rre la ç ã o d a ta b e la 12.6.
F ato res
Iten s A B
Ig u a ld a d e p a ra as m ulheres 0,94 0,13

C o n tro le d a n a ta lid a d e 0,94 0,00
P ro p rie d a d e p riv a d a —0,25 0,83
N egócios -0 ,1 0 0,87
Este exemplo muitíssimo simplificado não deveria nos levar a crer

que os fatores são “realidades” e que é sempre fácil interpretar resultados
de análise fatorial e dar nome aos fatores. Ao contrário, às vezes é muito
difícil. A única “ realidade” científica que os fatores possuem vem das
correlações entre testes ou variáveis sendo analisados. As cargas fatoriais
obtidas são, com efeito, reduções de dados muito mais complexos a
tamanhos manuseáveis para que o pesquisador possa interpretar melhor
os resultados.
A interpretação, entretanto, sempre pode estar errada. Primeiro, uma
carga fatorial substancial pode acontecer por acaso. Assim, o analista
poderá estar tentando interpretar um resultado ininterpretável. Segundo,
um pesquisador pode simplesmente se enganar quando deduzir a “natu
reza” de um fator. Pode ser que em determinada análise fatorial, itens
ou testes outros que os usados sejam mais fundamentais dos que os
realmente usados. Neste caso os itens usados podem ser apenas um
aspecto superficial do fator. É bem possível, por exemplo, que os itens
224
propriedade privada e negócios possam ser apenas aspectos superficiais
de um fator mais fundamental do que conservadorismo, o nome adotado
para o fator. Terceiro, os resultados da análise fatorial podem ser invali
dados por dificuldades e deficiências técnicas. A análise fatorial é com
plexa e tem problemas técnicas complexos. Por exemplo, freqüentemente
é difícil saber quantos fatores existem em um conjunto de dados. Se for
extraído o número “errado” de fatores, os dados podem levar a con
fusões. Embora os computadores e programas de computadores possibili
tem fazer análise fatorial bastante simplesmente, eles não dão, entretanto,
uma resposta realmente satisfatória ao problema do número de fatores.
Em todo caso, deveriamos estar agora em melhor posição para ler e
compreender o estudo de Woodmansee e Cook e os outros estudos resu
midos abaixo. Assim, voltemos a Woodmansee e Cook.
Volta a Woodmansee e Cook
Lembre-se de que Woodmansee e Cook encontraram 11 fatores ou

dimensões de atitudes em relação aos negros. Nosso objetivo é entender
análise fatorial e fatores e não a substância complexa dos resultados de
Woodmansee e Cook. Vamos, portanto, tomar apenas quatro de seus
fatores para tentar descobrir o que eles podem significar para podermos
compreender a importância da análise fatorial na pesquisa comporta-
mental. Suponhamos que um psicólogo social esteja fazendo uma pesquisa
sobre a mudança de atitudes em relação aos negros e prepara um experi
mento bem concebido para fazê-lo. Suponhamos que ele acredite que as
atitudes em relação aos negros sejam uma variável relativamente simples,
consistindo de idéias estereotipadas sobre os negros e que ele queira
transformar essas idéias me percepções mais acuradas. Sua variável
dependente, que reflete o que ele quer mudar, é então estereótipos de
negros. Suponhamos, ainda, que sua pesquisa não tenha sucesso, isto é,
suas variáveis independentes não tenham efeito sobre a variável depen
dente.
Se diversos psicólogos fizerem experimentos semelhantes com os
mesmos resultados, poderão concluir que as atitudes em relação aos negros
não podem ser mudadas. Esta afirmativa, naturalmente, pode não ser
verdadeira. Uma afirmativa mais exata é: “ Os estereótipos em relação
aos negros não foram mudados e pode ser difícil ou mesmo impossível
mudá-los. O ponto é que o pesquisador tirou uma conclusão sobre as
atitudes em relação aos negros baseado na evidência obtida sobre este
reótipos de negros. Os estereótipos são apenas uma parte das atitudes,
uma dimensão ou fator (e mesmo esta afirmativa pode não ver verdadeira
porque os próprios estereótipos podem ter mais de um fator). Assim, é
225
possível que relatos de que esta variável independente não tenha tido
nenhum efeito sobre aquela variável sejam deficientes, porque “aquela
variável” talvez não seja de fato “ aquela variável”, mas apenas um
aspecto dela.
O fator A de Woodmansee e Cook, “Política de Integração-Segre-
gação”, como o nome indica, centralizou-se nas posições dos sujeitos
sobre a conveniência da segregação e integração raciais. Os itens do
fator B expressavam “Aceitação em Relações Pessoais Intimas” : até onde
os sujeitos aceitariam negros em relações relativamente íntimas inter
pessoais? O fator C, “ Inferioridade do Negro”, tem sido tradicionalmente
associado às atitudes em relação aos negros no sentido em que tais
atitudes focalizaram-se na percepção dos negros como inferiores aos
brancos. (Outro fator, “Opiniões aviltantes”, relacionou-se intimamente
com o Fator C.) O fator D, “ Superioridade do Negro”, é um pouco
surpreendente. Seus itens atribuíam características que faziam os negros
superiores aos brancos, por exemplo: “Eu acho que os negros têm uma
espécie de coragem silenciosa que poucos brancos têm”.
Com os fatores restantes não precisamos nos preocupar. A questão é
que a análise fatorial das intercorrelações de grande número de itens que
Woodmansee e Cook usaram mostraram que as atitudes em relação aos
negros constituem um domínio complexo de 11 facetas ou fatores que
refletem vários aspectos de atitudes em relação aos negros: integração e
segregação, relações pessoais, inferioridade do negro, superioridade do
negro, e outras. Se alguém quiser, por exemplo, mudar as atitudes em
relação aos negros, terá que decidir que aspectos de tais atitudes deverão
ser mudados. Certamente as atitudes em relação aos negros estão longe
de ser uma variável unidimensional simples. Seu estudo e compreensão
requerem, obviamente, uma abordagem multidimensional.
Percepções do comportamento do professor: correlações entre indivíduos
Já ficou dito que as respostas de indivíduos a um instrumento

podem ser intercorrelacionadas e analisadas fatorialmente. Esta aborda
gem à pesquisa comportamental chama-se metodologia Q (Stephenson,
1953). É uma abordagem interessante e potencialmente poderosa, princi
palmente em psicologia. Sua ferramenta básica é o Q-sort, um maço de
40 a 100 cartões, nos quais os itens são datilografados ou pintados.
(Desenhos e figuras abstratas, por exemplo.) Os indivíduos são instruídos
a arranjarem os cartões separando-os em 10 ou mais pilhas conforme
diversos critérios: gostar-desgostar, aprovar-desaprovar, parecido comigo
— não parecido comigo e assim por diante. São atribuídos valores
diferentes a cada pilha — geralmente de 0 a 7, 8, 9 ou 10 — e esses
226
números são usados para iritercorrelacionar os conjuntos de respostas
dos diferentes indivíduos uns com os outros.
Em outras palavras, a metodologia Q focaliza-se principalmente nas
correlações entre os indivíduos. Se, por exemplo, dois indivíduos respon
dem a uma Q-sort cujos itens são itens de atitudes, digamos atitudes em
relação aos negros, e se a correlação entre os arranjos feitos por eles
for alta, então suas atitudes em relação aos negros são semelhantes.
Além disso, se um número suficiente de indivíduos responde ao mesmo
Q-sort, as respostas ao Q-sort podem ser intercorrelacionadas e analisadas
fatorialmente. Os fatores resultantes são chamados fatores de pessoas
(persons factors). Vamos examinar resumidamente um estudo que usou
esta interessante abordagem.
Sontag (1968), para estudar a relação entre as atitudes dos professo
res em relação à educação, sua variável independente, e suas percepções
dos comportamentos de professores, sua variável dependente, construiu
um Q-sort para descrever os comportamentos dos professores. Alguns dos
itens são dados abaixo. Sontag acreditava que os julgamentos dos pro
fessores sobre a desejabilidade dos diversos comportamentos de professo
res é influenciada por suas atitudes básicas em relação à educação.
Por exemplo, um professor cujas atitudes são “progressistas” conside
raria um certo conjunto de comportamentos de ensino desejável, enquanto
que um professor “tradicional” consideraria desejável outro conjunto de
comportamentos.
De fato, Sontag descobriu que professores progressistas e tradicio
nais, medidos por outros instrumento planejado para medir tais atitudes,
discordavam em suas percepções de comportamentos desejáveis de ensino.
Nosso interesse, entretanto, se concentra apenas nos fatores que ele
obteve com o Q-sort de comportamento de professor. É possível deter
minar os itens de um Q-sort aos quais as pessoas de um fator de péssoa-
■pessoas que se correlacionam altamente umas com as outras — têm
reações comuns ou semelhantes.
Sontag descobriu quatro de tais fatores tanto no primeiro como no
segundo graus de ensino. Itens selecionados dos arranjos fatoriais, associa
dos com o ensino de professores de segundo grau, juntamente com os
nomes que Sontag lhes deu, são vistos na tabela 12.8.
O leitor poderá talvez fazer uma idéia da natureza desses
fatores lendo os itens algumas vezes. “Preocupação com os Estudantes”
está obviamente centralizado no aluno: para os professores que
acham esses comportamentos desejáveis, as necessidades e pontos de
Vista dos alunos parecem soberanos. “ Estrutura e Assunto”, por outro
lado, está centralizado nas coisas ensinadas: para os professores que os
acham desejáveis, o conhecimento, a competência, a disciplina e o
planejamento e estrutura do ensino parecem importantes. A análise
227
fatorial das percepções das pessoas sobre os comportamentos de ensinar,
no estudo de Sontag, resultou em preciosa, compreensão das diferentes
percepções do ensino.
Tabela 12.8 Ite n s selecio n ad o s d e a rra n jo s d e fa to re s d e c o m p o rta m e n to d e en sin o

d e seg u n d o g ra u , e stu d o d e S o n tag c o m m eto d o lo g ia Q .
“ A p re se n ta ç ã o G e ra l d o A ssu n to ”
A p re se n ta a u la s b e m p lan e ja d a s.
E m su as a p re se n ta ç õ e s m o s tra b o m c o n h e c im e n to d o a ssu n to .
A p ro v eita-se d o in te re sse d o a lu n o ao p re p a ra r as a u la s.
“ P re o c u p a ç ã o co m o s a lu n o s”
M a n té m su a s p ro m e ssa s co m os a lu n o s.
E n sin a os a lu n o s a serem sensíveis à s n ecessid ad es d o s o u tro s.
M o stra in te re sse p e lo p o n to d e v ista d o s alunos.
“ E s tr u tu ra e A s s u n to ”
T ra n sm ite aos a lu n o s o q u a n to g o sta d o assunto.
D e sp e rta a a te n ç ã o dos alu n o s d u ra n te as aulas.
E m su as a p re se n ta ç õ e s m o stra b o m co n h e c im e n to d o assu n to .
“ N o rm a s e R eg ras”
E n fa tiz a o re s p e ito p elo s colegas ta n to q u a n to pelo p ro fe sso r.
A ju d a os a lu n o s a serem c o n stru tiv a m e n te crítico s em s u a a b o rd a g e m d o a ssu n to .
E n sin a o re s p e ito p o r to d o s os g ru p o s étnicos.
Testando uma teoria de atitudes sociais
Décadas atrás houve muita pesquisa sobre as atitudes gerais ou

ideologias do conservadorismo e liberalismo. Estes conjuntos de atitudes
“existem” realmente? É possível categorizar pessoas, escalas e itens
como “conservadores” e “liberais” ? Alguns psicólogos parecem acreditar
que atitudes sociais são complexas demais para que permitam ser assim
categorizadas. Mais importante, há exceções demais. Por exemplo, muita
gente adota uma mistura do que pode ser chamado ponto de vista conser
vador e liberal. Além do mais, alguns cientistas sociais acreditam que
muitas pessoas simplesmente “não têm” atitudes, por terem pouco conhe
cimento de questões econômicas, políticas e educacionais.
Minhas próprias pesquisas (Kerlinger, 1972b; Kerlinger, Middendorp
& Amón, 1976) parecem indicar que, sem dúvida, o conservadorismo e o
liberalismo “existem”, no sentido de que itens e fatores de pessoas conser
vadoras e liberais foram repetidamente encontrados em partes diferentes
dos Estados Unidos e em dois países europeus. O quadro é mais ou menos
o seguinte: os liberais acreditam que os programas de bem-estar social
deveríam ser fortes, que negros e mulheres deveríam ter igualdade total,
que as rendas deveríam ser taxadas progressivamente, que os negócios
deveríam ser regulamentados e que deveria ser permitido às mulheres
praticar o aborto, se desejarem. Os conservadores, por outro lado, enfa-
228
tizam a importância da religião e da igreja, expressam fé no capitalismo,
na propriedade privada e nos negócios, adotam a disciplina e o dever e
acreditam que as relações sociais devem se apoiar na autoridade. Há
muitas exceções, mas estes dois quadros em geral se conformam à
“realidade” da pesquisa. São muito mais complicados ainda, natural
mente, mas as descrições gerais são exatas.
Do ponto de vista do presente sumário da pesquisa, entretanto,
existe outra crença popular — endossada também por cientistas sociais
— que tem implicações teóricas e práticas importantes: que o liberalismo
e o conservadorismo foram uma única dimensão de atitudes sociais, com
liberais extremos, até radicais, de um lado, e conservadores extremos, até
reacionários, do outro. Da mesma forma, os conceitos sociais e as
questões estão dentro desta única dimensão. Naturalmente há cientistas
sociais que acreditam que as atitudes sociais são mais complexas, que há
vários fatores do liberalismo-conservadorismo. Entretanto, os vários fato
res são ainda concebidos como contendo questões e crenças tanto liberais
quanto conservadoras. Em outras palavras, o conservadorismo e o libe
ralismo são considerados como que apoiados em uma mesma dimensão,
ou únicas dimensões, que têm tanto questões conservadoras quanto libe
rais (ou gente) nas mesmas dimensões. Neste ponto de vista, conservado
rismo e liberalismo, conservadores e liberais, são concebidos como opos
tos: o que um aceita o outro rejeita. É a isso que se chama concepção
bipolar. Uma dimensão bipolar é a que tem duas extremidades, uma
positiva e outra negativa.
Anos atrás questionei essas idéias porque-os resultados de minhas
pesquisas pareciam contradizê-las, ou no mínimo lançar sérias dúvidas
sobre elas. Depois de trabalhar com essas idéias e pesquisar mais,
publiquei o que chamei teoria de atitudes dos referentes criteriais (crite-
rial referents theory of attitudes) (Kerlinger, 1967). Essa teoria pode ser
chamada uma teoria estrutural, porque esboça a estrutura fatorial geral
e algumas das características das atitudes sociais. Contradizia a validade
da concepção bipolar das atitudes sociais e dizia que o conservadorismo
e o liberalismo eram “ ideologias” separadas e distintas, ou grandes
conjuntos de crenças, não necessariamente opostas uma à outra. (O radi
calismo de direita ou de esquerda foi excluído de consideração, embora
ficasse dito que as atitudes podem ser bipolares no quadro de referência
do radicalismo.) Isto significa que há conjuntos de indivíduos que
têm atitudes predominantemente conservadoras ou predominantemente
liberais em relação a questões sociais, mas que indivíduos conservadores
não se opõem necessariamente a colocações liberais, e indivíduos liberais
não se opõem necessariamente a colocações conservadoras. Em resumo, é
pegada a crença comum de bipolaridade e afirmada uma vida distinta e
separada tanto para o liberalismo quanto para o conservadorismo.
A teoria é muito maior, naturalmente, mas isto é suficiente para
ilustrar o uso da análise fatorial, neste caso para testar uma teoria estru
tural de atitudes. A teoria foi testada um certo número de vezes nos
Estados Unidos, usando escalas de atitudes que consistiam de itens de
sentenças — por exemplo, “A primeira preocupação de qualquer socie
dade é a proteção dos direitos de propriedade” (conservadora) e “ É pre
ciso haver controle de natalidade mais efetivo se o mundo quiser resolver
seus problemas sociais e políticos” (liberal) — e itens referentes (palavras
e frases curtas expressando idéias sociais) — por exemplo, “propriedade
privada”, “competição” (conservadoras) e “igualdade”, “medicina sociali
zada” (liberais). As escalas foram aplicadas a grandes grupos de indi
víduos em partes diferentes do país e as correlações entre os itens foram
analisadas fatorialmente.
Os resultados das análises fatoriais foram altamente semelhantes
em quase todas as amostras. Foram obtidos seis ou mais fatores, e na
maioria dos casos itens liberais apareceram juntos em certos fatores e
itens conservadores apareceram juntos em outros fatores. Os dois tipos
de itens raramente apareceram juntos nos mesmos fatores. Já que os
fatores são relativamente independentes uns dos outros, parece que libe
ralismo e conservadorismo, conforme definidos pelos itens, são entidades
separadas e distintas. Além disso, uma chamada análise fatorial de segun
da ordem, uma análise fatorial das correlações entre os próprios fatores,
mostrou que os fatores com itens liberais eram correlacionados positiva
mente e igualmente os fatores com itens conservadores. Houve pouca
evidência nesses estudos de bipolaridade, isto é, itens liberais aparecendo
com cargas negativas em fatores conservadores e itens conservadores
aparecendo com cargas negativas em fatores liberais. Os estudos Q
também apoiaram os resultados acima sumarizados. A teoria estrutural,
então, parece ser apoiada pela evidência desses estudos.
Para dar ao leitor uma idéia dos resultados obtidos nesses estudos,
os arranjos fatoriais de um dos mais recentes deles (Kerlinger, 1972)
são dadas na tabela 12.9. O principal propósito do estudo foi testar a
teoria dos referentes criteriais descrita acima, usando os próprios refe
rentes como itens. Outro propósito foi entender melhor a natureza das
atitudes sociais determinando através da análise fatorial os fatores subja
centes às atitudes sociais. Os dados da Tabela 12.9 servem a este
propósito.
Uma escala de atitudes sociais de 7 pontos e 50 itens de palavras e
frases curtas (veja tabela 12.9), todas presumivelmente relacionadas a
atitudes sociais, foi administrada a amostras de estudantes pós-graduados
em educação em Nova Iorque, Carolina do Norte e Texas. Embora os
dados de cada um desses estados fossem analisados separadamente, as
230
amostras do Texas e Carolina do Norte foram combinadas para formar
uma amostra grande (N = 530), dando assim resultados de análise
fatorial de maior confiança. (A análise fatorial exige amostras grandes,
principalmente por causa dos erros de mensuração e muitas variáveis
estarem sendo analisadas.) Os resultados da amostra de Nova Iorque
TTabela 12.9 F a to re s d e a titu d e social, itens re fe re n te s e cargas fa to ria is, am o stra

b o m b in a d a d e C a ro lin a d o N o rte e T ex as, N = 5 3 0 “.
F ato res co n serv ad o res
R elig io sid ad e T rad ic io n alism o C o n servadorism o

ed u c a c io n a l econôm ico
R elig ião (0,78) C o n te ú d o (0,59) L iv re em p resa (0,62)

Ig re ja (0,73) E d u c a ç ã o com o tre in o Im óveis (0,53)
Fé e m D e u s (0,72) in te le c tu a l (0,52) P ro p rie d a d e p riv a d a (0,43)
C ristão (0,69) D isc ip lin a escolar (0,44) C apitalism o (0,37)
E d. relig io sa (0,57) G ru p o s hom ogêneos S o b e ra n ia n a c io n a l (0,30)
E n sin a m e n to d e v alo res (0,30) (C onhecim ento
e sp iritu a is (0,53) científico (0,30))
P a d rõ e s m o ra is em
e d u c a ç ã o (0,36)
P a trio tism o (0,33)
■
F ato res lib erais
D ireito s civis E d u c a ç ã o c e n tra liz a d a L iberalism o so cial

n a c ria n ç a
N eg ro s (0,60) In te re sse s d a c rian ça S eg u ran ça so cial (0,53)

D ir. civis (0,57) (0,56) S u p rem a C o rte (0,50)
In te g ra ç ã o ra c ia l (0,57) C u rríc u lo ce n tra d o A ju d a fe d e ra l p a ra
Ju d e u s (0,46) n a c ria n ç a (0,54) a edu cação (0,49)
D esag regação (0,43) P e rso n a lid a d e do M ed icin a so cializad a
(P u re z a ra c ia l ( —0,37)) alu n o (0,54) (0,47)
A uto-expressão das N ações U n id as (0,43)
c ria n ç a s (0,47)
In te ra ç ã o dos alunos
(0,44)
L ib e rd a d e d a c ria n ç a
(0,37)
* A s carg as são d a d a s e n tre p a rê n te se s. A s cargas 0,30 o u m aiores fo ra m conside

rad as sig n ificativ as. O s d o is re fe re n te s e n tre p a rê n te se s são u m ite m L c arreg ad o
em u m fa to r C e u m ite m C carre g a d o em u m fa to r L.
231
foram usados para comparar com os resultados das amostras combinadas
do Texas e Carolina do Norte. Estamos preocupados apenas com a
amostra combinada. Os dados foram analisados fatorialmente e foram
extraídos seis fatores das intercorrelações dos 50 itens referentes. Os
resultados da análise fatorial estão dados na tabela 12.9.
Três dos seis fatores tinham itens conservadores, segundo fora
previamente determinado, e três fatores tinham itens liberais, também
segundo determinações prévias. Esta determinação de liberal e conser
vador é, naturalmente, importante. Os julgamentos foram feitos com base
na literatura sobre pesquisas anteriores em conservadorismo e liberalis
mo (Hartz, 1955; Kirk, 1960; Rossiter, 1962), pesquisas anteriores,
antologias de medidas de atitudes (Robinson, Rusk & Head, 1968;
Robinson e Shaver, 1969: Shaw & Wright, 1967), e experiência e
conhecimento. Não é difícil ver que livre empresa, religião e conteúdo
são referentes conservadores e que direitos civis, igualdade e medicina
socializada são referentes liberais. Em todo caso, a maioria dos referen
tes designados como conservadores e liberais resultaram ser empirica-
mente “corretos’, no sentido de que se agrupavam em fatores predomi
nantemente conservadores ou liberais, como fora predito pela teoria.
Vale a pena estudar a tabela 12.9. Note primeiro que, com apenas
uma exceção, pureza racial no fator Direitos Civis, não há cargas nega
tivas na tabela. Segundo, todos os itens em qualquer arranjo fatorial
ou são conservadores ou são liberais, mas não ambos. Por exemplo,
todos os itens do fator “Liberalismo Social” são itens liberais, enquanto
que todos os itens no fator “ Conservadorismo Econômico” são conser
vadores, com uma possível exceção, conhecimento científico.
Terceiro, e mais importante do ponto de vista deste capítulo, note
o tema comum o caráter de cada fator. Você concorda com o nome
dado? Tem nome melhor? Note, por exemplo, que um item, segurança
nacional, não se encaixa direito no fator “Conservadorismo Econômico” .
Então, “ Conservadorismo Econômico” não é correto? (Nem sempre se
conseguem fatores “perfeitos”, naturalmente). Conhecimento científico
parece não combinar. A. coisa principal a notar, entretanto, é que a
maioria dos itens, às vezes todos, participam de uma idéia central, algum
núcleo de significado de atitude que possibilita identificar o fator. Além
do mais, já que os primeiros três fatores participam da característica
geral de terem itens conservadores, pode-se especular que existe um
fator “geral” de conservadorismo. Da mesma forma, talvez nos últimos
três fatores, cujos itens são todos liberais, definam um fator geral de
liberalismo. A evidência deste estudo e outros, mesmo na Espanha e
na Holanda, onde foram feitos estudos semelhantes (Kerlinger, Midden-
dorp & Amón, 1976) indicam que assim é.
232
Análise fatorial: uma apreciação
Os cientistas buscam explicações para os fenômenos. Como destaca

mos várias vezes, neste livro, a única maneira de explicar alguma coisa é
dizendo o que se relaciona a ela. Antes de podermos estudar as relações
entre as variáveis, precisamos saber o que são as variáveis; precisamos
saber alguma coisa a respeito do fenômeno que queremos estudar. Isso
parece tão óbvio que nem seria necessário mencionar. Mas não é óbvio;
na verdade, acontece que é extremamente confuso e difícil. Os psicólogos
desejam explicar a inteligência, assim como usá-la como variável para
ajudar a explicar outros fenômenos psicológicos. Para explicar inteligên
cia, entretanto, eles precisam ter uma idéia do que querem dizer com inte
ligência. Isso significa conhecer alguma coisa das categorias, dos tipos
de inteligência que formam o que é conhecido como “comportamento
inteligente” (comportamento inteligente deve, por sua vez, ser definido
constitutiva e operacionalmente).
Estes problemas formam um conjunto dos problemas mais difíceis
para a compreensão das ciências comportamentais. (Acho difícil até
enunciar o problema de sorte a poder entendê-lo antes de tentar expli
cá-lo.) Como sempre, tomemos um ou dois exemplos. Neste capítulo
vimos que Guilford criou uma classificação muitíssimo complexa de
tipos de inteligência. Seu sistema de classificação — formalmente uma
taxinomia — forma com efeito uma teoria da inteligência, ou pelo menos
os elementos e bases de uma teoria da inteligência. Ele usou três tipos
de categorias — operação, conteúdo e produto — cada um com subcate-
gorias. As combinações dessas categorias e subcategorias “prediziam”
aspectos do comportamento inteligente. Guilford e seus colegas criaram
itens e testes que pareciam derivar dessas “ definições”, aplicaram-nos a
amostras convenientes de pessoas e depois usaram análise fatorial para
testar a adequação da concepção teórica. Os fatores que Guilford predisse
aparecem da forma como ele disse que apareceríam? Os itens e testes
aparecem nos fatores preditos por Guilford?
Compreender os fenômenos depende em parte da taxinomia. Taxino
mia é a disciplina da classificação. Todas as ciências têm alguma espécie
de taxinomia ou sistema de classificação. Classificar coisas quer dizer
colocá-las em categorias. Mas que categorias? De onde vêm as categorias?
Uma das principais tarefas da ciência é inventar taxinomias adequadas
aos fenômenos ou variáveis da ciência — e então testar a validade
empírica dos sistemas taxinômicos. A análise fatorial é provavelmente o
método mais importante de realizar este teste e também explorar o
mundo de variáveis da ciência para descobrir, ou antes, conseguir
“dicas”, para sistemas taxinômicos. Foi isto que Thurstone e Guilford
fizeram em sua busca dos fenômenos de inteligência e o que eu fiz
tentando compreender atitudes sociais. Sem análise fatorial, natural
mente, essas tentativas teóricas e empíricas de compreender fenômenos
complexos seriam impossíveis ou no mínimo, muitíssimo difíceis.
A análise fatorial é, então, um instrumento básico da ciência com-
portamental, concebido inicialmente apenas como instrumento explora
tório, um método para “descobrir” ou “encontrar” fatores, e que agora
sabemos ser muito mais. Agora nós a concebemos e a usamos para
testar a validade empírica de teorias fundamentalmente estruturais ou
taxinômicas. Como tal, é fundamental e indispensável. É uma abordagem
importantíssima e um instrumento analítico para compreender o material
básico de uma ciência: seus fenômenos e suas variáveis.
234
13. A a b o r d a g e m m u lt iv a r ia d a :
c o r r e la ç ã o c a n ô n ic a , a n á lis e d is c r im in a n t e
e a n á lis e d e e s t r u t u r a s d e c o v a r iâ n c ia
A maior parte da discussão da pesquisa neste livro foi dominada

pela idéia de uma variável dependente. Voltando à discussão dos experi
mentos, vamos notar que uma única variável dependente, um só efeito
foi influenciado por uma ou mais variáveis independentes. Pode-se dizer
que a maioria das pesquisas nas ciências comportamentais teve apenas
uma variável dependente, ou pelo menos uma variável dependente por
vez. Até o método de regressão múltipla, com suas muitas variáveis
independentes, tem apenas uma variável dependente. (A análise fatorial é
diferente: geralmente não pensamos em variáveis dependentes ou inde
pendentes em estudos de análise fatorial, embora possamos pensar, se
quisermos.) Ficamos então, limitados a apenas uma variável dependente?
Não, de forma nenhuma.
Não há motivo para não estendermos nossa investigação a mais de
uma variável dependente e mais de uma variável independente. Às vezes
há motivos práticos imperiosos para limitarmos o número de variáveis
em pesquisa, mas, pelo menos conceitualmente, não precisamos nos
limitar tanto. Na verdade, podemos considerar toda pesquisa, não impor
tam quantas variáveis e de que espécie, como sendo casos especiais do
caso geral único de k variáveis independentes e m variáveis dependentes,
k e m sendo quaisquer números. A pesquisa multivariada é, então,
aquela em que haja mais de uma variável independente ou mais de uma
variável dependente, ou ambas. O termo usado comumente é “ análise
multivariada”, que é uma família de formas de análise semelhantes à
análise de regressão múltipla, só que há mais de uma variável dependente.
Neste livro, vamos considerar também a regressão múltipla como parte
da família da análise multivariada, embora apenas com uma variável
dependente.
Sem dúvida, os métodos multivariados são complexos e, às vezes,
difíceis de entender, em parte por causa dos terríveis aparatos de símbo
los matemáticos e estatísticos que o estudante em potencial tem que
saber. O ideal seria que se conhecesse o cálculo diferencial para compre
ender a regressão múltipla e outros métodos multivariados. Mas pode-se
chegar a uma compreensão satisfatória sem o cálculo. Pode-se até enten
der os métodos multivariados sem se conhecer os símbolos e a álgebra
de matrizes. Mas não se pode entender a pesquisa comportamental
contemporânea sem um bom entendimento dos métodos e abordagens
multivariados. Os motivos se tornarão evidentes à medida que entrarmos
no assunto.
Alguns exemplos experimentais multivariados
No capítulo 7 discutimos um experimento interessante de Berkowitz

(1959), no qual se buscava uma resposta à seguinte pergunta: Os anti-
semitas deslocam agressão para os judeus quando sua hostilidade é
deflagrada? Vamos estender o experimento univariado de Berkowitz
(uma variável dependente) de maneira multivariada. Suponhamos que
tenha sido demonstrado que a deflagração de hostilidade produz um
deslocamento de agressão em direção aos judeus entre os anti-semitas.
Com uma extensão do raciocínio teórico, podemos perguntar se a defla
gração de hostilidade produz também agressão direta ou aberta contra os
judeus. Há agora duas variáveis dependentes, agressão deslocada e
agressão aberta, e duas variáveis independentes, deflagração de hostili
dade e anti-semitismo. Isto seria um experimento multivariado com duas
variáveis independentes e duas variáveis dependentes.
É muito possível, naturalmente, testar o efeito da deflagração de
hostilidade nas duas variáveis dependentes separadamente. Tal procedi
mento seria semelhante aos descritos antes. Em vez de um experimento,
dois. Em um deles seria avaliado o efeito da deflagração de hostilidade
e anti-semitismo em agressão deslocada. No outro, seria avaliado o efeito
da deflagração de hostilidade em agressão aberta. Por que não fazer
dois experimentos? Por que nos preocuparmos com um experimento
multivariado consideravelmente mais complicado? Vamos agora tentar
responder essas perguntas, embora devamos confessar podermos dar
apenas respostas parciais.
Vamos considerar a experimentação educacional voltada para estudo
dos efeitos de diferentes métodos de ensino sobre a realização. Vamos
voltar ao estudo de Clark e Walberg, por exemplo, em que foi estudado
o efeito do reforçamento maciço e regular sobre a realização em leitura.
Não vamos nos esquecer de que o reforçamento maciço teve efeito consi
deravelmente maior sobre a realização em leitura do que o reforça
mento regular. Qual seria o efeito do reforçamento maciço sobre a
realização em matemática? O mesmo? Ou talvez diferente? Aqui nova
mente podem ser feitos dois experimentos, cada um com uma variável
dependente diferente. É possível, entretanto, obter-se uma resposta
236
melhor à questão da pesquisa sobre o efeito do reforçamento sobre a
realização, incluindo ambas as variáveis em um experimento. Por quê?
Qual poderá ser a vantagem? Uma resposta é que os métodos de reforça
mento podem afetar os dois tipos de realização diferentemfente e que as
diferenças podem não surgir nos dois experimentos e surgir em um experi
mento que inclua ambas as variáveis dependentes.
Há muitas situações práticas em que indivíduos têm que ser
“designados” para grupos diferentes com base em seu nível diferente de
traços, capacidades, experiência e assim por diante. Por exemplo, nas
escolas as crianças são “ designadas” para grupos de aprovados e repro
vados com base em seu esforço e realização. Candidatos a emprego em
uma companhia são designados para grupos de contratados e não
contratados com base em sua capacidade e experiência. Os psiquiatras
designam pessoas mentalmente doentes para categorias como neurótico,
esquizofrênico e maníaco-depressivo, com base em testes e observações.
Nestes casos o pesquisador considera o pertencer ao grupo como a
variável dependente e os vários testes e outros aparatos como variáveis
independentes. Embora haja apenas uma variável dependente, como na
análise de regressão múltipla, os métodos de análise empregados em tais
situações são considerados e denominados análise multivariada.
Um último exemplo mais complexo antes de entrarmos em maiores
detalhes. Roe e Siegelman (1964) acreditavam que experiências no início
da vida levavam a diferenças posteriores em orientação para pessoas. Seu
interesse em orientação partia da suposição de que a orientação para
pessoas influenciava os interesses por diversas ocupações. Um indivíduo
fortemente orientado para pessoas, mais provavelmente se tornaria um
professor, ou um aconselhador, por exemplo. Para testar a hipótese,
aplicaram dois conjuntos de testes a diversos alunos de quarto ano
de faculdade. O primeiro conjunto media variáveis associadas ao ambien
te familiar, primeiras experiências de atividades sociais, proximidade de
mãe e pai, interesse e energia que pai (ou mãe) demonstravam em
atividades outras que o trabalho e a família. As variáveis do segundo
conjunto refletiam a orientação em relação a pessoas, por exemplo,
curiosidade em relação a pessoas, desejo de relações pessoais íntimas,
calor humano e sociabilidade. Sua hipótese era que relacionamentos
intensos e satisfatórios no início da vida resultavam em adultos princi
palmente orientados para pessoas, enquanto relacionamentos inadequa
dos e insatisfatórios resultavam em adultos orientados para aspectos não
pessoais do ambiente.
Esta pesquisa é multivariada porque tem diversas variáveis inde
pendentes e diversas variáveis dependentes. O problema é como estudar
a relação entre elas. A coisa mais óbvia a fazer é simplesmente correla-
cionar cada uma das variáveis independentes com cada variável depen
dente e então estudar as muitas correlações. Se as primeiras experiências
de atividades sociais se correlacionam altamente com, digamos, uma
medida de orientação em relaçao a pessoas, — isto é, quanto mais cedo
a experiência de atividade sociais, maior a orientação para pessoas__,
então provavelmente os pesquisadores poderão concluir que as primeiras
experiencias influenciam a orientação posterior. Pode-se ainda calcular
todaj as correlações entre todas as variáveis e analisar fatorialmente as
correlações. Esta pode ser uma boa maneira de atacar o problema porque
os resultados da análise fatorial deveríam mostrar as relações entre as
primeiras experiências e as orientações.
Outro meio de abordar o problema analítico, um meio mais apro
priado porque seus resultados irão referir-se diretamente à hipótese
original,^ é calcular um índice composto para as variáveis independentes
e outro índice composto para as variáveis dependentes, e correlacioná-los.
Foi este o método usado por Roe e Siegelman.1 A correlação entre os
dois índices compostos, calculada de forma a aumentar a correlação
entre os dois conjuntos de variáveis, 8 medidas para cada conjunto, foi
de 0,47. Esta correlação canônica, como é chamada, foi estatisticamente
iîcando uma relaçao moderada entre as primeiras expe
riências e a orientação para pessoas.
O método possibilita ao pesquisador, além de obter a correlação
total entre os dois conjuntos de variáveis, obter estimativas das influên
cias relativas das variáveis separadas nos índices compostos. No caso
presente, a variável independente mais influente foi a variável chamada
“Primeiras experiências de atividades sociais”, e a variável dependente
mais importante foi a chamada “Orientação para pessoas”, calculada de
escala apropriada e itens de inventário. A hipótese de Roe e Siegelman
foi confirmada, uma vez que a correlação canônica foi estatisticamente
significante. Alem do mais, foi obtida informação sobre quais variáveis
contribuíram mais para a correlação entre os dois conjuntos de variáveis.
O método ora descrito é chamado análise de correlação canônica.
E o mais geral dos métodos multivariados, no sentido de que outros
métodos multivariados podem ser considerados casos especiais de corre
lação canônica. 12 É igualmente poderoso e elegante, embora a interpre
tação de seus resultados possa ser difícil e até ambígua. (O porquê
1 reâtada aqui foi feita, na verdade, por Cooley e Lohnes (1962,

pp. 40-44).
2 A afirmativa é um pouco inadequada. Uma afirmativa mais satisfatória é que
quase todos os métodos analíticos multivariados são casos especiais do chamado
modelo linear — e a análise de correlação canônica é um dos métodos mais
gerais de modelo linear. Isto significa, com efeito, que ela analisa virtualmente
238
disto não poderá ser explicado aqui porque a explanação exige recursos
técnicos além da finalidade do livro. Em geral, quanto mais complexa
uma análise, mais difícil a interpretação.) Para dar ao leitor maior idéia
e compreensão do método, inventamos um exemplo fictício e o vestimos
com variáveis relacionadas à aprendizagem de língua estrangeira. Deve
ser enfatizado, entretanto, que o exemplo é inteiramente fictício. Aliás,
eu não conheço nenhuma pesquisa real que sequer seja semelhante ao
problema e suas variáveis.
Análise de correlação canônica: um exemplo fictício
Vamos recordar a discussão sobre regressão múltipla: havia k

variáveis independentes e sempre uma variável dependente. Suponhamos
que no estudo de uma língua estrangeira um psicólogo-lingüista esteja
interessado nas capacidades que contribuem para falar um idioma estran
geiro. Ele acredita que três variáveis importantes têm influência no
aprendizado de uma língua estrangeira: memória, vocabulário e cognição
de relações. (Vamos tomar essas variáveis pelo que significam à primeira
vista, menos a última, que podemos tomar aqui como a capacidade de
apreender as conexões entre itens de informação.) Ele aplica testes das
três variáveis a 200 indivíduos que estudaram italiano durante um ano.
Além disso, ele dá notas de fluência no falar a língua a cada indivíduo,
notas essas fornecidas por especialistas de língua italiana a partir de
observações e testagem sob condições controladas. Fluência em falar
a língua, então, é a variável dependente.
O pesquisador analisou as notas dos três testes e as observações
sobre a fluência com análise de regressão múltipla. As notas de 8 dos
sujeitos estão dadas na tabela 13 1. (Vamos supor que os cálculos dados
aqui foram feitos com todos os 200 sujeitos. Usamos 8 notas por
conveniência.) As notas dos três testes, as variáveis independentes, estão
sob Xi, X2 e X3. A fluência ou nota de linguagem falada estão na
coluna Yi. A análise de regressão múltipla produziu um coeficiente de
correlação múltipla, R, entre um índice (composto) de regressão das
três variáveis independentes e a variável dependente de 0,37. O pesquisa
dor ficou desapontado: ele esperava que mais de 0,372 = 0,14 (R2), ou
14 por cento variância de Y fossem explicados pelas três variáveis
alquer tipo de dados com k variáveis independentes e m variáveis dependentes,

Étrai f; tores dos dados, avalia as relações dentro e entre as variáveis dependentes
indep mdentes e especialmente a máxima correlação possível entre índices com-
«tos das variáveis dependentes e independentes.
Tabela 13.1^ Notas fictícias em três medidas de variáveis independentes de capaci
dades relacionadas a linguagem e duas medidas dependentes de competência na
língua (italiano).
Variáveis independentes Variáveis dependentes
Pessoas Memória Vocabulário Relações Falar Ler

X, x2 X3 X Y, Y2 Y
1 12 9 9 10,00 11 10 10,50
2 10 8 11 9,67 9 8 8,50
3 14 11 11 12,00 9 9 9,00
4 21 10 8 13,00 7 7 7,00
5 24 19 20 21,00 12 14 13,00
6 18 16 21 18,33 14 12 13,00
7 15 17 14 15,33 7 15 11,00
8 20 14 10 14,67 18 16 17,00
Ele teve uma idéia então. Talvez as três variáveis independentes

fossem mais relacionadas à aprendizagem de leitura de uma língua
estrangeira. Felizmente ele obtivera notas de leitura de italiano em um
teste dado aos mesmos estudantes da língua. Essas notas estão dadas na
coluna Y2 da tabela 13.1. Uma análise de regressão múltipla desta
variável e as mesmas variáveis independentes forneceu um R de 0,89
e um R2 de 0,80. Portanto, 80 por cento da variância de Y2, leitura de
italiano, foi explicada por uma combinação de notas de memória, voca
bulário e cognição de relações. O pesquisador ficou contente. Embora as
três variáveis independentes fossem relacionadas com Yi, falar italiano,
a relação foi comparativamente fraca (embora muitos pesquisadores se
contentassem, neste caso, com um R2 de 0,14.) As três variáveis inde
pendentes estavam muito mais fortemente relacionadas, por outro lado, à
leitura do italiano.
O leitor perceberá que tal descoberta seria importante se confirmada
em replicações. É importante teoricamente porque foi aumentada a com
preensão da aprendizagem de uma língua estrangeira. Faz diferença, por
exemplo, se aprender uma língua significa aprender a falar ou aprender
a ler. A magnitude do R2 das notas de leitura foi gratificante para o
pesquisador: talvez tenha sido feito um avanço substancial em explicar
a leitura de uma língua estrangeira. Afinal, explicar 80 por cento da
variância não é façanha pequena.3 Talvez mais pesquisa e trabalho
possam aumentar 0 R2 com as notas de linguagem oral.
3 Deve ser enfatizado que um R2 tão alto é improvável. Neste exemplo foi
inventado para dar um efeito dramático.
240
Em vez de duas análises separadas, é possível usar uma análise
que inclua as três variáveis independentes e as duas variáveis depen
dentes? É possível analisar as relações entre os dois conjuntos de
variáveis em outras palavras? Os ingredientes de tal análise são dados
na tabela 13.1. As notas Xi, X 2 e X 3 foram calculadas em cada linha,
produzindo as médias_ de 10,00, 9,67, 12,00 e assim por diante, na
coluna encimada por X. As notas de Yi e Y2 foram igualmente calcula
das, resultando em médias_de 10,50, 8,50, 9,00 e assim por diante,
na coluna encimada por Y. Temos então, um componente X e um
componente Y que são, neste caso, as médias das notas X de cada
indivíduo e as médias das notas Y de cada indivíduo. A correlação
entre o componente X, X, e o componente Y, Y, é 0,54. Se elevarmos
ao quadrado esse r, obteremos 0,29. Se aceitarmos os X’s como represen
tativos das três variáveis X e os Y’s como representativos das duas
variáveis Y, então a correlação entre as três variáveis X, por um lado,
e as três variáveis Y, por outro, é 0,54, e 29 por cento da variância de
Y é compartilhada com X.
O procedimento descrito não seria usado comumente em pesquisas
reais. Nós o usamos para ilustrar uma idéia, a idéia de determinar
a correlação entre, conjuntos de notas em vez de notas isoladas, neste
caso a correlação entre o conjunto X e o conjunto Y. Na maioria de
pesquisas reais com conjuntos de variáveis X e Y, usaríamos análise
de correlação canônica, que calcula, entre outras coisas, o máximo
possível de correlação entre conjuntos de variáveis X e Y. Correlacionar
as médias de X e Y não calcula corretamente* a “ verdadeira” relação
entre os dois conjuntos de notas. Não calcula a correlação máxima
possível dados os dois conjuntos de notas e todas as relações entre eles.
Portanto, neste caso, dá uma estimativa muito baixa.
Vamos voltar à nossa discussão sobre análise de regressão múltipla.
Lembre-se que um coeficiente de correlação múltipla expressa a correla
ção entre a “melhor” combinação de variáveis independentes, ou X’s, e
uma variável dependente, Y. A correlação canônica estende a idéia a
mais de uma variável Y. Embora os cálculos sejam complexos, as idéias
básicas são simples. O coeficiente de correlação, entre as médias das
variáveis X e as médias das variáveis Y da Tabela 13.1, foi 0,54.
Se tivéssemos calculado a correlação entre as variáveis X e Y usando
análise de correlação canônica, teríamos produzido um chamado coefi-
ilente de correlação canônica que seria o máximo de correlação possível
entre os conjuntos X e Y das notas, dadas aquelas notas e as relações
entre as variáveis X, entre as variáveis Y e entre os conjuntos de
variáveis X e Y. A correlação canônica entre os conjuntos de notas X e Y,
então, seria maior do que a correlação obtida por nosso procedimento
§implificado usando as médias das notas X e Y. (A correlação canônica
241
é, na verdade, 0,99, muitíssimo alta. Mas raramente ocorre correlação
canônica tão alta com dados comportamentais. Neste caso é devida à
natureza sintética das notas e a alta correlação de 0,80 entre X2 e Y2.)
Além disso, a análise de correlação canônica produz taxas das
contribuições relativas das variáveis dependentes e independentes sepa
radas da correlação canônica. Por exemplo, no exemplo da aprendizagem
da língua, poderíam ser calculados pesos semelhantes às cargas fatoriais
discutidas no capítulo 12, e esses pesos diriam ao pesquisador que
variáveis ou variável independente tiveram influência relativamente maior
sobre que variável ou variáveis dependentes. Os resultados de uma
análise de correlação canônica dos dados da tabela 13.1, por exemplo,
mostraram que vocabulário, X2, e leitura do italiano, Y2, eram muito
mais importantes que as outras variáveis na determinação da correlação
canônica. Em outras palavras, a análise, se bem sucedida, determina a
magnitude da relação total entre os dois conjuntos de variáveis ou
medidas, e também indica que variáveis, quer dependentes quer indepen
dentes, contribuem mais para a relação entre os conjuntos. Embora
ainda haja muito a comentar a respeito da análise canônica, incluindo
as limitações do método e certas. dificuldades de interpretar dados
canônicos, vamos abandonar a discussão. Nosso objetivo de sugerir as
idéias básicas foi conseguido.
Análise discriminante
Pense em uma análise de regressão múltipla em que a variável

dependente expresse a participação em um grupo. Por exemplo, sexo,
classe social, preferência religiosa, política e outras, são variáveis que
expressam participação em um grupo. Qualquer indivíduo pode ser
designado para um grupo na base da posse de características “ apropria
das” àquele grupo. Geralmente podemos ver se um indivíduo é homem
ou mulher, mas em dúvida, podemos perguntar-lhes. A identificação,
com efeito, designa o indivíduo para um dos dois grupos, masculino
ou feminino.
O mesmo raciocínio se aplica a preferência política, só que a identi
ficação e designação a grupos é mais complexa. Preferência política,
por exemplo, é geralmente simples nos Estados Unidos; a maioria dos
eleitores é republicana ou democrata. Na Europa Ocidental, onde proli
feram os partidos políticos — na Holanda, por exemplo, há mais de
30 partidos políticos —, a identificação e designação de membros a
grupos são mais complexas e difíceis. Na ÍJnião Soviética, por outro
lado, onde há apenas um partido político, não existe qualquer questão
de designação a grupos; na verdade, não poderá haver variável de prefe
rência política.
242
Em muitas situações de pesquisa, então, os pesquisadores designam
pessoas a grupos com base em sua participação no grupo. Isso parece
quase tolice: Como o pesquisador pode designar pessoas a grupos dos
quais elas já fazem parte? Um ponto é que ele pode não saber a que
grupos elas pertencem, e se uma de suas variáveis é aquela que expressa
ffiarticipação como membro de um grupo, então ele terá que dar um
pito de determinar a participação no grupo. Isso, por sorte, geralmente
não é difícil. Ele poderá fazê-lo examinando registros ou simplesmente
fazendo perguntas bem dirigidas às pessoas.
Suponhamos, entretanto, que se deseja predizer uma variável de
participação em um grupo. Temos agora que ampliar nosso raciocínio.
Em algumas situações as pessoas ainda não estão “em um grupo” mas
serão “designadas” a ele pelo pesquisador com base em informações
obtidas por outras variáveis que não sejam as de participação em grupos.
Vejamos o que significa isso, porque muita pesquisa comportamental
tem o caráter essencial de “predizer” a filiações grupais.
Foi dado anteriormente um exemplo famoso: a previsão do câncer
do pulmão pelo fumar cigarros. O pesquisador, com efeito, designa
pessoas a um grupo de câncer no pulmão ou sem câncer no pulmão com
base no conhecimento do hábito de fumar cigarros. Quanto maior a
relação entre o cigarro e o câncer, mais bem-sucedida a predição. Os pes
quisadores educacionais designam crianças a grupos de aproveitamento
adequado e a grupos de aproveitamento inadequado com base nos resul
tados de testes de aptidão, notas, medidas de atitude, medidas de classe
social, sexo e em outras variáveis e medidas. Os-professores, igualmente,
designam alunos de ginásio a grupos de conceitos — A, B, C, D e F,
por exemplo — com base no desempenho, em testes, trabalhos de aprovei
tamento, tarefas especiais e até julgamentos pessoais.
O leitor sem dúvida se lembrará que a isso chamamos mensuração
nominal. Se uma pessoa tem tal ou qual característica, que seja designada
ao Grupo Ai; se, por outro lado, tem esta ou aquela característica,
j|esignar-se-á ao Grupo A2; e assim por diante para outras características
e grupos. Um ponto-chave é que os indivíduos sejam designados não
aos grupos a que realmente pertençam, mas aos quais “deveríam perten
cer” com base em evidências sobre os indivíduos que são independentes
de participação em grupos. Isto é, a participação no grupo é “predita”
baseada em evidência obtida independentemente e à parte da partici
pação no grupo, mas que se sabe, ou se acredita, ser capaz de prever
essa participação no grupo com eficiência.
O longo aparte acima foi necessário a fim de compreendermos o
método de análise discriminante e a respectiva pesquisa que dizem
(Despeito à predição de participação em um grupo. Análise discriminante é
uma forma muito útil de análise multivariada, cuja principal tarefa é
predizer a participação em um grupo. A pesquisa deste tipo é feita mais
ou menos da maneira que segue. Um pesquisador deseja compreender,
por exemplo, o problema da aquisição de linguagem. Algumas pessoas
podem aprender a falar e compreender uma língua estrangeira com
relativa facilidade; outras pessoas têm enorme dificuldade. Por quê?
Suponhamos que o pesquisador identifique primeiro dois grupos de
indivíduos. Um grupo será chamado “bons aprendizes” porque parecem
ter aprendido bem o italiano e com relativa facilidade, e o outro grupo
“maus aprendizes” porque, depois de um ano de estudo, o grupo fala
e compreende mal ou com dificuldade o italiano. Num esforço de
compreender as diferenças entre os dois grupos, o pesquisador lhes aplica
três testes, os mesmos usados antes: memória, vocabulário e eognição de
relações. Ele raciocina que se o coeficiente de correlação canônica for
tão alto no primeiro estudo, então talvez as três variáveis usadas antes
como variáveis independentes, se usadas juntas, serão capazes de uma
previsão bastante exata do sucesso ou falta de sucesso em aprender um
idioma estrangeiro.
A idéia é muito parecida com as idéias discutidas no capítulo 11,
vários testes ou medidas foram usados para “predizer” o desempenho
em alguma variável dependente. Por exemplo, Holtzman e Brown (1968)
usaram medidas de aptidão acadêmica e hábitos e atitudes de estudo
para preverem notas no segundo grau. Em vez de médias de notas,
uma variável contínua, eles poderíam ter usado uma medida de sucesso
no segundo grau. Tal medida pode ser obtida pedindo aos professores
que categorizem cada aluno como “bem-sucedido” ou “malsucedido.”
Ou o critério de terminar ou não o ginásio pode ser usado para indicar
“bem-sucedido” e “malsucedido” . Em outras palavras, é usada a partici
pação em um grupo, uma variável dicotômica, ou de dois valores.
A quantificação é simples: atribua 1 a ‘bem-sucedido” e 0 a “malsuce
dido.” Se for feita agora uma análise regressão múltipla, com aptidão
acadêmica e medidas de hábitos e atitudes de estudo como variáveis
independentes e a variável dicotômica, “sucesso”, como a variável depen
dente, teremos, com efeito, uma análise discriminante.
O aprendizado de linguagem revisitado
Vamos voltar ao problema da aprendizagem de um idioma. Suponha

mos que em vez de duas variáveis dependentes, como na tabela 13.1,
tivéssemos uma variável dependente dicotômica. Tal situação é dada na
tabela 13.2. Vamos conceber um problema semelhante ao da tabela 13.1
e sua discussão. Suponhamos que o problema seja explicar ou predizer
o sucesso em aprender uma língua estrangeira, desta vez o holandês.
Oito indivíduos que estudaram holandês durante um ano foram exarni-
244
fiados por três especialistas atuando como juizes e considerados “bem-
lucedidos” ou “malsucedidos” em falar holandês. Quatro deles foram
fiaracterizados pelos juizes como “malsucedidos” ; são as pessoas de
a 4 na tabela 13.2 e receberam 0 para indicar sua falta de sucesso
Tabela 13.2 Notas fictícias de três medidas de variáveis independentes de capaci

dades relacionadas com linguagem e uma medida dicotômica de sucesso em
aprendizado de um idioma (holandês).
Variável independente Variável dependente

X, X2 X3 Y
Memória Vocabulário Relações Categoria Sucesso,

Pessoas
linguagem
1 12 9 9 Sem sucesso 0
5 24 19 20 Sucesso 1
6 18 16 21 Sucesso 1
7 15 17 14 Sucesso 1
8 20 14 10 Sucesso 1
(coluna Y da tabela). As outras quatro pessoas, de 5 a 8, foram caracte

rizadas como “bem-sucedidas” . Receberam 1 nà tabela. Em outras pala
vras, os “dados” na tabela 13.2 consistem nas notas das três variáveis
independentes de memória, vocabulário e relações e notas de 1 e 0 na
variável dependente, aprendizado com sucesso, 1 indicando “bem-suce
dido” e 0 “malsucedido”.
Atribuir 1 e C assim parece confundir algumas pessoas. É uma
maneira natural, simples e eficaz de quantificar uma variável que
expressa participação em um grupo. Na verdade, já foi introduzida
quando variáveis como sexo, classe social, vivo-falecido e preferência
política foram discutidas. Geralmente tais variáveis são quantificadas
mediante contagem e os resultados colocados em tabelas de cruzamento
de variáveis, que têm freqüências nas células. Mas podem ser quantifi
cadas com 1 e 0 e suas correlações com outras variáveis facilmente
calculadas. As correlações entre a variável, sucesso da tabela 13.2, por
«exemplo, e as variáveis independentes da tabela são, em ordem, 0,56,
0,92 e 0,70, indicando que o sucesso no aprendizado de um idioma
está substancialmente correlacionado com as variáveis de memória, voca
bulário e relações,, mas principalmente muitíssimo correlacionado com
vocabulário. É mais difícil explicar a atribuição de 1 e 0. Neste caso a atri-
245
buição foi feita. deliberadamente para realçar as correlações. Em
pesquisas reais, entretanto, usam-se outros e melhores métodos.
Se for feita uma análise de regressão múltipla com os dados da
tabela 13.2 e se for bem sucedida — com os dados da tabela 13.2 foi
bem sucedida: R2 = 0,85 —, então a equação de regressão obtida pode
ser usada com futuros alunos. Digamos que um novo grupo de estudantes
está para começar a estudar o holandês. Poderemos aplicar-lhes os três
testes e, usando a equação de regressão obtida na análise anterior,
calcular uma nota predita para cada um deles. Essas notas podem então
ser usadas para indicar provável “sucesso” ou “falta de sucesso” em
aprender holandês.
A equação de regressão calculada com os dados da Tabela 13.2 é:
Y’ = — 0,99 + 0,01Xi + 0,14X2 — 0,01X3
Suponhamos que as notas de um indivíduo sejam Xi = 12, X2 = 9, e
X 3 = 9 (notas da Pessoa 1 na tabela 13.2). Então, substituindo essas
'■c notas na equação acima, Y’ = 0,06. Suponhamos que as outras notas de
outro indivíduo sejam Xi = 24, X2 = 19 e X3 = 20 (notas da Pessoa
5 na tabela 13.2). Substituindo na equação, obtemos Y’ = 1,23. Pode
mos então predizer que o primeiro aluno não se sairá bem e o segundo
sim. Estamos, com efeito, predizendo participação em um grupo, ou
predizendo 1 ou 0. A nota predita do primeiro aluno, de 0,06 está
próxima de 0; portanto, provavelmente ele não terá sucesso. A nota do
segundo aluno de 1,23 está próxima de 1; ele, portanto, provavelmente
terá sucesso.
Naturalmente 0 procedimento é falível, como todos o são. Nossas
predições são probabilísticas: dizemos apenas, com base nas três notas,
que um estudante provavelmente se sairá bem ou não se sairá bem.
Dada uma “boa” equação de regressão, ou de predição, acertaremos
uma boa proporção de vezes que usarmos a equação. Mas poderemos
errar às vezes. Leitores insatisfeitos com tal falta de predição perfeita
podem se consolar com o pensamento que sem o conhecimento fornecido 1
pelos testes quaisquer predições feitas — talvez baseadas na intuição,
experiência ou outros critérios mais ou menos subjetivos — provável- -
nente, não seriam tão boas.
Em todo caso, a análise discriminante é uma ferramenta poderosa
com problemas tanto práticos quanto teóricos. O uso prático foi ilustrado
com 0 exemplo dado acima. O uso teórico é sugerido pela equação de
regressão. A própria equação revela pistas para a relativa importância das
três variáveis independentes em sua suposta influência no aprendizado
de uma língua — se,, sem dúvida, o aprendizado do holandês puder
ser considerado representativo do aprendizado de idiomas e se a amostra,
246
cujos dados determinaram a equação e outras estatísticas de regressão,
for igual a outras amostras de estudantes de idiomas.4
Homem ou chimpanzé? Um exemplo de pesquisa de análise discriminante

Em um estudo de fósseis (Howells, 1972), os antropólogos tinham
que saber se determinado osso — dá extremidade inferior do antebraço
— pertencera a um ser humano ou a um chimpanzé. Este é um problema
difícil porque há semelhanças e características comuns entre os dois
tipos de ossos, especialmente na região corporal deste osso em particular.
Os antropólogos sabiam, entretanto, que era possível usar sete medidas
de ossos para distinguir ossos humanos de ossos de chimpanzés. O proble
ma ainda é difícil porque cada uma dessas medidas, tanto para homens
quanto para chimpanzés, tem uma variabilidade considerável e assim
haver uma superposição entre as medidas do homem e as do macaco.
Para visualizar um pouco do problema, examine a figura 13.1, em que
são desenhadas duas distribuições que se superpõem. (Estas são chamadas
distribuições normais. Isto significa, aproximadamente, que a maiorii das
notas, as de amplitude intermediária, ocorrerá no meio da distribuiç 3,
e cada vez menos notas ocorrerão nas extremidades inferior e superior.)
u„.
Ui
Q (
o
2 t
0
(ri
D
t3
Figura 13.1
4 Pode-se questionar o holandês como representativo de outras línguas.^ Seu apren

dizado, tanto para a escrita como para a leitura, parece ser mais difícil que o di-,
outras línguas acidentais. Todavia, não se sabe se isto é ou não verdadeiro.
Se for verdadeiro, então, a generalização fica enfraquecida. Se o holandês for mais
difícil que outras línguas, então é possível que, com outras línguas, teriam sido
Obtidas equações de regressão bem diferentes, e assim predições bem diferentes.
A distribuição A tem uma média de 57 e a distribuição B tem uma
média de 70. Suponhamos que a escala de mensuração, indicada pela
linha-base da figura, represente uma certa medida de osso que tenha
distinguido com fidedignidade ossos de homem e de chimpanzé. A distri
buição A representa medidas humanas e a distribuição B, medidas de
macaco. A média de A é 57 e a média de B é 70; determinou-se que
uma diferença de 13 era estatisticamente significante.
Suponhamos que temos cinco medidas, a, b, c, d, e e. Por serem extre
mas, as medidas a e b podem ser quase claramente categorizadas como
humano e chimpanzé, respectivamente. Elas caem em lugares sem nenhu
ma superposição na escala (a linha-base). Mas as medidas c e d, embora
próximas das duas médias, caem na área de superposição (indicada pela
área sombreada de linhas horizontais). A que grupo pertencem? c prova
velmente é humano e d provavelmente macaco. Mas não se pode ter
muita certeza porque ambas estão na área da superposição das duas
distribuições. E com e, a medida que cai perto do meio de ambas as
distribuições, fica-se em dúvida maior ainda.
Isto ilustra o problema com uma medida apenas. Se tivermos várias
medidas, entretanto, todas elas capazes de diferenciar fósseis humanos e
símios desta mesma maneira estatística, talvez possamos ser mais confian
tes na categorização dos ossos cuja identidade não é conhecida. Em sua
análise, Howells e um colega (Patterson) usaram sete de tais medidas —
não precisamos enumerá-las; são medidas técnicas e não pertinentes ao
nosso interesse imediato — e a análise discriminante para identificar o
osso desconhecido. É suficiente dizer que as sete medidas foram deter
minadas como capazes de diferenciar ossos humanos e símios. As sete
medidas foram feitas em 40 ossos humanos e 40 ossos de chimpanzés
em dois museus. O particular osso em investigação foi comparado às
médias das sete medidas dos 40 ossos humanos e também às médias das
sete medidas dos 40 ossos de chimpanzés, Infelizmente este procedimento
não levou a uma identificação perfeita por causa de uma superposição
das medidas.
Na técnica da função discriminante é possível extrair dos dados
uma combinação ponderada de medidas que distinguirão os grupos ao
máximo. (Uma “ combinação ponderada” significa que as variáveis de
uma combinação recebem ênfases quantitativas diferentes maiores ou
menores, atribuindo-se “pesos” diferentes, como 0,94; 0,72; 0,05 —0,40;
1,00 e assim por diante, a elas.) Howells desejava diferenciar o máximo
possível os dois grupos de ossos, usando as sete medidas. Qual a melhor
maneira de combinar as medidas para conseguir isso? A análise discrimi
nante, com efeito, descobre essa combinação maximamente diferencia-
dora, como já ficou indicado. A combinação, na realidade um perfil das
sete medidas, foi então aplicada ao fóssil investigado. A questão não é
248
apenas resolver este problema em particular mas também compreender
como funciona este fascinante método multivariado. Vamos fazer uma
breve digressão geométrica para ilustrar como funciona a análise discn-
minante. Ao fazer isso, vamos tomar de empréstimo e adaptar uma bela
demonstração apresentada por Tatsuoka (1970, pp. 5-7) em seu lúcido
manual sobre análise discriminante. Esta demonstração, alem de elucidar
a análise discriminante, joga mais um pouco de luz sobre a analise
multivariada em geral, em parte porque aborda o problema de concei-
tualizar espaços de k (mais de duas) dimensões.
Uma divergência geométrica ilustrativa

Suponhamos que temos seis ossos, três humanos e três de antropóide.
Suponhamos ainda, que temos duas medidas apenas, Xi e X2, em vez
de sete, e que essas medidas, em pares para cada um dos seis ossos,
sejam (1,5), (1,3), (3,5), (3,2), (4,5) e (5,4). O primeiro conjunto de
três pares de medidas vem de ossos humanos e o segundo conjunto, de
ossos de chimpanzé. Descobrimos um novo osso e desejamos saber a
qual dos grupos ele pertence. As duas medidas, Xi e X2, deste osso,
são (3,3).
Os seis pares de medidas Xi e X2 estão representadas na figura
13 2 Os três ossos humanos estão indicados por cruzes e os três antro-
póides, por círculos. O osso desconhecido está representado por uma
cruz dentro de um círculo. Por esta representação, é virtualmente
impossível dizer a qual grupo pertence o osso< cai bem perto do meio
dos dois conjuntos de medidas. (Como o leitor está imaginando, fiz isto
X
6 - '
5 + +
(1,5) (3,5)
4 o
(5,4)
3 + ©
(1,3) (3,3)
2 0
(3,2)
1
I L
1 2
Figura 13.2
249
de propósito.) Designá-lo para um dos grupos é questão que requer
estudo. m m
Vamos tomar uma idéia já apresentada, a da combinação linear

de Xi e X2 cada uma ponderada de sorte que uma única nota Y possa
ser calculada de cada par de notas X. Sejam os pesos 0,83 e —037
(Estes valores foram calculados atribuindo-se valores de Y iguais a 6
aos primeiros três pares e valores de Y iguais a 1 aos segundos três
pares, e fazendo-se, em seguida, uma análise comum de regressão. Os
valores são pesos de regressão.) Desenha-se então uma linha Y como
projeção de todos os seis pontos representados de sorte a maximizar
(aproximadamente) a diferença entre os dois grupos. Isto foi feito na
tigura 13.3, onde foram traçadas perpendiculares à linha Y, de cada
um dos pares de notas representados. Os pontos na linha Y que refletem
cada um dos pontos representados são — 1,0; — 0,3; 0,6; 1,5; 1,9
c 3,0.
A média desses seis valores Y é 0,95. Observe que isso separa
claramente os dois grupos de pontos. Na figura 13.3, os dois grupos de
j ® leitor interessado em melhor saber como fazer isto e no raciocínio envolvido

deve consultar o manual de Tatsuoka (1970, pp. 5 e ss).
250
por íos representados estão circulados separadamente e a linha ondulada
#l»cre eles acentua essa separação. Temos agora dois conjuntos de pontos ■
^rrespondentes aos dois grupos de ossos e as medidas associadas á eles.
O “sistema” pode ser usado para a identificação e categorização de ossos
incontrados no futuro. As regras são: Tome as medidas Xi e X2 do osso;
ffcpresente estes valores em um gráfico como 0 da figura 13.3; trace
Uma perpendicular à linha Y e leia o valor; se for maior de 0,95,
ftribua-o ao chimpanzé, do contrário, atribua-o ao homem.
Este exemplo, então, ilustra mais ou menos como funciona a análise
Éíscriminante. No exemplo com sete medições de ossos, em vez de serem
Usados apenas Xi e X2, são usados Xi, X2, X3, X4, X5, X ô e X7. O enten
dimento intuitivo, que usamos no exemplo acima, nos abandona agora.
As idéias básicas, entretanto, são as mesmas, ou pelo menos semelhantes.
As sete medidas ou variáveis são usadas em uma regressão múltipla para
jpredizer a participação no grupo. Os grupos originais de 40 ossos huma
nos e 40 ossos de chimpanzés são usados de modo similar a sujeitos
em um experimento psicológico ou educacional para fazer a análise de
ègressão. A variável dependente é a participação no grupo. A regra
Í umtitativá é simples: se for osso de chimpanzé, atribua 1; se for osso
humano, 0. O método discriminante então faz 0 que está representado
na figura 13.3: “projeta” uma combinação linear das sete variáveis ou
medidas numa linha Y para produzir o máximo de separação possível
dos dois grupos. Naturalmente não faz isso. A análise dos dados produz
um conjunto de pesos que são usados em uma equação discriminante
(regressão). As sete medidas de novos sujeitos_— neste caso os sujeitos
são ossos — são inseridos na equação para obter notas discriminantes,
que são então usadas para categorizar os sujeitos ou ossos.
Suponhamos que a equação discriminante do exemplo das duas
medidas dado acima tenha sido:
Y = 0,80Xi - 0,40X2
e Xi = 2 e X2 = 5. Então,
Y = (0,80(2) - (0,40) (5) = -0 ,4 0
Isto está bem abaixo da “nota de separação” de 0,95 dada anteriormente
(a média das seis medidas na linha Y da figura 13.3); portanto, o fóssil
é um osso humano. Note também que o mesmo resultado podería ter
sitio obtido representando o ponto (2,5) na figura 13.3 e depois traçando
uma perpendicular à linha Y.
Volta a Howells
Na pesquisa de Howells, a média humana numa linha Y foi 61,42

e a média chimpanzé foi 99,71. Estas são as médias das “notas discrimi-
251
nante” calculadas para os 40 ossos humanos e para os 40 ossos de
chimpanzé. As sete medidas do osso desconhecido produziram uma
nota discriminante de 59,40. Isto, naturalmente, está próximo da média
humana de 61,42, e o osso é classificado como humano. A probabilidade
do osso ter pertencido a um ser humano e não a um chimpanzé é alta.6
A análise discriminante e outras formas de análise multivariada são,
naturalmente, muito mais complexas. Entretanto, as idéias básicas são
relativamente simples — depois de compreendidas. O principal ponto dos
exemplos é que muitos problemas das ciências comportamentais são
complexos demais para serem resolvidos adequadamente por métodos
mais simples. É exigida a abordagem multivariada. Naturalmente jamais
deve-se usar método complexo onde um método simples resolve. A
questão é: Um método simples resolverá? A resposta a esta questão é
inseparável do problema e do julgamento do pesquisador.
Em um sentido mais geral, a análise discriminante é um método
de atribuir indivíduos a grupos com base na informação sobre os indi
víduos em duas ou mais variáveis. Até aqui usamos apenas variáveis
dependentes dicotômicas e dissemos que isso nada mais é que regressão
múltipla com uma variável dependente dicotômica, geralmente quantifi
cada como ■{1,0}-. A análise discriminante, entretanto, de forma alguma é
limitada a tais variáveis dicotômicas. Por exemplo, Cooley e Lohnes
(1962) usaram o método para discriminar três grupos usando medidas
de valores e personalidade como preditores (variáveis independentes).
Os três grupos eram um grupo de pesquisa, estudantes que faziam
um trabalho de pós-graduação para fazer pesquisa básica; um grupo de
ciência aplicada, pessoas que continuam em ciência e engenharia, mas
que não pretendem fazer pesquisa; e um grupo não-científico, dos que
deixam o campo para entrar em áreas que têm contato imediato com
pessoas. Alunos de seis faculdades responderam às medidas de personali
dade e valores e três anos depois, como ficou descrito acima, sua partici
pação nos três grupos ficou determinada. Cooley e Lohnes diferenciaram
os membros dos grupos e conseguiram descrever algumas diferenças
grupais.
A análise discriminante foi usada principalmente para pesquisa
aplicada. Seu uso é geral como se segue. Com base na teoria, conheci
mento prévio, ou palpite, medidas apropriadas de capacidade, personali
dade e outras variáveis, são aplicadas a membros de grupos conhecidos.
É feita a análise discriminante e calculadas as equações discriminantes
(como a equação de regressão descrita acima). As equações então são
usadas para predizer a (posterior) participação de indivíduos em um
6 No fim de seu trabalho Howells diz que seu colega, Patterson, voltou à região
onde foi encontrado o fóssil e encontrou outras provas confirmando a conclusão
discriminante.
252
grupo cuja participação no grupo não é conhecida, como fizemos uo
exemplo dos ossos. Um psicólogo, por exemplo, pode usar um conjunto
de testes com amostras selecionadas de meninos delinqüentes e não delin-
qüentes e calcular a equação discriminante para “predizer” delinqüência,
participação ou não participação no grupo de delinqüentes ou não delin
qüentes. Eh) outras palavras, ele calcula a equação com indivíduos cuja
participação no grupo é conhecida, delinqüentes e não delinqüentes.
Pode então usar a equação para predizer a posterior participação no
grupo, a delinqüência ou não delinqüência posterior de outros indivíduos.
Ele simplesmente aplica as mesmas medidas a outros indivíduos e, com
base nas notas que eles obtem, calcula sua futura participação nos grupos,
sua futura delinqüência ou não delinqüência. Isto, naturalmente deve
ser feito com grande cuidado e reserva. Afinal, a aplicação de uma
equação obtida com um grupo pode não ser aplicável a outro grupo por
vários motivos. Não obstante, a análise discriminante é um esquema de
predição útil e poderoso em pesquisa aplicada.
Suponhamos, agora, que um pesquisador básico esteja interessado
em descrever as diferenças entre grupos e em compreender porque os
grupos são diferentes. Ã análise discriminante pode ser usada para
ajudá-lo em tal descrição e compreensão. Na verdade, foi usada assim
por Cooley e Lohnes na pesquisa sumarizada acima. Este uso do método
é mais científico do que simplesmente predizer participação em um
grupo, porque Cooley e Lohnes estavam tentando entender por que são
feitas as escolhas de carreiras, saber alguma coisa dos determinantes de
suas personalidades e valores, e não. apenas predizer tais escolhas. Esta
diferença entre os objetivos da pesquisa básica e aplicada é importante
e está muito bem ilustrada pelo uso básico e aplicado da análise discri
minante.
Este ponto é tão importante que deveria ser mais discutido. Vamos
voltar ao exemplo de aprender holandês, ilustrado pelos dados ^da
tabela 13.2. Os educadores interessados no ensino de línguas estrangeiras
deveriam usar normalmente um método como a analise discriminante
preditivamente. Isto é, eles querem saber como predizer acertadamenté
o bom resultado no aprendizado do holandês. Geralmente querem saber
quais estudantes terão sucesso e quais os que provavelmente terão dificul
dades. Assim, talvez, eles poderão individualizar melhor o ensino. Os
pesquisadores mais orientados para a pesquisa básica, por outro lado,
mais provavelmente quererão saber por que e como alguns indivíduos
têm mais sucesso que outros. Para eles, a predição é mais um subproduto
do método. Provavelmente eles estarão mais interessados no aprendizado
da linguagem como fenômeno natural a ser explorado e compreendido.
Este esboço das duas orientações gerais da pesquisa está um pouco
pxagerado, naturalmente. O professor de holandês, sem dúvida, também
253
estará interessado em como e por que alguns indivíduos têm mais
sucesso que outros. E o pesquisador básico quererá saber se poderá
predizer o aprendizado bem sucedido e mal sucedido. Entretanto, a
distinção continua e é sempre importante. O ponto a ser ilustrado é que
a análise discriminante — e, logicamente, outras abordagens e métodos
mui tivariados — pode ser muito bem usada para ambos os propósitos.
Voltaremos à distinção básico-aplicada no capítulo 16.
Análise de estruturas de covariância
As abordagens e métodos multivariados libertaram os pesquisadores

das restrições de estudarem a influência de apenas uma ou duas variáveis
sobre uma variável dependente. Na pesquisa experimental, duas, três e
até mais variáveis podem ser manipuladas simultaneamente (embora haja
limitações práticas). A análise multivariada, entretanto, tem suas aplica
ções mais úteis e importantes em pesquisa não-experimental, onde os
grandes problemas são identificar e controlar várias fontes de variância.
No estudo da realização escolar ou no estudo de determinantes de inteli
gência, por exemplo, é quase absurdo pensar em uma ou duas variáveis
como determinantes. Tanto a realização escolar, quanto a inteligência,
assim como outros fenômenos psicológicos e sociológicos são complexos.
São, portanto, determinados .complexamente. Essa complexidade exige
concepções mui tivariadas. Sem dúvida a pesquisa científica psicológica,
sociológica, antropológica e política vem sendo transformada. Em 1930,
por exemplo, um estudo aplicado como Igualdade de Oportunidades
■Educacionais (Coleman e outros, 1966), já discutido no capítulo 8, onde
foram estudados os efeitos de mais de cem variáveis independentes sobre
a realização, dificilmente podería ter sido concebido, quanto mais feito.
Igualmente os estudos de Guilford (1967) e Catell (1963), estudos teóri
cos de inteligência, provavelmente nem teriam sido conceitualizados.
Ê muito possível, aliás, que a pesquisa comportamental tenha sido
revolucionada, de certo modo mudada radicalmente, devido ao impacto
das conceituações multivariadas e do computador moderno.
Para ilustrar o desenvolvimento radical, a conversão até, da pesquisa
comportamental devido ao pensamento multivariado, quero descrever e
ilustrar o que provavelmente seja a síntese mais complexa e poderosa
dos métodos multivariados para atingir objetivos científicos teóricos e
aplicados. Chama-se análise de estruturas de covariância, e faz parte
do sistema de Karl Jõreskog (1974, 1976), que juntou o trabalho de
diversos analistas em uma síntese brilhante e produtiva.7 A análise de
7 Por minha discussão vai parecer que Jõreskog foi o único responsável pela
análise de estruturas de covariância. Mas este modo de falar é por conveniência
apenas. Realmente, houve várias pessoas importantes no desenvolvimento da meto-
254
estruturas de covariância significa, essencialmente, a análise da variação
simultânea de variáveis que se encontram em uma estrutura, um edifício,
ditado pela teoria. O sistema faz vários tipos de análise multivariada
tas de tal maneira que não temos necessidade de perguntar que forma
E e análise está sendo feita. Isto acontece porque as possibilidades analíti
cas fazem parte 'dç um sistema mais amplo. Em outras palavras, Jõreskog
criou uma fórmula matemática e estatística abstrata que pode ser expressa
em equações algébricas e sua formulação abarca diversos métodos multi
variados.
Os programas de computador foram integrados ao sistema (veja a
nota n.° 7) de tal forma que uma concepção de pesquisa é ^‘realizada
com o uso do programa do computador. É uma descrição bastante
abstrata do sistema de Jõreskog, sendo insatisfatória para uma compre
ensão adequada. Para entendê-la melhor, vamos tomar dois exemplos.
O primeiro é de análise fatorial, porque é a maneira mais clara e fácil
de mostrar a idéia do sistema. Deve ser enfatizado, entretanto, que o
uso real do sistema envolve problemas mais intrincados e complexos.
Sem dúvida, uma de suas molas mestras é sua capacidade de lidar
eficientemente com conjuntos de variáveis relacionadas de maneiras com
plexas. O segundo exemplo é de análise de trajetória. Vamos explicar
mais adiante o que é análise de trajetória (path analysis).
Um exemplo teórico revisitado
No capítulo 12 foram apresentados os elementos de uma teoria estru

tural de atitudes sociais. A teoria “diz” que duas dimensões ^gerais ou
fatores formam a base das atitudes sociais, “conservadorismo” e “libe
ralismo”, e que estas duas dimensões gerais são independentes uma da
outra (Kerlinger, 1967). Esta última frase significa que a correlação
entre os dois fatores é próxima de zero. Isto implica que os conservado
res adotam princípios conservadores e não se opõem necessariamente a
princípios liberais. Por outro lado os liberais adotam princípios liberais
e necessariamente não se opõem a princípios conservadores.
dologia, cujas contribuições Jõreskog reconhece (por exemplo, Bock & Bargmann,
1966- Wilev, Schmidt & Bramble, 1973). Entretanto, Jõreskog juntou varias abor
dagens e métodos de análise em um (ou dois) sistemas gerais nos quais a mate
mática, a estatística e a tecnologia do computador foram integradas. De fato, os
dois sistemas de Jõreskog foram vagamente denominados pelos nomesi dos pro
gramas de computador usados para melhorar o sistema: ACOVb e nií>KE.u. a
primeira das duas referências dadas acima (1974) usa a mais simples das duas
abordagens, ACOVS. A segunda referência (1976) usa LISREL, que e mais geral
e mais complexa. É também mais poderosa. Na descrição acima limito-me a um
aspecto simplificado do núcleo da pesquisa e teoria do sistema.
255
A concepção comum de atitudes sociais é bastante diferente.
Enquanto a “teoria” ora mencionada, e dada com mais detalhes no
capítulo 12, diz que o conservadorismo e o liberalismo são entidades
distintas e separadas, idéias populares geralmente aceitas dizem que as
atitudes são bipolares. Um concepção bipolar, ou com duas extremidades,
de atitudes sociais implica que princípios e pessoas conservadoras
acham-se em um extremo de um continuum de atitudes sociais e prin
cípios e pessoas liberais acham-se no outro extremo do continuum. Isto
significa que não apenas os conservadores adotam princípios con
servadores, mas qtie também se opõem a princípios liberais — e a mesma
coisa para liberais e princípios liberais.
Argumentos racionais podem e foram aventados para ambas as
concepções. Mas o que diz a evidência empírica? A evidência empírica,
obtida em diversos estudos, a maioria usando a análise fatorial (por
exemplo, Kerlinger, 1972; Kerlinger, Middendorp, & Amón, 1976),
parece apoiar a relativa independência do conservadorismo e liberalismo.
Mas o assunto ainda não foi resolvido. Como as duas concepções, ou
teorias, poderão ser testadas com o sistema de Jõreskog?
Vamos usar o exemplo de itens de atitude, do capítulo 12. Suponha
mos que aplicamos quatro itens de atitude, dois sabidamente liberais,
igualdade para as mulheres e controle da natalidade — e dois conhecidos
como conservadores — propriedade privada e negócios — a seis pessoas.
(Novamente, muito mais itens de atitude de afiliação “conhecida” e
“desconhecida” seriam administrados a muito mais pessoas.) Os resulta
dos são aqueles da tabela 12.5, e são reproduzidos, para facilitar a
referência, na tabela 13.3. As correlações entre os itens foram relatadas
Tabela 13.3 Respostas de seis pessoas a quatro itens de atitude social (repro
duzidas da tabela 12.5) ’
Itens
1 2 3 4-
Igualdade para Controle da Propriedade

Pessoas as mulheres natalidade privada Negócios
1 1 2 4 2
2 1 3 2 2
3 2 2 5 6
4 5 6 5 5
5 6 5 3 4
6 6 6 2 1
* Os números na tabela são as classificações feitas por seis pessoas, dos quatro
referentes em uma escala de 1 a 6, 1 indicando baixíssima aprovação e 6 indi
cando forte aprovação.
256
na tabela 12.6 e estão reproduzidas aqui na tabela 13.4. Os resultados
de análise fatorial desta matriz de correlação, dados originalmente na
tabela 12.7, aparecem novamente na tabela 13.5. Estes resultados pare
cem apoiar a concepção de independência e dualidade, porque os dois
itens liberais estão carregados em um fator (cargas grifadas) e os dois
conservadores em outro fator (também grifadas). As cargas negativas
são baixas e sem conseqüências. Se uma concepção bipolar estivesse
correta, obteríamos um fator com os dois itens liberais com substancial
carga positiva e os dois itens conservadores tendo substanciais cargas
negativas.
Usando a abordagem de Jõreskog, estabelece-se primeiro a situação
teórica com diagramas. Os diagramas da figura 13.4 expressam as duas
alternativas. À esquerda (A) da figura está a hipótese de dois fatores.
Os números 1, 2, 3, 4, representam os quatro itens de atitude, 1 e 2
sendo igualdade para as mulheres e controle da natalidade e 3 e 4, pro
priedade privada e negócios, itens conservadores. Os círculos represen
tam os fatores presumidos, L e C, ou liberalismo e conservadorismo.
As setas representam a influência ou determinação nas direções de L
para 1 e 2 e de C para 3 e 4. Isto é, o fator L “determina” ou está
subjacente aos itens 1 e 2 e o fator C “determina ou está subjacente
aos itens 3 e 4.
Tabela 13.4 Correlações entre quatro itens de atitude social de seis pessoas
(reproduzidas da tabela 12.6).
Igualdade para Controle da Propriedade

as mulheres natalidade privada Negócios
Igualdade para as mulheres 1,00 0,91 -0 ,1 5 0,04

Controle da natalidade 0,91 1,00 -0 ,2 3 -0,11
Propriedade privada -0 ,1 5 -0 ,2 3 1,00 0,81
Negócios 0,04 -0,1 1 0,81 1,00
Tabela 13.5 Matriz fatorial rotada: resultado da análise fatorial da matriz de

correlação da tabela 13.4 (reproduzida da tabela 12.7).
Fatores
Itens A B
Igualdade para as mulheres 0,94 0,13

Controle da natalidade 0,94 0,00
Propriedade privada -0 ,2 5 0,83
Negócios -0 ,1 0 0,87
257
(Vide texto para explicação dos símbolos)
Figura 13.4
O diagrama da direita (B) expressa a hipótese bipolar. Um fator,

designado apropriamente LC, ou L versus C, na figura 13.4 (B), deter
mina todos os quatro itens, mas determina os itens 1 e 2 positivamente
e os itens 3 e 4 negativamente. Portanto, os sinais mais e menos foram
atribuídos às setas. (Note que a figura é muito simplificada. Por exemplo,
já que sempre há erros de mensuração ao se medir variáveis, tais erros
deveríam ser incluídos na figura e calculados pelo sistema.)
O próximo passo é expressar a situação diagramada na figura 13.4
em equações algébricas e depois encaixá-las no sistema de equações
gerais de Jõreskog. Vamos omitir este passo e estabelecer as chamadas
matrizes hipóteses ou matrizes “alvos.” Uma matriz alvo é geralmente
uma matriz de l's e 0 ’s, 1 indicando onde as cargas fatoriais substanciais
(ou outras estatísticas) são esperadas e 0 onde as cargas próximas de
zero são esperadas. (No presente exemplo vamos usar também — 1.)
Vamos chamar a hipótese ou teoria de dois fatores A e a hipótese ou
teoria de um fator B. Se as intercorrelações dos quatro itens — veja
tabela 13.4 — forem analisadas fatorialmente, que espécie de matrizes
podemos esperar para A e B? Que espécie de matrizes as duas teorias
“predizem”? As duas matrizes alvos que expressam as situações alterna
tivas estão dadas na tabela 13.6. (Veja o texto para a explanação dos
símbolos.)
O próximo passo no procedimento será analisar fatorialmente a
matriz de correlação da tabela 13.4. Depois de feito isto, os resultados
são comparados às matrizes alvos usando-se um procedimento quantita
tivo cujo resultado final indica o grau de acordo entre a matriz fatorial
obtida dos dados — fornecida na tabela 13.5 — e cada uma das duas
matrizes alvos da tabela 13.6. Este não é o verdadeiro procedimento.
Serve apenas para indicar a idéia. O verdadeiro procedimento é mais
258
Tabela 13.6 Matrizes alvos, ou matrizes hipóteses, expressando hipóteses alter
nativas para a estrutura fatorial da matriz de correlação da tabela 13.4.a
Hipótese de Hipótese de
dualidade bipolaridade
I II I II
1 0 -1 0
1 0 1 0
0 1 1 0
0 1 -1 0
*As entradas na tabela têm os seguintes significados: 1, carga fatorial positiva

significante; — 1, carga fatorial negativa significante; 0, carga fatorial próxima
de zero.
poderoso; será delineado adiante. Em todo caso, os dois coeficientes

de acordo — coeficientes usados frequentemente para comparar matri
zes fatoriais — calculados, por um lado, entre todas as oito cargas fato-
riais da tabela 13.5 e todos os valores 1 e 0 da matriz alvo de dois fatores
da tabela 13.6, e entre as cargas da tabela 13.5 e os valores 1, — 1 e 0 da
matriz alvo bipolar, são 0,99 para a hipótese de dois fatores e 0,61
para a hipótese bipolar. Evidentemente, a matriz alvo de dois fatores
concorda muito mais com os dados de pesquisa do que a matriz alvo
bipolar.
O método acima é insuficiente e não é o verdadeiro formulado por
Jõreskog. O que necessitamos é um método que nos leve de volta às
correlações originais entre os quatro itens. O método que acaba de ser
esboçado põe toda sua fé em comparar a matriz hipótese à matriz obtida
dos dados. É aconselhável voltar mais ainda e dar um jeito de gerar
uma matriz como a matriz de correlação. E essa matriz de correlação
deveria ser “produzida” pela matriz hipótese fatorial e pela matriz
fatorial obtida. Em outras palavras, queremos manipular as cargas fato
riais obtidas e os valores da matriz hipótese de maneira a produzir uma
matriz de correlação. Se a hipótese estiver correta, então esta matriz
“produzida” será muito parecida à matriz de correlação obtida dos
dados. Se, por outro lado, a hipótese não estiver correta — se houver,
por exemplo, quatro fatores ou talvez três, em vez de dois fatores, ou
se as cargas fatoriais obtidas dos dados não encaixarem na estrutura
ou no modelo especificado pelos l ’s e 0’s da matriz hipótese — então
a matriz de correlação “produzida” não estará de acordo com a matriz
de correlação obtida dos dados observados.
259
Uma das idéias básicas e centrais do sistema de Joreskog é a com
paração das matrizes de covariância. Uma matriz de correlação é um
tipo de matriz de covariância. Assim, para o que nos interessa, pode
mos dizer que uma das idéias centrais do sistema é comparar as matri
zes de correlação, uma fornecida pelas correlações entre as variáveis
obtidas e outra produzida por uma manipulação matemática da matriz
hipótese, como mostramos acima, e os resultados forçados pelas exigên
cias da hipótese ou hipóteses.
Para concretizar um pouco o que queremos dizer, vamos considerar
as duas matrizes, I e II na tabela 13.7. A matriz I e a mesma matriz de
correlações observada entre os quatro itens de atitude social já relatados
na tabela 13.4. A matriz II é um conjunto de correlações “forçadas”,
produzidas por um método bem conhecido, a partir das cargas fatoriais
da tabela 13.5. A operação foi simples: a matriz foi multiplicada por
si mesma. (Não precisamos nos preocupar com os detalhes. O leitor
interessado poderá consultar um texto de álgebra de matrizes ou uma
seção de álgebra de matrizes de um texto de estatística, por exemplo,
Cooley e Lohnes, 1971, pp, 15-20; Sullins, 1973; Tatsuoka, 1971,
capítulo 2.) Quando se faz isto, obtém-se a matriz II da tabela 13.7.
Queremos expressar e testar as implicações quantitativas da hipótese
de dualidade e as da hipótese de bipolaridade. As duas hipóteses ficaram
expressas de maneira simples nas matrizes alvo da tabela 13.6. Queremos
encontrar uma forma de operar sobre os fatores obtidos da tabela 13.5
para transformar as cargas fatoriais num conjunto que expresse a hipótese
Tabela 13.7 Correlações obtidas, correlações forçadas e matriz residual: hipó

tese de dualidade.
I: Correlações obtidas II: Correlações forçadas
1 2 3 4 1 2 3 4
1 1,00 0,91 -0 ,1 5 0,04 1 0,90 0,88 -0 ,1 3 0,02

2 0,91 1,00 -0 ,2 3 -0 ,1 1 2 0,88 0,88 -0 ,2 4 - 0 ,0 9
3 -0 ,1 5 —0,23 1,00 0,81 3 -0 ,1 3 - 0 ,2 4 0,75 0,75
4 0,04 -0 ,1 1 0,81 1,00 4 0,02 -0 ,0 9 0,75 0,77
Matriz residual
1 2 3 4
1 0,10 0,03 -0 ,0 2 0,02

2 0,03 0,12 0,01 -0 ,0 2
3 -0 ,0 2 0,01 0,25 0,06
4 0,02 -0 ,0 2 0,06 0,23
260
de dualidade e num outro conjunto que expresse a hipótese de biçola-
íridade. A operação se resume em usar os modelos teóricos expressos na
tabela 13.6 e em fazer com que os dados da tabela 13.5, as cargas
ifatoriais obtidas, se pareçam o máximo possível aos modelos expressos
na tabela 13.6. Quando foi feito isto, foram obtidas as duas matrizes
fatoriais da tabela 13.8.
Tabela 13.8 Matrizes de cargas fatoriais que expressam as hipóteses da dualidade

e bipolaridade.
Hipótese de Hipótese de
dualidade bipolaridade
I II I II
1 0,94 0,13 1 0,81 0,00

2 0,94 0,00 2 0,94 0,00
3 -0 ,2 5 0,83 3 -1 ,0 8 0,00
4 -0 ,1 0 0,87 4 -0 ,9 7 0,00
«---
A matriz da esquerda na tabela 13.8 é exatamente a mesma da

tabela 13.5. Assim, a matriz fatorial obtida da tabela 13.5 já expressava
a hipótese de dualidade. A matriz à direita na tabela 13.8 mostra o
aspecto da matriz fatorial, contando com os mesmos dados e a validade
empírica da hipótese de bipolaridade. Em outras palavras, a matriz deno
minada hipótese de dualidade, se obtida nas correlações originais, apoia
ria a hipótese de dualidade e a matriz denominada hipótese de bipolari
dade, se obtida nas correlações originais, apoiaria as hipótese de bipola
ridade.
Suponhamos agora que cada uma das matrizes fatoriais da tabela
13.8 fossem realmente obtidas a partir dos dados. Queremos gerar uma
matriz de correlação de cada uma delas e queremos comparar esta matriz
de correlação com a matriz de correlação original.
Já havíamos “produzido” uma matriz de correlação a partir da
matriz fatorial da tabela 13.5 e da matriz hipótese, ou alvo, da tabela
13.6 (à esquerda). Foi dada na tabela 13.7 sob a denominação corre
lações forçadas. Se subtrairmos os valores desta matriz dos valores da
matriz designada correlações obtidas, obteremos o que é conhecido como
matriz residual. Esta matriz de resíduo expressa a “diferença” entre as
duas matrizes e assim seu acordo: quanto menores os resíduos, maior o
acordo entre as duas matrizes. O valor médio dos resíduos, omitindo
do cálculo os valores diagonais, é 0,03.
Tabela 13.9 Correlações obtidas, correlações forçadas e matriz residual: hipótese
de bipolaridade.
I: Correlações obtidas II: Correlações forçadas

1 2 3 4 1 2 3 4
1 1,00 0,91 -0 ,1 5 0,04 1 0,66 0,76 -0 ,8 7 -0 ,7 9

2 0,91 1,00 -0 ,2 3 -0 ,1 1 2 0,76 0,88 -1 ,0 2 -0 ,9 1
3 -0 ,1 5 -0 ,2 3 1,00 0,81 3 -0 ,8 7 -1 ,0 2 1,17 1,05
4 0,04 -0 ,1 1 0,81 1,00 4 -0 ,7 9 -0 ,9 1 1,05 0,94
Matriz residual
1 2 3 4
1 0,34 0,15 0,72 0,83

2 0,15 0,12 0,79 0,80
3 0,72 0,79 - -0,17 - •0,24
4 0,83 0,80 - -0,24 0,06
Usando o mesmo procedimento para testar a hipótese de bipolari-

dade, obtemos a matriz de correlação designada Correlações Forçadas,
da tabela 13.9. Subtraindo os valores desta matriz dos valores das
verdadeiras correlações, mais uma vez dados a esquerda da tabela,
obtemos uma matriz residual, dada na parte inferior da tabela, É óbvio
que o “cordo” entre as matrizes I e II é pequeno: os valores dos resíduos
são grandes. Sua média é 0,59. Evidentemente, os resultados obtidos e
partir da hipótese de dualidade concordam muito mais com os dados
reais do que os resultados obtidos a partir da hipótese de bipolaridade.
Resumindo, pode-se usar a análise de estruturas de covariância para
testar que modelo teórico, entre dois ou três outros, melhor combina
com os dados observados. Isto é algo cientificamente sólido. Não nos
esqueçamos que uma das abordagens ou métodos mais significativos e
característicos da ciência é estabelecer e testar hipóteses alternativas.
O cientista não confia na evidência, por exemplo, de que pi leva a q.
Ele insiste em testar explicações alternativas plausíveis, p2, p3 e assim
por diante. A eliminação de tais hipóteses alternativas por meio da
pesquisa fortalece a hipótese pi. A força principal do sistema de Jõreskog
é sua capacidade flexível de testar hipóteses complexas e comparar
resultados obtidos a partir de modelos alternativos.
Nota: variáveis latentes
Uma característica muitíssimo importante e preciosa da análise de

estruturas de covariância tem que ser mencionada, nem que seja ligeira-
262
mente. É a concepção e o uso das chamadás variáveis latentes no sistema.
Uma variável latente é uma variável não-observada, que é usada para
“explicar”, ou que é incluída em hipóteses como estando influindo sobre
outras variáveis latentes ou variáveis observadas. Foi dado um exemplo
no figura 13.4 onde liberalismo (L) e conservadorismo (C) eram
variáveis subjacentes não observadas que se supunha “explicarem” os
quatro itens (ou variáveis) do exemplo. Para tornar a coisa mais clara
e para abordar o sistema de Jõreskog mais de perto, examine-se a
figura 13.5 onde a situação à esquerda da figura 13.4 é representada
mais de acordo com as linhas de Jõreskog.
L (liberalismo) e C (conservadorismo) são variáveis latentes, ou
não-observadas, que supostamente estão subjacentes às quatro variáveis
observadas (itens), estando L subjacente às variáveis 1 e 2, e C às
variáveis 3 e 4. As variáveis observadas são dadas em quadros e as
variáveis latentes em círculos. As setas de um sentido indicam a direção
de influência — por exemplo, L influencia 1 e 2. As setas de dois sentidos
indicam correlação — por exemplo, r,2 é a correlação entre as variáveis
1 e 2. Os e’s indicam os erros de mensuração nas variáveis observadas.
Fornecidos os dados — neste caso as correlações entre os quatro itens
-—, o sistema calcula a influência de L nas variáveis 1 e 2 e a influência
de C em 3 e 4. Estas influências são simbolizadas por ai e a2 (para L)
e as e at (para C), cujos valores são calculados pelo sistema. O sistema
calcula também a correlação entre L e C e as variâncias de erro ei, e2, e3
e e4. A análise então continua ao longo das linhas delineadas acima.
O objetivo da figura 13.5 é mostrar que o método, diferentemente
da maioria dos outros métodos de análises multivariadas, calcula os
efeitos das variáveis latentes sobre as variáveis observadas e até as
relações entre as variáveis latentes. Este é, naturalmente, o material
básico da construção e testagem de teorias. É também muito semelhante à
Figura 13.5
263
análise fatorial. Lembre-se da inteligência fluida e cristalizada de Cattell,
fatores de segunda ordem que podem ser também concebidos como
variáveis latentes. A diferença é que em análise de estruturas de cova-
riância a idéia é generalizada e aplicada a todo tipo de situações teóricas
e analíticas. Além disso, a análise fatorial é um caso especial do sistema
geral. Assim as teorias podem ser formuladas, testadas e comparadas
para mostrar sua congruência com os dados observados.
Um exemplo de análise de trajetória
Para mostrar a versatilidade e a flexibilidade da análise de estru

turas de covariância, vamos examinar agora um tipo diferente de
problema de pesquisa. Os estudos de realização escolar usaram, às vezes,
medidas de inteligência e classe social para predizer tal realização.
Suponhamos que um pesquisador educacional ache estas duas variáveis
insuficientes e que seja também necessária uma medida de motivação.
Ele escolhe uma medida de necessidade de realização, comumente
designada por n Realização, ou simplesmente n Ach (McClelland, Atkin-
son, Clark & Lowell, 1953). Em outras palavras, ele acredita que a
adição de n Ach à inteligência e à classe social melhora a predição
do sucesso na escola mas também fornecerá uma explanação teórica
mais satisfatória de tal sucesso. Sua “explicação” está diagramada na
figura 13.6.8
Às setas do diagrama indicam a direção da influência: a influência
correndo na direção apontada pelas setas. (Vamos, por enquanto, ignorar
os números relacionados às setas.) Por exemplo, SSE (status sócio-
econômico) influencia diretamente Ach (realização). Influencia também
Ach indiretamente, através de n Ach, cuja influência posterior é direta.
(Uma influência direta é representada por uma seta simples de uma
variável à outra. Uma influência indireta é mostrada por uma seta vindo
de uma variável que é ela própria o “ recipiente” de outra seta. Por exem
plo, como ficou indicado acima, SSE influencia n Ach diretamente e
Ach indiretamente, através de n Ach.) As setas geralmente são chamadas
de trajetórias ("paths”). Daí o termo “ análise de trajetória”. O diagrama
de trajetórias, então, expressa a “pequena teoria” do pesquisador. SSE e
Inteligência (Intel.) afetam n Ach diretamente, por exemplo; maior a
inteligência, maior n Ach e quanto mais alta a classe social, mais alta a
realização. Os dois também afetam a Realização diretamente: se classe
média então maior Realização, e se maior inteligência, então maior reali
zação. n Ach também afeta diretamente a Realização, como está indi-
8 Este exemplo é tirado de Kerlinger e Pedhazur (1973, pp. 323-324).
264
cado pela seta entre n Ach e Ach. Mas presume-se, SSE e Inteligência
exercem efeito indireto sobre Realização por seu efeito direto sobre Ach.
(Embora SSE e Inteligência estejam eles próprios correlacionados — isto
é indicado pela seta curva de dois sentidos entre eles — não são
considerados como afetando um ao outro.)
Os analistas de trajetória chamam a formulação acima de um modelo
causai: pelo seu uso podem ser determinadas algumas idéias de causas e
efeitos. (Evitaremos aqui comentar o espinhoso problema causa e efeito.)
Então, pelas correlações entre as variáveis do modelo, eles calculam os
coeficientes de trajetória (path coefficient). Um coeficiente de trajetória é
simplesmente um peso de regressão fornecido pela costumeira análise
de regressão. Por exemplo, a regressão de n Ach sobre SSE e Inteligência
(isto é, SSE e Inteligência são as variáveis independentes e n Ach a
variável dependente) produz coeficientes de regressão (coeficientes beta)
de 0,40 para a trajetória de SSE a n Ach e 0,04 para a trajetória de
Inteligência até n Ach. Estes valores indicam que SSE tem um efeito
substancial sobre n Ach, mas que Inteligência tem efeito pequeno.
Então, faz-se à regressão de Realização sobre SSE, Inteligência e
n Ach (isto é, Realização, a variável dependente, é predita pelas outras
três variáveis). A análise fornece coeficientes, como se segue: de SSE a
Realização, 0,01; de Inteligência a Realização, 0,50; de n Ach a Reali
zação, 0,42. Estes coeficientes de trajetória foram ligados a suas traje
tórias na figura 13.6. Naturalmente, a costumeira análise de regressão
teria produzido nesta situação estes últimos coeficientes. A diferença
entre uma análise de regressão comum e a análisfe de trajetória é, entre
tanto, que as trajetórias de SSE e Inteligência até n Ach foram acrescen
tadas porque o pesquisador acredita, com base ou raciocínio teórico,
que estão agindo tanto influências diretas quanto indiretas. Em outras
palavras, as três variáveis não apenas afetam diretamente Realização;
SSE e Inteligência afetam Realização também indiretamente através de
n Ach. (Note a semelhança de raciocínio ao fenômeno de interação já
estudado.) É uma análise das influências na Realização mais rica, mais
sofisticada e provavelmente mais exata do que as que obtemos pela
análise de regressão comum, neste caso principalmente porque já “expli
camos” n Ach a caminho de “explicarmos” Realização.
Quando examinamos o diagrama de trajetória da figura 13.6, vemos
que duas das trajetórias têm coeficientes de trajetória próximos de zero:
de SSE a Ach, 0,01 e de Inteligência a n Ach, 0,04. Já que uma das
metas da ciência não é apenas a explicação, mas também a explica
ção parcimoniosa, perguntamos: Se suprimirmos estas duas trajetórias
e recalcularmos os coeficientes de trajetória no modelo resultante mais
jjjarcimonioso, será que um teste com os dados originais, como o feito
com o modelo de análise fatorial acima, mostrará um bom acordo entre,
(0,30)
Figura 13.6
de um lado, as correlações entre as quatro variáveis produzidas pelo

novo modelo e, de outro, as correlações originais? Isto é, é possível
calcular um conjunto de correlações entre as quatro variáveis a partir
dos coeficientes de trajetória; esta matriz de correlações é então compa
rada à matriz das correlações originais. Daí, uma matriz residual — o
resultado da subtração de uma destas matrizes de outra — é calculada,
como antes. Se seus valores forem muito pequenos, podemos concluir
que o modelo teórico incorporado no diagrama de trajetória é satisfa
tório.
O novo modelo é dado no diagrama de trajetória da figura 13.7.
A diferença entre este modelo e o da figura 13.6 é que as duas trajetórias
mencionadas acima foram suprimidas. Aqui, Inteligência afeta Reali
zação diretamente e não afeta n Ach. SSE afeta Realização apenas através
de n Ach. Isto é, SSE afeta n Ach, que por sua vez afeta Realização.
Obviamente, o modelo é consideravelmente mais simples e mais parci-
monioso. Novamente, a pergunta é: é consistente com os dados originais,
com as correlações originais?
A tabela 13.10 nos dá a análise para responder à pergunta.
As correlações originais são dadas à esquerda da tabela, A, e as cor
relações forçadas, as correlações calculadas pelos coeficientes de trajetória
Figura 13.7
266
T
Tabela 13.10 Correlações originais, A, correlações forçadas, B, e matriz residual,
quatro variáveis, segundo modelo.
A: Correlações originais B: Correlações forçadas

1 2 3 4 1 2 3 4
1 1,00 0,30 0,41 0,33 1 1,00 0,30 0,41 0,32

2 0,30 1,00 0,16 0,57 2 0,30 1,00 0,12 0,56
3 0,41 0,16 1,00 0,50 3 0,41 0,12 1,00 0,48
í 0,33 0,57 0,50 1,00 4 0,32 0,56 0,48 1,00
Matriz residual
1 2 3 4
1 0,00 0,00 0,00 0,01
2 0,00 0,00 0,04 0,01
3 0,00 0,04 0,00 0,02
4 0,01 0,01 0,02 0,00
■F-
da figura 13.7, são dadas à direita, B. Subtraindo-se a matriz B da
matriz A obtém-se a matriz residual, dada na parte inferior da tabela.
É óbvio que as correlações produzidas a partir dos coeficientes de traje
tória são muito semelhantes às correlações originais: nenhum dos resíduos
é maior, de 0,04. Concluímos, portanto, que o modelo de trajetória da
figura 13.7 é consistente com os dados.*9 Evidentemente, a “explicação”
por trás do modelo da figura 13.7 é satisfatória. Já que é uma “expli
cação” mais simples que o modelo da figura 13.6, vamos aceitá-la como
“melhor” porque é mais parcimoniosa e produz correlações que concor
dam com as correlações originais.
É preciso destacar um ponto importante. O fato de modelo teórico
ser consistente com os dados obtidos não significa que a teoria em que
se baseia o modelo seja necessariamente “correta.” Na verdade, mais de
um modelo pode ser consistente com os dados obtidos. Então, neste
caso, embora o modelo da figura 13.7 seja consistente com as correla
ções obtidas, o próprio modelo pode ou não ser a explicação teórica
9 É preciso tomar cuidado. Se tivéssemos feito a mesma análise com o modelo de

trajetória da figura 13.6, a matriz residual teria somente zeros. Assim o modelo
a‘ figura 13.6 é também consistente com os dados. Mas isto não significa que
E .modelo da figura 13.6 seja melhor ou tão bom quanto o modelo da figura 13.7.
A reprodução perfeita das correlações é quase um artefato. Quando são usadas
todas as trajetórias possíveis em um diagrama de trajetórias, e calculados todos
os coeficientes possíveis, a matriz de correlação original é perfeitamente repro
duzida, qualquer que seja o modelo ou diagrama.
267
"correta.” O método exposto pode, portanto, ser considerado como
possuindo a virtude da negativa. Se um modelo não for consistente com
os dados, provavelmente não será “correto”. Mas se for consistente com
os dados, pode ou não estar “ correto”. Sua “correção”, em outras pala
vras, tem que ser julgada em outras bases, além da estatística. Esta é
uma das dificuldades de todas as teorias e explicações científicas (e de
c-utros tipos). Podem, ser mostradas como provavelmente incorretas, no
sentido de não serem consistentes com a evidência empírica, mas jamais
poderão ser mostradas como absolutamente corretas. Uma explicação
pode ser mostrada como provavelmente “melhor” que outras explica
ções alternativas, mas o cientista jamais poderá ter certeza de que seja
a última palavra. Se o leitor voltar à discussão sobre o fumo e o câncer
de pulmões no capítulo 8, talvez compreenda melhor o que lá ficou dito
a respeito de explicações e explicações alternativas.
Na discussão acima nada ficou dito sobre análise de estruturas de
covariância. Aliás, foi uma descrição mais ou menos convencional da
análise de trajetória. Ficou omitida a análise de estruturas de covariância
para que o leitor pudesse ter; uma visão geral da abordagem de análise
de trajetória no quadro de referência costumeiro da regressão múltipla.
Tentaremos mostrar agora, embora rápida e incompletamente, como a
análise de trajetória é um caso especial da análise de estruturas de
covariância e como o problema analítico da pesquisa pode ser abordado
no quadro de referência da estrutura de covariância.
Em análise de estruturas de covariância, os problemas representados
nas figuras 13.6 e 13.7 podem ser resolvidos com exatamente os mesmos
resultados. Pode ser feito mais, entretanto. Primeiro pode-se calcular as
variâncias de erros de mensuração associadas às medidas falíveis das
variáveis. Tal cálculo mudará então a solução, incluindo os coeficientes
de trajetória. A análise de trajetória geralmente admite a inexistência de
erros, tornando-se assim vulnerável à crítica. Segundo, as variáveis laten
tes podem ser postuladas e calculada sua influência. Por exemplo, no
modelo da figura 13.6, pode-se pensar que uma variável latente tenha
influência tanto sobre n Realização quanto sobre Realização.
Terceiro, a análise de estruturas de covariância permite testes da
significância estatística do acordo entre modelos teóricos e dados obser
vados. Além disso, modelos teóricos alternativos podem ser testados
para verificar-se sua congruência comparativa com os dados observados.
Por exemplo, a congruência entre as correlações originais e as correlações
forçadas da tabela 13.10, pode ser testada estatisticamente. Se as dife
renças entre as duas matrizes, mostradas na matriz residual da tabela
13.10, forem relativamente grandes, indicando falta de acordo entre
teoria e dados, o teste estatístico indicará. Se o teste estatístico não
mostrar significância, então, o acordo ou congruência será aceitável.
268
Finalmente, a estimativa das magnitudes dos valores dos coeficien
tes de um modelo — em análise de trajetória os coeficientes de trajetória,
por exemplo — é feita simultaneamente. No .exemplo de análise de
trajetória dado atrás, os coeficientes de trajetória foram calculados
sucessivamente. Por exemplo, no problema da figura 13.6 os coeficien
tes levando de SSE e Inteligência a n Realização foram calculados
primeiro e depois que os coeficientes de SSE, Inteligência e n Reali
zação a Realização foram calculados. Em análise de estruturas de cova
riância, entretanto, todos são calculados ao mesmo tempo, por assim
dizer, incluindo a estimativa das influências das variáveis latentes, se as
houver, e dos erros. Isto é, toda a informação é levada em conta de
maneira verdadeiramente multivariada. Deve ficar óbvio que a análise
de trajetória é um caso especial ,da análise de estruturas de covariância.
Como sempre, precisamos terminar a discussão com uma nota de
cautela. Embora poderosa, a análise de estruturas de covariância não é
a resposta perfeita aos problemas teóricos e analíticos. Não pode — ou
não devia poder — ser usado para análises comuns. É perda de tempo
e trabalho usá-la, por exemplo, para uma análise fatorial exploratória
comum. Deveria ser usada apenas para testar modelos teóricos relativa
mente complexos ou hipóteses alternativas complexas. Uma segunda limi
tação é que as suposições por trás de seu uso são bastante rigorosas,
tornando-a, pelo menos teoricamente, inaplicável em algumas situações
de pesquisa (por exemplo, com variáveis dicotômicas). Esta limitação do
sistema pode ser superada com o tempo. Há uma ou duas outras limi
tações, que vamos ignorar aqui. Em suma, a análise de estruturas de
covariância é uma estratégia rica, poderosa e um método de ataque aos
problemas de pesquisa, desde que estes sejam guiados pela teoria e
sejam de tal natureza que as suposições do método pdssam ser razoavel
mente satisfeitas. Pode-se dizer até que o método é um grande avanço
fia conceitualização e metodologia mostrando uma nova direção e sofisti
cação na pesquisa comportamental.
Conclusão
Fizemos quase um círculo completo. Começamos o livro com idéias

de teoria e explicação e repisamos continuamente teoria e explicação no
livro todo. Agora alcançamos o máximo metodológico contemporâneo
lia conceitualização abstrata e na testagem da teoria em um quadro de
referências multivariado. Com a análise multivariada, a metodologia da
pesquisa comportamental atinge um grau de complexidade jamais sonhado
em anos anteriores.
A força mais importante da análise multivariada é que os cientistas
podem se aproximar mais da complexa realidade do comportamento
humano, usando métodos multivariados. Outra força é que a condução
de pesquisa não-experimental e a análise de dados de pesquisa não-
experimental podem ser grandemente fortificados com abordagens e
análises multivariadas. talvez a palavra mais significante seja “controle” .
Com técnicas multivariadas apropriadas, pode-se conseguir a identifica
ção e controle da variância. O caminho da inferência a partir de uma
teoria inicial à confirmação e interpretação finais ficou mais claro,
embora tenha se tornando muito mais complexo.
A força e desejabilidade da abordagem multivariada não deveria
levar, entretanto, a acreditar que seu desenvolvimento resolve a maioria
de nossos problemas científicos, ou que não haja fraquezas ou que abor
dagens univariadas mais simples estejam mortas ou morrendo. Nada
disso. A pesquisa comportamental precisará sempre de abordagens mais
simples, principalmente em experimentos e certas situações de pesquisa
aplicada. Afinal, sempre se poderá dizer que o coeficiente de correlação,
que expressa a magnitude e direção da relação entre duas variáveis, é o
coração da análise multivariada. Observe que em certo sentido uma ferra
menta complexa como a correlação canônica resulta finalmente em um
coeficiente de correlação. Mais apropriado seria dizer que muitas
pesquisas não exigirão mais do que uma simples comparação de médias
usando análise de variância ou outro método, ou uma comparação de
freqüências e porcentagens como nas tabelas de cruzamento de variáveis,
ou no mais simples dos modelos de pesquisa, digamos, um grupo experi
mental e um grupo de controle. Não, a abordagem multivariada não irá
tanto substituir métodos mais simples como enriquecer a pesquisa com
portamental possibilitando abordar mais de perto as exigências complexas
da teoria comportamental. Uma teoria é um conjunto de constructos ou
variáveis sistematicamente relacionadas umas às outras de maneiras espe
cificadas. Por definição, uma teoria tem diversas variáveis em uma estru
tura unificada. Para testar adequadamente uma teoria, então, freqüente-
mente precisa-se de métodos multivariados. O propósito deste capítulo
foi fornecer um pouco do sabor, senão muito da substância, desta
necessidade.
270
14. O c o m p u t a d o r
O que há em relação aos computadores, para encantar e perturbar

tanta gente? Os computadores são ajudantes ou monstros de potencial
assustador? São bons ou maus para nós? Os computadores não são
máquinas apenas; são fenômenos sociais e psicológicos com implicações
importantes para a ciência e a pesquisa. Neste capítulo tentaremos com
preender uma pequena parte do que são os computadores, como funcio
nam e o que significam para o cientista. Vamos também tentar acabar
com um pouco de sua mitologia.
■Ái, DO
Não se pode compreender a pesquisa comportamental moderna sem
compreender o computador, uma das mais fortes influências contem
porâneas na pesquisa. Não é apenas pelo fato de mais problemas poderem
ser atacados hoje do que antes dos anos 50, os primeiros anos do compu
tador digital eletrônico de alta velocidade. A própria natureza dos proble
mas que estudamos é diferente; mesmo nossa abordagem a problemas é j UJ
i
diferente. O
Por exemplo, as técnicas analíticas multivariadas estudadas nos últi
mas capítulos são hoje facilmente alcançáveis pelo pesquisador porqug
há computadores, centros de computação, e programas multivariados dê:
computador a disposição. Sabendo disso, o pesquisador fica livre para
conceber uma enorme variedade de problemas de pesquisa que, digamos,
na década de 50 ele nem pensaria, simplesmente porque não havia meios
de fazer os cálculos necessários. A simples quantidade de cálculos, em
outras palavras, afetou drasticamente a natureza e a substância da teoria
e dos problemas.
O computador tornou-se tão intimamente ligado ao pensamento dos
esquisadores que é difícil fazer uma idéia da época em que eles não
E fdstiam. Eu me lembro bem deste tempo, mas agora penso como poderia
istir profissionalmente sem eles. E assim é com a maioria dos pesquisa-
ores psicólogos, sociólogos, economistas e educadores. Não podemos
imaginar o que é trabalhar sem um computador.
Vamos tomar um ou dois exemplos. Agora a análise fatorial é
usada quase rotineiramente para determinar o que os testes e escalas
medem. Pode-se construir um teste de aptidão, como Thurstone fez há
muitos anos atrás, e incluir o que se acredita ser três ou quatro tipos
271
de medidas de aptidão: verbal, numérica e espacial, por exemplo, O teste
mede realmente as capacidades especificadas? Um meio importante de
responder a esta pergunta é aplicando o teste a grandes números de
crianças ou adultos e depois analisar fatorialmente as correlações entre
os itens do teste. Lembre-se que análise fatorial, entre outras coisas, é
um método de análise que ajuda o pesquisador a determinar como os
testes ou medidas se agrupam. Determina também como os itens de
testes ou escalas se agrupam. Se alguns itens medirem, presumivelmente,
aptidão verbal e outros itens medirem aptidão numérica, então cada
conjunto deve se agrupar na análise. As correlações entre os itens verbais
deveriam ser positivas e ' substanciais, e as correlações entre cs itens
numéricos deveriam ser também substanciais, enquanto que a correlação
entre os dois tipos de itens, entre os presumíveis itens verbais e numéri
cos, deveria ser mais baixa (porque estão medindo coisas diferentes).
A análise fatorial, como já dissemos, faz tais análises satisfatoriamente
— com a ajuda do computador. (Veja capítulo 12, especialmente o
exemplo da escala de atitude e as tabelas 12.5, 12.6 e 12.7.)
Antes dos computadores entrarem em uso geral sabia-se — embora
não muito bem — que a análise fatorial de itens era necessária para
uma validade satisfatória e para outros estudos em mensuração. Tais
estudos, entretanto, eram raros, quase inexistentes.1 O simples volume
dos cálculos afastava essas idéias de consideração, embora alguns pes
quisadores se lembrassem dessa abordagem com melancolia. Assim, um
meio eficiente de se estudar a validade das medidas, de saber até certo
ponto o que realmente medem os testes e os itens era coisa virtualmente
inalcançável antes do moderno computador tornar-se comum. Hoje essas
análises são rotineiras.
No capítulo 11 vimos que a regressão múltipla é um meio poderoso
de estudar os efeitos juntos e separados de diversas variáveis indepen
dentes sobre uma variável dependente. Fazer regressão múltipla, aliás,
1 Em 1958 Kaya e eu (Kerlinger & Kaya, 1959) queríamos uma análise fatorial
das correlações entre os itens de uma escala de 20 itens de atitude a fim de
confirmar nossa idéia a respeito do domínio da atitude e dos itens. Nós mesmos
calculamos os 190 coeficientes de correlação em uma calculadora mecânica de
mesa. Nem é preciso dizer que levamos várias horas. Entretanto, o pensamento
de fazer análise fatorial nos amedrontava, embora ambos já o tivéssemos feito
“à mão". Levamos a matriz de correlação ao falecido Irwin Lorge, que tinha o
privilégio de possuir um dos primeiros computadores bem primitivos. Lorge fez
a análise fatorial, sem rotações ao custo de aproximadamente USS 600,00. O
trabalho levou horas, se bem me lembro. Kaya e eu fizemos as rotações à mão,
o que levou de 10 a 20 horas. Pode-se entender por que os pesquisadores hesi
tavam em planejar uma análise fatorial de itens. Hoje uma análise completa de
dados e itens semelhantes, de todas as estatísticas dos itens até as rotações de
eixos fatoriais, leva menos de 20 segundos no computador que uso atualmente!
272
fcsige a solução de diversas equações simultâneas. Um meio comum de
íe fazer isso exige o cálculo do inverso da matriz de correlações entre
as variáveis independentes. Fazer isto "à mão” com duas variáveis inde-
§endentes é fácil. Fazê-lo com. três variáveis independentes é mais difícil,
mas é possível. Fazê-io com quatro variáveis é muito mais difícil, perde-se
ftempo, é frustrante e pode-se errar. Um computador resolve facilmente
em questão de segundos. Até uma calculadora programável manual
pode manejar três variáveis independentes em cerca de dois minutos.
A questão é que os cálculos de um método poderoso como o da regressão
Jpúltipla estão agora à mão dos pesquisadores que não mais precisam
enfrentar a perda de tempo e as probabilidades de erro que as calcula
doras do passado ofereciam.
Mais um exemplo e, desta vez, um bastante complexo, que é a
análise de estruturas de covariância, descrita no capítulo 13. A análise
de estruturas de covariância é quase impossível de ser feita em uma
calculadora de mesa. Partes das computações são tão complexas que
podem ser feitas apenas por computador e isto em questão de segundos.
Assim podemos dizer que este método flexível, poderoso e frutífero de
abordar a teoria e o teste da teoria, tornou-se possível apenas com o
advento de computadores de alta velocidade. Sem dúvida, o método,
para começar, jamais teria sido concebido se seus autores não tivessem
trabalhado pensando na possibilidade do computador. E o mesmo serve
para quase toda análise multivariada com mais de, digamos, seis ou
sete variáveis. A influência do computador na pesquisa das ciências com-
portamentais tem sido muito grande. E estavamos falando apenas dos
efeitos dos cálculos. Os computadores tiveram grande efeito, natural
mente, em áreas não computacionais. Neste capítulo, vamos nos restringir
aos efeitos dos computadores em cálculos com números.
Características dos computadores e computação

A função básica das máquinas mudou fundamentalmente. U’a
ínáquina é um aparelho mecânico ou elétrico ou ainda um sistema para
realizar algum trabalho útil através de operação de rotina. É um molde,
por assim dizer, com o qual se produz alguma coisa regular e repetida
mente. Uma máquina de costura faz pontos regularmente, repetidamente
e com variações. Uma máquina de escrever produz sérias de letras. Um
piano produz séries e conjuntos de tons. O motor de um carro, através
de explosões repetidas e de intrincada interação entre suas partes, leva
força às rodas. As máquinas operam estereotipicamente. Elas fazem — ou
devem fazer — o que seus usuários mandam-nas fazer e nada mais.
A função básica da maioria das máquinas é libertar força de sorte que
determinado trabalho possa ser feito: os movimentos para cima e para
baixo da agulha da máquina de costurar, o mecanismo de um piano
que transforma e transporta a energia dos dedos para os martelos de
feltro que batem nas cordas, o trabalho do motor de um carro para
virar suas rodas.
Weizenbaum (1976), em seu penetrante livro sobre o computa
dor, afirma que o aparecimento de máquinas elétricas, especialmente
do computador, mudou o propósito fundamental das máquinas, da
transmissão de força para a transformação de informação. A observação
é profunda e seu significado é importante. O objetivo ou propósito do
computador não é produzir força para que algum trabalho seja feito.
Transforma a informação de certas formas para certas outras formas,
e faz isto a grande velocidade e com toda a segurança. Um exemplo é a
transformação de dados brutos na forma de números em outros números
chamados estatísticas, como somar longas filas de números e depois
calcular uma média, multiplicar muitos pares de números, somando-os,
e depois calculando as covariâncias ou explorar textos verbais, contando
palavras-chave, categorizando tais palavras e depois contanto os números
de tais palavras em cada categoria.
O computador é, então, u’a máquina elétrica de grande complexi
dade, cuja função básica é transformar informação a grande velocidade
e com alta confiabilidade. É um complexo elaborado de aparatos, cujas
principais características são a capacidade de fazer muitas operações
repetitivas a tremenda velocidade e com alto grau de exatidão, flexibili
dade e com o que eu gosto de chamar “ductilidade”. A velocidade dos
computadores modernos fica quase além do crível. Um computador
moderno grande pode fazer 200.000 operações ou mais por segundo!
Já dei um exemplo. Quero ser mais específico com um exemplo mais
complexo. Num estudo de atitudes feito na Holanda, uma amostra de
685 pessoas respondeu a uma escala de atitude de 72 itens (Kerlinger,
Middendorp & Amón, 1976). Foram calculadas as médias, os desvios
padrão e as intercorrelações dos 72 itens por um computador de grande
porte. Depois, a matriz de correlação foi analisada fatorialmente e os
fatores obtidos rotados sucessivamente, começando com dois fatores,
depois três fatores, e assim por diante até 12 fatores. O computador
levou 1 minuto e 40 segundos para fazer o trabalho. Para se ter uma
idéia do tamanho do trabalho, imagine o que foram 72 somas, 72 somas
de quadrados, 72 médias, 72 desvios padrão, 2.556 produtos cruzados e
milhares, até milhões de outros cálculos ligados à análise fatorial!
O computador opera também com toda exatidão. Faz todas estas
operações complexas com exatidão finita mas altíssima. A hardware —
como os técnicos chamam a parte física dos computadores — funciona
admiravelmente. Você pode confiar na maioria dos .resultados que con
seguir em um computador, contanto que você tenha feito seu trabalho
274
gorretamente e contanto que seu programa seja adequado. Infelizmente,
boa parte do que sai de um computador é inexato e até sem significado.
Mas isto não é culpa do computador; é culpa das pessoas que usam o
Computador. Grande parte desse rendimento questionável é provavel
mente devido a ignorância. Vamos voltar a este assunto mais tarde. O fato
é que os computadores modernos são de toda confiança, máquinas
exatíssimas em que se pode confiar para a maioria das análises em
pesquisa comportamental.
Entretanto, os computadores não são infalíveis. Não se pode confiar
inteiramente neles porque eles têm limitações. Se forem feitos cálculos
prolongados com números muito grande ou muito pequenos, os resultados
Üos cálculos podem exceder a capacidade do computador. Suponhamos
que eu tenha um pequeno computador com espaço para resultados não
maiores do que o número 1.000.000 ou sete lugares. Mas que eu tenha
que fazer o seguinte cálculo:
4672 X 543 + 117/0,005.
O resultado, naturalmente é maior que 1.000.000 e meu computador
não poderá resolver. Mas as capacidades dos computadores modernos
são maiores que 1.000.000, e eles podem acomodar a maior parte das
necessidades de computação das ciências comportamentais.
As vezes, entretanto, acontecem inexatidões, mesmo com os progra
mas mais bem escritos. (“ Programa” será definido mais adiante.) Por
exemplo, grande parte da análise multivariada depende de uma operação
matemática conhecida como inversão de matriz (já mencionada). O
inverso de uma matriz é como um recíproco ou um divisor ou um deno
minador em aritmética. Embora em álgebra se possa dividir facilmente
b por a, ou b/a, para produzir, digamos, c, ou c = b/a, não é possível,
em um sentido rigoroso, dividir u’a matriz de números por outra matriz
de números. Em vez disso, é calculada uma matriz inversa, e a primeira
matriz é multiplicada pela matriz inversa. Para se calcular inversos de
matrizes são necessárias várias multiplicações. Se os números forem
grandes, a capacidade do computador pode ser excedida. Se, como às
vezes acontece em análise multivariada, os números são pequenos — os
coeficientes de correlação são pequenos, e dois ou três multiplicados
juntos produzem números menores ainda porque são frações2 — então,
as muitas multiplicações poderão produzir números muito pequenos que
levarão a inexatidões e resultados confusos.
A confiabilidade do computador está relacionada a sua “ductili-
jiade” . "Ductilidade” significa “ tratabilidade”. Uma pessoa tratável faz o
3 Por exemplo, suponhamos que multiplicamos 0,30, 0,40 e 0,05:

0,30 x 0,40 x 0,05 = 0,006.
275
que os outros querem que ela faça. Um computador faz o que a pessoa
lhe diz para fazer. Fazendo isso é estúpido: faz exatamente o que lhe
mandarem; jamais mostra inteligência ou senso comum. Não existe um
programador de computador que uma vez ou outra não tenha dito:
“Seu idiota! Não era isso que eu queria.” Então pode-se dizer que os
computadores são estúpidos e tratáveis. É uma característica excelente
porque significa grande confiabilidade e segurança. Também exige muito
das pessoas que usam e programam os computadores. Elas têm que
explicar tudo o que computador deve fazer para atingir qualquer meta.
E isto, naturalmente, não é fácil de fazer. Em resumo, um programador
não pode omitir nada. Um computador faz fielmente os erros que é
mandado fazer! Não faz nada mais nem nada menos do que mandam
suas instruções!
Outra característica dos computadores e da computação não é
realmente uma característica da máquina. Ê inerente às pessoas trabalhan
do com a máquina. Os computadores parecem exercer uma fascinação
infinita sobre muita gente. Isto é particularmente verdadeiro para quem
programa com êxito o computador para fazer um trabalho útil. O prazer
é como o prazer do pianista que aprendeu e toca uma peça musical
desafiadora ou um jogador de xadrez jogando com um oponente igual.
É como se se fosse empurrado para conquistar não apenas a análise
que se precisa mas também o computador e a própria pessoa. A preocu
pação intensa e a concentração exigidas parecem se unir em uma expe
riência psicológica altamente compensadora. Em resumo, os programa
dores de computadores muitas vezes ficam viciados, ligados ao compu
tador.
Esta característica leva a resultados produtivos. Resolvem-se proble
mas que não teriam solução sem tais investimentos de preocupação,
concentração, energia e tempo. Mas os resultados podem ser também
negativos. É possível alguém se absorver a tal ponto, programando a
máquina, chegando a se esquecer das razões porque a programou! Weizen-
baum (1976, capítulo 4) descreveu de maneira incrível os “picotadores”
(hackers) de computador, indivíduos que virtualmente vivem para e com
o computador. Eles não programam tanto quanto “picotam” . Embora
tecnicamente brilhantes — às vezes, seu conhecimento de computadores
e programação é profundo — , pouco estão ligando para o que estão
programando. Weizenbaum diz que têm uma preocupação neurótica
não tanto de resolver ou ajudar a resolver problemas importantes, mas
de dominar a máquina, adquirir poder.
O exemplo extremo de Weizenbaum é dado para ilustrar a incrível
fascinação desta máquina complexa e poderosíssima. Embora o “pico-
tador” de Weizenbaum seja u’a manifestação neurótica dessa fascinação,
resta dúvida de que muita gente, talvez a maioria dos que lidam freqüen-
276
temente com computadores, se torna obcecada. Não há nada de mal
em um interesse profundo; muitas vezes ele leva a realizações criativas.
Mas o computador tem uma dimensão a mais; ele é basicamente uma
ierramenta para auxiliar a resolver problemas. Se isto ficar esquecido na
preocupação com a máquina propriamente dita, então a coisa se torna
um jogo. A maioria dos jogos é inofensiva e sua perseguição com avidez
não prejudica ninguém. Mas a perseguição ávida ao computador sem
preocupação pela finalidade científica e técnica de seu uso, pode conduzir
a banalidades sem significado ou, pior ainda, à erosão dos valores
científicos.
Como funcionam os computadores e os programas
Para se compreender o computador em sua relação com a pesquisa,

é necessário entender como ele foi feito para desempenhar sua tarefa.
Neste livro não nos interessa saber como os computadores funcionam
internamente, mas nos interessa saber como fazê-los trabalhar. Como,
por exemplo, podemos fazer o computador calcular a média de uma
série de números? Talvez a melhor maneira de compreender o computa
dor e seu uso, é aprender alguma coisa a respeito dos programas da
programação dos computadores.
Um programa é um conjunto de instruções numa linguagem especial
de computador que lhe diz com exatidão o que fazer para realizar o
objetivo do programa. Um programa de análise .fatorial, por exemplo, é
um conjunto elaborado de instruções para que um computador leia
dados de cartões ou fitas para calcular médias e desvios padrão de todas
as variáveis atribuídas, para calcular as intercorrelações de todas ou algu
mas das variáveis, para fazer os cálculos necessários para obter fatores
e rotá-los, e finalmente para imprimir os resultados com as denominações
apropriadas. Este programa será longo e complexo. As instruções espe
cíficas encherão muitas páginas. Um programa que uso para análise
fatorial ocupa 12 páginas grandes de saída de computador. Outro pro
grama mais complexo de análise fatorial ocupa 26 páginas. (Muitos
programas, naturalmente, são relativamente curtos.)
Um exemplo simples de programação
Os programas são escritos na língua especial dos computadores.

Usamos Fortran (FORmula TRANslation) aqui provavelmente porque
seja a linguagem mais conhecida, pelo menos nas ciências comporta-
mentais. Mas há várias outras linguagens: Algol, Cobol, Pascal e outras.
Uma vez que nossa preocupação é apenas com as idéias básicas de progra-
277
mação, não precisamos lidar com a linguagem e suas diferenças. Mas
vamos discutir e ilustrar rapidamente a linguagem usada para programar
outra invenção notável, a calculadora programável de bolso. Essas lingua
gens “menores” têm a virtude de uma relativa simplicidade, considerável
flexibilidade e capacidade. Além disso, as calculadoras programáveis
estão se tornando muito comuns e logo serão mais amplamente usadas
e bastante acessíveis a qualquer bolso. Sem dúvida, dentro de cinco
anos elas provavelmente preencherão diversas necessidades dos pesquisa
dores comportamentais para cálculos menores.
Fortran é uma língua intermediária — assim como o Algol, o Pascal
e outras linguagens semelhantes — que permite ao pesquisador se comu
nicar com o computador. Usa alguns comandos ou afirmativas básicas
em inglês, como: READ, WRITE, GO TO, CONTINUE, DO e IF.
Esses comandos podem ser entendidos literalmente: read (leia) tais e
tais dados; write (escreva, ou imprima) os resultados, go to (vá para)
uma outra parte do programa, if (se) uma quantidade computada for
positiva (por exemplo), go to (vá para) tal parte do programa, mas if
(se) for negativa ou igual a zero, go to (vá para) tal outra parte do
programa. A força e flexibilidade das linguagens de computador não
podem ser exageradas. Quase não existe operação lógica ou numérica
que não possa ser realizada com ele.
Suponhamos que desejamos somar dois números, 6 e 4, e pôr o
resultado em um lugar de armazenagem rotulado SUM. Uma instrução
Fortram para fazer isto, é:
SUM = 6 + 4
Mas isto é limitado demais porque certamente vamos querer usar a opera
ção de adição novamente. Então escrevemos:
SUM = A + B
Agora, quaisquer dois números podem ser lidos pelo “leitor” do compu
tador e podem ser armazenados nos “lugares” chamados A e B. Então
A e B.poderão ser usados mais tarde em quaisquer operações aritméticas
assim como adição. As outras operações aritméticas são manejadas da
mesma forma. Por exemplo, a multiplicação e a divisão são feitas da
seguinte maneira:
RESULT1 = A * B (multiplicação)
RESULT2 = A/B (divisão)
(O asterisco é a versão Fortran para "x”, multiplicar. “/ ” é a versão
Fortran para ” dividir.) As operações são combinadas facilmente,
como a combinação seguinte das quatro operações aritméticas básicas:
278
RESULT3 = ((RESULT1 + RESULT2) * A) / (A — B)
Se A = 6 e B = 4, então RESULT3 = 76,50.)
Este uso da Fortran em nível tão baixo, embora não seja particular
mente interessante ou poderoso, ilustra três pontos importantes relativos
a Fortran e à programação. Primeiro, as equações Fortran não são como
as equações algébricas comuns. Elas sempre querem dizer que o enun
ciado à direita é colocado no “lugar” marcado à esquerda. Um termo
apenas pode ficar à esquerda, qualquer número de termos ou expressões,
à direita. O enunciado SUM = A + B, acima, significa: No lugar
chamado SUM coloque a soma de A + B. Segundo, o resultado de uma
operação pode ser rotulado de quase qualquer coisa, desde que sejam
satisfeitas duas ou três regras simples (por exemplo, o nome pode ter
de uma a sete letras, números ou ambos: C, SUM, RESULT2, e assim
por diante).
Terceiro, os computadores modernos têm muita capacidade de
armazenagem, e os lugares de armazenamento são alcançados simples
mente por seus nomes ou rótulos. No exemplo acima, cada um dos valo
res, A, B, SUM, RESULT2 e RESULT3, está armazenado em lugares dife
rentes e facilmente acessíveis e rotulados como indicado. A armazenagem
e os lugares de armazenamento do exemplo acima podem ser concebidos
assim (embora não seja realmente feito assim): i.;
\-JLi
o t;
— ------- ---------- r _ - < P
O -4
6 4 10 24 1,50 76,50 Ci p
C& l
A B SUM RESULT1 RESULT2 RESULT3 'a
Agora, o programador pode fazer o que quiser com estes valores, ou

quaisquer outros valores que possa ter calculado, simplesmente escre
vendo novos comandos Fortran.
A verdadeira força do computador entretanto, está em sua flexível
capacidade de fazer operações repetitivas várias vezes a grande veloci
dade. Suponhamos que desejamos somar uma série de números e depois
calcular sua média. Há várias maneiras de fazer isto em Fortran. Vamos
ilustrar duas apenas. Elas nos permitirão entender dois ou três pontos.
Eis uma rotina para somar números:
DO 110 I = 1, N
110 SUMX = SUMX + X(I)
Isto pode ser traduzido assim: DO (faça) o que estiver indicado na
afirmativa 110, usando valores de 1 a N (1, 2, 3 . . . . , N), N sendo o
número total dos valores de X. Suponhamos que 100 valores de X dife-
rentes tenham sido lidos antes pela memória da máquina (N = 100).
Eles estariam então em 100 lugares de armazenamento. O comando
Fortran instrui a máquina a tomar esses valores de X de cada memória
por sua vez e somá-los em um outro lugar chamado SUMX. Esta é uma
maneira característica de se acumular valores em Fortran. Aliás, a
maquina faz esta operaçao repetidamente ate ter usado o N-ésimo valor
de X (tendo lido 100” anteriòrmente em um lugar de armazenamento
chamado N). Então pára à espera de novas instruções.
O procedimento acima, entretanto, usa armazenagem que não e
preciso ser usada. Um preceito de programação é usar sempre o mínimo
de armazenamento possível. Uma prática Fortran mais econômica seria
fazer a maquina ler um valor de X por vez em um cartão e fazer a
adição exigida imediatamente. Não havería necessidade de armazenar os
X’s, a não ser, naturalmente, que fosse preciso usá-los mais tarde.
A Fortran para realizar isto e também para calcular a média pode ser:
10 (Read in N.)
SUMX = 0.0 (Inicializa SUMX)
30 1 = 1 + 1 (Ajusta I para 1.)
40 (Read in X (I).)
100 SUMX = SUMX + X (I) (Soma Xi a SUMX)
105 IF (I.L.T.N) GO TO 30 (Enunciado condicional:
veja o texto)
AN = N (Põe N em AN)
107 AVER = SUMX/AN (Calcula a média)
110 (Print SUMX and AVER.)
END
Nesta rotina o computador lê primeiro N, ou 100, que o usuário

perfurou em um cartao. O comando 10, que foi omitido para evitar
complexidade, realiza isto. Então SUMX, o nome do que no final
se tornará a soma dos X’s, é ajustado para zero. Isto se chama iniciali
zação e é o mesmo que limpar uma calculadora antes de começar um
cálculo. O comando 30, I = I + 1, é uma forma padrão de acumular
uma soma. 1 é somado a l e colocado no lugar chamado I. (I será
usado como subscrito de X mais tarde.) O comando 40, cujos detalhes
são omitidos novamente, lê o primeiro X, ou X (1). No comando 100,
X (I), que, naturalmente é X (1), é somado a SUMX e colocado no
lugar SUMX. O comando 105 é o mais interessante. Traduzido, diz o
seguinte: “Se I for menor do que (LT) N, vá para o comando 30”. Já que
I = í, e portanto menor do que N, ou 100, o computador volta ao
comando 30. Isto completa um impulso (swing) pelo circuito (loop).
280
O computador volta agora à afirmativa 30, que soma 1 a I de
povo. No 40, é lido X (2), e no 100 é somado a SUMX. Se X (1) = 15 e
X (2) = 17, então SUMX agora é igual a 32. É feito novamente o teste
no comando 105, e uma vez que I, ou 2, é menor do que 100, o compu
tador volta novamente para 30. I é novamente incrementado, o X (I)
|eguinte é somado a SUMX, novamente é feito o teste em 105 e nova
mente o computador volta para 30. O procedimento continua até o 100.°
X, ou I = 100. Depois que X (100) é somado a SUMX, é feito nova
mente o teste IF na afirmativa 105, mas desta vez, já que I == 100
e, portanto, não é menor do que N, o computador não voltará a 30.
Em vez disso, continua até depois de 105.
A continuação do programa calcula simplesmente a média, chamada
AVER, depois de converter N em AN, o. que é feito para mudar o número
inteiro N em um número decimal para que a aritmética de SUMX/AN
possa ser feita. (Em Fortran, denominações de variáveis que começam
com I, J, K, L, M e N, são variáveis de números inteiros; todas as outras
são variáveis decimais. O leitor não precisa se preocupar com esta
distinção.) É calculada então a média AVER, no comando 107 e SUMX
e AVER são impressos pelo comando 110 (não dado). O programa e os
cálculos terminam então com a instrução END.
Isto é suficiente para dar ao leitor um pouco do gosto da linguagem
de um computador, como a Fortran, e uma idéia e como o computador
“trabalha”.
A princípio o procedimento pode parecer enfadonho, mas funciona, e
muitíssimo bem. Em um computador de grande porte, ò programa acima
tomaria apenas um ou dois segundos. Além disso, poderiamos facilmente
somar os quadrados de todos os X, calcular a soma dos quadrados, o
desvio padrão, se desejássemos e com pouquíssimo acréscimo de tempo
do computador. Ler os dados e imprimir os resultados levam mais tempo
do que os próprios cálculos, que são feitos tão rapidamente que se
apertássemos o botão para iniciá-los, eles estariam feitos antes de soltar
mos o botão!
Seria quase tolice usar computador tão grande para computações
tão simples. Se em vez de um X, tivéssemos 30 X’s, ou variáveis, e
quiséssemos calcular todas as médias, desvios padrão e correlações entre
os X ’s, não seria tolice. E isto é feito fácil, rápida e exatamente com
uma programação Fortran (ou outra). Naturalmente, o programa será
mais complexo. E se alguém quiser fazer outras análises, como análise
fatorial ou análise de regressão múltipla, então, o programa torna-se
mais longo e complexo. (Mostramos apenas uma pequena fração das
possibilidades da Fortran.) Entretanto, os procedimentos básicos são
■Semelhantes.
Computadores-calculadores programáveis
Por sua importância potencial e seu interesse intrínseco, vamos

examinar rapidamente agora a linguagem usada na pequena calculadora
programável Hewlett-Packard, a HP-67. 3 (A mesma linguagem é usada
com as HP-97, maiores, com ligeiras alterações.) A HP-67, como suas
primas TI, tem a capacidade de gravar programas escritos em pequenos
cartões de plástico. Quando se precisa um programa, o plástico é inserido
na máquina e o calculador programado está pronto para funcionar.
A flexibilidade e poder de tais máquinas — dentro de dois ou três anos
elas provavelmente serão mais fortes e flexíveis — são notáveis. Natural
mente elas não estão no mesmo universo de discurso dos grandes compu
tadores, mas não são brinquedos. São computadores-calculadores capazes
de muito trabalho analítico importante. Em todo caso, vamos ilustrar
agora um pouco da linguagem de programação e lógica da HP-67. Vamos
fazer a mesma coisa que fizemos com a Fortran, somando números e
calculando uma média.
O programa completo — o programa Fortran acima não estava
completo — é o seguinte:
(Entre Xi; LBL A Parte A rotulada
aperte A) STO + 1 Acumula os X’s na locação 1
1 } É somado incremento de 1
ST O +2 1 à locação 2
RCL 2 Chama o número incrementado em 2,
o número de casos.
RTN Parte A terminada.
(Aperte B) LBL B Parte B rotulada
RCL 1 Chama 1, a soma dos X’s.
RCL 2 Chama N de 2.
Divide, %Xi\N = Média.
STO 3 Armazena a média em 3.
RTN Parte B terminada.
Foram dadas notas explanatórias à direita em cada linha do programa.

Em “HP” cada parte de um programa, ou todo um programa, tem que
3 Há várias calculadoras programáveis a venda. As máquinas da Hewlett-Packard

(HP) e as da Texas Instruments (TI) são provavelmente as mais importantes graças
à sua capacidade relativamente grande — para máquinas tão pequenas — , sua
sofisticação e utilidade. Seus preços são cada vez mais baixos, talvez os únicos
produtos a ficarem mais baratos durante a inflação. Eu preferi ilustrar a linguagem
da HP, em vez da linguagem da TI. porque a primeira é mais compacta e mais
sofisticada. Os dois tipos de máquina, entretanto, são muito bons.
282
ser rotulado, A, B, e assim por diante: LBL A, LBL B. Nosso programa
tem dois subprogramas, A e B. O objetivo de A é somar os X e determi
nar o número de casos, N. O objetivo de B é calcular a média. Ambos
são feitos facilmente com seis comandos apenas. Em A, STO + 1 é
equivalente ao comando Fortran SUM = SUM + X (I). Toma um
número digitado pelo usuário e soma-o ao conteúdo da locação 1. Se X
fosse necessário a uma operação posterior, poderia ser armazenado para
esse fim. Isso poderia ter sido feito inserindo-se o comando STO 3 (ou
STO 4, STO 5) imediatamente após LBL A e antes de STO + 1.
Os dois comandos, 1 e STO + 2, são um “contador”. Eles incre
mentam os casos na locação 2. O número que estiver antes de STO + 2
sera somado áo conteúdo do lugar de armazenagem 2. Quando todos os
X’s tiverem eiitrado, a locação 2 conterá N, o número de casos. A afirma
tiva RCL 2 significa “Recall 2,” ou “chame tudo o que estiver na loca
ção 2”. Isto é conveniente porque mostra ao usuário qual é o número de
casos. A instrução RCL 2, em outras palavras, traz o que estiver em
2 para o display. A afirmativa final de LBL A é RTN, ou “volte”
(return). O computador interrompe a execução do programa e volta ao
início de LBL A.
Usando computadores grandes, grava-se (perfura-se) os X em cartões
ou fitas, e o computador os lê. Em calculadoras pequenas programáveis,
os X’s são digitados (embora haja um meio para a calculadora ler dados
de cartões plásticos). Com nosso pequeno programa, digita-se o primeiro
X ou X! e depois aperta-se A. A calculadora toma o valor introduzido e
soma ao conteúdo da locação 1. Se, por exemplo, introduzirmos 15,
este 15 ficará na locação 1. 1 é somado à locação 2, ou 0 + 1 = 1.
Isto é chamado de volta da locação 2 e mostrado. A calculadora volta
então a LBL A, pronta para nova entrada X. Vamos dizer que X2 seja 21.
Este é somado ao conteúdo da locação 1, ou 15 + 21 = 3 6 , e 3 6 fica
na locação 1. Novamente 1 é somado à locação 2, ou 1 + 1 = 2.-
Quajndo todos os X tiverem entrado, digamos, 40, aperta-se a chave
B que ativa LBL B. B chama de volta os conteúdos das locações 1 e 2,
e divide o primeiro pelo segundo ou, SXi|N, a média, naturalmente, que
aparece no display. Fica também depositada na locação 3 pela instrução
STO 3 para provável uso futuro. Se 0 programa for necessário para
cálculos semelhantes no futuro, pode ser gravado num pequeno cartão
plástico (já mencionado), guardado e usado em outra ocasião, introdu
zindo simplesmente o cartão na máquina. O programa assim escrito, está
■pronto para operar com dados novos, assim como um programa Fortran
é gravado em cartões ou fita e pronto para ser usado quando necessário.4
4 O le ito r d eve e sta r im a g in a n d o de què fo rm a o c o m p u ta d o r “ c o m p re e n d e ” as

in stru çõ es re c e b id a s em F o rtra n ou o u tra lin g u ag em e com o ex e c u ta os com andos.
283
Outros usos e operações dos computadores
Até agora falamos apenas do uso do computador em cálculos numéri

cos diretos: calculando médias, correlações, desvios padrões e assim por
diante, e ainda operações maiores, como regressão múltipla e análise
fatorial. O computador, entretanto, tem vários outros usos: análise de
material verbal, simulação de modelos teóricos, planejamento e regulação
do trânsito, e outros. A discussão desses usos está além do objetivo deste
livro. Há um tipo de uso, entretanto, que será proveitoso discutir porque
nos ajudará a compreender melhor a natureza do computador e seu uso
em pesquisa comportamental. Esta é a solução de problemas de cálculo
difíceis ou impossível de serem feitos sem um computador. Por exemplo,
tabelas de números aleatórios são publicadas em livros de estatística
e usadas constantemente pelos pesquisadores. (Lembre-se de nossa
discussão sobre casualidade e casualização nos capítulos 5 e 6.) Tais
números são difíceis ou até impossíveis de gerar adequadamente “à mão”
ou com calculadoras pequenas, mas é relativamente fácil gerar uma
grande quantidade de números casuais em um computador grande. (Até as
calculadoras programáveis HP-67 e TI podem gerar “bons” números
aleatórios.)
Em discussão anterior sobre a testagem da significância estatística,
foram negligenciados os testes de significância realmente usados pelos pes
quisadores porque o objetivo deste livro não é ensinar estatística e análise,
mas as idéias por detrás da estatística e da análise como partes vitais da
pesquisa. Depois de um pesquisador ter feito um experimento, digamos
como o de Clark e Walberg ou o de Aronson e Mills,.ele precisa testar
a “significância” de seu resultado estatístico para ver se o resultado se
afasta suficientemente da expectativa baseada no acaso para garantir
que realmente se trata de um resultado “estatisticamente significante” .
Um desses testes é o chamado teste t. Uma estatística, t, é calculada a
partir dos resultados experimentais de, por exemplo, a diferença entre
duas médias, como em Clark e Walberg. A estatística calculada é então
confrontada com uma tabela de tais t’s. Se o t calculado for igual ou
S eria necessário q u a se u m liv ro , e scrito p o r u m especialista e m co m p u tad o res,

p a ra e x p licar to d o o assu n to . E n tre ta n to , p o d em o s d iz e r a p e n a s o seguinte: em
q u a lq u e r c o m p u ta d o r g ra n d e , h á u m p ro g ra m a de “ tra d u ç ã o ” , o u u m c o n ju n to
de p ro g ra m a s c h a m a d o “ co m p ila d o r” (compiler). O compilador ex am in a a “ v ali
d a d e ” d a F o rtra n (se te m erro s d e g ra fia , p o n tu a ç ã o e assim p o r d ian te) e a
tra d u z p a ra a “ linguagem da m á q u in a ” , p a ra as in stru çõ es a b so lu ta s d a m á q u in a ,
em q u a lq u e r q u e seja seu sistem a in te rn o . P a ra m ais d e ta lh e s so b re co m p ilad o res
e o u tro s assu n to s re la c io n a d o s, o le ito r p o d e rá c o n su lta r liv ro s m u ito b o n s sobre
c o m p u ta d o re s e seu u so n as ciências c o m p o rta m e n ta is, e scrito s p o r B rier e
R o b in so n (1974) e G re e n (1963).
284
maior do que a entrada apropriada na tabela t — há muitos t’s na tabela
correspondentes aos números de casos nos grupos experimentais ^ o
resultado é considerado estatisticamente significante. (Para mais discus
sões desses testes estatísticos, veja o Apêndice no fim do livro.)
Os livros de estatística sempre contêm tabelas t — e outras tabelas
, usadas com testes estatísticos. Estritamente falando, entretanto, o compu
tador tornou tais tabelas obsoletas parcialmente. O computador pode
calcular de maneira bastante exata o t específico de que se necessita.
Tudo o que é preciso é o que se denomina uma sub-rotina para fazer a
aproximação necessária.5 Os valores tabelados para os diferentes t são
valores de distribuição. São valores esperados por acaso para vários N’s.
Suponhamos que o pesquisador obtenha uma diferença entre duas médias
e calcula t, que, digamos, é 3,714. Procurando a entrada apropriada na
tabela ao nível de significância de 0,05, ele encontra que o t na tabela é
2,010. Seu í é 3,714, maior do que o da tabela. Já que a entrada de
2,010 na tabela é o valor esperado por acaso — o valor esperado se
houvesse apenas uma diferença casual entre as duas médias , eles
podem concluir que as duas médias são significantemente diferentes.
O cálculo de valores de distribuição, como para a distribuição t, é
difícil porque envolve cálculos tediosos. O computador calcula valores da
distribuição usando procedimentos de aproximação sucessiva. (Uma
forma simples de tal procedimento vem ilustrada adiante.) Dentro de
alguns anos os programas de computador que incluam distribuições esta
tísticas provavelmente terão tais procedimentos de aproximação “embu
tidos” na maioria dos programas estatísticos. Quando um t, por exemplo,
for calculado, o computador calculará também, através de um procedi
mento de aproximação, a probabilidade que o t calculado (calculado
dos dados) ocorra por acaso. Por exemplo, a aproximação da probabili
dade que í = 3,714 tenha ocorrido por acaso é apenas de 0,0003, ou
3 chances em 10.000. Fiz uma HP-67 realizar os longos cálculos repeti
tivos _ muitos loops, aliás, para efetuar a aproximação — usando um
programa fornecido pela companhia. A calculadora levou cerca de 30
segundos para fazer o trabalho. Um computador grande faria o mesmo
trabalho em muito menos tempo, numa pequena fração de segundo
Em resumo, embora as tabelas de valores de distribuição talvez não se
tornem obsoletas, elas não serão tão úteis e necessárias quando são
agora.
5 U m a subrotina é u m p ro g ra m a d e n tro d e u m programa principal. A s su b ro tin a s

têm seus p ró p rio s n om es, g e ra lm e n te têm ob jetiv o s especiais e são u sa d a s n o v a
m e n te v á ria s vezes. U m d e seus o b jetiv o s é e c o n o m iz a r p ro g ra m a ç a o . E m v ez de
a c u m u la r o n ú m ero de casos no p ro g ra m a p rin c ip a l d o exemplo acim a,^ p o r
ex em p lo , p o d eriam o s tç r e sc rito o p ro c e d im e n to n u m a su b ro tin a e dep o is ch a
m a d o ” a su b -ro tin a nos lu g a re s a p ro p ria d o s.
285
U m e x e m p lo d e a p r o x im a ç ã o : r a iz q u a d r a d a
Quase todos nós aprendemos a calcular raízes quadradas de núme

ros usando um método cansativo que é quase impraticável para mais
de umas poucas raízes quadradas. Quinze ou 20 anos atrás as réguas
de cálculo davam aproximações bastante exatas de raízes quadradas.
As réguas de cálculo praticamente desapareceram. Sem dúvida, em duas
ou três décadas elas serão objetos para colecionadores. Quem necessita
de régua de cálculo, quando uma calculadora de bolso de quinze dólares
pode fazer tudo o que a régua faz — e com maior exatidão? Outro
método é procurar a raiz quadrada em tabelas. Este método também
está morrendo ou quase morto. Outro método ainda envolve a velha
calculadora de mesa: tentar adivinhar a raiz, elevar ao quadrado a
tentativa e chegar aos poucos à raiz final por tentativas e aproximações.
Dificilmente um método eficiente! É, entretanto, semelhante ao método
iterativo de aproximação dos computadores. A grande diferença fica na
rapidez, exatidão e em evitar frustração na adivinhação. Embora haja
uma enorme diferença entre um Vermeer e um Warhol, lucraremos muito
se examinarmos o cálculo da raiz quadrada por um método de aproxi
mação em um computador. O método a ser descrito também tem a distin
ção de ter tido nada menos que um gênio como Isaac Newton trabalhado
nele.
Um algoritmo é um conjunto de regras que nos ensina o que fazer
para executar determinado objeto ou objetivo. Muitas fórmulas algébricas
são algoritmos. Se eu disser a alguém exatamente como resolver certo
tipo de problemas, estarei dando-lhe um algoritmo. Se você quiser a
raiz quadrada, ou o logaritmo, ou o recíproco de um número, é só apertar
a chave certa de uma calculadora. Mas como a calculadora produz ou
calcula o número? Há uma tabela em seu sistema? Dificilmente. Em seu
sistema há um algoritmo que funciona muitíssimo rapidamente.
Aqui está uma expressão matemática para um algoritmo para obter
a raiz quadrada de qualquer número positivo:
onde x = número cuja raiz quadrada se deseja, r. = a i-ésima raiz e

r | + j = a raiz aproximada depois da í-ésima raiz. Eu fiz um programa
para a HP-67 fazer as iterações (repetições com mudanças) ou loops
implicados por esta equação. Em sua essência é como os algoritmos
usados em grandes computadores, só que os últimos são geralmente mais
complicados, mais sofisticados e trabalham com muito mais rapidez.
O programa funciona da maneira que se segue. O número cuja raiz
286
quadrada se deseja é introduzido na calculadora. A calculadora divide
este número por 2. Isto é ineficaz, mas sempre funciona. A calculadora
então usa o algoritmo acima sucessiva e repetidamente ate obter a ra_iz
quadrada. O processo geralmente convergirá rapidamente para a solução
correta.
Para ver como funciona, vamos pôr 15 na máquina. As iterações
sucessivas — eu fiz a calculadora parar depois de cada loop para poder
ver o resultado de cada iteração e assim cada aproximaçao antes das
soluções finais — eram:
15
4,75000 1/2 7,5 +
7,5 / J
15
3,95395 1/2 4,75 +
4,75
15
3,87381 1/2 3,95395 +
3,95395
15
3,87298 1/2 3,87381 +
3,87381
e 3,872982 = 15. Calcule \f~2. O algoritmo e as iterações produzidos:

1,50000
1,41667
1,41422
Para mostrar que funciona com um número maior e mais complexo,

calcule V 1587,8714. As iterações foram mais longas:
397,96785
200,97890
104,43979
59,82175
43,18256
39,97684
39,94831
39,84810
287
e 39.848102 = 1587,8714. Note como os números sucessivos convergem
para o número final correto. O procedimento funciona com números
menores de 1? Tente V 0,75. As iterações resultantes:
1,18750
0,90954
0,86707
0,86603
e
0,866032 = 0,75.
A primeira e a última tarefas tomaram cada cerca de 7 segundos, a

cerca de 5 segundos. V 1587,8714 levou ao todo 14 segundos. E possível
reduzir as iterações e, portanto, o tempo apreciavelmente, mas nos inte
ressa apenas ilustrar os algoritmos de computador e seu funcionamento.
Assim, embora estes cálculos sejam lentos pelos padrões de computado
res grandes, eles nos dão uma idéia dos procedimentos iterativos de
um computador.6
Igualmente, os analistas escrevem procedimentos algorítmicos para
outras quantidades para as quais não existem procedimentos exatos.
Algoritmos altamente sofisticados — ou “pequenos” programas — sao
incorporados à memória do computador e estão sempre prontos para
fácil uso. Quando se dá entrada em um número cuja raiz quadrada se
deseja, em uma calculadora pequena, e se aperta a chave de raiz quadra
da, a raiz quadrada do número aparece “instantaneamente.” Apenas
parece ser instantâneo, entretanto. Todos esses cálculos levam algum
tempo. Os analistas de computador têm sido tão habilidosos em escrever
e melhorar os algoritmos e a tecnologia da máquina (hardware) do compu
tador e das calculadoras tem progredido tanto que conseguiram-se velo
cidades incríveis. O leitor cético pode ver isto por si próprio obtendo
primeiro a raiz quadrada de um número em uma boa calculadora de
bolso. A raiz quadrada aparecerá como que instantaneamente. Obtenha
agora o logaritmo do mesmo número. Observe que há uma leve demora,
não tanto uma demora mas uma leve pausa. Isto acontece porque o
6 O le ito r cu rio so p o d e rá q u e re r sa b e r com o o c o m p u ta d o r “ sa b e ” q u a n d o deve

p a ra r de ite ra r. C om o ele sabe q u a n d o tem a raiz q u a d ra d a c o rre ta ? E ste é
u m p ro b le m a co m u m em p ro g ram ação d e c o m p u tad o res. A m á q u in a é in stru íd a
a p a ra r d e ite ra r q u a n d o certo crité rio fo r alca n çad o . O crité rio é d a d o a n te rio r
m ente e d ep o is d e c ad a ite ra ç ã o é feito u m teste p a ra v e r se fo i alca n çad o _o
critério. N o caso presen te, o c rité rio é 0,00001. O q u a d ra d o d e r (a a p ro x im ação
d a ra iz ), ou ri, é calc u lad o e ri é su b tra íd a d e x, o n ú m e ro c u ja ra iz q u a d ra d a
se deseja. Q u a n d o ri — x fo r m e n o r o u igual a 0,00001, o teste é satisfeito e o
co m p u ta d o r n ã o re p e te m ais. Se se d e se ja r m aio r e x atid ão , faz-se o crité rio m en o r,
p o r exem plo 0,0000001 ou 0,00000001.
288
algoritmo programado e, talvez, o hardware para o logaritmo não funcio
nem tão depressa como para tirar a raiz quadrada.
Questões mais amplas
Muito tem sido escrito e publicado sobre os computadores e seus

prováveis efeitos sobre as pessoas e a sociedade. Parte, como sempre,
como qualquer questão complexa, faz sentido e parte é absurdo. Não há
a menor dúvida quanto aos grandes e profundos efeitos do computador.
A questão é: No total, os efeitos são bons ou maus? Provavelmente a
questão não possa ser respondida sem ambigüidade. O computador é
um resultado inevitável do progresso da tecnologia e das necessidades
de computação dos cientistas, engenheiros, administradores e outros.
Nossa preocupação é apenas com seus efeitos sobre a pesquisa compor-
tamental. A maioria desses efeitos são claramente bons.
O primeiro e mais óbvio, muitos cálculos na análise de pesquisa
comportamental são trabalhosos, fatigantes e passíveis de erro. Exemplos
freqüentes e óbvios são os cálculos de raiz quadrada e soma de quadra
dos. Mesmo com as velhas calculadoras mecânicas, ainda usadas até
1950 e mais tarde, jamais foi tarefa fácil fazer os cálculos básicos para
desvios padrão e correlações. Nos computadores modernos é fácil, cômo
do, rápido e exato. Um excelente exemplo é a análise fatorial. Antes de
1960, os pesquisadores levavam muitas horas e dias para extraírem os
fatores de uma matriz de correlação. Para uma-matriz de correlações
20 x 20 — 190 coeficientes de correlação — e, digamos, quatro fatores,
eram precisos dois dias ou mais. Se ocorresse um erro — erro que fosse
descoberto! — o tempo podia dobrar. Já demos um exemplo do tempo
aproximado que um grande computador levava para fazer uma análise
fatorial completa de 72 variáveis: cerca de 100 segundos. Dessa forma
o trabalho árduo de antes foi eliminado em grande parte.
Segundo, o computador libertou os pesquisadores para trabalharem
e pensarem em idéias e tarefas mais desafiadoras e importantes do
que cálculos. A pesquisa, entretanto, não se tomou mais fácil de ser
feita. Ficou até, mais difícil. Vinte ou 30 anos atrás, boa parte do
trabalho de muitos pesquisadores era simplesmente o de análise e cálculo
bruto. Isto já não é mais preciso; o computador faz o trabalho pesado.
Com a ausência do trabalho de cálculos, entretanto, aumentou a expecta
tiva em relação à ciência. Espera-se que os pesquisadores desenvolvam
teoria, um trabalho sempre difícil, usem delineamentos apropriados de
pesquisa, e melhorem as medidas das variáveis que usarem. Anos atrás,
por exemplo, havia uma negligência quase arrogante pela exigência da
validade de medidas usadas; até as exigências de fidedignidade eram
289
negligenciadas. Hoje tal negligência é muito menos provável. Embora
estes melhoramentos não sejam inteiramente resultantes da disponibili
dade dos computadores, há pouca dúvida de que os computadores ajuda
ram a dar condições possíveis para melhoramento. Em resumo, o compu
tador libertou o pesquisador para coisas melhores.
A terceira influência benéfica do computador é mais sutil. A simples
presença de um centro de computação, que a maioria dos pesquisadores
acabará usando, afeta a vida e o pensamento de todos os que o cercam.
É uma manifestação física da matemática, ciência, pesquisa e tecnologia.
Seu staíus, como manifestação de uma das mais altas realizações tecno
lógicas e intelectuais, é uma lembrança constante dos valores que influen
ciam nosso pensamento e nosso trabalho. O grande investimento feito
pelas universidades — e outras instituições e organizações sociais — em
computadores e pessoal técnico, penetra as vidas dos pesquisadores. E um
des principais valores é a solução objetiva de problemas e comunicação.
O computador é, então, um poderoso símbolo de intelectualidade, princi
palmente intelectualidade científica. Como tal, ele reforça e apoia normas
e critérios científicos e intelectuais. Não é de admirar que pintores,
êscritores, historiadores e filósofos se preocupem com ele. Eles temem
que sua influência poderosa possa desequilibrar a universidade e até a
sociedade. E eles podem ter razão.
A quarta influência já foi mencionada neste capítulo. Os problemas
de pesquisa que não podiam ser prontamente abordados, estão agora ao
alcance. Já mencionamos análise fatorial e outras formas de análise
multivariada. Vamos tomar um exemplo bem diferente ainda não discu
tido aqui: a análise de conteúdo. Os cientistas políticos, historiadores,
psicólogos e sociólogos, entre outros estudiosos, sempre analisaram mate
rial documentário a fim de estabelecerem fatos e tendências e para estu
dar relações. Este estudo documentário é extremamente laborioso. Os
historiadores poderíam passar meses ou anos em bibliotecas para estuda
rem e documentarem um assunto. Sem dúvida, a imagem do intelectual
sempre foi a da pessoa que mais ou menos cava, vasculha e grava
pacientemente os resultados de suas escavações. Grande parte do trabalho
de um estudioso era deste tipo. Embora cansativo, não era possível de
ser evitado.
Graças ao computador e ao desenvolvimento da análise de conteúdo
dentro das ciências comportamentais, a abordagem do intelectual, sua
perspectiva e tjrabalho estão mudando drasticamente — ou talvez eu
deva dizer, mudarão drasticamente porque muitos estudiosos ainda não
foram afetados. Jamais haverá um verdadeiro substituto para o julga
mento humano que o estudioso tem que fazer constantemente. E provavel
mente sempre haverá uma certa quantidade de trabalho maçante. Mas o
computador pode eliminar muito desse trabalho maçante. Com uma
290
lista bem feita de conceitos-chave, nomes e assuntos, o levantamento
bibliográfico feito por computador — depois que a própria bibliografia
foi posta nos bancos de memória do computador — é agora possível.
A carga da pesquisa bibliográfica será grandemente aliviada. Depois
que o estudioso seleciona as fontes que deseja na lista que o computador
fornece para sua pesquisa, o computador pode ainda reproduzir a fonte
ou expedir instruções para fazê-lo.
Vamos tomar um exemplo mais interessante. Análise de conteúdo
é um método de analisar e estudar as comunicações — documentos de
toda espécie, inclusive documentos existentes e documentos produzidos
deliberadamente para fins.de pesquisa, livros, cartas, etc.. . de
modo sistemático, objetivo e quantitativo para medir variáveis ou realizar
outros propósitos de pesquisa. Suponhamos que desejamos estudar os
sistemas de valores de grupos ou países diferentes e que certas palavras
ligadas a valores foram descobertas em pesquisas anteriores como capazes
de diferenciar grupos sociais, palavras como igualdade, disciplina, reali
zação, religião e liberdade.
Um “ dicionário” de tais palavras pode ser colocado na memória
do computador. Amostras aleatórias de publicações-chave — editoriais,
discursos políticos e artigos de revistas, por exemplo em diferentes
países podem ser analisados. Seleções inteiras são perfuradas nos cartões
e lidas no computador. O computador examina os cartões, destaca as
palavras relativas a valores que foram colocadas em seu dicionário,^
depois analisa os “dados” contando, categorizando e calculando as esta
tísticas apropriadas. O grande trabalho de estudar e analisar os texto§
é evitado e o pesquisador pode se concentrar no que é impor ntfe
a teoria por trás do trabalho, o “dicionário” e seu conteúdo, a seleção
dos materiais para análise e outros assuntos substantivos e metodologicós.
Outro benefício dos computadores é que pessoas trabalhando em
diferentes campos entram em contato não apenas com os especialistas
de computadores, mas também com trabalhadores de outros campos.
Acontece, ocasionalmente, que um pesquisador, diante de um problema
analítico ou de computador desconhecido em seu campo, descobrirá com
alguém de outro campo que o problema já foi resolvido. Isto acontece
especialmente no contato com matemáticos. A maioria dos pesquisadores
comportamentais não se destaca por seus pendores matemáticos e as
vezes tomam conhecimento de que um problema analítico que os con
funde já fci resolvido por matemáticos ou estatísticos matemáticos.
O último benefício a ser mencionado vem do caráter internacional
dos computadores e da ciência da computação. As linguagens de compu
tadores, embora escritas em inglês, ou no que pode ser chamado de
uma forma de inglês, são na verdade, internacionais. No mundo inteiro,
os programas são escritos em Fortran, Algol e outras linguagens de
computador. As instalações de computador compartilham programas
internacionalmente. Certos pacotes de programas muito conhecidos e
usados podem ser encontrados nas universidades de Nova Iorque, Berkeley
e Amsterdã, para mencionar três instalações muito distantes. É também
muito comum usuários e especialistas de computadores de diversos
países se encontrarem em centros de computação e muitas vezes compar
tilharem seu conhecimento e know-how. A palavra ''Computador” e
certas outras a ela relacionadas, tornaram-se parte de línguas naturais.
Como a música e a matemática, a linguagem de computador é uma
espécie de linguagem internacional.
O efeito deste intercâmbio e influência internacionais ajuda a demo-
lir barreiras nacionais e sociais. Naturalmente, a ciência e a tecnologia
sempre tiveram esse caráter internacional e às vezes ajudaram a destruir
barreiras. A influência do computador pode ser maior, entretanto, pela
necessidade de as instituições terem centros de computação e know-how
fisicamente presentes dentro ou próximos das instituições. Os benefícios
para as ciências comportamentais vêm principalmente do crescente com
partilhar de metodologias — a análise de estruturas de covariância discu
tida no capítulo 13 é um excelente exemplo — e conhecimento ampliado
da teoria e pesquisa.
As desvantagens do computador foram muito discutidas por vários
observadores. Elas são complexas e muito menos óbvias do que as vanta
gens no sentido em que seu caráter negativo e até sua influência nociva
sao mais discutíveis. Veremos por que quando discutirmos e examinarmos
duas ou três delas.
A. primeira e mais óbvia desvantagem do computador é sua possível
violação do sigilo. Uma das regras ou valores importante que governam
a pesquisa da ciência oomportamental é que toda informação sobre
indivíduos e grupos é confidencial. A privacidade e os direitos dos indi
víduos devem ser cuidadosamente salvaguardados. Os dados coletados
sobre indivíduos não devem ser identificáveis. Mas se os nomes dos indi
víduos entrarem no computador com seus dados, torna-se muito fácil a
indivíduos ou organizações inescrupulosas obterem informações indivi
duais e violarem a privacidade e os direitos de indivíduos e grupos.
Infehzmente isto foi feito e o computador levou a culpa. O problema terá
que ser resolvido se este importante valor tiver que ser preservado.
A segunda influência nociva vem dos problemas levantados pela
pergunta. Os computadores podem pensar? De chofre, a maioria das
pessoas sensatas responderá prontamente — Não, é claro que os computa
dores não pensam — pelo menos como o ser humano “pensa”. O
problema é que a pergunta e sua resposta são muito complexas. É certo
que os computadores só fazem o que são instruídos para fazer. Mas as
vezes não se sabe direito para o que foram instruídos. Além disso, sua
292
busca incessante e implacável de possibilidades lógicas pode dar resul
tados surpreendentes. Isto é, os resultados de certa linha de pensamento
não podem ser conhecidos porque as possibilidades são muitas. Levaría
mos semanas, e até anos, para explorar algumas possibilidades apenas.
Mas podemos escrever um programa e instruir o computador a explorar
as possibilidades e imprimir os resultados. Em outras palavras, onde uma
pessoa pode levar adiante um procedimento apenas por tempo limitado
e com possibilidades limitadas, um computador pode segui-lo por minu
tos, horas e até dias (com grande despesa, claro) e explorar muitos
mais e até todas as possibilidades. Isto é “pensar"? Se não for pensar,
precisamente, é coisa muito parecida.
A capacidade do computador fazer operações repetitivas e variadas
a alta velocidade então, ajuda seus usuários a acompanhar as conseqüên-
cias de idéias e modelos complexos. Este grande poder tem uma aura
de magia que deixa muita gente desconfiada ou até com medo dos
computadores. Além disso os computadores podem simular processos
de pensamento humano com grande sucesso. Um exemplo famoso é um
programa de computador que pode demonstrar teoremas lógicos. Estas
demonstrações às vezes são muito difíceis até para especialistas em lógica.
O computador pensa quando resolve esses problemas? Um exemplo mais
conhecido e mais famoso é a incrível capacidade que o computador tem
para jogar xadrez. Os computadores podem derrotar a maioria dos joga
dores de xadrez (mas não os melhores). Eles “pensam" quando fazem
isso?.
O assunto é altamente controvertido e discqtível. Alguns dizem que
o “pensamento” de um computador é indistinguível do das pessoas. Ou
tros, que há uma diferença profunda. Provavelmente não haja uma solu
ção satisfatória para a dificuldade, querendo isto dizer que não é possível
responder à pergunta, Os computadores podem pensar? (A pergunta foi
até considerada sem sentido.) Talvez a melhor resposta tenha sido a
de Turing (1956), que anos atrás disse que para testar a pergunta é só
dar o problema que estiver exigindo pensamento a um computador e a
um especialista humano. Se um observador especializado não puder
discernir nenhuma diferença fidedigna nas soluções apresentadas, então
o computador pode “pensar” . Há pouca dúvida de que muito do que
os computadores fazem parece ser uma forma de pensamento. E não há
dúvida também de que os computadores podem simular efetiva e repeti
damente conhecidas características do pensamento humano. Vamos deixar
este problema embaraçoso e voltar a assuntos mais fáceis — com enorme
alívio, confessemos. 1*
7 O leitor pode ter uipa visão geral dos problemas envolvidos lendo Lindsay e
Norman (1977, pp. 593-599) que analisaram um problema particular chamado
Outra desvantagem do computador tem suas raízes na relativa facili
dade de uso do computador, a grande e fácil disponibilidade dos chama
dos “pacotes” de programas e a força e velocidade das máquinas moder
nas. Estas caracterítsicas e condições possibilitam aos indivíduos com
insuficiente conhecimento dos métodos usados, produzir análises que
podem e, às vezes, são absurdas. Tais usuários dependem muito de que
o computador faça por eles seu trabalho e pensamento. O mau uso de
pacotes de programa de análise fatorial é um exemplo freqüente e proble
mático. Métodos objetivos para análise fatorial convenientes para uso
em computadores foram elaborados e são amplamente acessíveis. O pro
blema é que um método completamente objetivo nem sempre produz uma
solução satisfatória para um problema de análise fatorial. O julgamento
humano tem que entrar no negócio em dois ou três lugares cruciais.
Por exemplo, uma parte importante da análise fatorial é o número
de fatores a serem rotados depois da extração dos fatores. (Veja no
capítulo Í2, nota de rodapé número 4, uma breve explanação de fatores
rotados.) Não há resposta completamente satisfatória para a questão:
Quantos fatores devem ser rotados? Há respostas e métodos objetivos,
mas que podem dar respostas enganadoras senão completamente erradas.
O único meio bastante satisfatório no presente envolve métodos objetivos
e o julgamento do pesquisador. A desvantagem, então, é a tendência dos
pesquisadores se tornarem dependentes demais do computador e, em
fazendo isto, perderem a compreensão real dos dados e da metodologia
com que trabalham, e abandonar o controle sobre sua pesquisa e seus
resultados.
Mais insidiosa e prejudicial é a forte tendência dos usuários dos
computadores em todo mundo, de depender dos chamados “pacotes” de
programas para a solução de seus problemas analíticos. Um “pacote” é
um programa generalizado que pode manejar todos os problemas de certo
tipo. É escrito para ser "geral” para uma classe de problemas analíticos;
meu problema, o seu problema e o problema dos outros podem ser feitos
com ele. Por exemplo, há "pacotes” para fazer análise fatorial, análise
de regressão múltipla e alguns deles são muito bons, sem dúvida. Outros
têm aspectos questionáveis. Muitos dos usuários de tais programas sabem
pouco ou nada a respeito do computador e do que ele pode ou não
pode fazer; e, pior, eles sabem pouco a respeito dos métodos empacota-
aritmética dos dias (Segunda + Quarta =?) na linha de computação e pensa

mento. Boa parte do livro de Lindsay e Norman, aliás, é fortemente influenciada
pelos computadores e pela tecnologia dos computadores. Uma descrição lúcida
de “ pensamento” e solução de problemas de computadores é dada por Green
(1963, pp. 219 e ss.). O brilhante ensaio de Turing (1956) vale a pena ler tam
bém. Para dizer o mínimo, seu ensaio dificilmente deixará impassível mesmo o
leitor mais cético.
294
dos nos programas. Dependem totalmente dos programas do computa
dor. Os terríveis resultados se mostram repetidamente. Ocorreu a pouca
gente, mesmo a pesquisadores, que tamanha dependência é perigosa, e
até perniciosa. Ela não leva apenas a resultados incorretos e confusos;
ela enfraquece a capacidade de muitas pessoas potencialmente talentosas.
Baixa ainda a qualidade geral da pesquisa nas ciências comportamentais.
A desvantagem final a ser discutida é a mais enganadora, complexa
e difícil de ser descrita. O poder, a aplicabilidade universal e a tremenda
velocidade do computador ajudam a gerar espanto e medo em muita
gente. (Naturalmente, quando a automação torna o trabalho obsoleto,
seguem-se a aversão e o ódio.) O computador é encarado como uma
força misteriosa cujo efeito derradeiro será o de destruir a humanidade.
O trabalho do computador e as pessoas que o usam são olhadas como
perigosas ameaças à integridade e peculiaridade existencial de homens
e mulheres. Em resumo, o computador, muitas vezes junto com a ciência,
é percebido como um inimigo da humanidade.
Fato e ficção se unem aqui. O fato é que tais- atitudes são muito
reais e exercem grande influência (veja Lee, 1970, para um estudo
de âmbito nacional de tais atitudes). A ficção é que o computador, essen
cialmente uma máquina, embora potente é antropomorfizado; recebe uma
“realidade” e um “poder” que não possui. Os computadores não desuma-
nizam as pessoas; as próprias pessoas se desumazinam. Os computadores
são produtos humanos e uma parte da estrutura social; devem ser contro
lados pelos homens e mulheres e pela estrutura social. Se a desumaniza-
cão for uma ameaça, então preste atenção a coisas mais profundas do
que .o computador.
Corno sempre, a resposta, se é que há uma resposta, não é culpar a
ciêrtôia, a tecnologia, os métodos e os computadores pelas mazelas huma
nas. Embora não haja dúvidas de que o homem e seus poderosos produtos
ajudam a formar os seres humanos, também não resta dúvidas de que
os males da sociedade são curados apenas pelos homens e mulheres
trabalhando juntos para efetuar curas.
Esta homilia por demais moralista nos leva a nossos últimos capítu
los. Neles discutiremos algumas das importantes e controvertidas questões
associadas à ciência e à pesquisa. Veremos que o computador é apenas
uma pequena parte de um maior e mais difícil complexo de problemas.
15. Concepções errôneas e controvérsias:
questões metodológicas
Nosso estudo da ciência e pesquisa comportamental nos levou muito

longe. Para compreender o como e o porquê da pesquisa científica, tive
mos que falar metodologicamente grande parte do tempo. Para completar
nosso estudo e compreensão, vamos nos dirigir agora a problemas mais
delicados vagamente ligados à falta de compreensão da ciência e da
pesquisa. Vamos terminar o livro voltando a este e outros problemas por
dois motivos. Primeiro, eles são muitíssimo interessantes e importantes
por si mesmos, e deveriam ser conhecidos e compreendidos. E segundo,
as concepções errôneas ligadas a eles obstruem seriamente a compreensão.
Devemos tentar compreender por que a ciência e a pesquisa empírica
foram tão atacadas nos últimos anos. Por que algumas pessoas dizem,
por exemplo, que a ciência é uma força destrutiva? Por que dizem
que é desumana, abstrata, fria e remota e que nos divorcia da realidade
humana, levando-nos à negação e ao desespero? Por que insistem em
que a finalidade básica da ciência deve ser melhorar as condições huma
nas? Por que há tão pouca compreensão em relação para que serve ou
não a ciência?
A tarefa destes últimos capítulos é, então, apresentar e estudar algu
mas questões controvertidas e difíceis para dar maior amplitude e profun
didade à compreensão do leitor. Neste capítulo vamos explorar o que
pode ser chamado vagamente de questões metodológicas controversas:
objetividade, quantificação, valores e ciência e o indivíduo. No último
capítulo a discussão se dirige para a relação entre a pesquisa e a prática.
Nele falaremos sobre a pesquisa básica e aplicada e sobre as idéias de que
a pesquisa precisa proporcionar uma retribuição. Vamos tentar explicar,
finalmente, como a pesquisa influencia a prática — o que pode e não
pode fazer e como ela o faz.
Objetividade
Um dos ataques mais sérios à ciência orgina-se nos ataques à objeti

vidade. Objetividade já foi definida como o acordo entre juizes espe-
296
cialistas sobre o que está sendo observado. Isto significa que a ciência
procura afastar os procedimentos científicos das preocupações humanas.
Todas as formas de conhecimento são influenciadas por valores, atitu
de e outras predileções. Jamais é possível ser-se completamente objetivo.
Em outras palavras, a objetividade é sempre uma questão de grau. Mas
a ciência insiste no ideal e no critério da objetividade como sendo indis
pensável. Sem objetividade não pode haver ciência.
Como ficou salientado no capítulo 1, o critério de objetividade
permite aos cientistas saírem de dentro de si próprios. Eles estabelecem
procedimentos “lá fora”, longe de si mesmos. A idéia é proteger os proce
dimentos de predileções e influências. Esta é a essência e o núcleo de
métodos científicos empíricos. Um dos testes de objetividade é se, a
partir de uma descrição de uma pesquisa, um outro investigador compe
tente é capaz' de replicá-la. Se for possível e se os resultados forem os
mesmos ou semelhantes, isto é apoio parcial para a “validade” da pes
quisa. A objetividade é uma das razões principais porque as explicações
científicas, apoiadas por evidência empírica objetiva, são consideradas
mais dignas de confiança do que outros métodos de se obter conheci
mentos.
As críticas à objetividade vão desde as mais ingênuas às mais sofisti
cadas. O núcleo da crítica, entretanto, parece tomar duas formas. A pri
meira já foi mencionada e discutida no capítulo 1. A objetividade, dizem,
leva ao distanciamento, à frieza, à inumanidade. O distanciamento e
a frieza da ciência destroem os valores humanos e desumanizam o
homem. Assim, a ciência é fundamentalmente perniciosa. Além disso,
não se pode confiar em conhecimento adquirido em sistema tão desumano
porque a ele falta sabedoria verdadeira e profunda, que vem apenas
da percepção intuitiva de verdades espirituais e humanas. A ciência é
reducionista: ela reduz o todo essencial dos seres humanos e o mundo
para dissecar fragmentos de conhecimento, que são, em essência, distor
ções da realidade. Os psicólogos, em tentativas objetivas de estudarem
a inteligência e a personalidade humanas, não compreendem a própria
essência da inteligência e personalidade, todos indivisíveis e impossíveis
de serem reduzidos ,a conceitos e números. A objetividade, em vez de
ser uma ferramenta neutra para o cientista, é de fato um poderoso inimigo
do homem e da verdade — pelo menos é o que dizem.
O segundo argumento é mais sofisticado e exerce maior influência,
principalmente na Europa, onde faz parte dos ataques marxistas^ à
objetividade. Diz-se — com bastante verdade, por sinal — que ninguém
pode ser verdadeiramente objetivo. Quando os cientistas colocam a
objetividade como um ideal, estão enganando-se a si próprios e aos
outros. Todos nós, inclusive os cientistas, somos conduzidos por nossos
valores e motivos. Não podemos ser objetivos. Marxistas e ideólogos
semelhantes vão mais além. Dizem, por exemplo, que os valores da
sociedade influenciam as hipóteses e as pesquisas de cientistas burgueses
e, se esses valores forem corruptos, como o são na sociedade capitalista,
então a pesquisa e os resultados são inevitavelmente corruptos. A objeti
vidade, então, é um mito burguês; é uma arma de opressão.
Dizem ainda que é mais importante conhecer a história de uma
hipótese do que testá-la. Isto significa que o que é importante é a história
e a origem das hipóteses na ciência capitalista ocidental. Quem formula
as hipóteses é a pergunta-chave. Elas vêm de cientistas apoiados pelo
establishment? Se assim for, elas são tendenciosas e suspeitas. Este tipo
de raciocínio e o raciocínio menos ideológico de críticos da pesquisa
comportamental sociológica e psicológica se juntam em seu ataque à obje
tividade.
No capítulo 1 foi respondido um argumento relacionado. Vamos nos
limitar aqui a breves observações centralizadas principalmente na con
fusão de duas definições de objetividade. A definição científica de objeti
vidade ficou dada atrás e elaborada no capítulo 1: acordo entre juizes
especialistas, “juizes” sendo definidos como pessoas ou máquinas. A
essência desta definição se refere a procedimentos, ela é de ordem meto
dológica: dá uma regra geral metodológica. A regra, em essência, diz:
todos os procedimentos devem ser públicos; devem ser replicáveis; devem
estar separados do investigador. E isso é tudo que significa.
Os críticos da objetividade, entretanto, baseiam seus argumentos
numa definição que se concentra no investigador. Eles, ou pelo menos
seus argumentos, pressupõem que a objetividade seja uma característica
ou traço cientista. Eles estão dizendo, com efeito, que os cientistas
reinvindicam a objetividade para si próprios, que eles, como classe de
indivíduos, são mais objetivos do que os não-cientistas. Eu estou exage
rando um bocado e sei que algumas críticas à objetividade são mais
sofisticadas do que indica o meu resumo de seus argumentos. Entretanto,
a confusão causada pela definição implícita ou explícita de objetividade
como um traço dos cientistas impede a comunicação e enfraquece a
compreensão de objetividade como um procedimento científico.
Os cientistas não reivindicam nenhuma objetividade pessoal (natu
ralmente há exceções). Eles insistem na objetividade como um procedi
mento metodológico que pode e deve ser colocado à parte dos cientistas
e suas predileções. Em resumo, os procedimentos devem ser públicos.
Os argumentos contra a objetividade expostos acima, não tocam neste
ponto. O primeiro argumento, de que a objetividade é distanciada, fria
e desumana, é correto. E tem que ser desta forma. É precisamente esta
separação da pesquisa científica das preferências humanas, aliada à
insistência em testes objetivos empíricos das hipóteses — que, uma vez
enunciados publicamente, ficam eles próprios fora dos seres humanos —
298
que aumentou de maneira tão notável nosso conhecimento. Que a objeti
vidade leva à destruição de importantes valores humanos, faz parte de
uma mitologia mais ampla. Sem dúvida, a prática da ciência leva ao
desafio de valores estabelecidos por causa de sua natureza básica de
indagação crítica. Mas que destrua valores humanos ou o próprio homem
é absurdo. Se os valores ou os homens tiverem que ser destruídos, os
homens farão isso. Os procedimentos podem nos desumanizar apenas
quando permitimos que o façam.
O segundo argumento também tem pouco peso, a não ser com
aqueles que querem acreditar nele. Naturalmente todos nós somos influen
ciados por nossas preferências. O fato de podermos ou não ser pessoal
mente objetivos é discutível. Mas a questão não é esta. A questão, como
já observamos, é que os procedimentos da ciência são objetivos — e não
os cientistas. Os cientistas, como todos os homens e mulheres são cpináti-
cos, dogmáticos, ideológicos — influenciados pelas forças que influen
ciam a todos nós. Esta é a verdadeira razão para insistir em objetividade
de procedimento: levar a questão para fora de nós mesmos, sujeitá-la
a investigação crítica pública.
Não há verdades absolutas, cientificamente falando. Não podemos
“saber” nada completamente. Há apenas graus relativos de conhecimento
válido e fidedigno. Os procedimentos objetivos aumentam a probabili
dade de obter conhecimento mais fidedigno e mais válido através da
pesquisa. A objetividade em e de si própria, tem pouco valor. Ser objetivo
não significa ser científico. Afastar a objetividade da ciência, entretanto,
destrói o núcleo do empreendimento científico. •
Métodos quantitativos
Outra fonte de mal-entendidos sobre a ciência, especialmente sobre

sua metodologia, é a grande proeminência da matemática, principalmente
a estatística, na análise científica. A crítica à quantificação nas ciências
naturais parece quase não existir. Parece natural e óbvio medir reações
químicas, movimentos moleculares, dimensões físicas de corpos e matéria.
As pessoas parecem não ligar para o alto grau de quantificação em
física, por exemplo, onde se estudam, entre outras coisas, as relações
entre as forças físicas. Há assim, pouca controvérsia. Em psicologia,
sociologia, educação e outros campos comportamentais, entretanto, a con
trovérsia floresce.
Como é possível medir inteligência? Não pode ser vista; n i n g u é m
pode entrar em uma cabeça (a não ser cirurgiões e fisiologistas) para
ver ’, quanto mais medir a inteligência. Mesmo admitindo que as
pessoas diferem em grau de inteligência — embora haja quem duvide!
— como é possível atribuir-se números a pessoas sugerindo que há
quantidades precisas de inteligência? Não é igualmente ridículo afirmar
que características humanas e características de grupos e organizações
possam ser medidas? Mesmo assumindo que parte da mensuração possa
ser bem-sucedida, não devemos então concluir que qualquer coisa que
tenha sido medida com eficácia seja trivial demais para ter muita impor
tância? Por exemplo, assumindo que certo aspecto da inteligência possa
ser medido, refletirão as medidas alguma parte de toda a riqueza, com
plexidade e da natureza multifacetada da inteligência humana? Ou deve
mos concluir que os aspectos medidos são relativamente sem importância,
bastante fragmentários e, em resumo, triviais? Certamente os números
fornecidos por tais procedimentos estão muito além da realidade, da
rica totalidade, das capacidade humanas. E usar esses números em
cálculos estatísticos leva a credulidade longe demais.
Vamos levar os argumentos dos críticos um pouco mais além. Qual
é o significado de uma nota média de um teste de inteligência de um
grupo de indivíduos? Em primeiro lugar, como se pode somar números
tão questionáveis e depois dividi-los por outro número? Como se pode
correlacionar dois conjuntos de números cujos componentes individuais
supostamente refletem características humanas quando, de fato, os núme
ros de ambos os conjuntos estão longe da “realidade” do indivíduo cujas
características devem ser medidas? Que significado real pode ter um
coeficiente de correlação entre, digamos, uma medida de autoconceito
e uma medida de prestígio ocupacional? Há outros argumentos contra a
quantificação, mas estes são suficientes para ilustrar o que se quer dizer.
É mais difícil responder tais argumentos do que propô-los. Parte da
resposta foi dada no capítulo 9 onde estudamos a mensuração de
variáveis. Não há dúvidas de que certas operações aritméticas com
números, em variáveis de ciência comportamental, são questionáveis.
Quando se soma, por exemplo, um conjunto de notas de testes de inteli
gência e se calcula a média do conjunto, está se supondo que os inter
valos entre pontos fixos, como 80, 90, 100, 110, 120, são iguais e que
as distâncias numericamente iguais, como de 80 a 100 e de 100 a 120,
representam distâncias empiricamente iguais. Medidas de testes de inteli
gência — e muitas outras usadas em pesquisa psicológica e educacional
— podem não satisfazer a suposição. Por exemplo, as diferenças entre
quocientes de inteligência de 150 e 140 realmente podem ser psicologica
mente maiores do que a diferença entre os quocientes de 110 e 100.
Ou seja, a distância psicológica entre 140 e 150 — a “verdadeira” dife
rença entre estes dois níveis mensurados de inteligência — pode ser
consideravelmente maior do que a distância psicológica entre 100 é 110.
Os números anteriores podem representar uma diferença muito maior em
inteligência, em outras palavras, do que os últimos, embora as diferenças
numéricas em ambos seja de 10.
300
Há diversas respostas à crítica feita à quantificação nas ciências
comportamentais, sendo que a mais importante é empírica e pragmática.
O uso da quantificação funciona! Embora as suposições que formam a
base do uso dos números e sua manipulação possam ser violadas, a
quantificação funciona muitíssimo bem. Quando a inteligência de criança
é medida com um teste fidedigno razoavelmente válido, pode-se correla
cionar os números obtidos com outros números obtidos em outro teste
aplicado às mesmas crianças, digamos, um teste de realização verbal, e
obter uma excelente aproximação da magnitude da relação. A evidência
para a “verdade” desta afirmativa é que — em geral e, naturalmente,
com as exceções de sempre — as crianças que obtêm notas altas em
testes de inteligência também recebem notas altas em testes de realização
verbal, assim como em testes de outros tipos de realização; e as crianças
que obtêm notas baixas em inteligência tendem também a receber notas
baixas em realização. (Veja a discussão sobre validade no capítulo 9.)
Embora o cientista não desdenhe arbitrariamente suposições impor
tantes na atribuição de números a objetos que estão sendo medidos, ele
sabe que, às vezes, não pode satisfazer todas elas. Além disso ele sabe,
por experiência e pela evidência, que com conhecimento, cuidado e habi
lidade em planejar e usar suas medidas, ele pode conseguir aproximações
razoáveis de suas variáveis e as relações entre elas no sentido de que seus
resultados, apropriadamente testados e verificados, concordam com a
“realidade”, como no exemplo acima de inteligência e realização verbal.
Conseguindo tudo isso, ele pode usar os métodos “fortes” da matemática
e da estatística para ajudá-lo a fazer inferências sobre o que está “lá
fora”.
Há uma resposta empírico-experimental fortemente relacionada com
isso para as acusações à quantificação. Os testes estatísticos de significân-
cia têm certas suposições por detrás. Por exemplo, um teste t, que já
discutimos anteriormente, entre outras coisas, avalia a significância esta
tística da diferença entre duas médias. Uma das suposições em que se
baseia o teste (Edwards, 1967, pp. 214-215; Hays, 1973, pp. 409-410) é
que as notas das duas populações das quais os dois grupos são amostras
são distribuídas normalmente.1 A teoria que apoia o teste t, da dife
rença entre duas médias, requer esta suposição. Se for violada, os resul
tados de um teste t podem não ser válidos. Igualmente, supõe-se que as
1 Lembre-se de que "distribuição normal” significa que as notas, se representadas

apropriadamente em um gráfico, formarão uma curva em forma de sino, encon
trada freqüentemente em textos de estatística e já mostrada neste livro. O “ signi
ficado” de uma distribuição normal é que a maioria dos sujeitos têm notas no
meio da distribuição, alguns poucos têm notas baixas e muito baixas, e alguns
têm notas altas e muito altas.
variâncias (variabilidades) das duas populações sejam iguais. Novamente,
se essa suposição for violada, se as duas variâncias não forem iguais
(estatisticamente), então, os resultados do teste t podem não ser válidos.
Testes empíricos (por exemplo, Boneau, 1960) e a experiência
mostraram que a suposição de normalidade pode ser violada sem grandes
prejuízos para os resultados do teste t. Os pesquisadores podem usar o
teste sem se preocuparem demais com a suposição, principalmente se
suas amostras forem grandes (Hays, 1973, p. 410). A suposição de variân
cias iguais é mais importante. Mas, em geral, esta também pode ser
violada, às vezes, impunemente. Ficou demonstrado, em outras palavras,
que o teste t e testes semelhantes, são “robustos”. São tão fortes que
podem funcionar muito bem até quando as suposições que os apoiam
são violadas. Naturalmente, ninguém em seu perfeito juízo advoga a
negligência das suposições. Mas agora sabe-se que elas não são tão impor
tantes quanto se imaginava que fossem.
Há, naturalmente, outros argumentos que apóiam a quantificação
nas ciências comportamentais. Mas eles nos levariam longe demais.
Vamos terminar a coisa, portanto, com o argumento pragmático de que
a quantificação e seu uso têm sido altamente bem sucedidos e, que com
o crescente uso do computador e métodos sofisticados, tornar-se-ão mais
eficientes ainda. Sem dúvida, o uso da quantificação nas ciências com
portamentais, tão essencial em todas as ciências, foi um dos empreendi
mentos mais notáveis do século XX. O argumento de que a mensuração
de atributos psicológicos e sociológicos é questionável, por exemplo, a
mensuração de inteligência e atitudes, é simplesmente contradito pela
evidência. Inteligência, atitudes e muitas outras variáveis psicológicas e
sociológicas — classe social, realização e necessidade de realização,
aptidões e outras — foram eficaz, senão perfeitamente, medidas.
Valores e ciência
Outra área de interesse bastante obscura é a dos valores e sua

relação com a ciência, assunto abordado no capítulo 3. Valores são
organizações de crenças sobre princípios, normas e padrões de compor
tamento e objetivos de vida (end-states of life), que expressam preferên
cias culturalmente ponderadas e julgam a “bondade” ou “maldade”
de preferências, normas e objetivos de vida. Expressam também julga
mentos morais de normas e comportamentos (veja Rokeach, 1973). Uma
característica significante dos juízos de valor, mostrada no capítulo 3,
é que eles não podem ser testados empiricamente. Portanto, eles não
podem ser submetidos à pesquisa científica. Afirmativas tais como
“ É errado praticar a discriminação com base em raça, religião, sexo ou
origem nacional”, “A propriedade privada é sagrada”, e “Religião é o
302
ópio do povo” são proposições de valores. Não há forma de testá-las
empiricamente. Elas estão além dos meios e capacidades da ciência.
Por isso, os cientistas excluem tais proposições de seu trabalho.
Isto não significa que os cientistas, como indivíduos, ou até em
grupos, não tenham valores. Tal afirmativa é absurda. Nem significa que
a pesquisa científica seja isenta de valores. As escolhas de tópicos de
pesquisa e até a metodologia da pesquisa são influenciadas pelos valores
que o cientista adota. Os valores podem também influenciar a interpre
tação dos resultados da pesquisa. O psicólogo ou o sociólogo informado
sabe disto, entretanto e usa salvaguardas para minimizar esta influência.
O fato de os cientistas evitarem proposições de valores como não
testáveis, não significa que os próprios valores não possam ser estudados
cientificamente. Sem dúvida eles foram assim estudados, mas por mais
estranho que pareça, nem uma fração do que sua importância justifica.
O estudo científico de valores é abordado o mais objetivamente possível;
o cientista que estiver estudando valores tem que ser especialmente
cuidadoso para que seus próprios valores não influenciem a coleta e
análise dos dados e a interpretação dos resultados. Exemplos possíveis
de pesquisa de valores são a influência de valores conservadores e liberais
no comportamento eleitoral; o efeito de valores religiosos em questões
como divórcio e aborto; as relações entre os valores de pais e filhos;
a ligação entre valores colocados em conceitos como liberdade e igual
dade, de um lado, e valores colocados em conceitos como propriedade
privada e capitalismo, de outro.
É perfeitamente possível, em outras palavras, estudar valores como
um fenômeno natural. Pode-se explorar a estrutura fatorial dos valores
que as pessoas dizem que adotam, para conhecer as relações entre conjun
tos gerais de valores e como os valores expressos podem se agrupar.
Pode-se estudar os diversos efeitos de valores declarados em tipos dife
rentes de comportamento social, ou as relações entre valores políticos e
valores religiosos, ou as maneira pelas quais as crianças aprendem os
valores. Mas não se pode testar empiricamente as próprias proposições de
valores, proposições que contenham as palavras “bom”, “mau”, “deve
ria”, “podería”, e assim por diante. Simplesmente não há maneira de
fazê-lo. Tais proposições e palavras implicam e refletem julgamento
humano. Não há nada a testar, nenhuma relação entre variáveis que
possa ser manipulada ou mensurada.
A pesquisa científica e o indivíduo
Uma fonte de considerável insatisfação com a ciência e a pesquisa

científica, principalmente a psicologia científica e a pesquisa psicológica,
centraliza-se na suposta falta de preocupação que a ciência teria pelo
indivíduo. Este problema já foi mencionado neste livro. Felizmente, foi
resolvido facilmente — racionalmente. Infelizmente não é fácil de resol
ver psicologicamente. A preocupação se origina no que as pessoas vêem
como sendo abstração, frieza e distanciamente da ciência — e falta de
preocupação com o indivíduo humano. Os próprios cientistas são consi
derados frios e distantes. Sente-se, então, que a ciência tem uma influên
cia desumanizadora e que os cientistas são pessoas a quem se deve
temer e limitar. Temos, então, um sentimento de antipatia bastante
forte para com a ciência, os cientistas, a pesquisa científica, baseado
no suposto descaso pelos problemas humanos.
Argumentar que esse sentimento está baseado em concepções
errôneas não acaba com ele. Devemos, assim mesmo, tentar explicar e
justificar esse distanciamento e essa frieza corretamente percebidos. Nossa
explicação se concentrará em torno da abstração da ciência e de sua
falta de preocupação com o indivíduo.
Como já ficou dito aqui neste livro, há justificação para perceber
a ciência como fria e distinta. Ela é necessariamente abstrata. Ser abstrata
significa estar. afastada, separada, à parte de coisas específicas. Uma
equação matemática é altamente abstrata. Todos os substantivos são
abstratos: não são as coisas que representam ou nomeiam. Em vez disso,
eles “estão no lugar” das coisas, eles as representam, eles lhes dão nomes.
Vejamos as palavras “livro”, “homem”, “mapa”, “ciência”, “pesquisa” .
As três primeiras palavras significam “objetos” específicos ou entidades
delineáveis; são abstratos. As duas últimas também querem dizer
“coisas”, mas são mais abstratas do que as três primeiras porque repre
sentam muito mais. Elas representam idéias e atividades complexas.
Estas últimas três ou quatro sentenças foram deliberadamente mais
abstratas do que poderíam ter sido. “As três primeiras palavras”, por
exemplo, foi usado em vez das palavras específicas “livro”, “homem”, e
“mapa”.
Uma das características mais importantes e indispensáveis da ciência
é sua abstração. Sem dúvida, os cientistas procuram ser o mais abstratos
possível porque abstração significa maior generalidade e força. A meta
é expressar relações descobertas e teóricas e talvez leis em símbolos e
expressões matemáticas.2 Suponhamos que um cientista, ao tentar expli
car a memória, descubra que ela é afetada pela inteligência, pela organi
2 Uma “lei” em ciência é um enunciado de relações que tem uma base teórica
e considerável apoio empírico. Uma teoria, naturalmente, pode ou não ter apoio
empírico. Se uma teoria foi apoiada repetidamente pela evidência, pode então ser
chamada “uma lei”. Não há regras rígidas e seguras, entretanto, para dizer
quando uma teoria confirmada se torna uma lei.
304
zação (da informação a ser lembrada) e pelas imagens. Ele pode e natural-
mente descreverá a relação descoberta em palavras. Mas ele expressará a
relação mais sucinta, exata e frutiferamente com, digamos, uma equação
de regressão, que mostra mais claramente qual é a natureza da relação.
Muitos outros exemplos da necessidades e força da abstração pode
ríam ser dados. Mas isto não chega à raiz do motivo pelo qual o cientista,
como cientista, não. tem que se preocupar com o caso individual. Ao
propor a equação de regressão, como no caso acima, ele perde indivi
dualmente as pessoas que foram seus sujeitos. Sua equação de regressão
é uma expressão média, uma abstração dos dados originais. Naturalmen
te, ele poderá usar a equação de regressão para predizer a nota de
qualquer sujeito em uma variável dependente. Mas isto também é uma
abstração, uma expressão que diz, com efeito: “Aqui está a predição
para o sujeito Xü, mas é apenas uma predição da média”. Temos aqui
um dilema e uma pista para a natureza “grupai” da ciência. Para enten
der isto, vamos examinar um meio muito útil de encarar disciplinas e
proposições.
A distinção nomotética-ideográfica
Existem dois grandes tipos de disciplina dè conhecimento, nomo-

téticas e ideográficas. Diz-se, por exemplo, que a física é nomotética e a
história, ideográfica. Nomotética significa fazedor a de leis. Uma disci
plina pode ser caracterizada como nomotética se seu objetivo básico é
estabelecer leis gerais. A física é um exemplo claro porque seu principal
objetivo é descobrir leis naturais ou enunciados de relações entre fenôme
nos físicos. A chamada lei da gravidade é um exemplo bem conhecido.
A psicologia e a sociologia são disciplinas nomotéticas, ou fazedoras de
leis. As ciências comportamentais são geralmente consideradas nomotéti
cas, embora haja desacordo neste ponto.
Ideográfica significa descrever as coisas individualmente. As disci
plinas ideográficas não são basicamente descobridoras de leis; são, antes,
descritivas. A história, por exemplo, é ideográfica: o historiador tenta
dar descrições exatas de acontecimentos singulares e de suas relações:
a história da Guerra Civil, as causas da Revolução Russa, a origem e
fundação das escolas públicas na América. São estudadas as relações e as
supostas causas e efeitos, mas o interesse se focaliza em indivíduos,
nações, organizações e acontecimentos. A história, portanto, não é uma
ciência. Isto de forma alguma significa que ela seja de alguma maneira
Inferior ou superior à ciência. É simplesmente diferente — é ideográfica.
Em psicologia e educação freqüentemente há conflitos entre nomote-
tistas e ideógrafos, como passarei a chamá-los. Os psicólogos clínicos
305
são principalmente ideógrafos. Estão principalmente preocupados com o
indivíduo e seus problemas. Os pacientes devem ser tratados. As pessoas
têm que ser servidas. Por outro lado, o estudante nomotético da personali
dade não está nem pode estar preocupado com o indivíduo. Ele procura
leis que expliquem o comportamento. Ele quer, por exemplo, conhecer
a raiz das neuroses. Está interessado no cliente apenas como um exemplo
da expressão de uma teoria de personalidade. A neurose do paciente deve
ser explicada por meio de leis, nomoteticamente. O quadro que estou pin
tando é um bocado extremo; há cientistas-psicólogos que combinam abor
dagem nomotética e ideográfica, mas eu imagino que não lhes é fácil
fazer isto. Há muitos anos, Carl Rogers expressou eloqüentemente seu
próprio conflito ao tentar ser ao mesmo tempo nomotético e ideográfico
(Rogers ,1955).
Os cientistas, então, não estão nem podem estar preocupados com
o caso individual.3 Eles buscam leis, relações sistemáticas, explicações de
fenômenos. E seus resultados são sempre estatísticos. Eles precisam apren
der a viver e trabalhar com a incerteza. As leis que buscam são enuncia
dos do tipo se p, então q, mas tais enunciados são sempre compreendidos
como enunciados do tipo se p, então provavelmente q. Quaisquer predi-
ções que são feitas para casos individuais, não são “individuais” no
sentido clínico ideográfico, mas antes uma espécie de "indivíduo” ,
abstrato de uma equação estatística.
Para clínicos, professores e pessoas cujo trabalho esteja ligado ao
indivíduo, parece difícil compreender a ciência e o cientista nomotético.
Seu principal interesse na ciência, se existir, está em como ela pode
ajudá-los a curar ou ensinar indivíduos, e nem tanto em leis abstratas
que podem ou não ser aplicadas a indivíduos particulares ou que talvez
apliquem a eles apenas em média.
Predição
Para compreender um pouco melhor a distinção, vamos examinar

agora as duas principais maneiras empíricas de estudar indivíduos: predi-
3 Existe uma aparente exceção a esta afirmação. Freqüentemente os cientistas

predizem para casos individuais, principalmente em psicologia e educação. Por
exemplo, com base em três, quatro ou mais testes e uma equação de regressão,
pode-se predizer os status ocupacionais de indivíduos. Foi dado outro exemplo
no capítulo 13, quando discutimos análise discriminante: foi predita a inclusão
de um osso particular em um grupo. Mas não acho, entretanto, que sejam real
mente exceções. Em todos os casos como este as predições foram estatísticas.
Calcula-se a nota provável de Y, alguma medida a ser predita, com base nas
notas obtidas de vários sujeitos. O cientista está basicamente interessado nas
relações, e não nos indivíduos, ossos ou pessoas de suas amostras. (Veja a dis
cussão a respeito de predição, adiante.)
306
ção è perfil. (Vamos omitir todos os meios mais ou menos subjetivos,
como a especulação psicológica intuitiva e a astrologia.) Pela predição
podemos prever o desempenho de um indivíduo em uma variável depen
dente com base em uma ou mais notas em certas variáveis independentes.
Ou, intimamente relacionado com isto, predizemos a categoria ou a
inclusão do indivíduo em um grupo com base em seu desempenho ou
suas medidas em um ou mais testes ou medidas. Exemplos comuns são
a predição de realização no segundo grau ou na universidade, com base
em medidas de inteligência, classe social, motivação e realização anterior,
e a predição de sucesso ocupacional a partir de medidas de escolaridade,
classe social, escolaridade e ocupação dos pais.
Talvez o método para fazer predições mais freqiientemente usado
seja o da análise de regressão múltipla. (Se houver, naturalmente, apenas
uma variável dependente a ser predita.) O pesquisador aplica as medidas
das variáveis independentes a um número de pessoas e apura ou mede
W d 00 TV
a variável dependente. (“Apura” é usado aqui porque quando a variável
dependente é a inclusão em um grupo — “sucesso” ou “insucesso” em
terminar a universidade, por exemplo — , tudo o que se tem a fazer é
determinar a que grupo ou categoria o indivíduo pertence.) Ele faz então
análise de regressão múltipla e usa a equação de regressão para fazer
a predição, como ficou esboçada no capítulo 11.
Como exemplo, vamos tomar um fenômeno muito difícil, a criativi
dade. O conceito é difícil porque não é fácil saber o que é criatividade;
é de difícil definição, principalmente de modo operacional. Mas vamos
imaginar que um psicólogo tem duas medidas razoavelmente boas qi ie ' ’
predizem criatividade em crianças, sendo que o conceito global de criati-p ?
vidade propriamente dito seria julgado por especialistas. Vamos deno
minar as duas medidas Xi e X2 e criatividade, Y. Neste ponto aconselhai;'
mos que o leitor volte ao capítulo 11 e reveja o parágrafo sobre o estudo
de Holzman e Brown e a seção imediatamente seguinte. Lá aprendemos
o que é uma equação de regressão, para que é usada, e como se podem
fazer predições individuais usando a equação de regressão.
Uma equação de regressão abstrata com duas variáveis indepen
dentes é:
Y’ = a -f- biXi + 02X2
Y’ é a nota predita, a, a chamada constante de intersecção, vamos
ignorar de novo; não é importante para o que queremos. Xi e X2 são
as variáveis independentes, e bi e b2 são os pesos de regressão para
Xi e X2. São partes dos frutos da análise de regressão. Como seu nome
indica, eles “ponderam” ou “atribuem importância” diferenciada às
medidas das variáveis independentes.
Vamos supor que o psicólogo aplicou Xi e X2 e sua medida de
ííiatividade, Y, a um grande número de crianças, tenha feito a análise
307
de regressão e tenha obtido a seguinte equação de regressão — que é a
mesma usada para ilustrar regressão e predição no capítulo 11:
Y’ = 0 ,10 + 0 ,6 8 X i + 0,39X 2
bi e b2 são 0,68 e 0,39, respectivamente. Eles indicam que em qualquer

predição individual Xi tem um “peso” maior do que X2. Em outras
palavras, foi descoberto que Xi contribui mais para a predição de Y do
que X2. Vamos supor ainda, que dois indivíduos, números 7 e 41 em
uma amostra de 50, obtiveram notas X /e X2 de (2,4) e (10,5), como no
capítulo 11. A predição dos dois Y ou das notas de criatividade são,
então:
Indivíduo 7: 0,10 + (0,68) ( 2) + (0,39) (4) = 3,02
Indivíduo 41: 0,10 + (0,68) (10) + (0,39) (5) = 8,85
Com base nestas predições, o psicólogo poderá dizer que o indivíduo 41
é, ou será, mais criativo que 0 indivíduo 7 (naturalmente nos aspectos de
criatividade medidos por Xi e X2).
Esta é a essência da predição. 4 O psicólogo predisse a nota de criati
vidade de dois indivíduos. Ele pode usar a equação para predizer a
criatividade, ou notas Y’ de quaisquer indivíduos semelhantes. Mas
observe cuidadosamente que essas predições são realmente predições de
“grupo”, no sentido de que os pesos foram obtidos das notas Xi X2 e Y
de um grupo de indivíduos. Elas são, por assim dizer, médias, abstrações
estatísticas derivadas dos dados originais do grupo. As predições são
assim de natureza estatística. Têm probabilidades maiores ou menores
ligadas a elas. Não são, portanto, e estritamente falando, predições indi
viduais, mas antes predições para classes de indivíduos que obtiveram
as notas dadas Xi e X2. Como tais, podem e são muito úteis às vezes,
mas não são “individuais” no sentido existencial do termo. Em outras
palavras, 0 indivíduo existencial, 0 núcleo da individualidade, escapa
para sempre do cientista. Ele está mais ligado a dados de grupos, predi
ção estatística e cálculos probabilísticos.
Foi dito que isto é verdadeiro nas ciências comportamentais; é uma
função da inexatidão dessas ciências. Mas nas chamadas ciências exatas,
entretanto, as leis seriam conhecidas virtualmente com certeza, e as predi
ções de casos individuais poderíam ser feitas com toda confiança. Não é
bem assim. Naturalmente há diferenças entre um e outro tipo de ciência,
mas não se trata de diferenças em idéias gerais, concepção, abordagem e
metodologia geral. São diferenças em grau de precisão da experimentação
4 O leitor interessado em predição estatística achará esclarecedor o livro de

Rozeboom (1966), que, às vezes, é divertido, difícil e mesmo profundo.
308
e mensuração. Mas todo o conhecimento científico é conhecimento de
relações empíricas, cuja “existência” traz sempre junto um rótulo de
probabilidade. Em ciências naturais as probabilidades são mais altas do
que em ciências sociais. As generalizações e predições em todas as
ciências, entretanto, são predições de grupo e são probabilísticas. Um
físico não pode predizer o movimento de um átomo com mais exatidão
do que um psicólogo pode predizer a nota de criatividade de uma criança.
Perfis
Outra maneira muitíssimo útil de estudar-se o indivíduo é através

de perfis e análise de perfil. “Na realidade, a análise de perfil está
intimamente relacionada com a predição. Naturalmente é mais complexa
e talvez mais interessante, principalmente para o pessoal ideograficamente
orientado. Perfil é um conjunto de notas de um conjunto de testes ou
medidas. Os perfis podem ser de indivíduos ou de grupos. Perfis indi
viduais consistem em duas, três ou mais notas de algum tipo dadas a
um só indivíduo. Perfis de grupos são algum tipo de notas médias obtidas
a partir de um grupo de notas. Um perfil comum de grupo seria um
conjunto de médias de um grupo em duas, três ou mais medidas.
Usam-se freqüentemente os perfis para propósitos diagnósticos. Por
exemplo, os professores estudam as notas de aproveitamento dos alunos
em diferentes matérias para diagnosticarem forças e fraquezas. As maté
rias de testes fornecem aos professores, administradores e orientadores,
perfis de informação tanto de indivíduos quanto de classes e até de
toda uma escola. Freqüentemente, os clínicos usam perfis de testes de
personalidade para ajudá-los a diagnosticarem as dificuldades de um
paciente. Assim, os perfis são instrumentos muito úteis para se trabalhar
com indivíduos. Como os métodos de regressão múltipla, são também
instrumentos multivariados que, pelo menos teoricamente, estão mais
próximos da complexidade dos atributos e do comportamento humanos
do que simples testes ou medidas.
Apesar de seu aparente caráter individual e seu apelo ideográfico,
os perfis, como as equações de predição discutidas anteriormente, são
produtos de grupos. Um perfil deriva seu significado apenas da ligação
de suas notas componentes aos dados de grupo. Isto está ilustrado na
figura 15.1. O perfil consiste nas notas representadas graficamente de
quatro medidas de talento musical — outro conceito difícil, por sinal —
memória, percepção melódica, acuidade auditiva e coordenação.5 Pode-
f Estas medidas foram escolhidas apenas para ilustrar as questões apresentadas;

elas não provêm de uma pesquisa real. Os detalhes técnicos de como apresentar
309
Coordenação
x
Figura 15.1
mos dizer que a figura 15.1 retrata o (limitado) perfil do talento musical
de um indivíduo. Por ela, pode-se avaliar mais ou menos a capacidade
musical da pessoa. Supomos que os quatro atributos dados sejam impor
tantes para qualquer um que aspire à realização musical. As notas do
indivíduo estão representadas acima e abaixo das médias das quatro
medidas. (Vamos supor ainda que as notas brutas dos testes foram
transformadas convenientemente em medidas comparáveis. Do con
trário, o perfil não teria muito sentido.) 6
No caso presente podemos verificar que o indivíduo tem memória,
percepção melódica e coordenação acima da média. Mas sua acuidade’
auditiva está consideravelmente abaixo da média. Já que a acuidade é
decisiva (digamos) na maioria das atividades musicais, o prognóstico para
seu sucesso musical não é nada bom. Entretanto, ele poderá dar um
bom baterista! Mas jamais um timpanista, já que é preciso afinar os
tambores, mesmo durante um concerto!
Observe novamente que os perfis, como as equações de regressão,
estão amarrados a medidas de grupos. As médias, calculadas pelas notas
de um grupo, são os referenciais comparativos que possibilitam a inter
pretação. Em resumo, o psicólogo, o professor e o orientador que usam
perfis como este são ignorados aqui, já que não estão ligados diretamente ao
problema.
* U p uiodo comum, mas não o único, de fazer isto é converter todas as notas
do indivíduo ein notas-padrão. Uma nota-padrão é a diferença entre uma nota
1 e a, m®câ SruP° naquele teste, M, convenientemente ajustada para
(dividida por) a variabilidade do grupo.
310
perfis ou notas preditas de regressão múltipla estão usando uma aborda
gem ideográfica; estão descrevendo indivíduos. Mas precisam fazer isto
sempre com base em medidas e estatísticas de grupos.7
A distinção nomotético-ideográfico é importante porque esclarece
parte da natureza fundamental da ciência e da pesquisa científica e
porque esclarece as limitações de ambas as abordagens. O bom novelista
é um ideógrafo. Ele descreve e sonda indivíduos e seus amores, temores,
motivações e comportamentos. O grande novelista faz isto e ainda mais:
ele dá um jeito de projetar também suas personagens na tela da humani
dade. Um Chaim Potok não apenas cria vividamente uma personagem
hassídica, no Brooklin, defrontada com o problema da ruptura com o
Hassidismo. Ele faz também o leitor sentir a dor de tal ruptura com
seu credo. Fazendo isto, ele, até certo ponto, escorrega para a nomotese.
O grande cientista jamais poderá passar de uma abordagem nomotética
para uma abordagem ideográfica. As regras do jogo não permitem.
Deve-se agarrar a elas e deixar a ideografia para os Potoks, porque a
própria definição da ciência como fazedora de leis, com sua restrição à
generalidade, não permite tratar com o indivíduo.
Um parodoxo perturbador
Podemos concluir este capítulo perturbador com um parodoxo pertur

bador. É um parodoxo da ciência, mas principalmente da ciência compor-
tamental, que se centraliza no que pode ser chamado a “unidade de
discurso” . A unidade de discurso em ciência é sempre o conjunto, o
grupo. Mas os cientistas comportamentais, e os psicólogos principalmente,
falam muitas vezes como se a unidade de discurso fosse o indivíduo.
As teorias psicológicas, por exemplo, são muitas vezes enunciadas como
se fossem explanações do que vai dentro de um único indivíduo.
O psicólogo social, por exemplo, pode falar sobre o efeito da semelhança
de atitude percebida em relação a questões sociais sobre a apreciação
7 O p ro b le m a re la c io n a d o c o m este, de u m a " e s ta tís tic a d o in d iv íd u o ” , é d ifícil.

E m te o ria , pode-se c o n c e b e r o u s o d e e sta tístic a s p a ra o s d a d o s d e u m in d iv íd u o .
'Or exemplo, a metodologia Q (Stephenson, 1953) é uma abordagem desse tipo.
Í nstrurnentos de mensuração, geralmente um maço de cartões, são construídos
com uma, duas ou três variáveis, incorporadas aos itens do instrumento. Um
único indivíduo responde ao instrumento, e, sob certas circunstâncias, os resul
t a d o s podem ser analisados com análise de variância. Pode-se chamar a isto uma
estatística do indivíduo. Igualmente interessante, as respostas de um indivíduo
Odern ser >rrelacionadas com as de outro — e assim por diante. A abordagem
Í metodologia e suas -forças e fraquezas são complexas demais para estudarmos
aqui. Basta dizer, entretanto, que a natureza grupai dos dados não muda.
por outra pessoa. Ao explicar as razões de tal relação, o cientista poderá
falar sobre o indivíduo e a estrutura e conteúdo de suas atitudes em
relação a questões sociais. Ou um teórico cognitivista poderá falar sobre
a estrutura da memória e seus efeitos em certos comportamentos. Estarão
falando, naturalmente, das atitudes e lembranças de indivíduos particu
lares.
Para sermos mais claros em relação a este difícil problema, vamos
tomar um exemplo sociológico e constrastá-lo com os exemplos acima.
Os sociólogos (por exemplo, Duncan, Featherman & Duncan, 1972)
tentaram explicar o status ocupacional usando as variáveis independentes
status ocupacional do pai, escolaridade do pai e escolaridade do sujeito,
e,ntr.e „0Utras variáveis- Ê claro que estas variáveis não são tão “indivi-
duais” quanto memória e atitude. Elas não estão tão “dentro do indi
víduo , dentro da cabeça”. Naturalmente, status ocupacional e escolari
dade são abstrações. Mas são menos abstratas do que memória e atitude,
no sentido de que é mais fácil encontrar os referentes, as coisas mais ou
menos específicas e operacionais, que “significam” escolaridade e status
ocupacional. Um índice de rápida determinação de status ocupacional é,
por exemplo, renda. índices operacionais de memória e atitude, entre
tanto, são mais difíceis de encontrar. Estas variáveis estão mergulhadas
no cérebro do indivíduo, por assim dizer. O sociólogo é menos inclinado
a falar como se estivesse lidando com um único indivíduo e seu status
ocupacional. O psicólogo, pela própria natureza de suas variáveis, pode
entrar mais facilmente no nível individual, usar mais facilmente as
unidades de discurso individual. Há, então, menos perigo para o sociólogo
falar em nível individual, porque suas variáveis são “menos individuais”,
menos amarradas às pessoas — embora o sabor de “conversa individual”
esteja presente às vezes mesmo em discussões sociológicas.
Vamos levar a discussão um pouco mais adiante. Quando o psicólogo
discute problemas, freqüentemente ele fala das características de- indi
víduos isolados. Por exemplo, na conclusão de um relatório de uma
estimulante pesquisa sobre a influência de traços característicos como
prototipos na memória (Cantor & Mischel, 1977, p. 47) aparece a seguin
te sentença: “Armazenar material em termos de sua relação com um
esquema conceituai consistente tem a probabilidade de dar a alguém
(o grifo é meu) uma estrutura de memória mais estável, menos redun-
7a" 4-6 - ' Aq(^ esta outra Passagem de um excelente estudo (Markus,
1977, p. 63): Esquemas do eu (Self-schemata) são generalizações cogni
tivas a respeito da própria pessoa, derivadas de experiência anterior, que
organizam e guiam o processamento da informação relacionada a si
mesmo contida na experiência social de um indivíduo (o grifo é meu)”.
Nestes estudos os autores só podiam trabalhar com grupos de indivíduos
312
e estabelecer as relações que estavam estudando usando grupos de indi
víduos. Entretanto, ambos os autores vão da unidade de discurso do
grupo para a unidade de discurso do indivíduo. Eles têm que fazer isto
mais ou menos porque suas teorias “explicam” o que há, presumivel
mente, dentro da cabeça do indivíduo. No segundo estudo, uma vez que
as relações enunciadas nas hipóteses foram confirmadas pela evidência
empírica grupai, a autora supõe que necessariamente existam esquemas
do eu nos cérebros de seus sujeitos individuais. 8 O paradoxo é, então,
que os cientistas, principalmente os psicólogos, devem formular hipóteses
e testar relações no nível do conjunto ou do grupo, quando eles freqüente-
mente desejam de fato falar em nível de indivíduo — e podem fazê-lo.
Adendo
Neste capítulo, a discussão da natureza coletiva ou “grupai” da

ciência e da necessária falta de preocupação científica pelo indivíduo
pode, aos olhos de certas pessoas, não ser completamente exata. Em geral
o argumento é válido, mas certos meios de trabalhar podem parecer
exceções à regra de que a unidade de discurso científico é sempre o
grupo e não o indivíduo. Pode ser argumentado, por exemplo, que o
chamado estudo de casos de indivíduos isolados são instrumentos legíti
mos de investigação científica. Seguindo a posição tomada neste capítulo
e em outros pontos do livro, vemos que isto é possível, estritamente
falando, apenas se os estudos de caso forem usados para obter medidas
de variáveis.
Geralmente o estudo de caso não é usado para este objetivo. Mas
pode ser, naturalmente. Pode-se usar a chamada análise de conteúdo
(mencionada em capítulo anterior) para se obter medidas de variáveis.
Seu objetivo usual, entretanto, é diagnóstico ou clínico. Procura-se com
preender o indivíduo mais profundamente do que é usualmente possível
para alguma espécie de objetivo prático. Em outras palavras, procura-se
conhecer as características ou atributos do indivíduo. O psicólogo clínico,
por exemplo, estuda uma descrição detalhada do paciente à procura de
pistas ou sintomas de uma doença. O psicólogo cientista, por outro lado,
8 Não se pretende fazer críticas negativas aos dois relatos citados. Só estou ten
tando mostrar como é difícil em psicologia escapar do nível individual de discurso
e do indivíduo com seus motivos idiossincráticos, percepções, motivos, atitudes
e assim por diante. Para atingir meu objetivo, selecionei deliberadamente o que
na minha opinião são bons exemplos de pesquisa psicológica. Outros exemplos
em que a orientação individual é mais pronunciada poderíam facilmente ser
citados. Sem dúvida., é virtualmente imnossível escapar à conversa de nível
individual na redação de pesquisas psicológicas.
313
pode selecionar alguns de vários casos — as notas mais altas e mais
baixas em uma variável dependente, digamos — para ajudar a compre
ender as relações sob estudo. Esta não é a abordagem científica básica
dos dados, naturalmente.
Outra possível exceção à regra coletiva é mais difícil e controvertida.
É uma abordagem na qual o pesquisador — talvez o caso mais famoso
seja o de B. F. Skinner, o psicólogo behaviorista— estuda um fenômeno
com um animal ou uma pessoa. Digamos que o problema seja o efeito
do reforçamento (recompensa) na aprendizagem. O pesquisador pode
reforçar uma ou mais vezes uma certa resposta ou classe de respostas em
um único pombo, como fez Skinner. Ele descobre que a aprendizagem
melhora com o reforçamento. Aqui há uma relação: temos um conjunto
de pares ordenados consistindo em pontos no tempo, ou reforçamento
em pontos no tempo, havendo um conjunto dado e as respostas a este
conjunto no outro. Isto pode ser considerado uma verdadeira exceção
à regra coletiva?
O alvo da ciência nomotética é estabelecer leis, explicações siste
máticas ou relações que se apliquem em geral. O pesquisador, neste caso,
quer poder afirmar que o reforçamento produz certas respostas e, a partir
disto, quer afirmar que o reforçamento produz aprendizagem. Se todo
indivíduo — rato, pombo, pessoa — fosse igual a todos os outros indi
víduos, estudando então um indivíduo isolado poderiamos produzir resul
tados generalizados aplicáveis a todos os indivíduos de uma certa espécie.
Como sempre, o problema são as grandes diferenças entre os indivíduos.
Mesmo isópodes, pequenos crustáceos marinhos, apresentam diferenças
individuais! (Morrow & Smithson, 1969.) Portanto, é necessário ter muito
cuidado com as conclusões obtidas pela pesquisa que usa um indivíduo
apenas. Os princípios de amostragem e generalização a partir de amostras
se aplicam a todas as situações, embora as exigências possam ser bem
menores em pesquisa com animais e no laboratório. O exemplo acima,
então, não é realmente uma exceção para o requisito coletivo.
Stephenson (1953), cujas idéias já foram mencionadas anterior
mente, afirma enfaticamente que uma teoria psicológica pode ser testada
com um único indivíduo, usando o que ele denominou metodologia Q.
Pede-se a um sujeito único que classifique um maço de cartas ou itens
de acordo com algum critério, digamos graus de aprovação ou graus de
importância na área que as cartas representarem. As cartas são colocadas
nas pilhas designadas com números variáveis de cartas em cada pilha.
As seis ou mais pilhas representam uma ordem de postos e atribuem-se
valores às cartas nas pilhas, valores diferentes para cada pilha e o mesmo
valor dentro de cada pilha.
O método é muitíssimo eficiente. Pode-se conseguir uma espécie de
"estatística do indivíduo.” Isto é feito construindo categorias dentro de
314
um Q-sort e seus itens. Por exemplo, ao se medir atitudes sociais, pode-se
ter metade dos itens conservadores e metade liberais. Então, depois que
uma pessoa escolheu as cartas de acordo com suas crenças e números
apropriados que foram atribuídos às cartas de cada pilha, é feito um teste
estatístico apropriado da significância da diferença entre a média dos
itens conservadores e a média dos itens liberais. Obviamente pode-se
construir duas e até três categorias dentro dos itens. A categoria “ abstrato-
específico” pode ser usada, por exemplo. Então, pode-se aplicar ao
arranjo feito por um indivíduo a análise de variancia fatorial, como
ficou descrita em capítulo anterior (e cujos detalhes não são pertinen
tes aqui).
O método é realmente um meio sofisticado de ordenar em postos
um conjunto de itens. É difícil e tedioso ordenar 60 ou 80 itens. Colocar
cartões em pilhas é muito mais fácil e ainda eficiente. Além da análise
estatística dos valores Q de um indivíduo, pode-se correlacionar os
valores de um indivíduo com os de outro. Na verdade, as correlações
entre os arranjos Q de diversos indivíduos podem ser intercorrelaciona-
das e analisadas fatorialmente, freqüentemente com resultados provei
tosíssimos.
Stephenson afirma que uma teoria incorporada aos itens Q pode
ser testada usando o arranjo Q de um indivíduo cujas características
sejam conhecidas. Um conservador que tivesse classificado o Q-sort de
atitudes sociais descrito acima deveria ter uma média maior nos itens
conservadores do que nos itens liberais. Embora esta descrição seja por
demais simplificada, é suficiente para o que nos interessa no momento.
A idéia é importante e interessante. (Estranho não ter sido mais
usada do que foi.) Infelizmente, está sujeita a mesma avaliação feita
para o exemplo anterior do estudo do reforçamento com um animal.
Em resumo, não se pode estabelecer as relações de uma teoria com dados
de um único indivíduo. Exige-se generalidade maior do que podem
fornecer os dados de um indivíduo apenas. Sem dúvida, uma das fraque
zas da metodologia Q é que a natureza do método — exigindo aplicação
quase personalizada dos arranjos Q, investindo-se muito tempo com
um indivíduo apenas, por exemplo — virtualmente impede o uso de
grandes grupos de sujeitos.
Acredito que a distinção nomotético-ideográfico, e a colocação feita
peste capítulo, de que a ciência não está nem pode se preocupar com
indivíduos, seja geralmente válida. Entretanto, quero deixar um pouco
aberta a porta do entendimento do leitor. É possível que exceções legíti
mas — em psicologia fisiológica, por exemplo — possam ser desenvolvi
das no futuro. Embora eu próprio não possa imaginar como a ciência
possa ser outra coisa que não nomotética, pode ser que no futuro seja
possível à ciência trabalhar com o indivíduo isolado. Em todo caso,
pode-se compreender consideravelmente melhor a ciência comportamen
tal moderna, conhecendo-se a distinção nomotetico-ideográfico e o para
doxo indivíduo-grupo do psicólogo.9
eií r x?terf S??n,?, em se aProfundar n0 assunto pode consultar a penetrante

e ,ss-l- NaSel podería até achar parte da discussãc
deste capitulo questionável. Ele diz, por exemplo, que seria um erro dizer que
»C1f d°- !ingulares na° desempenham qualquer papel na ciência. Ele salienta
p fra'S P0df.m Ser sustentados apenas^ oelo uso de enunciados singu-
^ S £luer dizer, creio eu, que a evidência empírica precisa estar
ligada a instâncias especificas. Entretanto ele diz também que de um modo geral
os enunciados nas ciências naturais e sociais "contêm poucas, se algumas, refe-
a m .? p S 8 o b je to ! “ p e c i f i c o s . . e n q u a n t o q u e e n u n c ia d o s em h is tó ria “ são
q u ase sem ex ceção sin g u lares n a f o r m a . . . ” (p. 548).
nnftp^r filósofo com que trabalho (J. van Heerden) indicou que dizer que
P° ^ ' . ,^ zer. qu® 0 lnd_ividuo desempenha um papel na ciência como membro
enunciados singulares nao sao usados em ciência é forte demais. Além disso,
r írlíX f c asse’ Por,.°“jro la.do’ ? clência não lida e não pode lidar com singula
ridades e com o mdividuo singular. 6
316
16. C o n c e p ç õ e s e r r ô n e a s e c o n t r o v é r s ia s :
p e s q u is a e p r á t ic a 1
Como a pesquisa influencia a prática? Para que serve a pesquisa?

Por que os cientistas fazem pesquisa? A finalidade da pesquisa é melho
rar o destino da humanidade? O alvo da ciência é ajudar homens e
mulheres a viverem melhor? Ou o alvo da ciência é simplesmente enten
der fenômenos naturais? Estas perguntas difíceis e outras no mesmo tom
necessitam respostas razoáveis se desejarmos completar nossa compre
ensão da pesquisa científica.
Os problemas e argumentos deste capítulo não são fáceis de com
preender. Não há grande dificuldade conceituai como houve em capítulos
mais técnicos deste livro. A dificuldade é o tipo de incompreensão e
resistência psicológica que surgem quando crenças aceitas e tradicionais
são desafiadas, como o devem ser agora. Quando dizemos, como vamos
dizer, que o objetivo da ciência não é aumentar o bem-estar da humani
dade, podemos acender uma chama de incredulidade a até ressentimento
nas mentes de alguns leitores. Para que serve a ciência se não melhora
as condições humanas e sociais? A pesquisa nãd deveria apresentar divi-
• dendos práticos para o investimento feito? Pode-se colocar uma atividade
importante como a pesquisa científica em categoria separada da maioria
das outras atividades humanas?
Para responder a estas questões, vamos estabelecer a questão central
do capítulo: Qual é a relação entre pesquisa e prática? A pesquisa
científica fica traduzida na prática? Deve-se pedir que os cientistas mos
trem como sua pesquisa beneficiará de certa forma as pessoas e a socie
dade antes de serem destinadas verbas para a pesquisa? Ao tentar
tesponder estas perguntas voltaremos, como no capítulo 15, aos temas
introduzidos no capítulo 1. Em outras palavras, começamos e terminamos
este livro com estes importantes problemas. Vamos repetir rapidamente
o propósito da ciência e da pesquisa científica, definir e discutir pesquisa
básica e aplicada, esboçar um importante erro de concepção do objetivo
1 Parte do conteúdo e argumentação deste capítulo foi tomada de empréstimo,

ou pelo menos influenciada por uma comunicação apresentada no encontro anual
da American Educational Research Association, em Nova Iorque, no dia 6 de abril
de 1977 (Kerlinger, 1977).
da pesquisa, as vantagens e, finalmente, discutir as complexas relações
entre a pesquisa e a prática. v
O objetivo da pesquisa científica revisitado
O propósito básico da pesquisa científica é a teoria. Já dissemos

isto antes e devemos repetir aqui por causa de sua importância. A prin
cipio, a afirmativa parece enigmática e intrigante principalmente porque
estamos tao acostumados a pensar que a pesquisa precisa ter objetivos
práticos. Uma vez entendido seu significado, entretanto, o enigma desa
parece. Significa simplesmente que o objetivo da pesquisa científica é
compreender e explicar fenômenos naturais. Como diz Braithwaite (1953
p. 2): O conceito fundamental para a ciência é o da lei científica, e o
alvo fundamental da ciência é o estabelecimento de tais leis”. Uma teoria
apresenta uma visão sistemática de fenômenos especificando relações
entre variaveis^ com o propósito de explicar e predizer os fenômenos.
Os cientistas em a teoria em alta conta — e com razão. Isto vem do
proposito básico da ciência e a teoria é o veículo para expressar este
proposito. A ciência, então, não tem outro propósito a não ser a teoria
ou a compreensão e explicação. ’
Muita gente pensa que a finalidade da pesquisa científica é resolver
problemas humanos e técnicos e aperfeiçoar a prática. Considera-se, por
exemplo, que a meta da pesquisa em biologia e química, é produzir, em
ultima analise, uma agricultura mais perfeita, um atendimento médico
superior ou outros resultados benéficos à sociedade. Considera-se, igual
mente, que a pesquisa sociológica e psicológica deveria se concentrar em
resolver entre outras coisas, problemas de preconceito e discriminação
reparando deficiências de aprendizagem, melhorando a aprendizagem ê
ensino, criando testes úteis para a educação e a indústria, e ajudando
as pessoas a serem psicologicamente equilibradas e construtivas.
É bem verdade que muito da pesquisa é mais ou menos dirigida
para tais objetivos. Discutiremos isto depois. Em geral, entretanto, tais
metas valiosas e praticas não são o propósito da pesquisa científica.
O proposito e a_ teoria e nenhum outro. Já que discutimos este ponto
no capitulo 1, nao vamos continuar agora. Sua aceitacão, entretanto é
a base da argumentação deste capítulo. Damos, então, dois exemplos
de pesquisa científica psicológica, um verdadeiro e um inventado, para
ilustrar o que queremos dizer. ^
Dois exemplos de pesquisa científica psicológica
Já apresentamos a essência do importante estudo de CattelI (1963)

sobre a natureza da inteligência humana. Lembre-se de que ele afirma quê
318
há dois tipos amplos de inteligência, chamadas inteligência cristalizada e
inteligência fluida. A inteligência cristalizada é aquela tipo usual testado
pela maioria dos testes de inteligência. Por exemplo, capacidade verbal é
parte importante da inteligência mensurada e faz parte da inteligência
cristalizada. Muitos psicólogos acreditam, com bastante justificação, que
há uma inteligência geral, ou “g”, que permeia testes de inteligência;
é uma capacidade geral que é a fonte por excelência da inteligência
humana. Cattell diria que “g” é inteligência cristalizada. Diz ele, além
disso, que há outra importante forma geral de inteligência muito diferente
da inteligência cristalizada, embora obviamente ligada a esta. A isto ele
dá o nome de inteligência fluida.
Inteligência fluida é uma espécie de segundo “g”. Mostra-se no
desempenho humano caracterizado pela adaptação a novas situações.
Ê a aplicação “fluida” da capacidade geral, por assim dizer. Tal capa
cidade é mais característica do comportamento criativo do que a inte
ligência cristalizada. Em resumo, Cattell diz que há duas formas de
inteligência geral e não uma apenas. No estudo citado acima ele testou
sua hipótese aplicando testes que, segundo ele, mediam a inteligência
cristalizada — testes verbais, numéricos, de raciocínio, por exemplo —
e testes que, segundo ele, mediam a inteligência fluida — testes per-
ceptuais menos comuns, que presumivelmente exigem maior abertura de
pensamento, maior flexibilidade e assim por diante.
Cattell aplicou testes de ambas as espécies, junto com medidas de
personalidade, a crianças de oitava série, e analisou fatorialmente os
resultados. Estes resultados apoiavam sua hipótejse: os dois tipos de testes
apareceram juntos em dois fatores diferentes. Algumas outras predições
ficaram também confirmadas.
Essa pesquisa é pesquisa científica. Procura explicar aspectos impor
tantes da inteligência humana especificando as definições e relações de
uma teoria. Não diz nada em relação a melhorar a inteligência;
“explica-a” apenas.
Um segundo exemplo: suponhamos que uma teoria de aprendizagem
foi considerada empiricamente válida e explica com bastante eficiência
a aprendizagem de conceitos. A pesquisa que testou a teoria foi pesquisa
científica porque explica algum aspecto ou aspectos da aprendizagem
humana. Pode ou não ter aplicações no ensino de conceitos a crianças.
Se tem ou não, nada tem a ver como sua condição como pesquisa
científica. Suponhamos ainda que um técnico de ensino crie um método
de ensinar conceitos baseado na teoria e pesquisa. Ele é um engenheiro,
um técnico. Embora baseado em pesquisa científica, o que ele faz não é
em si mesmo, pesquisa científica. Ele pode, naturalmente, testar a eficácia
de seu método usando técnicas criadas por cientistas. Sua pesquisa é
pesquisa aplicada que é, neste caso, inspirada pela pesquisa original.
O ensino real usando o método é parcialmente engenharia, parcialmente
arte. Não é ciência.
Ciência e engenharia
Grande parte dos mal -entendidos na cabeça das pessoas com relação
à pesquisa e seu suposto propósito melhorativo surgiu provavelmente do
fato de se confundir ciência com engenharia e tecnologia. Vamos aqui
nos afastar um pouco do assunto para explicar a diferença.
A engenharia é um conjunto de disciplinas aplicadas que dependem
principalmente da ciência, mas que em si próprias não são ciência. O tra
balho do engenheiro é descobrir soluções técnicas para problemas práti
cos. Ao fazer isto, ele usa a tecnologia, que da mesma forma, surge às
vezes da ciência, mas que em si não é ciência. A tecnologia abrange
métodos técnicos e materiais criados para atingir objetivos práticos.
O técnico em ensino mencionado acima criou um método de ensinar
conceitos. Os .técnicos de computadores criam máquinas e linguagem de
máquinas, como vimos no capítulo 14, para descobrir soluções para
problemas analíticos. O técnico de ensino e o técnico de computador
são elementos muitíssimo importantes dentro da comunidade intelectual.
Mas não são cientistas; basicamente são engenheiros, embora às vezes
seja difícil traçar uma linha clara entre a engenharia e a ciência. A pista
essencial para compreender a diferença é o objetivo básico de cada uma.
O objetivo da engenharia e tecnologia é resolver problemas práticos
relativamente específicos. O objetivo da ciência é compreender fenôme
nos naturais. O certo e apropriado é esperar e pedir soluções de proble
mas práticos aos engenheiros. Não é certo nem apropriado esperar e
pedir soluções de problemas práticos aos cientistas, como veremos.
Pesquisa básica e aplicada
Outra vez a pergunta: Para que serve a ciência? Dissemos neste

livro que o objetivo da ciência é a teoria ou a explicação sistemática de
fenômenos naturais. imos aceitar este argumento como correto. Se
assim for, o trabalho dos cientistas deveria, então, estar centralizado no
estudo das relações entre fenômenos. Em ciências comportamentais isto
significaria pesquisa de fenômenos tais como aprendizagem, memória,
percepção, motivação, atribuição, ocupação, preferências religiosas, orga
nizações, personalidade, classe social, movimentos sociais, ideologia, atitu
des, valores e assim por diante. Tal pesquisa é chamada pesquisa básica.
A pesquisa basica vem tendo muitas definições, a maioria insatis
fatória de um ou outra forma. Tem sido até peremptoriamente afirmado
320
que não é possível uma definição adequada ou operacional da pesquisa
básica (Kidd, 1959). Entretanto, os cientistas, pensadores e escritores da
ciência sabem, às vezes vagamente, o que significa o termo, especialmente
em contraste com a pesquisa aplicada. Em todo caso, pesquisa básica é
pesquisa feita para testar teoria, estudar relações entre fenômenos com
o fim de entender os fenômenos, com pouca ou nenhuma preocupação
quanto à aplicação dos resultados da pesquisa a problemas práticos.
Apesar das prováveis impropriedades desta definição, ela é suficiente
para nos ajudar a falar sobre pesquisa básica. Diz o que vimos dizendo
desde o primeiro capítulo deste livro: que a pesquisa científica é a inves
tigação disciplinada das relações entre fenômenos naturais e acrescenta
que ela não foi criada para atingir metas práticas.
Pesquisa aplicada é pesquisa dirigida para a solução de problemas
práticos especificados em áreas delineadas e da qual se espera melhoria
ou progresso de algum processo ou atividade, ou o alcance de metas
práticas. As pesquisas denominadas programáticas e dirigidas são pes
quisa aplicada. Tais pesquisas são dirigidas para determinados objetivos
que prometem solução de problemas geralmente aflitivos. É o tipo citado
freqüentemente pelos jornais quando se discute pesquisa, porque é fácil
compreender as razões e a motivação de pesquisadores aplicados e suas
fontes de recursos financeiros. Como sempre os exemplos podem nos
ajudar a entender as diferenças importantes entre pesquisa básica e
aplicada.
O estudo de Aronson e Mills (1959), já citado, é um bom exemplo
de pesquisa básica em psicologia. Os pesquisadores estavam interessados
nas influência da privação e dificuldade de entrada em grupos, no valor
que os membros do grupo colocavam na participação no grupo. Eles
procuravam também lançar mais luz sobre a teoria sócio-psicológica para
ajudar a explicar certos fenômenos ligados à participação em grupos.
Os estudos sobre obediência à autoridade de Milgram (1974), também
citados anteriormente, são igualmente bons exemplos de pesquisa básica.
Lembre-se que foi pedido aos sujeitos que aplicassem choques suposta
mente dolorosos a outra pessoa num suposto experimento sobre aprendi
zagem. A questão era: Até onde irão os sujeitos experimentais? Até onde
inflingiriam dor a outra pessoa sob o comando de um “investigador
científico”? A relação estudada foi entre as variáveis autoridade e obe
diência.
Nenhuma dessas pesquisas parece ter, sido feita com o pesquisador
pensando em conseqüências práticas. Eles estavam à procura de explica
ções explícitas ou implícitas para fenômenos naturais: o valor presumi
velmente mais alto colocado na participação em um grupo quando a
pessoa experimentou privação ou dificuldade em fazer parte do grupo
e obediência à autoridade.
321
Memória e planarias
Para entender melhor a pesquisa básica, vamos examinar um estudo

sobre memória pouquíssimo comum e, para muita gente, totalmente não-
prático, feito muitos anos atrás usando planárias como sujeitos. (Na ver
dade, escolhi este estudo porque parece estar longe de ter aplicação
prática — e também por sua importância no estudo e compreensão da
memória.)
A memória sempré chamou a atenção dos psicólogos, não apenas
por ser uma função muitíssimo interessante, complexa e esquiva do
cérebro, mas também por ser uma chave para a compreensão de outros
processos e funções psicológicas. Sem entrarmos muito em teorias de
aprendizagem, memória e funções cerebrais2, podemos dizer que a
atenção científica dirigiu-se para a descoberta da localização, no cérebro,
da fala, audição, aprendizagem e habilidade verbais, aprendizagem musi
cal e assim por diante. Descobriu-se que se uma parte do cérebro for
prejudicada, em alguns casos uma outra parte do cérebro passa a exercer
á função ou funções da parte prejudicada. Já que é muito difícil ou
impossível fazer experimentos controlados no cérebro humano, usam-se
freqüentemente animais e cérebros de animais. Embora a diferença entre
os cérebros humano e animal seja grande, às vezes é possível testar
hipóteses e explorar funções cerebrais, bem como relações entre estas
funções, com animais. Apesar da diferença ser grande, a semelhança
pode ser suficiente para justificar o estudo das relações entre as funções.
McConnell, Jacobson e Kimble (1959) num clássico estudo sobre
aprendizagem em lesmas, ou planárias, exploraram a regeneração caracte
rística destes pequenos animais para demonstrar que a aprendizagem,
tanto quanto características físicas, é regenerada. Se uma planária for
cortada em-dois, um “novo” animal renasce. Isto é, ambas as partes do
animal “cortado” serão organismos completos! Os pesquisadores “ensi
naram” primeiro um grupo experimental de cinco planárias a reagirem
fisicamente à luz juntando o aparecimento da luz com um choque elétrico.
O choque faz o animal se contrair longitudinalmente. A aprendizagem
completava-se quando o corpo das planárias se contraía apenas com a
2 Podem ser encontrados relatos claros e muito bem escritos destes fenômenos,
assim como outros fenômenos psicológicos, em: Hilgard, Atkinson e Atkinson
(1975) Introduction to Psychology, O próprio início do livro (p. 4) é um bom
exemplo de parte do principal argumento deste capítulo. Os autores dão dez
problemas de pesquisa psicológica como exemplos do trabalho dos psicólogos.
Dos dez, oito são problemas de pesquisa aplicada, um é problema de pesquisa
básica e um é problema metodológico. Entretanto grande parte, ou talvez a
maior parte do texto do livro, está preocupada com pesquisa básica.
322
luz, sem necessidade do choque. Um grupo de controle de cinco animais
não recebeu este treinamento.
Depois do treinamento, os experimentadores cortaram os animais de
ambos os grupos, experimental e de controle, em dois. Será que as
seções da cauda dos animais do grupo experimental, que originalmente
tinha tido cérebro — naturalmente as seções da cabeça tinham os cére
bros originais, e portanto acreditava-se terem “ aprendido” a resposta
condicionada à luz — mostrariam evidências de terem “aprendido” a
resposta à luz? Depois de aproximadamente quatro semanas, tempo
suficiente para a regeneração, os animais do grupo experimental e do
grupo de controle foram testados. Foram testadas tanto a seção da
cabeça quanto a da cauda. A situação está representada na figura 16.1.
A figura é auto-explanatória.
A seção da cauda dos animais regenerados do grupo experimental
exibiram a resposta condicionada à luz? Já que a seção da cabeça do
grupo experimental continuava com o cérebro original que aprendera
a resposta, supôs-se que reteria.a aprendizagem. Como os animais do
grupo de controle não tiveram treinamento, esperava-se que ambas as
seções, cabeça e cauda, depois da regeneração, não apresentariam nenhu
ma aprendizagem. A medida da variável dependente foi o número de
tentativas necessárias para alcançar um critério de 23 respostas condicio
nadas em 25 tentativas consecutivas.
Os resultados mostraram que as caudas dos sujeitos, do grup< expe
rimental, possuíam a aprendizagem, da mesma_ forma que as cabeças!
O número médio de tentativas do treinamento original foi de 134.
A média das seções de cabeça, depois do corte e regeneração, foi 41),
Corte Cérebro
Seção da Seção da
cauda . cabeça
Figura 16.1
e a média das seções de cauda foi de 43,2. As diferenças entre a média
do treinamento original e ambas as médias de reteste, após a regeneração,
foram estatisticamente significantes. A média das seções de cabeça dos
animais do grupo de controle foi de 248,6, e a média das seções de cauda
foi de 207,8. Estas médias não diferiam significantemente entre si.
Mas as seções de cauda e cabeça diferiam significantemente das médias
do grupo experimental após a regeneração.
Estes resultados são notáveis. Não há dúvida de que o experimento
e sua concepção têm uma espécie de estranha beleza. Teria a aprendi
zagem, de alguma forma, chegado às caudas regeneradas do grupo experi
mental de planarias? Nossa preocupação, entretanto, não é com os resul
tados e a fascinação da pesquisa, mas com pesquisa básica. Ê claro que
os pesquisadores provavelmente estivessem interessados ria aprendizagem
humana, mas parece claro que eles pouco ou nada estavam ligando para
sua aplicação prática. Todavia, se resultados tão impressionantes são
confirmados em pesquisas posteriores, a teoria e pesquisa da memória,
tanto.com animais quanto com seres humanos, poderíam ser fortemente
afetadas. A questão seguinte, naturalmente, é por que e como as seções
de cauda regeneradas do grupo experimental haviam “aprendido” .
Não é difícil encontrar-se exemplos de pesquisa aplicada. O estudo
de Clark e Walberg, tantas vezes citado neste livro, é um estudo aplicado,
embora sem dúvida tenha aspectos de pesquisa básica. Foi dirigido para
a obtenção de uma resposta parcial a uma questão bastante difícil:
Qual a melhor maneira de ensinar grupos minoritários de crianças caren
tes (underachieving) a ler? Grande parte da pesquisa em educação é por
natureza aplicada: seu objetivo é ajudar a melhorar a prática educacio
nal. Por exemplo, a maioria dos estudos de métodos de ensino, instrução
programada, crianças excepcionais, etc., são pesquisa aplicada. Por estar
focalizada em problemas práticos específicos e por sua falta de foco na
compreensão básica de fenômenos, o campo da pesquisa aplicada é mais
estreito e seu impacto potencial mais limitado. Os estudos aplicados em
educação não são feitos tanto para aumentar os conhecimentos, alargar
e aprofundar a compreensão dos processos de educação, quanto o são
para ajudar as crianças a aprenderem melhor. Em outras palavras, são
essencialmente pragmáticos: procuram descobrir o que funciona ou deter
minar as relações, não pelas relações e pela possível teoria, mas para o
planejamento e decisões da ação educacional.
Dois importantes estudos em pesquisa aplicada
Um dos mais importantes estudos em pesquisa aplicada do século,

já citado neste livro, é a investigação em larga escala da desigualdade e
324
igualdade na educação norte-americana, feita por ordem do Congresso,
Equality of Educational Opportunity (Coleman e outros, 1966). Sua
grande influência mostra claramente que não faltam significância e
importância à pesquisa aplicada. Na procura de respostas para as
questões sobre a igualdade feitas pelo Congresso, Coleman e seus colegas
estudaram os efeitos de um grande número de variáveis na realização
escolar. Os resultados do estudo, assim como sua metodologia, ainda têm
muito impacto hoje. Foram feitos estudos semelhantes em outros países
sob o título geral de International Studies of Educational Achievement
(por exemplo, Husén, 1967; Thorndike, 1973), e sua importância e
influência são também grandes.
Outro estudo em pesquisa aplicada de grande importância prática
para o bem-estar dos Estados Unidos é um conjunto de levantamentos
feitos pelo Survey Research Center da Universidade de Michigan, para
determinar as atitudes dos brancos em relação aos pretos (Campbell,
1971). Na verdade foram estudadas também as atitudes dos pretos em
relação aos brancos, no conjunto completo de estudos, mas o livro de
Campbell limitou-se às atitudes de'brancos em relação a negros. Levanta
mentos geralmente são pesquisa aplicada: são feitos para objetivos práti
cos específicos, comumente para obter informação na qual basear decisões
ou ações. O estudo sob consideração não é exceção. Parte dele foi autori
zado pelo Comissão Consultora Nacional sobre Desordens Civis (veja
Report of the National Advisory Commission on Civil Disorders, 1968)
para obter informações sobre distúrbios raciais e assuntos relacionados.
Presumivelmente a informação obtida ajudaria a. Comissão e outras orga
nizações a melhor lidarem com os problemas raciais. Em todo o conjunto
de estudos, cerca de 9.000 americanos foram incluídos nas amostras e
entrevistados em 1964, 1968 e 1970.
As descobertas desses estudos são surpreendentes e importantes.
Mas Campbell nos avisa logo no início do livro (p. 1) que não há maneira
simples de descrever as atitudes dos brancos em relação aos pretos.
Contudo, ele chega a três ou quatro conclusões importantes. Uma,
embora não haja dúvidas de que o branco americano tenha atitudes
francamente racistas, a população branca das cidades não é universal
mente racista. Além disso, tem havido um movimento maciço em direção
a atitudes raciais mais favoráveis. Apesar de longe de serem igualitários,
os brancos americanos são muito mais igualitários do que já o foram.
E apenas uma pequena porção da população expressou atitudes aberta
mente hostis em relação aos pretos.
Duas, a resistência à mudança nas relações raciais é muito difun
dida, embora de forma alguma, universal. Algumas formas de mudança,
por exemplo a aceitação de pretos em situações de trabalho, são aceitas.
Outros tipos de mudanças mais de ordem privada sofrem maior resis
tência. Três, a idéia de superioridade racial não caracteriza as atitudes
dos brancos. Este signo convencional de doutrina racial parece ter
mudado para melhor.
Quatro, os americanos que freqüentaram universidades depois da
Segunda Guerra Mundial são claramente mais positivos em suas atitudes
em relação aos pretos dos que os que não freqüentaram universidades
ou que as freqüentaram antes da guerra. Esta foi a relação mais forte
encontrada no estudo. Em outras palavras, houve uma importante
mudança no clima intelectual do campus nos Estados Unidos: os pretos
são aceitos pelos diplomados brancos mais jovens. Talvez o ensino supe
rior recente tenha tido um impacto importante e benéfico. Há várias
outras descobertas, claro, mas estas são as principais. Aceitando-as como
indicadores válidos da atitude dos brancos norte-americanos em relação
aos pretos — e os resultados de pesquisas de organizações de grande
categoria como o Survey Research Center são geralmente aceitos pelos
cientistas por causa da excelente qualidade conceituai e técnica de seu
trabalho —, podemos ter uma boa idéia de como a pesquisa aplicada
pode ser importante.
Pode restar pouca dúvida, então, de que a pesquisa aplicada tenha
freqüentemente grande importância prática, social e humana. Seria difícil
superestimar a importância dos dois estudos ora sumariados. Tais estudos,
assim como outros semelhantes, levam, entretanto, muito gente a acreditar
que a pesquisa aplicada é mais importante e significante do que a pes
quisa básica. A importância e significância da pesquisa básica são fáceis
de serem negligenciadas porque geralmente a pesquisa básica não se
dirige a questões de importância e urgência humanas. É muito mais
fácil entender, por exemplo, a relevância social dos dois estudos acima
do que entender a importância dos estudos de teoria das atribuições ou
estudos da memória humana.
A pesquisa aplicada é indispensável e quase sempre muito signifi
cativa de duas ou três formas. Primeira, pode, como aliás é sua finali
dade, fornecer informações que levarão à solução de problemas. Segunda,
pode sugerir, às vezes, linhas novas ou diferentes de pesquisa básica.
Pode ser descoberta, por exemplo, uma relação inesperada entre duas
variáveis em um levantamento de opiniões. Esta relação pode sugerir a
alteração de uma teoria que estiver sendo testada na pesquisa básica.
As necessidades da pesquisa aplicada podem estimular também a pesquisa
básica metodológica. A necessidade de formas mais apropriadas de
análise para estudo de fenômenos como realização escolar, status ocupa-
cional, sucesso na vida adulta e variáveis semelhantes ajudaram, aparen
temente, a reforçar o desenvolvimento da análise multivariada, especial
mente análise de regressão múltipla e análise de trajetória. Terceira, e
talvez mais importante, a pesquisa aplicada tem, às vezes, uma qualidade
326
heurística. Pode levar ao desenvolvimento da teoria e da pesquisa básica.
É freqüentemente rica em hipóteses potenciais que exigem testagem e
fundamentação teórica.
Vantagens
Os povos das modernas nações industriais são fortemente pragmáti

cos. Admiram e gostam do que funciona, principalmente do que funciona
rápida e eficientemente. Esta atitude, provavelmente mais forte nos
Estados Unidos, é sadia no sentido de que as coisas sejam feitas. Se há
algum problema a ser resolvido, que se peça conselho aos técnicos,
explore soluções anteriores para problemas semelhantes, mas acima de
tudo, que se faça alguma coisa. Se alguma coisa funciona, ótimo. Se não,
que se tente outra coisa. Mas é preciso descobrir algo que funcione.
Há uma espécie de estilo impetuoso em muitas soluções norte-ameri
canas para problemas, mas, sem dúvida, tenta-se soluções, o que provavel
mente é muito melhor do que ignorá-los, analisá-los à exaustão ou esperar
que eles desapareçam. Infelizmente, uma perspectiva e uma atitude forte
mente pragmática tanto são amigas quanto inimigas da ciência. Ê amiga
enquanto pessoas, principalmente pessoas poderosas, entendem a ciência
como útil na solução de problemas. Se, por outro lado, considerarem a
ciência ineficaz na solução de problemas ou distanciada de preocupações
práticas, daí a atitude pragmática tornar-se uma inimiga da ciência e da
pesquisa básica. Parece que é isto que está acoütecendo hoje nos países
do ocidente.
Mantendo esta atitude pragmática, muito gente acredita que a pes
quisa pode e deveria resolver problemas práticos e melhorar as condições
sociais e humanas. Esta suposição é falsa. A pesquisa não conduz direta
mente à melhoria da prática ou das condições sociais e humanas. A solu
ção de um problema de pesquisa está em um nível diferente de discurso
do que a solução de um problema de ação. O resultado de uma pesquisa
geralmente é o estabelecimento de uma relação de alguma espécie entre
dois ou mais fenômenos. Isto é também verdadeiro para os problemas
de pesquisa aplicada. Vamos tomar um resultado aplicado relativamente
simples como o do experimento de Clark e Walberg. Lembre-se de que o
reforçamento maciço teve um efeito bastante substancial na realização
em leitura de crianças negras que se achavam bem atrasadas em leitura.
Estes resultados podem ser aplicados diretamente na prática educa
cional? Superficialmente parecería que sim. Se uma pesquisa mostra
que o reforçamento maciço ajuda crianças atrasadas a lerem melhor,
então que se estimule os professores a usarem reforçamento maciço para
327
ensinar essas crianças. Infelizmente as coisas não são tão simples assim.
O reforçamento maciço funciona com crianças de outras idades? Que
diferença faz o reforçamento maciço quando usado por tipos diferentes
de professores? Mais sutil ainda, é possível que o uso prolongado do.
reforçamento maciço tenha efeito deletério sobre algumas ou mesmo todas
as crianças? Poderia ter, por exemplo, o efeito de sufocar a iniciativa
e a motivação interna das crianças?
Então, mesmo os resultados aparentemente mais óbvios e simples
de uma pesquisa que é mais aplicada que básica acabam tendo impli
cações incertas para a prática. Se tomarmos o resultado de muitos
trabalhos de pesquisa básica que parecem ter implicações para a prática
educacional, descobrimos um hiato maior ainda. Na maioria de tais
estudos, a lacuna entre tais descobertas e a prática é larga e profunda.
Estudar relações e entrar em ação estão em dois níveis diferentes
de discurso que não se podem unir facilmente.3 A pesquisa científica
jamais teve como propósito resolver problemas humanos e sociais, tomar
decisões e entrar em ação. O pesquisador está e deve estar preocupado
com variáveis e suas relações. Jamais deve se exigir dele que pense ou
explique ou fale das implicações do que ele está fazendo ou fez. Exigir
isto é exigir um salto de um nível relacionai abstrato de discurso para
outro nível muito mais concreto e específico. Isto não pode ser feito
diretamente; não é possível fazer uma pesquisa e então ter os profissio
nais usando imediatamente seus resultados.
A expectativa de que a pesquisa deveria levar rapidamente à
mudança na prática vem em boa parte, como já mencionamos, da orienta
ção prática e pragmática das pessoas. Elas imaginam que o objetivo da
ciência seja o progresso humano, ambiental e técnico. A pesquisa, sob
este aspecto tem que ter vantagens; deve haver um retomo no investi
mento feito em pesquisa. São exigidas, da ciência e dos cientistas, respos
tas práticas e solução de problemas.
3 É importante saber o que se quer dizer com “nível de discurso”. Sempre que
falamos sobre algo, falamos em um contexto ou quadro de referência. Vamos
denominar este quadro de referência U, significando “ universo” . Um particular
U é um nível de discurso e deve incluir todos os objetos em discussão. Se saltar
mos de um nível de discurso para outro, digamos de Ui para U2, o novo nível
não conterá todos os objetos. Pode, aliás, não conter nenhum deles. Quando se
discute segregação e suas implicações, não devemos saltar para problemas religiosos
— “ Ê desejo de Deus que haja raças; e as foram feitas, obviamente, para estarem
separadas” . Estes são dois níveis ou universos de discurso: segregação e religião.
Mudar de níveis de discurso, sem uma transição conveniente, é uma maneira
consciente e inconsciente de distorcer a comunicação. No problema discutido
acima, o nível de discurso dos problemas de ação é inteiramente diferente do nível
de discurso da pesquisa científica. Veja Kerlinger (1973, pp. 57-58) para mais
discussão.
328
Uma atitude fortemente pragmática, então, virtualmente dirige o
foco para resultados e realização de coisas. O que é bom é o que fun
ciona! Por que funciona é menos importante; o mais importante é que
funcione. Isto, em ciência, é uma atitude derrotista, porque como
Thomson (1960) observou: “A melhor maneira de fazer progressos na
tecnologia. .. vem a ser a compreensão do princípio” (p. 997). Ele
observou também que esta idéia é uma descoberta recente e só recente
mente tornou-se verdadeira.
Os profissionais têm geralmente pouca paciência com o que julgam
como pesquisa “não-prática”, “torre de marfim”. Eles querem que a
pesquisa seja colocada em trabalho prático. Uma das manifestações infeli
zes desta orientação geral para a pesquisa é o desejo urgente e a exigência
que a pesquisa dê lucros, que traga vantagens rápidas. Falar sobre
pesquisa com finalidade de compreensão, parece para a grande .maioria,
tolo e até patético. Tem que haver uma vantagem! É uma expectativa
fútil. A pesquisa científica não tem vantagens de maneira simples porque
não está nem pode ser dirigida para problemas práticos (Brain, 1965;
Brooks, 1971; Dubos, 1961; Townes, 1968; Waterman, 1966).
E a pesquisa aplicada? O mesmo argumento se lhe aplica? Afinal,
por definição a pesquisa aplicada é dirigida para a aplicação. Não deve
mos então exigir vantagens da pesquisa aplicada? A resposta parece ser
um Sim com muitas ressalvas. Pode-se esperar vantagens, mas é ilusório
, exigí-las. Já foi dado um exemplo aqui. A aplicação direta das desco
bertas do estudo de reforçamento maciço de Clark e Walberg, obtidos
de pesquisa aplicada de grande qualidade, foi Considerada questionável.
Uma possível vantagem proporcionada por este estudo é a sugestão de
que reforçamento maciço podería ajudar certos tipos de crianças.
Como já dissemos, o amplo estudo Equality of Educational Opportu-
nity foi pesquisa aplicada. Que vantagens proporcionou? Por estranho
que pareça, suas descobertas pouco oferecem ao profissional. Elas docu
mentaram a desigualdade de recursos e realização. Mas não ofereceram
soluções. Mostraram também que uma porção consideravelmente maior
da variância de realização, foi devida presumivelmente ao ambiente fami
liar e às características que a criança traz para a escola, do que às dife
renças entre escolas (ou recursos da escola). O que significa isto para
a prática educacional? Não se preocupar gastando dinheiro com escolas?
Se apenas uma porção relativamente pequena da variância de realização
é devida a escolas, por que então fazer, tanto esforço para ter escolas
excelentes? Não há dúvida de que a extrapolação direta dos estudos
de pesquisa pode levar, às vezes, a conclusões absurdas! Curiosamente,
a única vantagem real do estudo Equality foi enfatizar que situações
educacionais e realização são complexas demais e exigem pesquisa muito
mais complexa do que a feita geralmente. Mostrou também maneiras de
estudar tais situações. Em resumo, mostrou uma grande necessidade de
compreender os fenômenos educacionais.
Naturalmente a pesquisa aplicada pode ser usada para resolver pro
blemas mas esta solução não leva ordinariamente à compreensão do
complexo fenômeno da pesquisa comportamental. Como no estudo
Equality, ela freqüentemente esclarece problemas de pesquisa, problemas
teóricos e metodológicos, mas é duvidoso que aplicações diretas sejam
possíveis para os fenômenos de interesse na pesquisa comportamental.
Seus resultados, entretanto, podem sugerir o que fazer. Mas, como
sempre, os profissionais têm que. fazer as coisas. Os resultados das
pesquisas fornecem apenas possível apoio às decisões.
Leitura é um bom exemplo. As respostas aos problemas de leitura
não estão em muitas pesquisas voltadas para dizer aos professores como
ensinarem a ler. Elas estão em pesquisas dirigidas à compreensão dos
vários aspectos da aprendizagem humana e do ensino ligado à leitura.
Tal compreensão é conseguida, se realmente o for, invocando teorias
psicológicas e outras ligadas à leitura e durante longo tempo fazendo
pesquisa dirigida à compreensão dos fenômenos ligados à leitura. A
pesquisa sobre leitura é em si quase que invariavelmente improdutiva.
Devemos estudar leitura no contexto de percepção, motivação, atitudes,
valores, inteligência e assim por diante. Em outras palavras, o alvo não
deveria ser o aperfeiçoamento da leitura! Deveria ser a compreensão
das relações entre os vários fenômenos complexos ligados à leitura. Para
melhorar coisa tão complexa quanto a leitura é necessário compreendê-la
e os vários fenômenos a ela ligados, tarefa sem dúvida muito difícil.
E, naturalmente, não há garantia de melhoramento na leitura das crian
ças, mesmo que sejam feitas pesquisas básicas dos fenômenos relaciona
dos com a leitura.
A exigência de que a pesquisa proporcione vantagens, é então uma
exigência impossível, pois é baseada em mal-entendidos do que é ou
não pesquisa científica. Sua persistência é testemunha de sua força.
Infelizmente sua influência pode ser bastante perturbadora para indi
víduos que procuram compreender a ciência e a pesquisa científica
porque inculca-lhes idéias erradas a respeito do objetivo e do que a
pesquisa pode realizar. 4
4 Outro aspecto que dificulta a compreensão da ciência e da pesquisa comporta

mental é que tal pesquisa deve ser relevante. Como o aspecto vantagem, este é
difícil de ser tratado por ser tão plausível. Parece tão óbvio que a pesquisa
comportamental deva ser dirigida para problemas significantes humanos e sociais.
O enfoque neste livro, entretanto, é o de que a relevância é um critério total
mente exterior à pesquisa — na verdade, é um critério essencialmente político
— e que a insistência em seu uso enfraquecerá seriamente a pesquisa nas ciências
330
Dada a importância da questão, poder-se-ia pensar que os pesquisa
dores já teriam estudado os efeitos relativos das pesquisas básica e
aplicada na prática. Mas parece que o problema não foi estudado empiri-
camente. Assim, de um ponto de vista empírico sabemos pouco a respeito
dos efeitos relativos de, digamos, pesquisas básica e aplicada na prática.
A maioria das discussões e asserções são opiniões mais ou menos infor
madas e especulação. Recentemente, entretanto, foi publicado um impor
tante estudo empírico em medicina (Comroe& Dripps, 1976). Este estudo
tem as virtudes da perenidade, importância e competência, e o que é
mais importante, traz excelente evidência empírica para o difícil problema
da relação da pesquisa com a prática. Vamos nos voltar para ele agora.
O estudo de Comroe e Dripps
Comroe e Dripps (1976) desejavam saber — entre toda a pesquisa

que podería ter influenciado a prática médica moderna — qual tipo de
pesquisa teve a maior influência. Sua principal questão era se foi a
pesquisa básica ou a pesquisa aplicada que teve maior impacto sobre a
prática da medicina.
Pediram então a 40 médicos que fizessem uma lista dos avanços na
prática médica que consideravam mais importantes para seus pacientes.
Enviaram uma lista com uma seleção desses avanços a um grande número
de especialistas, pedindo-lhes que votassem na lista. Os votos escolheram
três avanços nos últimos trinta anos. Com 140 consultores então, os
autores identificaram os corpos essenciais de conhecimento que deveríam
ser desenvolvidos para que as melhorias pudessem ser feitas.
De cerca de 2.500 relatórios de pesquisa especialmente importantes
para o desenvolvimento de um ou mais corpos essenciais de conhecimento
identificados, eles e seus consultores escolheram mais de 500 artigos
essenciais ou chaves para cuidadoso estudo. Um artigo “chave” era um
que'tivera efeito importante sobre pesquisa e desenvolvimento subseqüen-
tes, apresentava dados novos ou novas maneiras de considerar velhos
dados, um novo conceito ou hipótese e assim por diante. Em outras
palavras, era um artigo chave se conduzisse a uma das 10 melhorias
clínicas.
Comroe e Dripps classificaram os artigos como: (1) pesquisa básica
não relacionada com a solução de um problema clínico; (2) pesquisa
básica relacionada com um problema clínico; (3) estudos sem preocupa-
sociais politizando-a e desviando os pesquisadores do alvo da atividade científica:

a pesquisa básica. (Veja Kerlinger, 1977, para mais discussões sobre relevância
e seus efeitos.)
ções com mecanismos básicos; (4) resenhas críticas; (5) trabalho de
desenvolvimento ou engenharia para criar, melhorar ou aperfeiçoar apa
relhos ou técnicas para a pesquisa; (6) o mesmo que (5), mas para uso
com pacientes.
Os resultados foram claros: a pesquisa básica foi responsável por
quase três vezes mais artigos chaves que outro tipo de pesquisa e quase
duas vezes mais artigos do que a pesquisa não-básica e de desenvolvi
mento juntas. (As cifras foram básica: 61,7%; não-básica: 21,2%; desen
volvimento: 15,3%; resenhas: 1,8%.) Esta notável pesquisa sobre pes
quisas corrige idéias distorcidas sobre as contribuições das pesquisas
básica e aplicada à prática e afirma enfaticamente o que muitos cientistas
vem dizendo nos últimos 30 ou mais anos: pesquisa básica feita sem
visar vantagem tem, no final das contas, provavelmente maior efeito do
que a chamada pesquisa programática. Mesmo podendo-se discutir esta
afirmativa, fica no mínimo evidente que a fé na plausibilidade do argu
mento vantagem deve ser abalada.
A influência da pesquisa na prática
Como a pesquisa influencia a prática? Ninguém sabe dizer ao certo.

Há muitas opiniões, logicamente, mas pouca evidência obtida sistematica
mente. O estudo de Comroe e Dripps é uma raridade e importante.
Mas é limitado. Faríamos descobertas semelhantes em psicologia, socio
logia e educação? Seria muito mais difícil fazer estudos semelhantes
nesses campos porque seria difícil chegar a um acordo sobre o que são
avanços e o que são artigos chave (por exemplo). Embora falte evidência
sólida, parece haver um consenso entre muitos cientistas da grande impor
tância tanto da pesquisa básica quanto da aplicada e a necessidade de
fomentar ambas. Creio que este consenso é sadio; é a posição tomada
neste livro. As observações que se seguem sobre como a pesquisa afeta
a prática são em parte baseadas no estudo de Comroe e Dripps, em um
estudo de Deutsch, Platt e Sanghaas (1971) sobre avanços feitos nas
ciências sociais e na publicação de escritos e relatórios de cientistas e
filósofos durante os últimos 10 a 15 anos. (Alguns deles já foram
citados neste capítulo.)
Possíveis efeitos de séries de estudos
Os efeitos da pesquisa são indiretos e sentidos somente através de

apreciáveis períodos de tempo. A profunda compreensão de fenômenos
subjacentes é lenta, relutante até, porque precisa combater ou afastar
conjuntos de crenças arraigadas. Tendências mais amplas no pensamento
332
teórico e séries de pesquisas voltadas para responder questões gerais
teóricas, psicológicas e sociológicas têm a maior probabilidade de terem
um impacto. Mas o impacto é geralmente não específico. Unia pesquisa
apenas ou mesmo um conjunto de pesquisas, por exemplo, jamais informa
ao profissional o que fazer. Em vez disso, se tem alguma influencia,
influencia maneiras de pensar, de perceber, de reagir. E particularmente
assim com a pesquisa básica. Estudos em pesquisa^ aplicada, virtualmente
por definição, têm menos oportunidade de terem impacto profundo e de
longo alcance porque estão apontados para metas específicas e relativa-
mente estreitas. Estudos teoricamente orientados, dirigidos para a com
preensão de fenômenos, são gerais, abstratos e em principio aplicáveis
a muitos problemas e situações diferentes — se é que são realmente
aplicáveis. .
Vamos tomar a teoria de inteligência fluida e cristalizada de
Cattell, já mencionada. Se pesquisas posteriores confirmarem as idéias
de Cattell, é possível, no final das contas, que o pensamento psicoló
gico e educacional possa ser mudado. Se se tornar aceito que ha dois
tipos de inteligência geral, cristalizada e fluida, isto não poderá influen
ciar no fim o ensino? Muito do ensino contemporâneo tem sido influen
ciado pela idéia de que há uma forma geral de inteligência^ que passa
por muitos testes de capacidade e muito do^ desempenho^ humano (o
famoso “g”). Levar em conta diferenças individuais no ensino significa,
em grande parte, fornecer instruções diversificadas para diferentes níveis
de uma inteligência geral. Mas Cattell diz que há duas formas de inte
ligência geral! Se isto for verdadeiro e se tornar geralmente conhecido
e aceito, ficará óbvio então que levar em conta diferenças individuais
torna-se mais complexo.
A teoria das atribuições é outro exemplo interessante. Na ultima
década, apareceu uma bibliografia muito grande em psicologia social
sobre o fenômeno da atribuição.5 Atribuição é o processo que as pes
soas usam para compreender e explicar as causas do comportamento -
especialmente o comportamento de outras pessoas. Se vemos^ alguém
resolvendo problemas rápida e eficientemente, podemos atribuir isto à
sua capacidade. Ou podemos atribuir à facilidade dos problemas. Por
outro lado, se vemos alguém com grande dificuldade com os problemas,
podemos atribuir a falta de sucesso à preguiça, falta de concentração
e até mesmo a raça e sexo! O que causa estas e outras atribuições? Como
s Por exemplo, Harvey, Ickes e Kidd (1976), lones, Kanouse, Kelley. Nisbett,
Valins e Weiner (1971) e Shaver (1975). Infelizmente a maioria das referencias
é enfadonha. Talvez a melhor introdução seja a de Shaver (1975). Pode ser encon
trada uma exposição breve mas muito clara no capítulo 18 do texto de psicologia
geral de Hilgard, Atkinson e Atkinson (1975). (O capítulo, de fato, foi escrito
por Daryl J. Bem.)
estão relacionadas às características dos indivíduos que as fazem? Obvia
mente, a atribuição é um fenômeno altamente geral. É também heurís
tico: estimula grande parte da teoria e da pesquisa. Vamos examinar
dois estudos ligeiramente.
Harvey e Kelley (1974) fizeram a pergunta geral: Que condições
afetam o sentido do indivíduo de sua própria competência em fazer
julgamentos? Em um experimento fizeram sujeitos realizarem compara
ções dos tamanhos relativos de figuras, mas as figuras foram-lhes apre
sentadas de maneiras diferentes. Foram-lhes apresentados 20 vezes
pares de figuras de tamanhos diferentes, e perguntava-se aos sujeitos
qual das duas era maior. A manipulação experimental foi a estabilidade
da apresentação. As primeiras 10 das 20 apresentações de uma condição,
por exemplo, foram instáveis; isto é, as figuras foram apresentadas em
maneiras casuais: às vezes, a figura maior à esquerda, às vezes, à direita.
As segundas dez apresentações foram todas estáveis: a figura maior
aparecia sempre ou à direita ou à esquerda. Esta foi a condição instável-
estável. As outras três condições foram estável-estável, estável-instável
e instável-instável.
Num segundo experimento foram igualmente manipulados estabili
dade e instabilidade (desta vez com três condições), A modalidade,
entretanto, foi audição. Pediu-se aos sujeitos que julgassem a localização
relativa de sons. Harvey e Kelley descobriram, entre outras coisas, que
a estabilidade e instabilidade da apresentação afetava os julgamentos
de autocompetência. A seqüência instável-estável levou aos julgamentos
mais altos de autocompetência, enquanto que as outras seqüências em
geral levaram a julgamentos mais baixos.
Em outro estudo estimulado pela teoria da atribuição, Jones e seus
colegas (Jones, Rock, Shaver, Goethals & Ward, 1968) estavam interes
sados nos efeitos do sucesso e fracasso iniciais nos julgamentos dos
observadores. Fizeram seus sujeitos tentarem resolver uma série de pro
blemas apresentados de tal forma que os observadores viram alguns
sujeitos resolverem primeiro e depois fracassarem e outros sujeitos fra
cassarem primeiro e depois resolverem. Os observadores julgaram os que
resolveram primeiro mais capazes dos que os que fracassaram primeiro,
independentemente do desempenho posterior. Ou seja, os observadores
atribuíram graus diferentes de habilidade dependendo de se os sujeitos
primeiro resolvessem ou primeiro fracassassem.
Séries de estudos iguais a este deviam aumentar nossa compreensão
da atribuição. Esta compreensão, por sua vez, deveria aumentar nossa
compreensão da autopercepção, percepção social e julgamento. Muitos
problemas interpessoais e de julgamento em situações práticas, como em
negócios e educação, podem ser afetados por esta crescente compreensão.
Podemos, por exemplo, compreender melhor o julgamento dos alunos
334
pelo professor, as condições da escola, os traços do professor; e os com
portamentos que afetam tais julgamentos. Pode-se colher dividendos no
caminho. O inesperado da exploração teórica e da pesquisa e frequente
mente surpreendente e recompensador. Será possível, por exemplo, que
o estudo de Harvey e Kelley seja uma abertura para um aspecto muito
importante mas pouco explorado da motivaçao: sentido de competência.
Em si, nenhum desses estudos tem muito significado para a prática
— embora’todos os três sejam sugestivos. Por outro lado, um corpo de
tais estudos pode ajudar a mudar o pensamento de psicologos, sociolo-
eos e educadores em importantes áreas do comportamento humano, neste
caso inteligência, e fazer julgamentos e outras atribuições. A compreensão
assim ganha poderá ter um impacto sobre a prática — embora nunca
se possa garantir se haverá impacto significante e benefico.
Outro exemplo de pesquisa de longo alcance que já está mudando
a educação na América e na Europa é a série de estudos epistemológico-
desenvolvimentais de Piaget e seus colegas. Durante muitos anos Piaget
observou cuidadosamente crianças de todas as idades, entrevistando-as
e falando com elas, e criando “problemas” pam que elas resolvessem.
Ele está evidentemente interessado em responder a antiga questão episte-
mológica e psicológica: Como conhecemos? Ele acha que a pergunta
pode ser respondida, pelo menos em parte, entendendo o desenvolvi
mento dos processos de pensamento da criança. 6 Uma das descobertas
gerais de Piaget — congruente com o que dissera John Dewey muitos
anos antes — é que a criança tem uma vida intelectual propna, uma
maneira de olhar a realidade diferente do adultó. Em outras palavras,
em seu pensamento, a criança não é apenas um adulto pequeno. A
compreensão da concepção de realidade da criança, pelo educador e pelo
psicólogo provavelmente afetará profundamente a interação dos adultos
com as crianças, principalmente em educação. Por conseguinte^ series
de estudos como estes terão -provavelmente um impacto na pratica.
A influência da metodologia
Boa parte deste livro se preocupou com a metodologia, um termo

geral significando maneiras diferentes de fazer coisas para propósitos
diferentes. A metodologia inclui maneiras de formular problemas e hipó
teses, métodos de observação e coleta de dados (não enfatizado neste
6 O leitor interessado poderá ler um ou dois dos vários livros de Piaget, mas
um melhor conselho — infelizmente os escritos de Piaget não sao modelos de
clareza — é tentar uma das várias explanações em forma de livro. Uma das mais
antigas, mas talvez ainda a melhor, é o livro de Flavell (1963).
335
livro; veja Apêndice), a mensuração de variáveis e técnicas de análise
de dados. A metodologia inclui também aspectos da filosofia da ciência
urna abordagem critica geral a pesquisa. Apesar de sua grande impor
tância, raramente pensamos na possível influência da metodologia na
prática. Isto é estranho porque a metodologia já teve uma profunda
influencia no conhecimento científico comportamental.
Se podemos dizer que a pesquisa tem influência na prática, segue-se
então que qualquer coisa que influencie fortemente a pesquisa pode,
por sua vez, influenciar a pratica. A metodologia influencia fortemente
a pesquisa. Tal influência, naturalmente, será bem indireta. Afinal, a
influência da própria pesquisa é indireta. A influência da metodologia
é mais indireta ainda. Vamos tomar um exemplo bem óbvio. Antes de
1930; os experimentos eram. principalmente uma questão de duas va
riáveis.^ Era manipulada uma variável independente e observado seu
presumível efeito sobre uma variável dependente. Depois da invenção
da análise de variância, contudo, puderam ser feitos experimentos mais
realistas e teoricamente mais interessantes usando duas ou mais variá
veis independentes. Alguns deles foram descritos em capítulos anteriores.
O efeito do progresso na metodologia é ajudar a produzir pesquisa
cujos resultados sejam mais generalizáveis e ampliar as abordagens e
problemas de pesquisa tanto experimentais quanto não-experimentais.
Mas é possível que a metodologia tenha efeitos mais profundos?
Vamos especular, por exemplo, sobre os possíveis efeitos da regressão
múltipla sobre os hábitos de pensamento daqui a 10 ou 20 anos A
essência da regressão múltipla é o efeito simultâneo de muitas variáveis
sobre uma variável dependente. Geralmente a maioria das pessoas pensa
no efeito de uma variável sobre outra. É possível que depois de repetida
exposição e do uso de regressão múltipla — e não há dúvidas de que
as próximas duas décadas verão muito tal exposição e uso — possamos
não mais pensar em influências isoladas? Será possível que influências
múltiplas se tornarão parte de nossa maneira habitual de pensar? Para
mim parece que sim.
A influência da teoria
A fonte mais importante de influência sobre a prática é a teoria,

stou pensando em teoria em dois níveis. Um é o tipo mais amplo de
teoria, associado a escolas de pensamento psicológico e sociológico. A
psicologia, por exemplo, foi influenciada pelas teorias gestálticas (holís-
ticas), comportamentais, psicoanalíticas e cognitivas. Cada uma destas,
e as vezes conjunções delas, tem suas tradições de pesquisa. A psicologia
social foi influenciada em seus primeiros anos pela teoria gestáltica
pela teoria comportamental e pela teoria psicoanalítica. A psicologia
336
experimental foi influenciada pela teoria comportamental e pela teoria
cognitiva. Tais teorias provavelmente influenciam a prática, porque
influenciam decisões sobre quais são os problemas de pesquisa impor
tantes — a pesquisa de atribuição surgiu principalmente da teoria ges-
táltica (ou de campo) e da teoria cognitiva — e porque as idéias esti
muladas pela teoria entram em livros e, às vezes, até se tornam parte
de dogmas. Assim, muito indiretamente, a prática pode por fim ser
afetada. O difundido uso da dinâmica de grupo por professores e assis
tentes sociais nas décadas de 50 e 60 foi resultante em parte da teoria
de campo, um ramo da teoria gestáltica, que éstimulou tanto a pesquisa
em processos de grupos quanto a introdução e uso de técnicas de grupo
em situações práticas.
O outro tipo de influência teórica é a teoria mais específica, como
a teoria das atribuições, a teoria do reforçamento e as teorias de inteli
gências. As teorias de inteligência podem mudar o pensamento e a prá
tica educacional e previdenciária. Teorias de inteligência ambiental e
hereditária, por exemplo, podem levar a práticas previdenciárias e edu
cacionais muito diferentes. A influência da teoria do reforçamento já foi
sentida por causa de sua forte enfatização do reforçamento positivo.
Pais e professores preferem usar recompensa à punição, porque sua edu
cação e treinamento não podem evitar de ser influenciados pela teoria e
pesquisa do reforçamento. Eles “sabem”, freqüentemente sem conheci
mento específico e explícito, que o efeito da recompensa é muito melhor
que o efeito da punição. (Se o leitor estiver inclinado a achar que isto
é óbvio, lembre-se de que no século XIX a punição era a maneira mais
comum de lidar com crianças, pelo menos nas escolas.)
Preconceito e autoritarismo: um exemplo misto
A ciência, as teorias científicas comportamentais e a pesquisa

mudam nossa maneira de pensar a respeito de nós mesmos, de outros,
crianças, sociedade, problemas sociais e possíveis soluções para proble
mas sociais. Como já ficou dito, tal mudança é indireta e relativamente
lenta. Além disso é muito difícil, talvez quase impossível, dizer até
onde a teoria e a pesquisa afetaram, por exemplo, abordagens e tenta
tivas de solução de problemas sociais. Foi a pesquisa que afetou o pen
samento de muitos indivíduos em relação ao preconceito, ou foi, por
exemplo, uma mudança geral nas condições sociais que afetaram esse
pensamento? Ou foram ambos? Eu creio que foram ambos — além de
outros fatores, Se a pesquisa tem realmente um efeito, como tem esse
efeito? Grande parte da dificuldade em responder tais questões não é
apenas sua complexidade. É também porque a pesquisa que pode ter
tido efeito geralmente não foi feita para ter especificamente o efeito.
337
Foi feita, repetindo talvez tediosamente, para aumentar a compreensão
dos fenômenos que se relacionavam aos problemas sociais.
Vamos considerar um problema da maior magnitude: a igualdade
dos negros norte-americanos. Rotulo o problema desta forma porque
os problemas concernentes às relações de raça, preconceito, discrimina
ção e segregação podem ser agrupados em igualdade com os brancos,
então a maioria dos problemas provavelmente desaparecería com o
tempo. Sem dúvida houve um progresso considerável, grande até, em
melhorar as condições dos negros norte-americanos. É desnecessário cata
logar as leis aprovadas, e as estatísticas de empregos, habitação e aceita
ção, em transformação. Poucos americanos negarão que homens, mulhe
res e crianças pretos devem ter direitos e oportunidades iguais perante
a lei. (Veja a discussão anterior da pesquisa de Campbell.) Outro sinal
de importante mudança social é o abandono de linguagem ofensiva e
estereotipada. No início do século, expressões e palavras aviltantes eram
comumente usadas para descreverem o negro — e ninguém pensava que
isso fosse errado. Embora tal linguagem ainda seja usada hoje, seu uso
diminuiu enormemente. São grandes mudanças. O que a pesquisa tem a
ver com estas e outras mudanças salutares de pensamento e prática?
Ninguém sabe ao certo. Não há nenhum estudo de Comroe e Dripps.
Então o que se segue é necessariamente especulação, embora, espera-se,
especulação bem informada.
O pensamènto e os escritos sociológicos e psicológicos sobre raça e
preconceito fizeram progressos no início do século. A pesquisa, no sen
tido de investigação controlada, começou realmente a florescer na ter
ceira, quarta e quinta décadas do século. Investigações clássicas sobre
um dos fundamentos do preconceito, os estereótipos, tiveram grande
impacto sobre os psicólogos e sociólogos (por exemplo, Katz e Braly,
1935). 7 Foram feitos muitos outros estudos sobre estereótipos e outros
aspectos do preconceito e o assunto foi analisado teoricamente (por
exemplo, Krech & Crutchfield, 1948). Cientistas comportamentais dese
javam compreender o fenômeno, assim como contribuir para sua solução.
Escolhi deliberadamente um fenômeno cuja investigação teve moti
vos mistos. Por ter sido dito repetidamente que o propósito da ciência
é a teoria, ou a compreensão, não quer dizer que os teóricos e os pesqui
sadores desejem pura e simplesmente obter conhecimentos. De fato,
muitos pesquisadores trabalhando na área geral do preconceito pareciam
ter fortes motivos sociais, baseados em uma ideologia igualitária. Entre
tanto, o progresso na compreensão do preconceito — hoje preconceito é
7 Um livro de Simpson e Yinger (1965) discute estereótipos e outros aspectos

do preconceito. A bibliografia é muito grande; Simpson e Yinger resumem com
habilidade uma grande parte dela.
338
bastante bem compreendido, embora, como sempre, muita coisa não seja
ainda entendida — veio da pesquisa científica sobre o fenômeno e sobre
fenômenos relacionados. Vamos nos voltar agora para um conjunto de
investigações muitíssimo interessante, importante e influente, cujo alvo
inicial foi estudar e compreender o preconceito, mas cuja execução foi
consideravelmente além do preconceito. Embora já tenhamos examinado
aspectos dessas investigações, sua importância e especial adequação para
o problema da pesquisa e prática justifica uma repetição.
A influência de um livro notável publicado em 1950, The Autho-
ritarian Personality (Adorno e outros, 1950), é sentida ainda hoje. A
meta ambiciosa da pesquisa nele contida era estudar, compreender e
explicar o preconceito. Os pesquisadores eram homens e mulheres que
se dedicavam também ao combate do preconceito na moderna sociedade.
De fato, duvidamos que tal estudo pudesse ter sido feito sem que os
pesquisadores tivessem esta motivação. Logo na primeira página do livro,
Horkheimer e Flowerman, diretores do Departámento de Pesquisa
Científica do Comitê Judeu Norte-Americano, que patrocinou o estudo,
propuseram diversas questões perturbadoras, estimulados pela persegui
ção e extermínio de milhões de seres humanos por outros seres humanos:
Como é possível que . . . em uma cultura de lei, ordem e razão
possam ter sobrevivido os remanescentes irracionais de antigos
ódios raciais e religiosos? Como . . . explicar a disposição de gran
des massas de pessoas para tolerar o extermínio em massa de seus
semelhantes e concidadãos? Que tecidos continuam cancerosos na
vida da nossa moderna sociedade, e que, a despeito de seu propalado
progresso, mostram o incongruente atavismo de povos primi
tivos? (p.v)
São questões profundas. O fato de serem feitas como perguntas
para serem respondidas pela investigação empírica, pelo menos em
parte, é um dos aspectos mais notáveis desta pesquisa. Horkheimer e
Flowerman dizem:
Mas uma consciência desperta não é suficiente se não estimular
uma busca sistemática de uma resposta. A humanidade pagou um
preço muito alto por sua ingênua fé nos efeitos automáticos da
simples passagem do tempo; a magia jamais conseguiu dissipar tem
pestades, catástrofes, peste, doença ou outros males. .. (p.v)
Não estamos agora tão preocupados com a substância, metodologia
e descobertas do estudo, mas com sua motivação mista e de que maneira
pode ter afetado a prática. Os pesquisadores, profundamente preocupa
dos com o preconceito e seus efeitos secundários perniciosos, desejavam
contribuir com a busca de respostas práticas para erradicarem o pre
conceito. Afinal, o estudo fora iniciado e financiado pelo Comitê Judeu
Norte-Americano, entre cujas principais tarefas estava combater o anti-
semitismo. Todos sabiam, entretanto, que teriam que compreendê-lo
para combate-lo. “Nosso objetivo não é merámente descrever o precon
ceito, mas explicá-lo a fim de ajudarmos em sua erradicação” (p. vii).
Através de uma combinação de abordagens de pesquisa, os pesqui
sadores chegaram a várias conclusões importantes. Uma delas foi que o
preconceito é um fenômeno muito geral que faz parte das personalidades
dos indivíduos. A esta personalidade eles denominaram “personalidade
autoritária” porque descobriram, entre outras coisas, que uma “perso
nalidade autoritária” possuía uma síndrome de características que pre
dispunham o indivíduo que a possuía a ser hostil em relação a grupos
que não fossem o seu.
Uma segunda conclusão foi que o preconceito tende a ser gene
ralizado. A pessoa que tem preconceito contra um grupo torna-se incli
nada a ter preconceito contra outros grupos. Esta conclusão, como outras
de Adorno e seus colegas, foi confirmada por outras pesquisas. O indi
víduo que não gosta de judeus provavelmente não gosta de negros,
estrangeiros e assim por diante. Observe que isto explica muito do com
portamento social humano, mas especialmente o que envolve o contato
entre grupos. Significa também que, para compreender o anti-semitismo,
é preciso compreender também o preconceito em relação a outros grupos
minoritários.
Uma terceira conclusão — a última que vamos considerar — está
relacionada à primeira resumida acima: atitudes políticas, religiosas e
outras, estão relacionadas ao autoritarismo. Isto é, a personalidade auto
ritária^ não tende apenas a ter preconceito em relação a outros grupos
que não o seu; ela tem também atitudes identificáveis e predizíveis em
relação a questões sociais. O termo geral que engloba estas atitudes é
“conservadorismo”, mas os autores mostram cuidadosamente que eles
querem dizer “pseudoconservadorismo”, pelo que parecem querer dizer
conservadorismo reacionário. Não há dúvida, entretanto, da correlação
positiva entre o autoritarismo e o conservadorismo medidos. 8
Evidentemente o preconceito é muito complexo e não é fácil com
preendê-lo. Adorno e outros descobriram que o anti-semitismo faz real-
8 resultado infeliz desta e de outras pesquisas semelhantes é uma tendência

de alguns liberais a considerarem a ideologia conservadora como de certa forma
imatura e perniciosa. Tal visão pode ser tão dogmática e preconceituosa quanto
as visões dos autoritários em relação a negros e judeus. Rokeach (1960) observou
corretamente que o dogmatismo e o autoritarismo podem ser tanto de direita
quanto de esquerda.
340
mente parte de uma síndrome mais ampla que pode ser chamada de
etnocentrismo: caracterizada pela centralização dos membros no seu
próprio grupo, crença em seu valores e retidão e por atitudes negativas
em relação a outros grupos. Descobriram ainda que o etnocentrismo por
sua vez faz parte de outro fenômeno chamado autoritarismo, e que o
autoritarismo descreve um certo conjunto de traços de personalidade.
Sua ênfase foi fortemente psicológica no sentido de terem localizado o
etnocentrismo e o autoritarismo no indivíduo. Eles provavelmente acer
taram, mas é provável que ambos sejam afetados por forças sociais e
variáveis fora do indivíduo. Entretanto, The Authoritarian Personality é
uma grande realização da pesquisa e da ciência comportamental, uma
contribuição distinta e importante para a compreensão do preconceito,
do autoritarismo e da ideologia, das relações entre personalidade e
ideologia.
Praticamente toda essa pesquisa foi pesquisa básica. Sua meta era
compreender e explicar o preconceito, ainda que os pesquisadores e seus
patrocinadores tivessem convicções profundas sobre os males do precon
ceito e forte desejo de erradicá-lo. Ninguém pode dizer com certeza,
claro, se o estudo teve algum efeito real sobre o preconceito em si.
Eu creio que provavelmente tenha tido influência porque, com a maior
compreensão do preconceito, líderes intelectuais e uma geração de estu
dantes ganharam uma base para entenderem como lidar com o precon
ceito. Provavelmente tenha também ajudado a criar uma noção mais forte
da necessidade de igualdade em muito mais pessoas. Do ponto de vista
deste capítulo, os autores de The Authoritarian Personality mostraram
não somente capacidade de pesquisa, discernimento e argúcia; mostraram
sabedoria quando escolheram fazer pesquisa básica. Um conjunto de
estudos aplicados poderia ter dado em nada porque provavelmente teria
fracassado em encontrar relações mais profundas que os autores encon
traram. 9
Uma palavra final: Valores científicos
Uma das coisas mais significativas com respeito à ciência é seu

sistema de valores. Quando uma tradição de pesquisa científica é forte
em uma instituição ou sociedade, fomenta-se uma atmosfera aberta de
investigação crítica. Com tal atmosfera, todas as questões e afirmativas
potencialmente “testáveis” são consideradas questões abertas sujeitas ao
9 Houve, como pode se supor, muita crítica e muita controvérsia em relação a

T h e A uthoritarian Personality. As referências seguintes podem ser úteis ao leitor
interessado: Christie e Jahoda (1954) e Kirscht e Dillehay (1967).
escrutínio científico e à investigação. Todas as outras questões e afirma
tivas não têm interesse científico. Questões que são em geral não-testáveis
empiricamente podem ter valor, mas não são relevantes à ciência simples
mente porque não são testáveis. Foram dados exemplos de tais questões
no capítulo 1 e em outras partes do livro. Em resumo, dois dos valores
de ciência são investigação aberta e crítica e insistência em trabalhar com
questões que sejam empiricamente abordáveis. Com todas as questões,
entretanto, os cientistas e a ciência são sempre céticos.
Um terceiro valor da ciência é a fé na ciência em si, combinada
com o ceticismo mencionado acima. Os cientistas acreditam que, com
condições apropriadas e metodologia, pode-se conseguir uma compre
ensão limitada da maioria dos fenômenos naturais. Apesar da com
preensão e do conhecimento absoluto estarem fora de nosso alcance, a
compreensão e o conhecimento probabilístico limitado não estão. Esta fé
é especialmente importante para os cientistas comportamentais porque
muita gente duvida que os métodos da ciência possam ser usados para se
estudar o comportamento humano. Por exemplo, diz-se que ninguém
jamais poderá conhecer a verdadeira natureza da inteligência humana
porque ela não é diretamente observável e assim não-mensurável. Da
mesma forma, a motivação humana está para sempre fora de alcance,
já que também não podem ser observados os motivos humanos impor
tantes e inferir motivação de comportamento é sempre enganoso e até
ilusório. Embora reconhecendo a grande dificuldade de inferir inteli
gência,. motivação e fenômenos semelhantes, os cientistas mantêm a fé
em que isso possa ser feito. Esta fé parece ser justificada: tem sido
feito grande progresso no estudo científico, não apenas de inteligência
e motivação, mas em muitos outros fenômenos “não-observáveis”. (Natu
ralmente, muitas das variáveis da física e outras ciências “ exatas”
também são “ não-observáveis”.)
Quarto, os cientistas e a ciência têm que ser completamente hones
tos — e geralmente o são. Isso nada tem a ver com moralidade pessoal.
A moralidade pessoal dos cientistas provavelmente não seja melhor ou
pior do que a de outras pessoas. Dentro do sistema científico, entretanto,
o cientista tem que ser absolutamente honesto porque o sistema assim
o exige. Na verdade, uma de suas bases é uma “alta moralidade”.
É como se fosse um mandamento: Não falsificarás. Naturalmente tem
havido casos de falsificação e até o cientista mais escrupuloso poderá
inconscientemente falsificar. Mas se a desonestidade, consciente ou
inconsciente, ao fazer e publicar uma pesquisa se espalhasse, o empreendi
mento científico iria por terra.
A analogia com a objetividade como critério básico da metodologia
científica é estreita. Sem objetividade não pode haver ciência, como já
ficou dito. Da mesma forma, sem honestidade completa, não há ciência.
342
Não há concessões, interferências, como em negócios ou em política.
A ética da ciência é absoluta. O fato de que a maioria dos cientistas
observa a ética que é mostrado pelo choque com que é recebido algum
caso de trapaça. É mostrado ainda pelo destino do cientista trapaceiro:
ele perde seu status de cientista. O caso de Sir Cyril Burt, que foi um
dos psicólogos mais famosos e respeitados da Inglaterra, pode ser um
exemplo. Alegou-se que o exame cuidadoso das evidências que ele apre
sentara para apoiar conceitos de hereditariedade de inteligência indica
vam que ele falsificara ou inventara os dados. Não vamos discutir o
caso. A questão foi o choque causado no mundo científico comporta-
mental do Ocidente. Qualquer cientista que falsifique dados, por qual
quer motivo, causa um tremendo choque. Ainda mais Burt, por causa
de sua posição e do respeito que seus colegas tinham por ele. A questão
ainda não foi resolvida. Há os que estão convencidos que Burt fez q,;
que o acusaram e que foi, portanto, desonesto. Mas ha os que não
acreditam nisso. Provavelmente a questão jamais seja resolvida completa
mente, porque Burt já não está mais aqui para ser questionado e porque
a evidência parece ser equívoca.
Outro problema importante, relacionado aos valores da ciência e
que contribuiu para a má interpretação da ciência e da pesquisa, é ò
suposto conflito entre a ciência e o estudo das humanidades. Acredita-se
que a ciência não toca na maioria dos aspectos da experiencia humana,;
Acredita-se, por exemplo, que a essencia da musica e da poesia está
além da ciência e que, na verdade, a ciência não toca nas experiências
humanas mais importantes. Assuntos estéticos e espirituais, entre outras
coisas, escapam à ciência e aos cientistas.
Seria agradável dar uma resposta eloqüente e romântica a tais argu
mentos. Mas não é possível uma resposta real. Primeiro, os fatos
estão corretos: a ciência nada tem a ver com musica e poesia e não a
toca muitos aspectos da experiência humana. Mas isto é verdadeiro para
qualquer atividade humana. A música abraça toda a humanidade? E a
literatura? A pintura? Se existe uma resposta satisfatória é que a ciência,
por um lado, e a música, arte, literatura, experiências místicas, etc., por
outro, são simplesmente diferentes. Não podem ser comparadas no
sentido comum da palavra. Alguém diz que flor e melhor do que cafe?
— a não ser naturalmente, que se esteja atras do exotico ou comparando
alguma qualidade comum aos dois, como o cheiro ou a cor.
Segundo, imaginar um conflito entre ciência e humanidade é coisa
sem significado e sentido. As duas simplesmente são diferentes^ têm
objetivos diferentes. É absurdo esperar que a ciência tenha como objetivo
a satisfação estética (a não ser, talvez, para o cientista), assim como^ e
absurdo esperar que a ciência e a pesquisa resolvam problemas sociais.
A ciência procura compreensão. Não se destina a melhorar nível de vida,
experiência estética, ou o ser existencial do indivíduo. O conflito ou
polaridade entre a ciência e as humanidades, então, é um conflito psico
lógico: está na cabeça de homens e mulheres e não pertence à natureza
“oposta” da ciência e das humanidades. Duas coisas serem opostas
implica que existe alguma coisa em comum entre elas. Ciência e humani
dades são, ambas, atividades intelectuais humanas. Termina aí. Não há
virtualmente, mais nada em comum entre elas. Então como pedem ser
opostas? A compreensão da ciência exige a compreensão de que sua
natureza e objetivos são muito diferentes de outras atividades .humanas.
Isto quer dizer que não está oposta a nada embora seu efeito' seja abrir
áreas de atividade humana, geralmente fechadas, ao exame crítico e
cético.
Duas perguntas difíceis, as últimas: A influência da ciência tem
sido boa ou má? Se se entender “boa” por conforto e conveniência física
e se se admitir que grande parte da tecnologia moderna foi criada pela
ciência, então deve-se responder: Sim, a influência da ciência tem sido
boa, as pessoas se sentem fisicamente melhor do que no século XIX.
Se se fizer perguntas sobre a qualidade de vida que a ciência possa ou
não ter acentuado, a resposta é muito mais complexa e ambígua. Vamos
então nos limitar aqui à ciência e à pesquisa comportamentais.
Ao contrário do que muita gente acredita, a ciência e a pesquisa
comportamental contribuíram muitíssimo em uma área em que deveríam
ser julgadas: conhecimento e compreensão do comportamento humano.
Antes de irmos mais adiante, entretanto, vamos reconhecer que qualquer
contribuição é sempre parcial e, talvez até, apenas uma pequena parte
de todas as contribuições possíveis. É até bastante duvidoso que surgirá
completa compreensão científica do comportamento humano. Provavel
mente sempre haverá áreas nebulosas e desconhecidas em aspectos da
economia, sociologia, psicologia, antropologia e assim por diante. As
depressões econômicas provavelmente jamais serão totalmente compre
endidas, se não por outras razões, pelo menos porque as situações socais
mudam constantemente, e o mesmo acontece, portanto, com as situações
econômicas. Surgem até novos fenômenos e variáveis. O conhecimento
completo da motivação e habilidades humanas continuará a nos escapar.
As complexidades das instituições e dos movimentos sociais provavel
mente jamais serão também entendidos completamente.
Uma das coisas que as pessoas esperam da ciência é que, depois
de algum tempo, maturidade e trabalho, a pesquisa resultará em conhe
cimento e compreensão total dos fenômenos; esta esperança é errônea e
inadequada. A ciência e a pesquisa jamais produzirão conhecimento e
respostas completas às questões. Manter essa esperança é compreender
mal a pesquisa e a ciência. Isto, entretanto, não é motivo de desespero.
344
Não quer dizer que, por não poder dar respostas completas, a empresa
científica perde seu valor. Longe disto.
Um modo mais exato e realista de encarar a ciência e concebê-la
como um meio poderoso de reduzir a ignorância. Vamos tomar a inteli
gência novamente. Em, digamos, 1850, não havia evidência científica
sobre a natureza da inteligência. O que era “ conhecido” foi resultado de
observação e dedução, aguçadas ou não, sábias ou não. Não se fazia
uma investigação controlada sistemática da inteligência. Em resumo, o
estado de ignorância, se não era completo, era quase. Na década de 70,
entretanto, sabe-se muita coisa sobre a inteligência humana. Natural
mente muita coisa continua desconhecida, mas isto não quer dizer que
não saibamos quase nada a seu respeito. Sabemos, por exemplo, que a
inteligência humana é produto tanto da hereditariedade quanto do meio
ambiente. Sabemos que não se trata de uma coisa isolada, unitaria,
querendo dizer, por exemplo, que uma pessoa aUamente inteligente e
inteligente em todas as áreas. Aliás, é um função multifacetada que
evidentemente tem tantas manifestações quanto pessoas. Certos fatores,
ou tipos de inteligência, estão agora bem estabelecidos e bem conhecidos:
verbal numérico, espacial e assim por diante. Há até evidência, embora
não ainda sólida, de que não há só 6 ou 7 fatores de inteligência, mas
mais de 20 ou 30.
Uma das grandes realizações científicas e técnicas do século é, então,
a mensuração da inteligência. Ela pode ser medida com alta fidedigm-
dade e elogiável validade. Há os que duvidam, naturalmente. Uma das
principais causas de dúvida é a desconfiança de que o que esta sendo
medido não é a verdadeira essência a inteligência. Talves não. Mas então,
a “verdadeira essência” da inteligência jamais será medida. Isso de forma
alguma diminui a magnitude teórica e prática da realização. A ignorância
completa foi reduzida para o que pode ser chamado ignorância parcial.
Graças ao trabalho de cientistas sociais, sabemos que classe social
tem muita influência sobre a inteligência, realização e ocupação. Sabe-
mos muita coisa a respeito do papel que desempenha a raça em casa, na
escola e no trabalho. Sabemos muita coisa a respeito do funcionamento
dos sistemas econômicos — não o suficiente para evitarmos depressões
e acabar com a inflação, mas muita coisa, apesar de tudo. Os sociologos
e os economistas reduziram bastante a ignorância social e econômica.
Ajudaram também a destruir falsas crenças e mitologias enganosas sobre
a sociedade e seu funcionamento.
Alguns anos atrás, Deutsch, Platt e Senghaas (1971), publicaram
um estudo do progresso das ciências sociais e de onde veio este progresso.
Fizeram uma lista de 62 melhoramentos feitos durante o período de
1900-1965 que influenciaram a pesquisa e a prática. Omitindo as contri
buições não científicas, resta-nos ainda uma lista formidável de melhora-
mentosr a sociologia da burocracia, cultura e valores, teoria e pesquisa
de aprendizagem, testes de inteligência, estudos sobre autoritarismo,
pesquisa de atitudes e opiniões, e vários avanços metodológicos, como
analise fatorial, análise de conteúdo, definições operacionais, análise
estatística, computadores, análise multivariada e assim por diante. Dizem
os autores:
Juntos, estes melhoramentos acrescentam-se à inconfundível evidên
cia de crescimento cumulativo do conhecimento nas ciências sociais
no decorrer do século. Hoje, afirmativas como “não sabemos mais
do que Aristóteles sobre psicologia humana e política”, expressam
principalmente a ignorância daqueles que as proferem (p. 455). 10
Em suma, as contribuições da ciência e da pesquisa comportamental
foram impressionantes na redução da ignorância. O progresso não foi tão
impressionante quanto em física, química e biologia, mas considerando
sua relativa juventude e grande complexidade, são sem dúvida impressio
nantes. A compreensão do mundo físico e de nossos corpos progrediu
enormemente graças à ciência. A compreensão de nós mesmos e de nosso
ambiente, embora não sendo enorme, tem sido e é uma realização
excepcional, reduzindo nossa ignorância praticamente completa cem anos
atras.
É verdade jjue podemos não saber muito bem como lidar com
depressão, inflação, desemprego, terrorismo, preconceito religioso e racial
e privação intelectual extrema. Conhecemos, entretanto, algumas das
causas destes fenômenos e relações entre eles. Estamos começando a com
preende-los cientificamente. Embora isto não signifique solução definitiva
dos problemas — repetimos, não é este o objetivo da ciência —, signi-
íca, no mínimo, redução considerável da grande ignorância que permeia
estes e outros problemas psicológicos e sociais semelhantes. Significa
uma certa medida de compreensão, compreensão que pode nos fornecer
as razoes, senão os remédios, da nossa infelicidade e nossa felicidade
• de nossos fracassos e nossos sucessos.
a, „!0de-Se- dif Utlr a. is.ta de 62 avanços na ciência social. Por exemplo, diversos
avanços nao forarn absolutamente científicos: a teoria da organização unipartidária
L f ? revolu?a°. de Lenm psicanálise e psicologia profunda, contabilidade da
foram E f / ™ por diante- £ lém diss0’ certos melhoramentos significantes
evidência de realiSSo0 “ * ^ é impressionante e incontestável como
346
A p ê n d ic e
T ip o s d e p e s q u is a , m é t o d o s d e o b s e r v a ç ã o
e t e s t e s d e s ig n if i c â n c ia e s t a t í s t i c a
Uma vez que o objetivo básico deste livro é levar à compreensão

conceituai da pesquisa científica comportamental, foram omitidos vários
aspectos e tópicos comumente importantes para a cobertura mais ampla
do assunto. Embora uma tal abordagem conceituai geral possa ser valiosa,
no sentido de ajudar a compreender a pesquisa científica e sua lógica,
abordagem e métodos, corre-se o risco de, com a omissão de certos
tópicos, como cálculos e análises estatísticas, e tipos diferentes de pes
quisa, chegar a uma noção distorcida, ou até estreita, a respeito da
pesquisa. O objetivo deste Apêndice é preencher algumas lacunas deixa
das no texto, embora superficialmente. A função específica do Apêndice,
então, não é ensinar ou mesmo explicar essas omissões, mas simples
mente defini-las e caracterizá-las rapidamente. Isto será feito conside
rando três áreas ou categorias importantes para um entendimento mais
completo da pesquisa, não discutidas no corpo do livro ou mencionadas
apenas de passagem: tipos de pesquisa, métodos de observação e coleta
de dados e testes de significância estatística.
Tipos de pesquisa
Um tipo mais importante de pesquisa dominou o texto: pesquisa
em que foram estudadas as relações entre variáveis dependentes e inde
pendentes. Este é, naturalmente, o tipo de pesquisa mais importante e a
meta última de quase toda a pesquisa científica: pesquisa para testar
relações hipotéticas entre variáveis. Há, contudo, vários outros tipos de
pesquisa que são importantes. Vamos examinar dois deles rapidamente.
Investigação histórica
Pesquisa histórica, ou investigação histórica, é uma investigação
crítica dos acontecimentos, desenvolvimentos e experiências do passado,
pesagem cuidadosa da evidência da validade de fontes de informação
347
ção, alguns deles já foram mencionados. Vamos agora caracterizar rapi
damente três dos métodos mais usados.
Observação é um termo geral que significa qualquer tipo de dado
obtido através de notar eventos, contá-los, medi-los, registrá-los. Métodos
de observação são procedimentos sistemáticos e padronizados para se
obter dados. Quase todos os métodos têm o objetivo técnico de ajudar
o observador ou pesquisador a obter medidas de variáveis. O principal
objetivo de “fazer observações”, então, é medir variáveis. Em ciência,,
fazer observações significa mais do que olhar as coisas simplesmente.
Significa também qualquer aparato usado para medir variáveis.
Entrevistas
Há duas maneiras gerais de obter informações das pessoas. Uma

delas é fazendo-lhes perguntas. Esta é bem direta. A segunda maneira é
fazendo os indivíduos responderem algum tipo de estímulo estruturado,
como discutimos e ilustramos no capítulo 9. Esta forma é mais indireta.
Exemplos de perguntas diretas são: Você é casado? Você acha que seu
casamento teve sucesso? O que você acha da lei que propõe suspender
as restrições ao aborto? Por quê? A pessoa então responde. Fornece as
respostas que contêm informações que podem ser convertidas em
variáveis. Tais questões são usadas em entrevistas. Um conjunto de tais
questões é incorporado em um roteiro de entrevista. Entrevistadores
treinados usam então esses roteiros e obtêm respostas de (geralmente)
respondentes pré-selecionados.
Uma entrevista consome tempo e é cara. Algumas vezes é o único
meio de se obter a informação necessária para uma pesquisa. E tem certas
vantagens que outros métodos não têm. O entrevistador pode, por
exemplo, depois de fazer uma pergunta geral, sondar as razões das
respostas dadas. Uma das grandes vantagens da entrevista é, então, sua
profundidade. Os pesquisadores podem ir mais abaixo da superfície das
respostas, determinando razões, motivos e atitudes.
Como ficou indicado no capítulo 16, a construção de roteiros de
entrevistas é uma arte de alta engenharia. Em mãos competentes são ins
trumentos poderosos para se fazer observações. Usada rotineiramente em
levantamentos por amostragem, são úteis também em outros tipos de
pesquisa onde possa ser difícil ou mesmo impossível usar outros métodos.
Escalas e testes objetivos
Acabamos de dizer que a segunda maneira geral de obter infor

mações das pessoas é fazendo-as reagirem a estímulos estruturados. Em
350
grande parte da pesquisa comportamental, os estímulos estruturados sao
escalas e testes objetivos, que são mais usados do que qualquer ra
coisa para fazer observações. Em capítulos anteriores mencionamos exem
plos de tais testes e escalas, e no capítulo 2 eles foram definidos. Vamos
repetir as definições. Um teste é um procedimento sistemático em que se
apresenta aos indivíduos a serem testados um conjunto de estímulos
construídos, chamados itens, aos quais eles respondem de uma forma
ou de outra. Estas respostas possibilitam o pesquisador atribuir notas
individuais, que presumivelmente indicam o grau em que os indivíduos
possuem o atributo que está sendo medido, ou o grau em que eles
“conhecem” a coisa sendo testada.
Uma escala é semelhante a um teste, enquanto possui itens, e cada
um deles deve medir o que. quer que esteja sendo medido. As escalasv
contudo, não têm o sabor competitivo dos testes. São construídas de
forma que números diferentes possam ser atribuídos a sujeitos diferentes
para indicarem quantidades diferentes da propriedade ou atributo em
mensuracão. Foram dados exemplos no texto. Lembre-se, por exemplo,
de que a conhecida escala F mede autoritarismo. Lembre-se também das
escalas referentes destinadas a medirem conservadorismo e liberalismo.
Foram construídas, literalmente, centenas de escalas e usadas em pesquisa
comportamental para medirem atitudes, valores, rigidez, preconceito, inte
resses, introversão-extroversão e assim por diante. O L;
pC BC.!
LaJ
Observação de comportamento
Outra maneira de categorizar os métodos de observação: pergunfai

e observar. Em essência, as entrevistas, testes e escalas pedem infor
mações às pessoas, geralmente a respeito delas próprias. Elas diferem
quanto ao grau em que são diretos: a entrevista é mais direta do que
os testes e as escalas. Em vez de perguntar, podemos observar direta
mente o comportamento das pessoas. O objetivo é 0 mesmo: obter medi
das de variáveis. Suponhamos que queremos medir a cooperatividade
em pequenos grupos. Depois de definirmos comportamento cooperativo,
observamos um grupo de algum modo sistemático, digamos em períodos
escolhidos ao acaso de 10 minutos cada vez, e procuramos observar atos
de comportamento cooperativo. Pode parecer estranho, mas a observação
direta de comportamento não tem sido muito usada em pesquisa compor
tamental. Um dos motivos é a grande dificuldade do método. Observar
comportamentos não é tão simples quanto parece. Vejamos uma parte
do problema mais de perto.
Muita gente acha que seria muito melhor observar o comportamento
diretamente nas ciências comportamentais. Afinal, as pessoas nem sempre
dizem o que pensam. Como se pode confiar em entrevistas, testes e
escalas? Ao responder escalas de motivação ou de atitudes, por exemplo,
as pessoas não darão respostas válidas. (Isto não é verdade, diga-se de
passagem.) Seria, então, melhor observar seu comportamento. As ações
falam mais alto do que as palavras! Este argumento não é apenas
ingênuo; mas não enxerga as dificuldades envolvidas na observação de
comportamento. Não queremos entrar em problemas técnicos, mas pode
mos mencionar uma grande dificuldade na observação de comporta
mento: o problema da observação-inferência.
Este problema surge de inferências muito diferentes que podem ser
feitas observando-se o mesmo comportamento. Um observador poderá
registrar uma criança como “agressiva”, se a vê bater em outra criança.
Outro observador poderá registrar o mesmo comportamento como
“brincalhão”. Da mesma forma, os observadores podem diferir em
variáveis como coesão, amizade, dominância, etc. Por outro lado, o
observador humano tem vantagens que máquinas de observação ■ — se
fossem possíveis — não têm. O observador humano pode relacionar o
comportamento que estiver observando às variáveis de um estudo —
e pode ignorar outros comportamentos. Ele pode prestar atenção e
observar uma variável e uma variável apenas — ou, naturalmente, duas
ou três. Além disso, o acordo ou falta de acordo entre observadores
pode ser averiguado. Observadores competentes e observações bem-feitas
de comportamento podem ajudar a superar o difícil hiato entre os
constructos e o comportamento, distinguindo claramente que comporta
mento reflete qual constructo, pelo menos para os propósitos do estudo
à mão.
Há outros métodos de observação, coleta e análise de dados, nume
rosos e complexos demais para os descrevermos neste Apêndice: a socio-
metria, a metodologia Q, métodos projetivos, análise de conteúdo e
outros. O pesquisador nas ciências comportamentais precisa conhecer e
compreender estes métodos. Todos eles têm propósitos diferentes e
características especiais que os tornam apropriados para obterem certos
tipos de dados. Para o não-pesquisador, a necessidade de estudá-los é
menor. As principais coisas a saber são os aspectos mais amplos da
coleta de dados descritos acima. O leitor interessado em conhecer melhor
estes métodos pode consultar um ou mais livros sobre o assunto (Festin-
ger & Katz, 1953; Kerlinger, 1973; Lindzey e Aronson, 1968).
Estatística e análise
Um ou dois leitores do primeiro manuscrito deste livro se queixaram

pelo fato dele conter pouca coisa de estatística. Mas ele contém pouca
estatística por causa do propósito do livro — que não é ensinar esta-
352
tística. Entretanto, a natureza onipresente da estatística e sua importância
vital na análise de dados exige mais do que um “fora” cavalheiresco.
Estamos longe de ter negligenciado o assunto. Nos capítulos 4, 5 e 6,
além de em outros pontos, foram dadas as bases conceituais da análise,
do estudo de relações e da testagem de hipóteses. . . No capítulo 10,
discutimos análise de freqüências. Vimos correlação, regressão e abor
dagens multivariadas nos capítulos 11, 12 e 13. Mas uma análise descri
tiva e uma vista geral da estatística não foram discutidas, sistematica
mente. Vamos fazê-lo agora, mas de forma limitada. O objetivo não é
ensinar estatística; é aprofundar a compreensão da pesquisa comporta-
mental em geral. Vamos anteceder a discussão de estatística com uma
consideração da natureza da análise.
Análise é a categorização, ordenação, manipulação e sumarização
de dados. Seu objetivo é reduzir grandes quantidades de dados brutos
passando-os para uma forma interpretável e manuseável de maneira que
características de situações, acontecimentos e de pessoas possam ser des
critas sucintamente e as relações entre as variáveis estudadas e interpre
tadas. A estatística, naturalmente, faz parte da análise. Já foi definida
mas, para maior clareza, vamos caracterizá-la novamente. Estatística é a
teoria e método de analisar dados obtidos de amostras de observações
com o fim de descrever populações, estudar e comparar fontes de variân-
cia, para ajudar a tomar decisões sobre aceitar ou rejeitar relações entre
fenômenos e para ajudar a fazer inferências fidedignas de observações
empíricas (Kerlinger, 1973, p. 185). Vamos considerar apenas como
avaliar a significância estatística em três situações de pesquisa variadas
e comumente usadas.
Significância estatística: O teste t
A função primeira e talvez a mais freqüente da estatística é testar

resultados obtidos, que são expressos em forma de estatísticas — médias,
diferenças entre médias, variâncias, coeficientes de correlação, e assim
por diante — quanto à sua significância estatística. Como ficou explicado
no capítulo 5, isto quer dizer testar um resultado estatístico quanto a
sua distância em relação à expectativa baseada no acaso. Se determinado
resultado estiver bem distante da expectativa casual, diz-se que ele é
“estatisticamente significante”.
A idéia básica foi ilustrada anteriormente, principalmente pelo uso
de médias. Na tabela 5.1, por exemplo, as médias de 10 conjuntos de
números aleatórios foram “checadas” contra a média total. Uma vez que
os números eram aleatórios, as médias dos 10 conjuntos não deviam se
afastar muito da média de todos os 100 números. Na tabela 5.2, foram
apresentados cinco conjuntos de médias quase-aleatórias de dois grupos
e as diferenças entre elas. As diferenças variavam de — 1,15 até 4- 2,15,
flutuações essencialmente casuais. Foram dadas também as médias reais
dos grupos experimental e de controle do estudo de Clark e Walberg.
A diferença entre elas foi de +4,76, consideravelmente maior que as
diferenças casuais. Outros exemplos semelhantes do princípio de compa
ração de resultados obtidos com expectativas casuais foram também dadas
no capítulo 5.
Os estatísticos inventam testes estatísticos e incorporam os resulta
dos que são essencialmente casuais — ou os limites dos resultados casuais
— em tabelas, para fácil referência. Cada teste estatístico tem um nome
e um objetivo específico. Vamos examinar três desses testes, um para
medidas contínuas, o teste t, aplicado para diferenças entre médias;
outro para freqüências (ou contagem), quiquadrado; e um terceiro, outra
vez um teste í, para coeficientes de correlação. No capítulo 14, na ver
dade, vimos o teste t e os resultados de Clark e Walberg, mas um tanto
superficialmente. Vamos examinar agora o mesmo exemplo com maiores
detalhes e maior profundidade. As médias dos grupos experimental e
de controle de Clark e Walberg foram 31,62 e 26,86. Será que esta
diferença de 4,76 é suficientemente diferente do acaso para justificar que
seja chamada uma diferença estatisticamente significante?
Em vez de tabelas gigantescas de médias casuais, nos moldes das
tabelas 5.2 e 5.3, os estatísticos criam fórmulas para testes de signifi-
cância estatística. Existe uma fórmula para t. (Na verdade há várias
fórmulas para t, dependendo do tipo de teste que estiver sendo feito.)
Em nosso caso, a diferença entre duas médias é dada no numerador da
fórmula e uma medida da variabilidade de diferenças casuais entre
médias no denominador, ou:
Tabela A .l V a lo re s selecionados d e u m a ta b e la f.
p* 0,05 0,01
g .l.b
10 1,81 2,76
15 1,75 2,60
25 1,71 2,49
30 1,70 2,46
108 1,66 2,36
‘ p : p ro b a b ilid a d e ; 0,05 e 0,01: níveis d e significância d e 0,05 e 0,01.

b g.l. = n ú m e ro to ta l d e casos m enos 2, o u N — 2.
354
Média 1 — Média 2
t = ------------------------------------------
Variabilidade de médias casuais
Tais fórmulas foram nitidamente caracterizadas como informação versus
erro (Diamond, 1959). A informação, neste caso a diferença entre duas
médias, está no numerador. O erro, no denominador. O resultado então é
conferido com uma chamada tabela t (dada em qualquer texto de esta
tística). As entradas de uma tabela t são razões t, como acima, e essas
razões t são dadas para amostras de grupos de diferentes números de
casos nas amostras e para níveis diferentes de significância (probabili
dades). Uma pequena parte de uma tabela t é dada na tabela A. 1.
p na tabela significa “probabilidade”, e g.l. significa graus de liber
dade, que não é necessário explicar. Neste caso g.l. é igual ao número
total de casos menos 2, ou N — 2. No estudo de Clark e Walberg,
havia 110 crianças; assim, g.l. = N — 2 = 110 — 2 = 108. Dois p ou
níveis de probabilidade são dados, 0,05 e 0,01. Estes são dois “níveis
de significância” usados comumente. A entrada para g.l. = 108, 1,66,
significa que se um t produzido pela fórmula t é 1,66 ou maior, então
a diferença entre as duas médias é estatisticamente significante: a dife
rença afasta-se significantemente da expectativa casual ao nível de 0,05;
não é um resultado que pudesse ter sido provavelmente produzido apenas
por acaso.
O í do estudo de Clark e Walberg foi 3,09.1 Suponhamos que
aceitemos o nível de 0,05 como nosso critério. Isto quer dizer que
estamos dispostos a aceitar um risco de 5 por cento de estarmos errados.
Já que o t obtido, calculado dos dados dos dois grupos de crianças, foi
3,09, e este é maior do que .1,66 da tabela, a diferença de 4,76 é estatisti
camente significante, o que significa que este resultado provavelmente
não é casual. Lembre-se que as entradas ria tabela são resultados casuais,
por assim dizer. Se o í obtido fosse, digamos, 1,54, então seríamos
forçados a dizer que a diferença de 4,76 entre as médias foi uma das
lnuitas diferenças que poderiam ter acontecido somente pelo acaso.
Portanto, não seria um resultado estatisticamente significante. Isto signi
fica, por sua vez, que realmente não houve diferença alguma de reali
zação em leitura entre os grupos experimental e de controle que pudesse
g p atribuída a outros fatores além do acaso, implicando assim que o
fêçforçamento maciço não teve qualquer efeito apreciável na realização
do grupo experimental de crianças.
1 C alcu lei este t d o a re s u lta d o s p u b licad o s. C om o isto foi feito n ã o te m im p o r

tân cia aqui.
555
Se quiséssem os ter consideravelmente mais segurança dá significân-
cia estatística da diferença de 4 ,7 6 , poderiamos ter escolhido o valor de
2 ,3 6 , correspondente ao nível de 0,0 1 . Então a diferença de 4,7 6 é esta
tisticam ente significante ao nível de 0,01, significando que há apenas
uma chance em 100 de obter diferença tão grande apenas pelo acaso.
A mesma conclusão do parágrafo antecedente se seguiría, só que esta
ríamos consideravelm ente mais seguros de que o resultado era estatis
ticamente significante. 2
Significância estatística: O teste de quiquadrado
O s testes t e outros semelhantes de significância estatística são

usados com m edidas contínuas. (Medidas contínuas, falando por alto,
estão em um a escala contínua de mensuração. Por exemplo, 1,0, 1,5,
1,7, 2 ,5 , 4 ,8 , implicam medidas contínuas.) H á muitas situações de
pesquisa, entretanto, nas quais é feita apenas contagem, por exem plo,
o número de congressistas republicanos que votaram a favor de determi
nada m edida versus os que votaram contra, o número de mães de classe
média que desmamaram seus filhos cedo, contra o número de mães de
classe operária que desmamaram seus filhos cedo. Este último exem plo é
do estudo de M iller e Swanson descrito nos capítulos 1 e 10. Tais dados
são dados de freqüência, conforme descrição do capítulo 10. Como
avaliamos a significância estatística de dados de freqüência?
Em um interessantíssimo estudo feito por W hiting e Child (1953),
foram testadas hipóteses psicanalíticas usando dados, do chamado arquivo
intercultural de Y ale (Murdock e outros, 1950). Nesses extensos arquivos
estão guardadas informações variadas sobre diferentes culturas. N o par
ticular subestudo que desejamos examinar, W hiting e Child selecionaram
39 das culturas ou sociedades e extraíram informação da informação
registrada para testarem a hipótese de que sociedades que fomentassem
a ansiedade oral em sua socialização de crianças explicariam as doenças
oralmente. Usando um procedimento de análise de conteúdo, classifi
caram as sociedades em duas formas: altas ou baixas em ansiedade oral
e usando ou não explanação oral para doença. O s resultados estão na
2 O uso da tábela f e de tabelas semelhantes tomar-se-á talvez obsoleto, como

foi indicado no capitulo 14. Os computadores podem calcular as probabilidades
dos t obtidos. Em vez de avaliar um resultado verificando se é igual ou maior
que um valor dado na tabela, o computador produzirá um valor “mais exato”.
Estes cálculos podem ser feitos até nas pequenas calculadoras, prograraáveis men
cionadas no capftuln 14. Por exemplo, calculei o valor p do t de 3,09 numa tal
máquina. A probabilidade foi de 0,001, que significa tuna chance apenas em
1.000, da diferença de 4,76 ocorrer por acaso. Obviamente n io precisei da tabela t.
356
tabela A .2. As entradas na tabela representam números de sociedades.
Por exemplo, 17 num total de 39 sociedades tinham alta ansiedade oral
e usavam também explicações orais para doença.
Tabela A .2 R elação e n tre a n sie d a d e o ral e ex p la n a ç ã o o ra l d a d o en ça, e stu d o de

W h itin g e C h ild (1953) *.
Sociedades com S ociedades sem

e x p lan a ção o ral ex p lan a ção o ral
S ociedades altas em 17 3 20
a n sie d a d e o ral (11,79) (8,21)
S ociedades b aix as em 6 13 19
a n sie d a d e oral (11,21) (7,79)
23 16 39
A s e n tra d a s d as células são freq ü ên cias. As e n tra d a s en tre p a rê n te se s são fre-

qüêrtcias esperadas, calculadaè dos to tais m arg in ais, p o r exem plo, (20) (23)/3 9
= 11,79. = 11,49, significante ao n ív el d e 0,01; C = 0,48. (V eja o tex to p a ra
u m a e x p lan a ção d e x 2 e C.)
Se calcularmos as proporções ou porcentagens da maneira descrita

no capítulo 10, veremos uma forte relação. Mas as porcentagens não são
calculadas porque isto não nos interessa aqui' e po,rque calcular porcen
tagens com tão poucos casos pode ser enganoso. Queremos realmente
testar as freqüências na tabela quanto ao seu afastamento em relação à
expectativa do âcáso. Para; fazermos isto, calculamos uma estatística
chamada quiquadrado (x 2), Como isto é feito precisamente não nos
interessa; mas sim a idéia. Os totais marginais (17 + 3 = 20,
17 + 6 = 23, e assim por diante) e o total de 39 são usados para
Calcular as freqüências de cada célula esperadas por acaso. A freqüência
esperada da primeira célula, por exemplo, é: (20 X 23) /39 = 11,79.
As freqüências esperadas foram inseridas nas células da tabela A . 2 entre
parênteses. A freqüência obtida para cada célula é comparada à freqüên
cia esperada para aquela célula. Quanto maiores as disçrepâncias, maior
distanciamento do acaso. Todas as discrepâncias para as quatro células
da tabela são 5,21.
Se não houvesse relação entre as duas variáveis, então as freqüências
obtidas nas células se aproximariam das freqüências esperadas. Se, por
gxemplo, as freqüências obtidas fossem as da tabela A .3, então as
diferenças entre as freqüências obtidas e as esperadas seriam menores,
tlssas diferenças são 2,21 para cada uma das quatro células da tabela
357
Tabela A .3 Cruzamento da tabela A .2, com freqüências "obtidas” fictícias, pró
ximas da expectativa de acaso*.
14 6 20
(11,79) (8.21)
9 10 19
(11,21) (7,79)
23 16 39
A® entraiâs üas células são freqüências. As entradas entre parênteses são fre
quências esperadas, calculadas dos totais marginais, por exemplo, (20)(23)/39
= 11,79. x2 = 2,06, significante ao nível de 0,01; C = 0,22. (Veia o texto para
uma explanação de x1 e C.) ^
A . 3 . Compare estas diferenças com as diferenças de 5,21 para a

tabela A . 2.
Como a razão t, é fácil calcular o quiquadrado. Se o fizerm os,
vam os obter, para os dados da tabela A . 2, 11,49. Este é comparado,
ao nível de 0 ,0 5 ou de 0,01 (ou outro) numa tabela de quiquadrado
(encontrada em qualquer texto de estatística) no número apropriado de
graus de liberdade, neste caso, g.I. = 1. A entrada 0,05 da tabela é
3,84; a entrada para 0,01 é 6 ,6 4 . É usado o m esm o raciocínio esboçado
para o teste t‘, se o quiquadrado obtido é igual ou maior que o qui
quadrado da tabela, então os dados são estatisticamente significahtes,
apartam-se suficientem ente da expectativa de acaso para justificar a
çrença na natureza não-casual da .relação que eles expressam. A hipótese
d e W hiting e Child fica confirmada: h á uma relação significativa entre
ansiedade oral e explanação oral da doença.
U m cálculo do quiquadrado das freqüências fictícias obtidas da
tabela A .3 revela 2,0 6 . Isto é m enos do que a entrada na tabela, ao
nível de 0,05, que é 3,84. Portanto, as freqüências “ obtidas” não se
separam significantem ente da expectativa.de acaso. Isto é, elas poderíam
ter surgido por acaso, dadas as mesmas freqüências marginais da
tabela A . 2 . 3 Assim , não há "nenhuma relação” entre ansiedade oral e
explanação oral da doença. Ê possível calcular medidas da magnitude
aproximada da relação em cruzamentos como as da tabela A . 2. e A . 3 .
Uma destas m edidas, comumente usada, chama-se coeficiente de contin-
3 As "verdadeiras" probabilidades associadas aos dois quiquadrados, calculadas

com um pequeno calculador programável, são: para 11,49, p = 0,0007; para
2,06, p = 0,1512.
358
gêttcia, ou C. C para a tabela A . 2 é 0 ,4 8 e para a tabela A .3 é 0,22.
Estes coeficientes C são apenas medidas aproximadas das relações. Eles
subestimam a magnitude das relações, por exem plo. Entretanto, dão uma
idéia da magnitude relativa das relações nas duas tabelas.
A significância estatística das correlações
Em princípio, a significância de qualquer resultado estatístico pode

ser testada. Isso às vezes pode ser difícil de fazer na prática, mas
teoricamente é sempre possível. O princípio básico de tais testes é a
comparação dos resultados obtidos com os resultados esperados pelo
acaso. Há duas maneiras gerais de se fazer isto. Uma, associada à
contagem ou enumeração das possibilidades de eventos, ficou discutida
e ilustrada no capítulo 5. Questões como: Q ual é a probabilidade de
obter um sete em uma jogada d e dois dados? Q ual é a probabilidade de
pegar todas copas em u ’a mão de bridge? Q ual é a probabilidade, em
uma amostra casual de 5 00 cidadãos adultos de Genebra, Suíça, de se
obter entre 24 0 e 26 0 hom ens, supondo-se que haja número igual de
homens e mulheres em Genebra?
Em princípio, responder tais perguntas exige contagem ou especifi
cação d e todas as possibilidades, contagem ou especificação do número
de vezes que o evento em questão possa ocorrer e depois calcular a fração
de probabilidade. Por exem plo, a probabilidade de dar um sete núma
jogada de dois dados, é de 6 /3 6 = 1 /6 = 0 ,1 7 , porque há 36 combi
nações possíveis de dois dados e seis possíveis maneiras de dar sete.
Tais questões podem sèr complicádas e difíceis de responder. A questão
sobre o número de homens e mulheres em uma amostra de cidadãos de
Genebra, por exem plo, não é fácil porque é difícil enumerar todas as
possibilidades. (Entretanto, quando outro m étodo disponível é usado, o
problem a se torna m ais fácil.)
A segunda maneira geral de comparar os resultados com expecta
tiva de acaso é estabelecer, por assim dizer, contingências casuais e
comparar os resultados obtidos com as contingências casuais. Fizemos
isto com o teste t e o teste do quiquadrado. Algumas fórmulas, com o as
usadas para os testes t e F, expressam perfeitamente a idéia. Tom e a
fórm ula para o teste t da significância da diferença entre duas médias.
Esta em uma forma um pouco diferente da outra dada antes:
Xt-Xt
359
onde Xi e X2 são as médias dos grupos 1 e 2 e EP . , _ é o chamado
Xj —X2
erro padrão das diferenças entre as duas médias. Um erro padrão é
uma medida de flutuação ao acaso. Neste caso é o erro padrão da
diferença entre duas médias. É um cálculo da variabilidade das diferen
ças entres as médias, tendo as médias sido calculadas de conjunto de dois
grupos de números aleatórios. Por exemplo, supondo que tiramos núme
ros aleatórios em conjuntos de dois, digamos, 20 números em cada grupo,
calculamos então as médias de cada conjunto e as diferenças entre estas
médias. Fazemos isto diversas vezes e calculamos então a variabilidade
(os erros padrões) das diferenças. Este erro padrão, então, é usado para
avaliar a magnitude da diferença obtida. Se a diferença obtida for “sufi
cientemente maior do que” o erro padrão, então a razão t é “grande”
e considerada estatisticamente significante.
Esta abordagem geral é muito usada nas ciências comportamentais.
Vamos agora ilustrá-la com a avaliação da significância estatística de
coeficientes de correlação. O raciocínio e o método são semelhantes.
A fórmula para o erro padrão, naturalmente, é diferente. A fórmula para
avaliar a significância estatística de um coeficiente de correlação.é:
r
t = ---------
EPr
Como calcular EPr, o erro padrão de r, não irá nos ocupar. O que
devemos notar é que temos novamente um teste t, e a forma da fórmula
é a mesma que foi usada para a significância da diferença entre duas
médias: informação (no numerador) contra erro (no denominador).
Vamos supor que estejamos interessados em compreender as atitu
des em relação às mulheres e, em consonância com um exemplo dado em
um capítulo anterior, acreditamos que as crenças sociais são sistematica
mente relacionadas, e que a crença na igualdade para as mulheres está
positivamente ligada à crença na liberdade sexual e legalização do aborto.
Ou seja, indivíduos que acreditam que deva haver considerável liberdade
sexual para ambos os sexos e que o aborto deveria ser legalizado e feito
quando a mulher o desejasse, também acreditam na igualdade para as
mulheres. Suponhamos ainda que tenham sido construídas escalas para
medir, por um lado, atitudes em relação à liberdade sexual e legalização
do aborto e, por outro, igualdade para as mulheres, que ambas as escalas
tenham sido aplicadas a 20 homens e que 0 coeficiente de correlação
entre as duas escalas seja 0,30.
Este r de 0,30 apóia nossa crença de que há uma correlação posi
tiva entre os dois conjuntos de crenças? Assim como com todas as
estatísticas, devemos perguntar se este r é estatisticamente significante.
360
Ou é um dos muitos r que poderíam ter sido calculados entre conjuntos
de números aleatórios? Se calculamos t para este r, obtemos t = 1,33.
O t da tabela, ao nível de 0,05 para 18 graus de liberdade (N — 2 —
20 — 2 = 18), que, digamos, aceitamos anteriormente como nosso
critério de significância, é 1,73. Nosso t obtido, entretanto, é de apenas
1,33. Já que é menor que 1,73, percebemos que nosso coeficiente de
correlação de 0,30 não é estatisticamente significante. Concluímos, por
tanto, que há pouca ou “nenhuma” relação entre nossos conjuntos de
crenças.
Suponhamos que o r obtido tenha sido de 0,62 com 20 sujeitos que
responderam ambas as escalas. Será estatisticamente significante? Sim, é.
O t então é 3,35, que é maior do que ambas as entradas ao nível de
0,05 e 0,01 da tabela t (o t para 0,05 é 1,73, como acima e o t para 0,01
é 2,55). O r de 0,62 é, portanto, estatisticamente significante e podemos
então pensar na magnitude de r e seu significado. Quer dizer que há
uma relação bastante substancial entre os dois conjuntos de atitudes:
indivíduos que acreditam em liberdade sexual e legalização do aborto
tendem também a acreditar na igualdade para as mulheres. Em resumo,
a significância estatística de um coeficiente de correlação é estabelecida
primeiramente, e depois sua magnitude é avaliada.
Observe que o tamanho de N, o tamanho da amostra, afeta a signi
ficância estatística das estatísticas. Suponhamos, por exemplo, que tivésse
mos obtido um r de 0,30, mas que houvesse 30 sujeitos que responde
ram aos instrumentos de atitude (em vez de 20 sujeitos). Então
t = 1,664. Embora isto não seja significante de acordo com a tabela
t — a entrada t ao nível de 0,05 para g.l. = 28 é 1,701 — é quase
significante. Se calcularmos a probabilidade com um computador, como
fizemos antes, encontraremos p = 0,054, apenas um pouco maior do
que 0,05. Assim, isto seria, embora marginal, sugestivo. Não o caracte
rizaríamos como claramente não significante. Se tivéssemos 35 sujeitos e
um r de 0,30, t = 1,807, que é significante ao nível de 0,05. (A proba
bilidade calculada pela máquina é p = 0,04.)
Há, naturalmente, muitos tipos diferentes de tèstes de significância
estatística. A maioria deles, por mais complicadas que sejam suas fórmu
las, são baseados no mesmo princípio relativamente simples: a compa
ração de resultados obtidos com resultados esperados por acaso. O leitor
deveria perceber, entretanto, que a significância estatística diz pouco
ou nada a respeito da magnitude de uma diferença ou de uma relação.
Com um número grande de sujeitos, digamos, mais de 200, a maioria
dos testes de significância mostra significância estatística, mesmo
quando uma diferença entre médias seja bastante pequena, talvez trivial,
ou um coeficiente de correlação seja muito pequeno e trivial. Com 1.000
sMieitos, por exemplo, um r obtido de 0,06 apenas é significante ao nível
361
de 0,05! Como sempre, não há substituto para o bom julgamento e para
a experiência. Para se usar a estatística adequadamente, é preciso com
preender os princípios e ser capaz de julgar se os resultados obtidos
são estatisticamente significantes e se são significativos no contexto par
ticular da pesquisa. Um coeficiente de correlação de 0,30 pode ser
baixo, até trivial, com um problema de pesquisa e ao mesmo tempo
ser substancial com outro problema.
362
Bibliografia
A d o m o , T . W ., F ren k el-B ru n sw ik , E ., L evinson, D . J. e S a n fo rd , R . N . The authori-

tarian personality. N e w Y o rk : H a rp e r & R o w , 1950.
A m e ric a n P sychological A sso ciatio n . Standards for educational and psychological
tests and manuais. W a sh in g to n , D . C .: A m e ric a n P sychological A ssociation,
1966.
A ro n so n , E. e G e ra rd , E . B eyond P a rk in so n ’s la w : T h e effect of excess tim e o n
su b s e q u e n t p e rfo rm a n c e . Journal of Personality and Social Psychology,
3:336-339, 1966.
A ro n so n , E . e M ills, J. T h e effect o f severity o f in itia tio n o n lik in g fo r a g roup.
Journal of Abnormal and Social Psychology, 59:177-181, 1959.
B a rk e r, R . G ., D em b o , T . e L ew in, K . F ru s tra tio n a n d regression. In : R . G .
B a rk e r, J. S. K o u n in e H . F. W rig h t (orgs.), Child behavior and development.
N e w Y o rk : M cG ra w -H ill, 1943.
B e n n e tt, E . L ., D ia m o n d , M . C ., K rech, D . e R osenzw eig, M . R . C hem ical a n d
a n a to m ic a l p lasticity o f b ra in . Science, 146:610-619, 1964.
B erelso n , B. e S te in e r, G . A . Human behavior: An inventory of scientific findings.
N e w Y o rk : H a rc o u rt, 1964.
B erk o w itz, L. A nti-S em itism a n d th e d isp lacem en t o f aggression. Journal of Abnor
mal and Social Psychology, 59:182-187, 1959. •
B erk o w itz, L. e W a lste r, E . Equity theory: Toward a general theory of social
interaction. N e w Y o rk : A cadem íc P ress, 1976.
B ock, R . D . e B arg m an n , R . E . A nalysis o f co v a ria n c e stru c tu re s. Psychometrika,
31:507-534, 1966.
B o n eau , E . A . T h e e ffe c ts o f violations o f assu m p tio n s u n d e rly in g th e t test.
Psychological Bulletin, 57:49-64, 1960.
B o rro w m an , M . H isto ry o f ed u catio n . In : C. H a rris (org.), Encyclopedia of edu
cational research (3.a e d .). N ew Y o rk : M acm illan , 1960.
B ra in , W . R . Science a n d antiscience. Science, 148:192-198, 1965.
B ra ith w a ite , R . B. Scientific explanation. C am b rid g e: C am bridge U n iv ersity Press,
1953.
B rier, A . e R o b in so n , I. Computers and the social Sciences. L o n d o n : H u tc h in so n ,
1974.
B ro o k s, H . C an Science survive in th e m o d e rn age? Science, 174:21-30, 1971.
C am p b ell, A . White attitudes toward black people. A n n A rb o r, M ich .: In stitu te
fo r S ocial R e se a rc h , U n iv ersity o f M ich ig an , 1971.
C am p b ell, D . T . e S tan ley , J. C. Delineamentos experimentais e quase-experimen-
tais de pesquisa. S ão P a u lo : E .P .U ./E D U S P , 1979.
C a n to r, N . e M ischel, W . T ra its as p ro to ty p e s: E ffects o n re c o g n itio n m em ory.
Journal of Personality and Social Psychology, 35:38-48, 1977.
C attell, R . B. T h e o ry o f flu id a n d c ry stalh z ed intelligence. Journal of Educational
Psychology, 54:1-22, 1963.
C hristie, R . e Ja h o d a , M . (orgs.). Studies in the scope and method of "The
Authoritarian Personqlity”. N ew Y o rk : F ree P ress, 1954.
C itro n , A ., C hein, I. e H a rd in g , J. A nti-m in o rity re m a rk s: A p ro b le m fo r a c tio n
research . Journal of Abnormal and Social Psychology, 45:99-126, 1950.
C lark , G. A . e W a lb e rg , H . J. T h e in flu e n c e of m assive re w a rd s o n re a d in g
a c h ie v em en t in p o te n tia l u rb a n school d ro p o u ts. American Educational
Research Journal, 5:305-310, 1968.
C olem an, J. S., C am p b ell, E . Q ., H o b so n , C. J., M c P a rtla n d , J., M ood, A . M .,
W ein feld , F . D . e Y o rk , R . L. Equality of educational opportunity. W ash in g to n ,
D . C.: G o v e rn m e n t P rin tin g O ffice, 1966.
C om roe, J. H . e Drípps, R . D . S cientific basis fo r th e s u p p o rt o f b iom edical
Science. Science, 192:105-111, 1976.
C ooley, W . W . e L o h n es, P . R. Multivariate procedures for the behavioral Sciences.
N ew Y o rk : W iley, 1962.
Cooley, W . W . e L ohnes, P. R . Multivariate data analysis. N e w Y o rk : W iley, 1971.
C ro n b ach , L. J. e M eeh l, P . E . C o n stru c t v alid ity in psychological tests. Psycho-
logical Bulletin, 52:281-302, 1955.
C u trig h t, P. N a tio n a l p o litical d e v elo p m en t: M easu rem en t a n d analysis. American
Sociological Review, 27:229-245, 1963.
D eu tsch , K . W ., P la tt, J. e S enghaas, D . C o n d itio n s fa v o rin g m a jo r ad v an ces in
social Science. Science, 177:450-459, 1971.
D iam o n d , S. Information and error. N e w Y o rk : Basic B ooks, 1959.
D o lla rd , ]., D o o b , L. W ., M iller, N . E., M o w rer, O . H . e S ears, R . R. Frustration
and aggression. N e w H av en , C o n n .: Y ale U niversity P ress, 1939.
D u b o s, R . S cien tist a n d p u b lic . Science, 733:1207-1211, 1961.
D uB ridge, L . A . S cience serves society. Science, 764:1137-1140, 1969.
D u n c a n , O . D ., F e a th e rm a n , D . L. e D u n c a n , B. Socioeconomic
background and
achievement. N e w Y o rk : S em in ar P ress, 1972.
E d w a rd s, A . L. Statistical methods (3.a ed.). N ew Y o rk : H o lt, R in e h a rt a n d
W in sto n , 1973.
E d w a rd s, A . L . Experimental design in psychological research (4.* ed .). N e w Y o rk :
H o lt, R in e h a rt a n d W in sto n , 1972.
E tzioni, A . Modem organizations. E n g lew o o d C liffs, N .J.; P ren tice-H all, 1964.
F estinger, L. A theory of cognitive dissonance. S ta n fo rd , C alif.: S ta n fo rd U n iv ersity
P ress, 1957.
F estin g er, L. e K atz, D . (orgs.). Research methods in the behavioral Sciences. N e w
Y o rk : H o lt, R in e h a rt a n d W in sto n , 1953.
F lavell, }. H. The developmental psychology of Jean Piaget. P rin c e to n , N .J.: V a n
N o stra n d , 1963.
F red erik sen , N ., Jensen, O . e B eaton. E. A . Organizational climates and administra-
tive performance. P rin c e to n , N .J.: E d u c a tio n a l T e stin g S ervice, 1968.
G ates, A . e T a y lo r, G . A n ex p e rim e n ta l stu d y of th e n a tu re o f im p ro v em en t
resu ltin g fro m p ra c tic e in a m e n ta l fu n c tio n . Journal of Educational Psycho
logy, 76:583-592, 1925.
G etzels, J. W . e G u b a , E. G . R ole, ro le co n flict, a n d effectiveness. American
Sociological Review, 79:164-175, 1954.
364
Goldfarb, W. The effects of early institutional care on adolescent personality.
Journal o f E xperim ental Educatioh, 12: 106-129, 1943.
Green, B. F. D igital com ptiters in research. N ew York: McGraw-Hill, 1963.
Guilford, J. P. Psychom etric m ethods { 2 ‘ ed.). N ew York: McGraw-Hill, 1954.
Guilford, J. P. The structure of intellect. Psychological Bulletin, 53:267-293, 1956.
Guilford, J. P. Three faces of intellect. A m erican Psychologist, 14:46 9-479, 1959.
Guilford, J. P. T h e nature o f h um an intelligence. New York: McGraw-Hill, 1967.
Guthrie, E. R. T h e psychology o f learning. New York: Harper e Brothers, 1935.
Hartz, L. T h e liberal tradition in Am erica. New York: Harcourt, 1955.
Harvey, J. H., Ickes, W. J. e Kidd, R. F. N e w directions in a ttribution research
(Vol. 1). Hillsdale, N.J.: Lawrence Erlbaum Associates, 1976.
Harvey, J. H. e Kelley, H. H. Sense of own judgmental competence as a function
of temporal pattem of stability-instability in judgment. Journal o f Personality
a n d Social Psychology, 29:526-538, 1974.
Hays, W. L. Statistics fo r the social Sciences (2.* ed.). New York: Holt, Rinehart
and Winston, 1973,
Hilgard, E. R., Atkinson, R. C. e Atkinson, R. L. Intro d u ctio n to psychology
(6.* ed.). New York: Harcourt, 1975.
Holtzman ,W. H. e Brown, W. F. Evaluating the study habits and attitudes of
high school students. Journal o f E ducational Psychology, 59:404-409, 1968.
Howells, W. W. The importance of being human. In: J. M. Tanur <org .), Statistics:
A guide to th e un kn o w n . San Francisco: Holden-Day, 1972.
Hurlock, E. An evaluation of certain incentives used in schoolwork. Journal o f
Educational Psychology, 16:145-159, 1925.
Husén, T. (org.). International stu d y o f achievem ent in m athem atics: A com parison
o f tw elve countries (Vols. I e II). New York: Wiley, 1967.
Hyman. H. H., Wright, C. R. e Reed, J. S. T h e enduring effects o f education.
Chicago: University of Chicago Press, 1975.
Jones, E. E., Kanouse, D. E., Kelley, H. H., Nisbett, R. E., Valins, .S. e Weiner, B.
A ttribution: Perceiving th e causes o f behavior. Morristown, N.J.: General
Learning Press, 1971.
Jones, E. E., Rock, L., Shaver, £ . G., Goethals, G. R. e Ward, L. M. Pattem of
performance and ability attribution: An unexpected primacy effect. Journal o f
Personality and Social Psychology, 10:317-340, 1968.
Jõreskog, K. G. Analyzing psychological data by structural analysis of çovariance
matrices. In: D. H. Krantz. R. C. Atkinson, R. D. Luce e P. Suppes (orgs.),
Contem porary developm ents in mathematiccd psychology (Vol. II): Measure-
m eni, psychophysics, a n d inform ation processing. San Francisco: Freeman,
1974.
Jõreskog, K. G. Structural equation models in the social Sciences: Specification,
estimation and testing. Research report 76-9. Uppsala, Sweden: Uppsala Uni
versity, 1976.
Katz, D. e Braly. K. W. Racial prejudice and racial stereotypes. Journal o f
A bnorm al and Social Psychology, 3 0: 175-193, 1935.
Kemeny, J. G. A phitosopher tooks at Science. Princeton, N.J.: Van Nostrand, 1959.
Kemeny, J. G., Snell, J. L. e Thompson, G. L. In tro d u ctio n to fin ite m athem atics
(2.* ed.). Englewood CUffs, N.J.: Prentice-Hall, 1966.
Kerlinger, F. N. Social attitudes and their criterial referents: A structural theory.
Psychological R ev iew , 74:110-122, 1967.
Kerlinger, F. N. The structure and content of social attitude referents: A prelimi-
nary study. Educational and Psychological. Measurement, 32:613-630, 1972.
Kerlinger, F. N. The influence of research on educational practice. Educational
Researcher, 6:5-12, 1977.
Kerlinger, F. N. Foundations of behavioral research (2.a ed.). New York: Holt,
Rinehart and Winston, 1973.
Kerlinger, F. N. e Pedhazur, E. J. Multiple regression in behavioral research. New
York: Holt, Rinehart and Winston, 1973.
Kerlinger, F. N., Middendorp, C. P. e Amón, J. The structure of social attitudes
in three countries: Tests of a criterial referent theory. International Journal of
Psychology, 11:265-279, 1976.
Kidd, C. V. Basic research — Description versus definition. Science, 129:368-371,
1959.
Kirk, R. The conservative mind (ed. revista). Chicago: Henry Regnery, 1960.
Kirscht, J. P. e Dillehay, R. C. Dimensions of authoritarianism: A review of
research and ikeory. Lexington, Ky.: University of Kentucky Press, 1967.
Krech, D. e Crutchfield, R. S. Theory and problems of social psychology. New
York: McGraw-Hill, 1948.
Lee, R. S. Social attitudes and the Computer revolution. Public Opinion Quarterly,
34:53-59, 1970.
Likert, R. e Hayes, S. P. (orgs.). Some applications of behavioral research. Paris:
UNESCO, 1957.
Lindsay, P. H. e Norman, D. A. Human information processing: An introduction
to psychology (2.a ed.). New York: Academic Press, 1977.
Lindzey, G. e Aronson, E. (orgs.). The handbook of social psychology (Vol. 2).
Reading, Mass.: Addison-Wesley, 1968.
Marjoribanks, K. Ethnic and environmental influences on meiítal abilities. Ameri
can Journal of Sociology, 78:323-337, 1972.
Markus H. Self-schemata and processing information about the self. Journal of
Personality and Social Psychology, 35:63-78, 1977.
McClelland, D. C. The achieving society. Princeton, N.J.: Van Nostrand, 1961.
McClelland, D. C., Atkinson, J. W., Clark, R. A. e Lowell, E. L. The achievement
motive. New York: Appleton, 1953.
McConnell, J. V., Jacobson, A. L. e Kimble, D. P. The effects of regeneration
upon retention of conditioned response in the planarian. Journal of Compara
tivo and Physiological Psychology, 52:1-5, 1959.
Milgram, S. Obedience to authority. New York: Harper & Row, 1974.
Miller, N. E. Neal E. Miller: Selected papers. Chicago: Aldine, 1971.
Miller, D. R. e Swanson, G. E. Inner conflict and defense. New York: Holt,
Rinehart and Winston, 1960.
Morrow, J. e Smithson, B. Learning sets in an invertebrate. Science, 159:850-851,
1969.
Murdock, G. et al. Outlines of cultural materiais (3.‘ ed.). New Haven, Conn.:
Human Relations Area Files, 1950.
Nagel, E. The structure of Science. New York: Harcourt, 1961.
Nunnally, J. Psychometric theory. New York: McGraw-Hill, 1967.
Page, E. B. Teacher comments and student performance: A seventy-four classroom
experiment in school motivation. Journal of Educational Psychology,
49:173-181, 1958.
366
Parkinson, C. N. Parkinson’s law. London: John Murray, 1957,
Platt, J. R. Strong inference. Science, 146:347-353, 1964.
Report of the National Advisory Commission on Civil Disorders. Bantam Books,
1968.
Robinson, J. P., Rusk. J. G. e Head, K. B. Measures of political attitudes. Ann
Arbor: Institute for Social Research, University of Michigan, 1968.
Robinson, J. P. e Shaver, P. R. Measures of social psychological attitudes. Ann
Arbor: Institute for Social Research, University of Michigan, 1969.
Roe, A. e Siegelman, M. The origin of interests. Washington, D.C.: American
Personnel and Guidance Association, 1964.
Rogers, C. R. Persons or Science? A philosophical question. American Psychologist,
10:267-278, 1955.
Rokeach, M. The nature and meaning of dogmatism. Psychological Review,
67:194-204, 1954.
Rokeach, M. The open and closed mind. New York: Basic Books, 1960.
Rokeach, M. Beliefs, attitudes, and values. San Francisco: Jossey-Bass, 1968.
Rokeach, M. The nature of human values. New York: Free Press, 1973.
Rokeach, M. e Mezei, L. Race and belief as factors in social choice. Science,
757:167-172, 1966.
Rosch, E. H. Natural categories. Cognitive Psychology, 4:328-350, 1973.
Rosenberg, M. Factors influencing change in occupational choice. In: P. Lazarsfeld
e M. Rosenberg (orgs.), The language of social research. New York: Free
Press, 1955.
Rossiter, C. Conservatism in America (2.a ed.). New York: Vintage, 1962.
Rozeboom, W. W. Poundations of the theory of prediction. Homewood, 111.: Dorsey
Press, 1966.
Schachter, S., Elertson, N., McBride, D. e Gregory, D. An experimental study of
cohesiveness and productivity. Human Relations, 4:229-238, 1951.
Shaver, K. G. An introduction to attribution processes. Cambridge, Mass.:
Winthrop Publishers, 1975.
Shaw, M. E. e Wright, J. M. Scales for the measurement of attitudes. New York:
McGraw-Hill, 1967.
Simpson, G. E. e Yinger, J. M. Racial and cultural minorities (3.a ed.). New York:
Harper & Row, 1965.
Snedecor, G. W., & Cochran, W. C. Statistical methods (6.a ed.). Ames, lowa:
Iowa State University Press, 1967.
Social Science Research Council. Theory and practice in histórical study: A report
of the committee on historiography. New York: Social Science Research
Council, 1946.
Sontag, H. Attitudes toward education and perception of teacher behaviors. Ameri
can Educational Research Journal, 5:385-402, 1969.
Stephenson, W. The study of behavior. Chicago: University of Chicago Press, 1953.
Stevens, S. S. Mathematics, measurement and psychophysics. In: S. S. Stevens
(org.), Handbook of experimental psychology. New York: Willey, 1951.
Stouffer, S. A. Communism, conformity, and civil liberties. Garden City, New
York: Doubleday, 1955.
Sullins, W. L. Matrix algebra for statistical applications. Danville, 111.: Interstate
Printers and Publishers, 1973.
Tatsuoka, M. M. Discriminant analysis: The study of group differences. Champaign,
111.: Institute for Personality and Ability Testing, 1970.
Tatsuoka, M. M. Mulíivariate analysis: Techniques for educational and psycholo-
gical research. New York: Wiley, 1971.
Thomson, G. The two aspects of Science. Science, 132:996-1000, 1960.
Thorndike, R. L. Reading comprehension education ín jifteen countries: Interna
tional studies in evaluation (Vol. III). New York: Wiley, 1973.
Thurstone, L. L. e Thurstone, T. G. Factorial studies of intelligence. Chicago:
University of Chicago Press, 1941.
Townes, C. H. Quantum electronics, and surprise in development of technology.
Science, 159:699-703, 1968.
Turing, A. M. Can a machine think? In: J. R. Newman (org.), The world of
mathematics (Vol. 4). New York: Simon & Schuster, 1956.
Walster, E., Cleary, T. A. e Clifford, M. M. The effect of race and sex on college
admission. Journal of Educational Sociology, 44:237-244, 1971.
Walster, E., Walster, G. W., Piliavin, J. e Schmidt, L. “Playing hard to get”:
Understanding an elusive phenomenon. Journal of Personality and Social
Phychology, 26:113-121, 1973.
Waterhian, A. T. Federal support of Science. Science, 153:1359-1361, 1961.
Weizenbaum, J. Computer power and human reason. San Francisco: Freeman, 1976.
Whiting, J. W. M., e Child, I. L. Child training and personality: A cross-cultural
study. New Haven, Conn.: Yale University Press, 1953.
Wiley, D. E., Schmidt, W. H. e Bramble, W. J. Studies of a class of covariance
structure models. Journal of the American Statistical Association, 68:317-323,
1973.
Woodmansée, J. J. e Cook, S. W. Dimensions of verbal racial attitudes: Their
identification and measurement. Journal of Personality and Social Psychology,
7:240-250, 1967.
Worell, L. Levei of aspiration and academic success. Journal of Educational
Psychology, 50:47-54, 1959.
368
ín d ic e o n o m á s tic o
Adorno, T. W. 63n, 71, 154, 339 Comroe, J. H. 129, 331

Amén, J. 228-232, 256, 274 Cook, S. W, 221-226
Aronson, E. 27, 81n, 95-96, 102-104, 105, Cooley, W. W. 238n, 252, 253, 260
113, 119, 131, 161, 321, 352
Cronbach, L. J. 159n
Atkinson, J. W. 264
Crutchfield, R. S. 338
Atkinson, R. C. 322n, 333n Cutright, P. 199-200
Atkinson, R. L. 322n, 333n
Bargmann, R. E. 225n Dembo, T. 47

Barker, R. G, 47 Deutsch, K. W. 129, 332, 345
Beaton, E. A. 36 Dewey, J. 335
Bem, D. J. 333n Diamond, M. C. 38, 138-139
Bennett, E. L. 38, 138-139 Diamond, S. 355
Berelson, B. 137 Dillehay, R. C. 341n
Berkowitz, L. 36, 43, 117-118, 131n, 236 Dollard, J. 40, 71, 117
Bock, R. D. 225n Doob, L. W. 40
Boneau, E. A. 302 Dripps, R. D. 129, 331
Borrowman, M. 348 Dubos, R. 329
Brain, W. R. 329 Duncan, B. 312
Braithwaite, R. B. 318 Duncan, O. D. 312
Braly, K. W. 338
Bramble, W. J. 225n Edwards, A. L. 62n, 113, 301
Brier, A. 284n Ellertson, N. 38
Brooks, H. 329 Etzioni, A. 36
Brown, W. F. 48, 187-189, 192, 244
Burt, C. 343 Featherman, D. L. 312
Festinger, L. 103«, 114, 127n, 352
Campbell, A. 325, 338 FlavelI, J. H. 335«
Campbell, D. T. 113, 114 Flowerman, S. H. 339
Campbell, E. Q. 134-135 Frederiksen, H. 36
Cantor, N. 312 Frenkel-Brunswik, E. 63n
Cattell, R. B. 218, 254, 264, 318, 333 Freud, S. 41-42
Chein, I. 106n
Child, I. L. 356-357 Gates, A. 42, 43
Christie, R. 341« Gerard, E. 113
Citron, A. 106n Getzels, J. W. 144
Clark, C. A. 4-5, 8, 9, 11, 27, 35, 36, 47, Goethals, G. R. 334
86, 91, 96, 141, 236, 324, 327-328, Godfarb, W. 137-138
329, 354-355 Green, B. F. 284n, 294n
Clark, R. A. 264 Gregory, D. 38
Cleary, T. A. 115-116 Guba, E. G. 144
Clifford, M. M. 115-116
Guilford, J. P. 155n, 205, 218-220, 233,
Cochran, W. C. 99« - 254
Coleman, J. S. 134-135, 254 Guthrie, E. R. 113
369
Harding, J. 106» Markus, H. 312
Hartz, L. 232 Meehl, P. E. 159»
Harvey, J. H. 333», 334 Mezei, L. 43
Hayes, S. P. 172» Middendrop, C. P. 228-232, 256, 274
Hays, W. L. 301 Milgram, S. 120-130, 131», 143, 321
Head, K. B. 232 Miller, D. R. 6-9, 28, 36, 91, 110, 164,
Üilgard, E. R. 322», 333» 170, 356
Hobson, C. J. 134-135 Miller, N. E. 16, 40
Holtzman, W. H. 48, 187,189, 192, 244 Mills, I. 27, 81», 95-96, 102-104, 119,
Horkheimer, M. 339 131, 141, 321
Howells, W. W. 247-248, 251-252n Mischel, W. 312
Hurlock, E. 36, 47 Mood, A. M. 134-135
Husén, T. 325 Morrow, J. 314
Hyman, H. H. 166-170» Mowrer, O. H. 40
Murdock, G. 356
Ickes, W. J. 333»
Nagel, E. 316»
Jacobson, A. L, 322 Nisbett, R. E. 333»
Jahoda, M. 341» Norman, D. A. 38, 294»
Jensen, O. 36 Nunnally, ). 155»
fohnson, L. B. 175
Jones, E. E. 333», 334
Joeskog, K. 254-263 Page, E. B. 3
Parkinson, C. N. 113
Kanouse, D. E. 333» Pedhazur, E. J. 264»
Katz, D. 127», 338, 352 Piaget, J. 335
Kaya, E. 272» Pilivian, J. 42
Kelley, H. H. 333», 334 Platt, I. R. 124, 129, 332, 345
Kemeny, J. G. 53, 79 Potok, C. 311
Kerlinger, F. N. 30», 69,115», 165» 174»,
228-232, 255, 264», 272», 274, 317», Reed, J. S. 166-170
328», 331», 352, 353 Robinson, I. 284»
Kidd, C. V. 333» Robinson, I- P. 232
Kidd, R. F. 321 Rock, L. 334
Kimble, D. P. 322 Roe, A. 237-238
Kirk, R. 232 Rogers, C. R. 306
Kirscht, J. P. 341» Rokeach, M. 43, 136-137, 158, 302, 340»
Krech, D. 38, 138-139, 338 Rosch, E. H. 36
Rosenzweig, M. R. 38, 138-139
Lee, R. S. 295 Rossiter, C. 232
Lenin, V. I. 346» Rusk, J. C. 232
Levinson, D. J. 63»
Lewin, K. 47 Sanford, R. N. 63»
Likert, R. 172» Schachter, S. 38
Lindsay, P. M. 38, 294»
Schmidt, L. 42
Lindzey, G. 352
Lohnes, P. R. 238», 252, 253, 260 Schmidt, W. H. 225»
Lorge, I. 272n Sears, R. R. 40
Lowell, E. L. 264 Senghaas, D. 129, 332, 345
Shaver, K. G. 333», 334
McBride, D. 38 Shaver, P. R. 232
McClelland, D. C. 8, 264 Shaw, M. E. 232
McConnell, J. V. 322 Síegelman, M. 237-238
McPartland, J. 134-135 Simpson, G. E. 338»
Marjoribanks, K. 194-199 Skinner, B. F. 314
370
Smithson, B. 314 Valins, S. 333n
Snedecor, G. W. 99n Van Heerden, J. 316n
Snell, J. L. 53
Sontag, M. 227-228 Walberg, H. J. 4-5, 8, 9, 11, 27, 35, 36,
Stanley, J. C. 113, 141 47, 75, 86, 91, 96, 141, 236, 324,
Steiner, G. A. 137 327-328, 329, 354-355
Stephenson, W. 226, 3 lln , 314-315 Walster, E. 42, 49, 115-117, 131n
Stevens, S. S. 145 Walster, G. W. 42
Stouffer, S. A. 163-164, 170, 171, 172 Ward, L. M. 334
Sullins, W. L. 260 Waterman, A. T. 329
Swanson, G. E. 6-9, 28, 36, 91, 110, 164, Weiner, B. 333n
170, 356 Weinfeld, F. D. 134-135
Weizenbaum, J. 274, 276
Tatsuoka, M. M. 249, 250n, 260 Whiting, J. W. 356-357
Taylor, G. 42, 43 Wiley, D. E. 255n
UNÍVERSIDADF FEPFRAL D0 PARÁ

Thompson, G. L. 53 Woodmansee, J. J. 221-226
Thomson, G. 329 Worell, L. 43
Thorndike, R. L. 325 Wright, C. R. 166-170
Thurstone, L. L. 206-207, 233, 271 Wright, J. M. 232
Thurstone, T. G. 206
Townes, C. H. 129, 329 Yinger, ]. M. 338n
Turing, A. M. 293 York, R. L. 134-135
ín d ic e a n a lític o
A b stra ç ã o 15 ------- e comportamento do professor

acaso 79-81 226-228
— e p ro b a b ilid a d e e p e sq u isa 81-84, ------- e computador 271-272, 289
86-87 ------- elementos de 207-217
adm issão a fa c u ld a d e s e d iscrim in ação ------- estudos de Guilford sobre a es
115-117 trutura de intelecto 218-220
agressão 23 ------- exemplo fictício 209-212
álg eb ra das m atrizes 258-259 ------- exemplos em pesquisa 218-232
algoritm o 286-288 ------- interpretação de problemas
am b ie n te 194-199 224-225
am p litu d e 61« ------- tamanho da amostra 231
am o stra 90 ------- teoria de atitudes sociais 228-232
am ostragem ------- uma apreciação 233-234
— a le a tó ria e stra tifiç a d a 171 — multivariada 235, 254
— c asu al 100, 115n, 170-171 — secundária de dados 166, 168
análise aprendizado de uma língua estrangeira
— d e c o n te ú d o 239-242
-------- e c o m p u ta d o r 291 — e análise discriminante 242-244
-------- e o in d iv íd u o 312-315 arquivo intercultural de Yale 356
— de e s tru tu ra de c o v a riâ n c ia 254-269 atitudes sociais
c o m p a ra d a com a análise d e tr a — e raça 325-326
je tó ria 268-269 — teoria de 228-232
-------- e c o m p u ta d o r 273 — teoria dos referentes criteriais 229
-------- e p ro g ra m a s d e c o m p u ta d o r autoridade e obediência 120-123
254n, 255 autoritarismo
-------- exem plo te ó ric o 255-262 — e preconceito 337-341
— d efin ição 353 — significado do 158
— d e fre q ü ê n c ia 173-177
— d e regressão 190-201 Blocos de fatores 216
— d e tra je tó ria 264-269
-------- c o m p a ra d a com an álise d e regres
Capacidade mental 194-199, 209-212
são 265
-------- e an álise d e e s tru tu ra d e cova
— verbal 203, 206
riâ n c ia 268-269
cargas fatoriais 206, 213-216
— de v a riâ n c ia 82 — definição 204
— d isc rim in a n te 242-254 casualização
e p re d iç ã o 300n — definição 97, 102
-------- u m ex em p lo d e p e sq u isa 247-249 — e delineamento 97-104
— e e statística 353-362 — e designação aleatória 99-102
— fa to ria l 202-234 — princípio de 102
-------- ab o rd ag em q u a n tita tiv a e esp acial classe social e tempo de desmame 6-9
212-217 ciência(s)
-------- a titu d e s ra c ia is 220-225 — abstração da 304-305
-------- d a in telig ê n c ia 205-207 — bem-estar humano 19-21
-------- d e fin ição 203 — caráter empírico 15-17
372
—- e engenharia 320 — n a an álise dos d ad o s 170
~ — e o indivíduo 303-313 co rre la ç ã o 60, 183-184, 207-209
— e pragmatismo 327-329 — a lta e a n á lise de reg ressão 199-201
— e valor 302-303, 341-346 — c a n ô n ic a 239-242
— naturais e objetividade 12-13 — e n tre ind iv íd u o s 226-228
— natureza geral da 3-9 — fo rç a d a 260-262
— neutralidade da 37-38 — m o m e n to -p ro d u to 184
— objetivo da 17-21 — sig n ificân cia e statística d a s 359-362
— social (ver pesquisa comportamental) — zero 2 1 l n
— versus humanidades 344 “ c o rre la to s” 163w
— unidade de discurso 311-316 c o v a riâ n c ia 30,183-184
classificação, fidedignidade 153 — an álise de e stru tu ra s d e 254-269
coeficiente c ria tiv id a d e
— de consistência interna 153 — o b serv açõ es d a 10
— de contingência 358-359 — p re d iç ã o d a 307-308
— de correlação 60, 61, 64, 183-184, 270 c ru z a m e n to 174
múltipla 192-194 — e an á lise d e fre q ü ê n c ia 177
— de fidedignidade 153 c u rio sid a d e c ien tífica 202
de teste-reteste 153
— de regressão 190 D a d o s 28-29
— de trajetória 265 — c o le ta d e 349-352
Comitê Judeu Norte-Americano 339-340 d e fin ição
comportamento — c o n stitu tiv a 46
— do professor 226-228 — o p e ra c io n a l 46-50
—■inteligente 233 -------- c rític a d a 49-50
— observação do 351-352 -------- e x p e rim e n ta l 47
computador 271-295 -------- fu n ç ã o d a 47-48
— calculadoras programáveis 282-283 -------- m e d id a 47
— características dos 273-277 -------- m e d in d o a in te lig ê n c ia 147-148
— caráter internacional 291-292 — p o r re g ra 53
— desvantagens de 292-295 — te ó ric a 77
— e tabela t 356n d elin eam en to (s)
— iteração 287-288 — c a su alização 97-104
— raiz quadrada 286-289 — “ clássico ” 105
— efeitos na pesquisa comportamental — d e p e sq u isa 94, 119
271-273, 289-295 — d e u m a só v ariá v e l in d e p e n d e n te
— limitações 275 94-107
— usos e operações 284-289 -------- g en eralização 97
— viciados 276 ---------lim ita ç ã o 104
conceito — fa to ria is 105-119
— definição 23 -------- dois-por-dois 107
— variável 45-46 -------- 2x2x3 115-117
concepção bipolar 229, 256 -------- exem plo fictício 106-113
conhecimento, bases do 1-2 -------- exem plos d e p e sq u isa 113-118
conjuntos 52 -------- fo rm a s 112
conservadorismo 228-232, 340 -------- v an tag e n s 106
constante 45n desig n ação a le a tó ria 27, 94-95
constructo — e casu alização 99-102
— na hipótese 41-42 d e so rd e n s civis 175-176
— variável 25, 45-46 (ver também con d ia g ra m a d e tra je tó ria 264
ceito) d ife re n ç a s casuais 87-89
contaminação 125 d ire ç ã o d e in flu ê n c ia 263, 264
contar, como mensuração 178n d isc ip lin a
controle 123-130 — id io g ráfica 305-306
— definição de 123-124 — n o m o té tic a 305-306
distorção e propósito da ciência 20 — reco m p en sa m a c iç a e ap ro v e ita m e n to
distribuição n a le itu ra 4-5
— de freqüência 174 — testagem d a te o ria 125-126
— normal 301n — “ v e rd a d e iro ” 141-142
divergência geométrica 249-251 explicação(ões) 8, 15, 118-119
dogmatismo 158-159. — com o p ro p ó sito 17-20
— e m e lh o r p re d iç ã o 196
ductilidade 275
— e o b je tiv id a d e 13-14
— n a tu ra is 70
Efeito(s)
— teo ria e relaçõ es 69-73
— da privação 137, 141
— heurístico 334
F a to r
— principais 110 — d efinição 203-204, 221-225
entrevista 163, 350 — de pessoa 227
equação de regressão 190, 246 — ro ta ç ã o d e 216 n, 294
erro padrão 360 fid e d ig n id a d e 91, 148-155, 159
escala(s) 29 — com o e sta b ilid a d e 153
— D (dogmatismo) 158-159 — d efin ição d e 149-150, 152
— definição 351 — exem plos 150-154
— F 154, 158 — im p o rtâ n c ia d a 154-155
— objetiva 11, 350-351 fo n te
escolarização, efeitos duráveis da 166-170 — p rim á ria 348
escolha ao acaso 4n — se c u n d á ria 348
estado agêntico 126 F o rtra n 277-281
estatística 348-349 freq ü ên cia(s)
— concepção errônea da 92-93 — com o m e n su ra ç ã o 178n
— definição 89-90, 353 — d efin ição 173-174
— descritiva 90 — relativ as 173n
— e análise 352-362 fu m o e p e sq u isa d o c â n c e r 132-133
— e realidade 92-93
— influência 91 G en erá liz a ç ã o 129-130
— propósito da 93 gráficos de relaçõ es 62-63
graus d e c erteza 74-75
estereótipo
— racial 225-226, 339-340 gru p o
— d e c o n tro le 5
— sexual 115-117
— e x p e rim e n ta l 5
estudo (s)
— da tolerância e intolerância 163-164
H ip ó tese(s) 38-44
— de caso 313 — de dois fa to re s 257
— definição 26-27 — d e . in te ra ç ã o 110, 117
— de igualdade e liberdade 136-137 — e te s ta b ilid a d e 41-42
— longitudinal 166, 168 — exem plos d e 42-44
— sobre predição 187-189 — te ste d a 82-84
estrutura fatorial 204 — v a lo r das 39-41
etnia 194-199 h isto rio g ra fia 348
etnocentrismo 341
evento 77, 84 Ig u a ld a d e d e o p o rtu n id a d e edu cacio n al
experimento(s) [veja re la tó rio C o lem an)
— artificialidade do 128 in d e p e n d ê n c ia 84-86, 109, 184-185
— características 26-27, 125-127 ín d ice 6 2 n
— definição 3, 94-95, 125, 143 in d iv íd u o
— e estudo não-experimental ( veja pes — e a n álise d e c o n te ú d o 312-314
quisa não-experimental) — e ciência 303-313
— generalização do 129-130 — e p e rfis 309-311
— no campo 95, 127« — e p re d iç ã o 306n
374
— estatística do 31 ln, 314-315 — crítica da 160
inferência(s) 91 — d e fin iç ã o 145
— causais 13 ln, 181n, 199 — d isc rim in a ç ã o 146-147
inteligência — do d ogm atism o 158-159
— análise fatorial da 204-207 — em p e rsp e c tiv a 159-161
— conhecimento acerca da 344-346 — fid e d ig n id a d e d a 148-155
— e efeitos na educação 168-170 — in telig ên cia 147-148
— e realização 181-182 — n o m in a l 178n, 243
— estudos de Guilford 218-221 — v a lid a d e d a 160
— fatores da 209-212 m é to d o (s)
— geral 218 — d o s g ru p o s co n h ecid o s 158
— medindo 147-148, 299-303 — q u a n tita tiv o s 209-302
— teoria de Thurstone 205-207 m eto d o lo g ia 296-316, 335-336
— verdadeira e funcional 148 — Q 226-227, 314-315
interação de variáveis 108, 112 m odelo
— sexo e capacidade 116-117 — c asu al 265
International Studies of Educational — lin e a r 238«-239n
Achievement 325
inversão de matriz 275 National Advisory Commission on Civil
investigação Disorders 325
— história 347-348 nível
— sociológica 162-170 — do discu rso 328n
------- classe social e tempo de desmame — d e significância 354, 355
164 n o ta (s)
------- conclusão 178 — d isc rim in a n te s 251-252
------- efeitos duráveis da escolarização — p a d rã o 310n
166-170 — p re d ita s 245-246
------- estudo de tolerância e intolerân — v e rd a d e ira 150 ( veja p o n to )
cia de Stouffer 164-165 n ú m e ro s 146n
------- valores orientados para pessoas — ale a tó rio s 69, 80
e escolha ocupacional 165-166 p o r c o m p u ta d o r 284
itens 29, 254n
iteração 287-288 O b e d iê n c ia e a u to rid a d e 120-123
o b je tiv id a d e 8, 296-299, 342
Lei(s) — com o p ro c e d im e n to 14-15
— científicas 304n — c rític a d a 297-298
— de Parkinson 113-114 — d efin ição 10-11, 298-299
levantamento(s) 170-173, 325-326 — e exp licação 13-14
- descritivos 171 — e h ip ó te se 39-41
liberalismo 228-232 — e p e sq u isa c ien tífica 9-15
linha de regressão 58, 62 — p e rd a d a 20
o b se rv a ç ã o 144-145
Manipulação 3, 27, 95 — d e co m p o rta m e n to 351-352
máquina, definição de 273-274 — d e fin iç ã o 350
matriz 204 — d isto rção n a 10
— alvo ou hipótese 211, 258-259 — m éto d o s d e 349-352
— de carga fatorial 204 o rie n ta ç ã o p a ra pessoas e o c u p a ç ã o 238
— de correlação 204, 259
— de covariância 260 P a re s o rd e n a d o s 55
medidas p e n sa m e n to
— contínuas 356 — c o n v erg en te 220
— definidas 29 — d iv erg en te 32
média 61n — p ro b a b ilístic o 32
memória, estudo da. 322-324 p e q u e n a te o ria 18, 73, 264
mensuração 145-148 p e rfis 309-311
pesos — conversão 174-177
— b e ta 191-192 pragmatismo
— d e regressão 189-192 — comparado com o empirismo 15-16
p esq u isa — de apelo e preconceito 106-113
— a p lic a d a 115-117 — e ciência 327-331
d e fin ição 321 prática, influência da pesquisa na 332-341
-------- dois im p o rta n te s estu d o s 324-327 preconceito
-------- e an álise d isc rim in a n te 252-253 — análise fatorial do 220-226
-------- e p e sq u isa b á sic a 320-327 — e admissão a faculdade 115-117
— b á sic a 320-321 — e apelos pragmáticos e morais 106-113
-------- e a p lic a d a 320-327, 331-332 — e autoritarismo 63-64, 65
— co m p o rta m e n ta l — e explicação 70-71
-------- co n ceito s e d efinições 22-32 — e medição 146-147
-------- co n cepções e rrô n e a s e c o n tro v é r — hostilidade e agressão 117-118
sias 296-316, 317-346 predição 306-309
-------- d e fin ição 2 n — e explicação 196
-------- o b je tiv id a d e n a 12-13 — grupo 308
-------- p ro b a b ilid a d e e acaso 81-84 — participação no grupo 243
-------- relaçõ es n a 58-66 princípio da parcimônia 202-203, 265
— ■— traço s c a ra c te rístic o s d a 8 probabilidade(s) 31-32, 75-89
— d e le itu ra 330 — concepção errônea 84-86
— efeitos possíveis d a 332-335 — condicionais 175
— e p rá tic a 317-346 — definição 76-79
— e questões éticas 122 — e acaso e pesquisa 81-84
— e re le v â n c ia 330w-331n — nas ciências naturais versus compor-
— ex p e rim e n ta l 120-130 tamentais 74-76
-------- co n tro le 123-130 problemas 35-38
-------- fo rç a d a 127-128 critérios de 36-37
-------- fra q u e z a d a 128-130 — definição 35
— ex post facto (veja p e sq u isa não-ope- — exemplos 42-44
racio n al) — valor e engenharia 33-34
— m eto d o ló g ica 348 procedimento de Monte Cario 89
— m u ltiv a ria d a 179-201, 235-270 programas de computadores 277-281
-------- an álise d isc rim in a n te 242-254 — ACOVS e LISREL 255n
-------- an álise fa to ria l 202-234 — de tradução (compilador) 283n-284n
-------- con clu são 269-270 — linguagem para 277-281
-------- c o rrelação ca n ô n ic a 239-242 — pacote 294
-------- d e fin ição 180n — sub-rotina 285n
-------- exem plos e x p erim en tais 236-247 proposições testáveis 34-35, 36-37, 41-42
-------- p a rtiç ã o d a v a riâ n c ia 179-186 psicometria 349
— n ão -ex p erim en tal 130-134
-------- classes sociais e tip o s d e Criação Q-sort 227, 314
5-9 questão
-------- c o n fia n ç a 124 — de engenharia 33-34
-------- d e fin ição 3-4 — de valor 33-34, 37
------— e p e sq u isa e x p e rim e n ta l 139-141 quociente de inteligência (QI) 148
-------- ex em plos d e 134-141
-------- in v estig ação sociológica 162-170 Raiz quadrada por computador 286-289
-------- v ariáv eis n á 133 realidade dos fatores 203
— objetiv o d a 318-320 realização 8-9
— tip o s d e 347-349 — definida operacionalmente 48
“ p ic o ta d o re s” d e co m p u ta d o re s 276 — e inteligência 181-182
p o n to , d efin iç ã o 25 ( veja n o ta) — explicação da 72
p o p u la ç ã o , d efin iç ã o 80 — necessidade de 264-269
p o rcen tag en s, u sa d a s n a s tab elas 164/t referentes criteriais 229
376
re fo rç a m e n to 9n — e hipótese 41
— p o sitiv o e neg ativ o 4 n .— e lei 304b
reg ressão m ú ltip la 187-194 — e pesquisa da eqüidade 131
— e c o m p u ta d o r 273 — explicação e relações 69-73
— e q u aç ão 189-192 — influência da 336-337
— ex em plos d e p e sq u isa 194-201 — objetivo 17-19, 318-320
re la ç ã o “ se-então” 39 — pequena 18, 73, 264
relaçõ es 26, 51-52, 53-57, 183 — testagem no experimento 126
— com o u m c o n ju n to d e p a re s o rd e testagem empírica 37
n a d o s 55-56 teste(s)
— d efin iç ã o 5-6 — definição 29, 351
— d ire ç ã o e m a g n itu d e 58-62, 63-64, — de inteligência 148, 210
66-69 — fidedignidade 153-154
— e ex p licação e te o ria 69-73 — objetividade 10-11, 350-351
— e h ip ó te se 38-39 — redações 11
— e m en su ra ç ã o 145-146 — "robustos” 302
— ex p ressão d a 39 — t 284, 301-302, 353-356
— g ráfico s d e 62-63 The Achieving Society 8
—; n a p e sq u isa c o m p o rta m e n ta l 57-64 The Authoritarian Personality 339-341
— n eg ativ as 67-68
— p o sitiv a s 58 Unidade de discurso na ciência 311-316
— ra c ia is 325-326, 337-341 universo do discurso 328b
— tip o s d e 65-69
— z e ro 61, 62, 69 Validade 155-159
re la tó rio C o lem an 134-135, 178, 254, — de constructo 157-159
325, 329 — de conteúdo 157
re le v â n c ia 330n-331n — definição e natureza da 156-157
re p lic a ç ã o 5, 12, 127, 128, 140 — empírica 75
Report of the National Advisory Com- — e o método dos grupos conhecidos
mittee on Civil Disorders (1969) 158
175-176
— e validação de constructo 159
re p re ssã o , c o n stru c to d e 41
— preditiva 157
ro ta ç ã o em análise fa to ria l 216 b
— tipos de 157
S ig n ificân cia, te s ta r a 284
valor(es)
— esta tístic a 88, 89 — científicos 341-346
-------- d e co rrelaçõ es 359-362
— de população 90-91
---------o teste d e q u iq u a d ra d o 356-359 — e ciência 302-303
-------- o teste t 353-356 — instrumental e terminal 136
su b sc rito s 56 b variação 29-30
Survey Research Center (d a U niversi — concomitante 65
d a d e d e M ichigan) 172 variância 29-31
— análise de (veja análise de variância)
T a b e la s t 284-285 — compartilhada 183-184, 189-192
ta x io n o m ia 57, 233 — partição da 179-186
te c n o lo g ia 320 — quando as variáveis independentes
te o ria são correlacionadas 184-186
— " c o rre ta ” e m o d elo 267-268 — residual 193
— d a a trib u iç ã o 333-334 — significado da 179-180
— d a d isso n ân cia co g n itiv a 103, 114 verdadeiras notas 150
— d a fru stração -ag ressão 117-118 variável(is) 22-25, 44-50
— d efin iç ã o 73 — categóricas 23
— d e F re u d , te s ta b ilid a d e d e 41 — definição 5, 44-46
— d o reforçam ento- 4-5, 41 — de participação em um grupo 242-244
— dos c o n ju n to s 108 b -109 b exemplo de pesquisa 247-249
377
—i — quantificação 245-246 — medida 23
— dependentes e independentes 24 — mensuração de 144-161
— de status 153-154 — na pesquisa não-experimental 133-134
— experimentais e manipuladas 24 — ortogonais 109
— independentes 24, 182, 184 — sociais 162-164
versus naturais 128 — tipos por campo ou disciplina 25
— interação de 108 — valor da 45
— latentes 262-264
— manipulada e medida 134« Zero, relação 61, 62, 69
378
S o uto , C lá u d io
O que é pensar sociologicamente ?

72 p„ formato 14 x 21 cm., ISBN 978-85-12-80050-9
O que é o social? Como se explicam os movimentos de aproximação

e de afastamento no espaço social? O que é o grupo social e como se
explica o fenômeno associativo humano? Como se explicam o equilí
brio no espaço social e o conflito nesse espaço? São a competição e o
conflito sempre desequilibrantes? Temos, ou não, equilíbrio social es
tável em algum país do mundo de hoje, e por quê? Existe uma lei sobre
o movimento de associação no espaço de interação social? A atitude
sociológica pretende ser uma atitude de conhecimento científico da
realidade social do homem.
Sumário: Pensar sociologicamente: algo que vem da vida, para a vida.

A atitude sociológica. Como são trabalhados os problemas sociológi
cos. Alguns problemas sociológicos fundamentais. Métodos (caminhos)
básicos do pensamento sociológico. Conclusão. Leituras sugeridas.
O objetivo incif desta permiti
compreensão da ^êr cia e da pesqur A
noções fundamentais da pesq isa entífica
apresentadas de odo significativo e não-
técnico, sem prejuízo da r didade e
exatidão. O autor ostra, com bastante claieza,
como são feitas as pesquisas em várias áreas de
estudo, como a Psicologia, a Educação e a
Sociologia, embora sua preocupa ã seja
aproximar os princípios de odas as ciências
São discutidos desde tópicos de caráter gerai,
como a natureza da ciência da pesqu' ci -
tífica, conceitos e definições de variáveis,
problemas, hipóteses, probabi idade estatís
tica, até tópicos mais específicos, como i ives-
tigações sociológicas, co ção, análise
fato ria I etc.
Os conceitos básicos de metodologia da pes
quisa são ilustrados com a descrição e pes
quisas reais, acompanhadas da teoria em que se
baseiam. A obra é complementada por u
Apêndice, onde são tratados outros tipos d
pesquisa não abord dos .o corpo do livro, em
como métodos de observação e c leta de dad
e testes de significância estatísi ca
tf
ISBN 978-85 12 1 '340 1

9 788512 603407 ISBN 85 12 60340-..:

Kerlinger, Fred Nichols - Metodologia Da Pesquisa em Ciencias Sociais - Um Tratamento Conceitual-Epu (2003) PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Kerlinger, Fred Nichols - Metodologia Da Pesquisa em Ciencias Sociais - Um Tratamento Conceitual-Epu (2003) PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Metodologia da

Data J O I O i ___ 20 O ^L.

Kerlinger, Fred Nichols, 1910-

1. Ciências sociais — Metodologia 2. Pesquisa

Índices para catálogo sistemático:

10a- reim pressão, 2007

Fred N. Kerlinger, nascido em 1910, é professor convidado do

O propósito deste livro é auxiliar as pessoas a compreenderem a

Como “conhecemos” o mundo? Como conseguimos entender as

1 As ciências comportamentais são as que estudam e procuram entender o homem,

A ciência é um empreendimento preqcupado-exclusiyamente,com

Dois exemplos de pesquisa

Para termos algo específico com que trabalhar, examinemos dois

2 As referencias citadas desta maneira são dadas no fim do livro.

Um experimento: recompensa maciça e aproveitamento na leitura

Muitas pesquisas vêm se devotando a entender como o homem e os

3 Sc o leitor acha que o princípio do reforçamento positivo é óbvio, deve levar

2. Um estudo não-experimental: classes sociais e tipos de criação

Vamos examinar agora um estudo não-experimental. Sabemos que

Classe social Desmame

trabalhadora, 17 desmamavam cedo e 31 desmamavam tarde.5 Há, apa­

? se preocupe muito se não conseguir entender completamente como se deve

Objetividade e pesquisa científica

Embora fácil de definir, a objetividade não é fácil de ser com­

6 Eles esclareceram um pouco mais outro fenômeno importante, o reforçamento.

À medida que avançarmos veremos que a objetividade, tanto ex­

Objetividade como característica e como procedimento

Antes de deixarmos o assunto objetividade, tentaremos esclarecer

O caráter empírico da ciência

O caráter empírico da ciência é muito mais facil de compreender

O objetivo da ciência: teoria e explicação

O objetivo da ciência já foi determinado. Precisamos agora rea­

que amplo. Um psicólogo poderá propor uma teoria da liderança em

8 Este exemplo é parcialmente realista, parcialmente fictício. O leitor não deverá

Uma das maiores dificuldades ao abordar um assunto novo é o seu

O termo “variável” talvez seja o mais usado na linguagem da

Variáveis categóricas, medidas e manipuladas

Quando alguma coisa pode ser 'classificada em duas ou mais cate­

Variáveis dependentes e independentes

Dois termos que são bastante usados em pesquisa comportamental

Há outras classificações de variáveis, mas geralmente não são tão im­

“Relação” provavelmente é a palavra mais fundamental em ciência.

Quando os cientistas fazem determinada pesquisa, diz-se que fize­

Os cientistas usam comumente a palavra “ dados” (data) e sabem

1 “Data” é uma dessas palavras curiosas que é realmente plural — o singular

Medidas, pontos, testes, escalas

Um conceito estatístico fundamental na pesquisa científica é “ va-

Alto Alto Baixo

* "Posto” (rank): lugar em uma ordenação. O posto 1 corresponde ao primeiro

um número baixo em a, há um número baixo em b. Há uma relação

Um dos maiores bloqueios à compreensão e apreciação da pesquisa

UNIVERSIDADE ¥ DERAL DO PARÍ 1

______ umjro b le m a i_um a, questão_.que.jmqstra uma

1 Estas proposições de problemas nem sempre são apresentadas nas palavras de

Uma hipótese um enunciado çonjetural das relações entre^duas

2 Como já foi rnencionado, há exceções ao requisito de relação. Por exemplo,

O valor das hipóteses

As hipóteses são muito mais importantes na pesquisa científica

Esta linha de pensamento nos leva a outra idéia importante sobre

Exemplos de problemas e hipóteses

A discussão até aqui foi quase toda sobre problemas e hipóteses.

agressão deslocada, dado deflagração de hostilidade. O argumento é mos­

Uma das palavras-chave na literatura das ciências comportamentais

trabalhadora, 17 desmamavam cedo e 31 desmamavam tarde.5 Há, apa

Embora fácil de definir, a objetividade não é fácil de ser com

À medida que avançarmos veremos que a objetividade, tanto ex

O objetivo da ciência já foi determinado. Precisamos agora rea

Quando alguma coisa pode ser 'classificada em duas ou mais cate

Há outras classificações de variáveis, mas geralmente não são tão im

Quando os cientistas fazem determinada pesquisa, diz-se que fize

agressão deslocada, dado deflagração de hostilidade. O argumento é mos

Há dois tipos de definição: constitutiva e operacional. Uma defi

Suponhamos que eu seja um cientista social interessado em proble

Na figura 4.2 damos dois conjuntos que foram encerrados em for

A definição de relação como conjunto de pares ordenados é com

A definição de relações como conjuntos de pares ordenados é sim

Embora relações, teoria e a explicação fossem discutidas no pri

Tabela 5.2 Médias de oontos de leitura de cinco replicaçÕes hipotéticas do expe

O plano e a estrutura da pesquisa são comumente chamados o deli