Escolar Documentos
Profissional Documentos
Cultura Documentos
Kerlinger, Fred Nichols - Metodologia Da Pesquisa em Ciencias Sociais - Um Tratamento Conceitual-Epu (2003) PDF
Kerlinger, Fred Nichols - Metodologia Da Pesquisa em Ciencias Sociais - Um Tratamento Conceitual-Epu (2003) PDF
Pesquisa em
Ciências Sociais
Um tratamento conceituai
Bibliografia.
CDD-300.72
-300.18
80-1332 -507.2
Metodologia da
Pesquisa em
Ciências Sociais
Um tratam ento
conceituai
íMfOM KBBGÓGICB
€ UnreRSfTfíRM ITDfi.
Tradução do original em inglês:
Behavioral Research — a conceptual approach
Copyright © 1979 by Holt, Rinehart and Winston
UNIVERSIDADE t ,hA
BIBLIO ■ ' nTRAL
r O?
Tradução:
Helena Mendes Rotundo
Revisão técnica:
José Roberto Malufe
Professor-Assistente de Metodologia da Pesquisa em Educação, na PUC/SP
ISBN 978-85-12-60340-7
ISBN 85-12-60340-2
© E.P.U. - Editora Pedagógica e Universitária Ltda., São Paulo, 1980. Todos os direitos reservados.
A reprodução desta obra, no todo ou em parte, por qualquer meio, sem autorização expressa e por
escrito da Editora, sujeitará o infrator, nos termos da lei n° 6.895, de 17-12-1980, à penalidade
prevista nos artigos 184 e 186 do Código Penal, a saber: reclusão de um a quatro anos.
E. P. U. - Telefone (0++11) 3168-6077 - Fax. (0++11) 3078-5803
E-M ail: vendas@epu.com.br Site na Internet: http://www.epu.com.br
Rua Joaquim Floriano, 72 - 6o andar - conjunto 65/68 - 04534-000 São Paulo - SP
Impresso no Brasil Printed in Brazil
Para
William Clark Trow
Theodore M. Newcomb
5
Sumário
Prefácio .................................................................................... r ? . . XV
1. A natureza da ciência e da pesquisa científica....................... 1
t»
2. Conceitos comportamentais científicos e definições................... 22
3. Problemas, hipóteses e variáveis . . . . ....................................... 33
4. Relações e explicações .............................................................. 51
5. Probabilidade e estatística .......................................................... 74
6. O delineamento da pesquisa experimental: delineamentos de
uma só variável.......................................................................... ■. 94
7. Delineamento da pesquisa experimental: delineamentos fatoriais 105
8. Pesquisa experimental e não-experimental ............................... 120
9. Observação e mensuração de variáveis ................................... 144
10. Investigação sociológica, levantamentos e análise de freqüências 162
11. A abordagem multivariada: regressão múltipla e partição da
variância ............................... ...................................................... 179
12. A abordagem multivariada: análise fatorial ........................... 202
13. A abordagem multivariada: correlação canônica, análise dis-
criminantè e análise de estruturas de covariância.................... 235
14. O com putador.............................................................................. 271
15. Concepções errôneas e controvérsias: questões metodológicas 296
16. Concepções errôneas e controvérsias: pesquisa e prática . . . 317
Apêndice — Tipos de pesquisa, métodos de observação e testes de
significância estatística ................................................................... 347
Bibliografia ....................................... 363
Índice onomástico .............................. 369
Índice analítico ................................ 372
Sobre o autor
J.R.M.%
*■ » J
ar
Ui
I
Prefácio
XII
contemporânea. A cobertura desta parte é ampla e diversificada. Inclui
relações, probabilidade, delineamento de pesquisa, mensuração e análise
multivariada. É o núcleo técnico do livro, mas na sua maior parte
expresso em linguagem não-técnica.
O capítulo 4 estabelece a base: examina relações e explicações e
tenta mostrar como estão subjacentes a todo o empreendimento científico.
O capítulo 5 apresenta uma abordagem intuitiva à probabilidade e à
estatística. A importância da idéia de aleatoriedade, mencionada acima,
é fortemente enfatizada. Os capítulos 6, 7 e 8 formam uma unidade
sobre experimentação e delineamento de pesquisa. Os delineamentos de
pesquisa têm o propósito essencial de fornecer quadros de referência que
tornem possível responder diferentes questões de pesquisa. Os capítulos 6
e 7 esboçam os princípios de tais quadros de referência. O capítulo 8
mostra as semelhanças e diferenças entre a pesquisa experimental e a
não-experimental. Raramente essa distinção tão importante é discutida
na bibliografia. Considero-a suficientemente importante para justificar
um capítulo inteiramente dedicado a ela. A distinção e as suas con-
seqüências, tais como apresentadas no capítulo 8 e em outros trechos do
livro, podem ser questionadas. Todavia, por mais corretas ou incorretas
que sejam julgadas a definição, as distinções e as conseqüências, não há
dúvida de que o tema requer divulgação e compreensão.
Mensuração é a principal preocupação do capítulo 9. Assim como a
estatística, a mensuração psicológica é uma das maiores conquistas de
nossos tempos. Embora tenha ainda um longo caminho pela frente, boa
parte deste já é conhecido, e uma parcela do núcleo desse conhecimento
está condensada no capítulo 9. A despeito de ser uma grande realização,
a mensuração tem sido também o calcanhar de Aquiles de grande parte
da pesquisa comportamental. O capítulo ajuda a esclarecer suas forças e
fraquezas.
O capítulo 10 procura descrever um volumoso e importante tipo de
pesquisa — em termos gerais denominado “investigação sociológica” —
cujas principais características são sua natureza não-experimental, sua
mensuração e seus modos de análise. Temos este tipo de pesquisa quando,
por exemplo, os pesquisadores estudam principalmente o que pode ser
chamado de “variáveis sociológicas” — classe social, status ocupacional,
sexo, preferências religiosas e políticas, e assim por diante — e quando
o método predominante de observação é a contagem, geralmente a conta
gem de características “ sociológicas” de indivíduos. O capítulo ocupa-se
de suas características e de seu uso na pesquisa comportamental.
A inclusão dos capítulos 11, 12 e 13, sobre a abordagem multiva
riada, é essencial em um livro sobre a pesquisa comportamental contem
porânea. Algumas pessoas poderão achar que o assunto é muito complexo
para um livro deste tipo. Como se poderia explicar análise fatorial,
XIII
regressão múltipla e análise discriminante de modo preciso e não-técnico?
Essa é uma boa pergunta, e para a qual não existe uma resposta pronta
e fácil. O problema é que, se não forem discutidas as abordagens multi-
variadas à pesquisa e à análise de dados, deixa-se uma grande lacuna no
conhecimento e na compreensão que terá o leitor sobre a pesquisa com-
portamental. A pesquisa comportamental passa, atualmente, por uma
verdadeira revolução, a meu ver, precisamente por causa, em grande parte,
da abordagem multivariada e do ultra-rápido computador moderno.
Problemas de pesquisa, que antes não poderíam ser contemplados por
uma incapacidade de se fazer as complexas análises envolvidas, são hoje
abordados quase rotineiramente. Assim, decidiu-se incluir o assunto, a
um nível cortceptual e semitécnico. Há a conseqüente supersimplifica-
ção, ignorando-se diversos problemas importantes. Os riscos, entretanto,
talvez sejam compensados por uma imagem melhor e mais completa que
o leitor poderá adquirir. Pelo menos, estes capítulos poderão aumentar o
1-interesse e difundir uma abordagem fascinante, com muitas probabili
dades para a teoria e a pesquisa significativas e criativas.
A terceira parte do livro, capítulos 14, 15 e 16, discute e explora
diversos problemas controvertidos e mal compreendidos, que trazem
considerável preocupação à ciência e aos cientistas. Um deles — feliz
mente, relativamente fácil de manejar — é a natureza e a finalidade do
computador. Não há dúvida de que o computador foi e é uma das
influências mais fortes na pesquisa comportamental contemporânea.
Esta influência é examinada no capítulo 14. Os notáveis poderes do com
putador são descritos e analisados com o propósito de se compreender o
que o computador pode fazer e, o que é praticamente tão importante
quanto isso, o que o computador não pode fazer. Depois de estabelecida
essa base, procurou-se também esclarecer um ou outro mal-entendido
sobre o computador e o seu lugar na pesquisa e na ordem das coisas.
Os dois últimos capítulos do livro, capítulo 15 e 16, exploram basica
mente um certo número de problemas mal compreendidos e contro
vertidos, que intrigam e desorientam os pesquisadores e os indivíduos
que observam a ciência e a pesquisa. Por exemplo, a questão de para
que serve a ciência é atacada diretamente, e são tiradas conclusões que
poderão desconcertar alguns leitores. Qualquer atividade humana com
plexa é controvertida. A ciência não é exceção. Decidi, portanto, que
alguns dos mal-entendidos mais perturbadores e importantes sobre a
ciência e a pesquisa teriam que ser abordados. Naturalmente, ao se fazer
isso, há um risco considerável. Poderá parecer que se está tomando
partido em um debate. Na realidade, o que se está assumindo é menos
um partido em um debate do que uma posição baseada no que se
considera ser a natureza da ciência. Novamente, isto se torna um
obstáculo à compreensão. Por exemplo, muitas pessoas acreditam que o
XI V
propósito da pesquisa científica é aumentar o bem-estar humano. Quando
isso é categoricamente negado, e se afirma que o propósito da pesquisa
científica é a teoria, ou a compreensão e explicação, não é de se admirar
que surjam dificuldades. Pretende-se, entretanto, explicar de tal maneira
as coisas, que as razões para as afirmações feitas possam ser compreendi
das e, pelo menos, consideradas. Assim, os últimos dois capítulos do
livro exploram controvérsias e mal-entendidos. Tentam colocar em
perspectiva três ou quatro das maiores questões, em parte filosóficas, da
ciência e da pesquisa.
Embora possa ser considerado metodológico, num sentido amplo,
este não é um livro de métodos. Não se tenta ensinar como fazer pesquisa;.,-
Toda a ênfase é posta em compreender pesquisa. Na verdade, é provável- '-í
mente impossível compreender qualquer assunto complexo sem trabalhar1'
ativamente com ele; Para compreender realmente a estatística, a maioria^
das pessoas precisaria trabalhar com problemas estatísticos, por exemplo, j
Todavia, um nível substancial de compreensão pode ser alcançado por-'
uma forma vicária de trabalhar com os problemas. Muitos de tais
“trabalhos vicários” são dados no livro. Por exemplo, uma característica
importante do livro é a descrição de pesquisas reais, geralmente acom
panhada da teoria em que se baseiam os estudos, bem como as questões:.
colocadas pelos pesquisadores. Assim, o livro descreve a maneira pelar
qual as pesquisas têm sido feitas e é, portanto, numa certa medida^ 5
metodológico. Mas deixa quase que completamente de lado os métodos;
reais de fazer observações, medir variáveis, analisar dados e assim pog
diante. A necessidade de informações sobre esses tópicos é atendida, numá*
certa medida, pelo Apêndice, no qual são discutidos tipos de pesquisa
diferentes dos tratados no texto, bem como alguns métodos de observação.
Embora saiba o quanto me ajudou, não creio que minha mulher
compreenda realmente até que ponto ela é uma parte importante deste
livro. Em todo caso, por suportar minhas rabugices e frustrações,
deixando de lado o que ela considerava obstáculos menores, dando-me
apoio e ânimo, eu lhe agradeço.
Amsterdã, Holanda
junho de 1978 Fred N. Kerlinger
XV
1, A natureza da ciência e da pesquisa científica
1
informação válida e fidedigna sobre fenômenos complexos, inclusive o
complexo fenômeno do próprio homem. Era preciso superar explicações
absolutistas, metafísicas e mitológicas de fenômenos naturais — ou pelo
menos suplementá-las — com uma abordagem até certo ponto exterior
ao homem O sucesso da ciência como abordagem do conhecimento e
compreensão de fenômenos naturais tem sido notável. Mas a compreen
são da ciência e da abordagem usada pelos cientistas tem sido conside
ravelmente menos notável. Pode-se dizer que a ciência é seriamente
mal compreendida.
O objetivo básico deste livro é ajudar o leitor a compreender a
abordagem, o pensamento e os métodos da ciência e da pesquisa cien
tífica. Seu foco especial se dirigirá para a pesquisa em psicologia, socio-
> logia é educação. A abordagem geral é a mesma, ou pelo menos basica
mente semelhante, em todas as ciências. Estudaremos esta abordagem
'* muito cuidadosamente. Entretanto, há dificuldades e problemas especiais
na ciência e pesquisa comportamentais que precisamos conhecer se qui
sermos entender tal pesquisa.1 Em outras palavras ,a abordagem geral do
conhecimento e compreensão da física e da psicologia é a mesma, mas os
detalhes da teoria e investigação são muito diferentes. Por exemplo, a
complexidade e a ambigüidade do comportamento humano, geralmente
considerado como mais complexo e ambíguo do que os objetos do mundo
físico, criam grandes problemas de observação e inferência válidas e
fidedignas. Medir aspectos do comportamento humano — agressividade,
preconceito, preferências políticas e realização escolar, por exemplo —
é geralmente mais difícil do que medir as propriedades dos corpos
físicos.
E grande a necessidade de compreender a ciência e a abordagem
científica. Esta necessidade é grande principalmente na psicologia, socio
logia e educação, dada a urgência dos problemas humanos e sociais que
os pesquisadores estudam, e dada a natureza controvertida de alguns
dos problemas e métodos das ciências comportamentais. Este livro se
concentra nesta necessidade.
2
Natureza geral da ciência
3
da mudança sobre a outra variável. Estas idéias devem ficar claras depois
de lermos a discussão dos dois estudos que vêm a seguir.
4
Inteligência superior ao do outro. No tipo de pesquisa em que se usam
dois grupos e um tratamento especial é aplicado a um deles, este grupo
é íreqüentemente chamado “grupo experimental”. O outro, ao qual não
se faz nada em especial, chama-se “grupo de controle”.
No início do experimento, todos os alunos foram elogiados por seu
trabalho. Isto foi usado para estabelecer médias de recompensa para
os professores das crianças. (Naturalmente os professores diferem quanto
à recompensa que usam.) Depois de seis sessões, as médias de recom
pensa ficaram estabilizadas e o experimento propriamente dito começou.
Os professores do grupo experimental, das crianças a receberem trata
mento èspecial ou experimental, foram avisados para dobrarem ou tripli
carem a recompensa, enquanto os professores do grupo de controle
foram avisados para “manterem o trabalho em ordem”. No fim de um
período de três semanas foi feito um teste de leitura com as crianças.
A análise dos resultados dos testes mostrou que o grupo experi
mental ou da “recompensa maciça” fez o teste melhor do que o grupo
de controle. Esta conclusão foi inferida de um teste estatístico da dife
rença entre a média de pontos de leitura entre os dois grupos: a média
do grupo experimental foi maior do que a média do grupo de controle.
Mais tarde explicaremos o princípio que rege tais testes estatísticos.
Por enquanto, pode-se dizer que a recompensa maciça teve resultados
aumentando a contagem de pontos do grupo experimental em compa
ração com o número de pontos feitos pelo grupo de controle. Se se
pode dizer que recompensas maciças funcionam com crianças negras
carentes e que possam ou devam ser usadas com elas, dependerá de
outras pesquisas, destinadas a averiguar se os mesmos resultados são
obtidos repetidamente — isso se chama replicação — e testando o
reforçamento em geral com diferentes tipos de crianças. Em outras
palavras, os resultados de um estudo são sugestivos, embora não conclu
sivos. Talvez as crianças negras carentes necessitem de reforço maciço
— mas talvez não.
5
que as variáveis A e B estão relacionadas, queremos dizer que existe
algo em comum entre as duas variáveis, alguma ligação entre elas.
Suponhamos que os dois círculos da figura 1.1 representem essências
do que sejam A e B. Isto é, A representa a essência do que seja a va
riável A. É a substância de A. O círculo B, naturalmente, representa a
essência de B. Observe que os círculos A e B se sobrepõem e que a
superposição é indicada por traços horizontais. Isso indica que algo das
essências de A e B é compartilhado. Uma parte de A é igual a uma
parte de B e vice-versa. Esta faixa compartilhada, indicada pela área
de traços finos, representa a relação entre A e B. A pode ser inteligência
e B aproveitamento escolar. A superposição na figura 1.1 é a relação
entre as duas. O que é esta propriedade dividida? É difícil dizer sem
outras evidências. Pode ser aptidão ou habilidade verbal; pode ser o
que se denominou inteligência geral. Mas voltemos ao nosso exemplo.
Os psicólogos e sociólogos fizeram grande número de pesquisas
sobre classes sociais e descobriram sua importância para a explicação de
diferentes tipos de comportamento: recreação, eleições e criação dos
filhos, por exemplo, são fenômenos associados às classes sociais. Miller
e Swanson (1960) levantaram a hipótese, entre outras coisas, de uma
relação entre a classe social dos pais e o tempo que levavam para
desmamar os filhos. Foi perguntado a uma amostra de 103 mães da
classe média e da classe trabalhadora de uma grande cidade do
meio-oeste como estavam criando seus filhos. O resultado de uma per
gunta sobre o tempo do desmame é apresentado na tabela 1.1. Os
números nas casas representam a quantidade de mães que eram da classe
média ou da classe trabalhadora e que haviam desmamado os filhos
mais cedo ou mais tarde.
O estudo dos números nas diferentes casas da tabela indica que as
mães da classe média parecem desmamar os filhos mais cedo do que
as mães da classe trabalhadora. Das 55 mães de classe média, 33 des
mamavam cedo enquanto 22 desmamavam tarde; das 48 mães da classe
Figura L I
6
Tabela 1.1 Classe social e tempo de desmame, estudo de Miller e Swanson (1960). *
Cedo Tarde
Classe média 33 22
(0,60) (0,40) 55
Classe trabalhadora 17 31
(0,35) (0,65) 48
50 53 103
As entradas nas casas são frequências: número de mães. As cifras entre parên
teses são proporções, por exemplo, 33/55 = 0,60. Se as proporções forem multi
plicadas por 100, obtêm-se as porcentagens: (33/55) (100) = (0,60) (100) = 60
por cento, ou 60 por cento das mães da classe média disseram que desmamaram
seus mhos cedo.
7
não estar presente entre todas as mães. É necessário mais pesquisa para
reforçar a afirmação e a certeza que se pode ter quanto à sua “verdade” .
Estes dois estudos têm um bom número de aspectos que são caracte
rísticos da pesquisa comportamental. Primeiro, um é um estudo experi
mental, o outro não-experimental. Segundo, eles ilustram a objetividade,
uma característica da pesquisa científica que logo examinaremos. Ter
ceiro, seu uso de análise quantitativa elementar irá nos ajudar a apro
fundar mais na análise e estatística. Por exemplo, no estudo de Clark
e Walberg, foram calculadas e comparadas as médias e no estudo de
Miller e Swanson, foram tabuladas e comparadas as freqüências. Estes
são dois dos modos mais comuns de se fazer análise quantitativa. Quarto,
os problemas, relações e metodologia de ambos os estudos são simples
e claros; serão úteis para ilustrar colocações a serem feitas em discussões
subseqüentes.
Mais pertinentes ao tema principal deste capítulo é o que os estudos
tentaram fazer, quais foram seus objetivos. Um dos objetivos do estudo
de Clark e Walberg foi compreender e explicar o aproveitamento, ou
antes, um certo aspecto do aproveitamento, o chamado subaproveita-
mento. Um dos objetivos do estudo de Miller e Swanson foi explicar o
desmame, que é, naturalmente, um aspecto do trabalho de cuidar de uma
criança. As palavras “compreender” e “explicar” devem ser interpretadas
num sentido amplo. Quando dizemos que “compreendemos” um fenô
meno, queremos dizer que conhecemos suas características — pelo
menos algumas — o que o produz e quais as suas relações com outros
fenômenos. Queremos dizer que tentamos “explicar” o fenômeno. Po
demos dizer o que provavelmente o tenha causado, o que o influencia
agora, o que o influenciará e no que ele influencia. É importante obser
var aqui que nossa compreensão de um fenômeno é sempre incompleta,
parcial e probabilística. Sem dúvida, muito do nosso conhecimento do
mundo, especialmente do fenômeno social e humano, é parcial e
até falho.
A realização é um fenômeno importante no mundo ocidental.
Quando dizemos que procuramos “compreendê-lo” , em parte queremos
dizer que desejamos saber por que certas pessoas conseguem grandes
coisas, enquanto outras conseguem muito pouco. Ou, mais ambiciosa
mente, queremos saber por que certos grupos conseguem tanto e outros
tão pouco. Por exemplo, McClelland (1961), num livro estimulante,
The Achieving Society, relatou uma pesquisa voltada para uma questão
geral: Como e por que as pessoas de diferentes países diferem em sua
motivação para a realização? É possível se estender muito discutindo
um conceito tão rico quanto o de realização. O núcleo da idéia de com
preensão e explicação, entretanto, é que explicamos um fenômeno espe
cificando o que está relacionado a ele.
8
Clark e Walberg se interessaram por explicar um aspecto relativa
mente limitado da realização. Eles desejavam explicar e compreender a
realização em leitura, de crianças negras que eram geralmente defi
cientes, na realização escolar. Queriam saber se o reforçamento maciço
da realização iria afetá-la positivamente. Estudaram, então, a relação
entre o reforçamento e a realização em leitura. Conseguiram mostrar
que o reforçamento maciço afetava positivamente a realização das
crianças em leitura. Eles, até certo ponto, “ explicaram” a realização por
que mostraram uma coisa que á afetou.6
O fenômeno “explicado” por Miller e Swanson foi o desmame, ou,
talvez mais exatamente, a técnica de cuidar de crianças, que inclui entre
outras coisas métodos disciplinares, tipos de recompensas usadas e mé
todos para induzir à obediência. Eles mostraram, por exemplo, que mães
da classe média e da classe operária diferem nas suas práticas de des
mame. Assim estabeleceram uma relação, por um lado, entre classes
sociais e por outro, no método de desmame. Mostraram que algumas
diferenças observadas no desmame eram devidas à classe social, em
outras palavras. Assim, até certo ponto, eles “explicaram” as diferenças
nas práticas de desmame.
Vamos interromper nossa discussão a respeito das metas e propó
sitos científicos para discutirmos duas características importantíssimas
da ciência. A primeira, objetividade, é uma característica metodológica
controvertida e difícil de entender. A segunda é a natureza empírica da
ciência. Após discutirmos estas características, estaremos em melhor
posição para continuar a discussão principal. Pode ser dito clara e
categoricamente que sem o “método” ou “critério” de objetividade, ou
sem a abordagem e a atitude empírica, a ciência como é conhecida no
mundo moderno não seria possível. O que significa esta afirmativa? E o
que ela tem a ver com a natureza da pesquisa científica?
9
sua influência e predileções. Em vez de estarem em suas cabeças, as
idéias testadas são objetivadas, feitas objetos “do lado de fora”, objetos
que têm uma existência, por assim dizer, separada de seus inventores.
Qualquer um pode observar um experimento e como ele é feito; ê coisa
pública.
Todo conhecimento do mundo é afetado, e até distorcido de certa
forma, pelas predisposições dos observadores. Quanto mais complexas
as observações, mais se afastam da realidade física, e quanto maiores
as inferências feitas, maiores as probabilidades de distorção. Quando o
cientista físico lida com pesos, por exemplo, há uma baixa probabilidaue
de distorção: existem pequenas oportunidades para pontos de v ist:
pessoais, inclinações e prenoções entrarem no processo. Mas considerem
se as possibilidades de distorção no estudo e mensuraçâo de autoritaris
mo, dogmatismo, inteligência, nível de aspiração, realização, classe social,
ansiedade e criatividade.
Tomemos apenas uma destas variáveis, a criatividade. Embora
concordemos que vamos estudar e medir a criatividade, podemos ter
idéias muito diferentes do que seja a criatividade. Essas idéias diferentes,
estas percepções diferentes, podem influenciar nossas observações de,
digamos, criatividade em crianças. Um ato comportamental que para
um indica criatividade pode não indicar criatividade para outro e essas
diferenças em percepção podem afetar nossa mensuraçâo. Em outras
palavras, as verdadeiras observações do comportamento criativo podem
ser, muito diferentes, dependendo de quem observa, a não ser que se
concorde em adotar um método de observação — e se ater rigidamente
a ele.
Objetividade é um acordo entre juizes “especialistas” relativo ao
que é observado, ou o que deve ser ou o que foi feito em pesquisa.
Suponhamos que um cientista observe alguma coisa e anote essa obser
vação, digamos, em forma numérica. Outro, de igual competência,
observa a mesma coisa, independentemente, e registra sua observação.
Se o processo puder ser repetido com resultado idêntico ou parecido
— isto é, se há acordo entre as observações dos cientistas — consegue-se
objetividade. Em algumas áreas da ciência, como na química e física,
por exemplo, a objetividade não é problema sério, graças aos instru
mentos de alta precisão, como os microscópios eletrônicos. Tais instru
mentos aumentam a probabilidade de acordo entre os juizes, porque, ao
usá-los, juizes diferentes provavelmente obterão e anotarão os mesmos
resultados. Além disso, a máquina tem menos possibilidade de influen
ciar observações e de ser influenciada pela natureza do que estiver
sendo observado.
A definição de objetividade como acordo entre juizes não deve
ser interpretada com estreiteza: é bastante ampla. O que significa isto?
10
A condição principal para satisfazer o critério de objetividade é, ideal
mente, que quaisquer observadores com um mínimo de competência
concordem em seus resultados. Em psicologia e educação, por exemplo,
usam-se testes e escalas objetivas. São chamados "objetivos” porque
qualquer pessoa, devidamente orientada, pode avaliá-los e obter os mes
mos resultados (com pequena margem de erro). A expressão “testes
objetivos” não significa que os testes sejam em si mesmos “objetivos”.
Eles o são porque a contagem de pontos é a mesma, não impor
tando quem os avalie. Por outro lado, a correção de respostas em
redações depende muito mais do julgamento pessoal do juiz, enquanto
tais julgamentos são virtualmente excluídos em testes objetivos. (Deve
ser notado, entretanto, que a avaliação de redações pode ser feita de
maneira muito mais objetiva do que geralmente se faz.)
Mudemos um pouco a perspectiva. No estudo Clark e Walberg a
mensuração do aproveitamento em leitura foi mais objetiva do que a
mensuração de tempo de desmame no estudo de Miller e Swanson por
que o primeiro foi medido com um teste de tipo objetivo, enquanto o
segundo foi medido através de entrevistas. Qualquer um que avaliasse o
teste de leitura obteria os mesmos resultados. Mas dois entrevistadores
poderíam mostrar diferenças na mensuração de tempo de desmame, no
caso por dois motivos. O primeiro acaba de ser dado: juizes diferentes
podem interpretar as respostas do entrevistado diferentemente. Uma mãe
pode dizer que desmamou seu filho quando a criança tinha entre 7 e 9
meses. Um entrevistador pode se satisfazer com esta resposta e anotá-la,
mas outro pode querer se aprofundar mais "e acabar descobrindo que
a mãe desmamou o filho aos seis meses. O segundo motivo se deve à
falta de memória da mãe: ela pode simplesmente não se lembrar quando
desmamou o filho e dizer que foi aos dez meses, quando de fato foi
aos oito. Não existe tal ambigüidade com mensuração de tipo objetivo
(embora não esteja isenta de outros tipos de dificuldades). Um teste de
leitura de tipo objetivo, por exemplo, tem regras explícitas para a ava
liação das respostas. A resposta a qualquer pergunta só pode ser ou cor
reta ou incorreta: há pouca margem para a iniciativa ou o julgamento
do avaliador.
A importância da objetividade exige mais explicação ainda. Embora
seja aplicada geralmente a observações e mensuração científicas, a idéia
é mais ampla. Quando os psicólogos fazem experimentos, lutam por
objetividade. Isso significa que fazem sua pesquisa controlando de tal
modo a situação experimental e descrevendo de tal modo o que fazem
que outros psicólogos poderão repetir ó experimento e obter resultados
iguais ou semelhantes. Em outras palavras, a objetividade ajuda o pes
quisador a “ sair” de si mesmo, ajuda-o a conseguir condições publica
mente replicáveis e, conseqüentemente, descobertas publicamente averi-
11
guáveis. A ciência é um empreendimento social e público, como tantos ^
outros empreendimentos humanos, mas uma regra importantíssima do
empreendimento científico é que todos os procedimentos sejam objetivos
— feitos de tal forma que haja ou possa haver acordo entre juizes
especialistas. Esta regra dá à ciência uma natureza distinta, quase remota,
porque quanto maior a objetividade mais o procedimento se afasta das
características humanas — e de suas limitações. Por exemplo, a obje
tividade quase glacial de partes das ciências naturais, cujos experimentos
são feitos em laboratórios e em circunstâncias altamente controladas,
cujas observações são feitas quase inteiramente por máquinas de alta
precisão e fidedignidade, parece coisa muitíssimo distante de gente e de
suas preocupações sociais e pessoais. (Isto não significa que os cientistas
que pesquisam e controlam as máquinas sejam imunes a erros.)
Comparem-se agora os procedimentos em psicologia e educação. O
cientista físico pode “sair de si mesmo” mais facilmente do que o cien
tista comportamental, porque é mais fácil para ele preparar uma pesquisa
e testar hipóteses “fora” e longe de suas próprias predileções e inclina
ções e de outros. Isto acontece porque os procedimentos são mais fáceis
de ser “objetivados”. Uma vez que o funcionamento de um processo
físico fique compreendido, pode ser repetido e medido pela maioria de
técnicos e cientistas competentes. Em outras palavras, há uma replica-
bilidade relativamente alta.
Em pesquisa sociológica, psicológica e educacional, entretanto, isto
é verdadeiro em grau muito menor. A manipulação de variáveis psicoló
gicas, como a coesão de grupo, a atmosfera em sala de aula, estilos de
liderança e ansiedade, é muito mais difícil de ser feita objetivamente
por causa da maior complexidade, amplitude de variação e acessibili
dade a influências outras que as do pesquisador. Igualmente, a mensu-
ração de variáveis comportamentais, tais como inteligência, realização,
atitudes, classe social e motivação é mais sujeita a influências sistemá
ticas e casuais, tornando mais difícil — embora não impossível, como
pretendem alguns críticos — vários observadores concordarem em suas
observações e mensurações. Isto não significa, entretanto, que os proce
dimentos do psicólogo não sejam objetivos. Na verdade, eles freqüente-
mente podem possuir um nível de objetividade relativamente alto. Eles
são simplesmente menos objetivos do que os do cientista físico.
Não há qualquer diferença de princípio, por outro lado, entre o
uso do critério de objetividade pelo cientista físico e pelo cientista com
portamental. A única diferença está no grau de objetividade. Já foi dito
que as ciências comportamentais não podem ser verdadeiramente cientí
ficas porque não podem usar os métodos das ciências físicas. Isto não
é assim, a não ser num sentido puramente literal. Em todas as ciências
são usados a mesma abordagem e os mesmos métodos gerais. Assim está
12
longe de ser impossível chegar-se à objetividade nas ciências comporta-
mentais; isto já foi conseguido com sucesso, muitas vezes. É apenas
mais difícil.
Objetividade e explicação
Figura 1.2
13
objetividade, entretanto, é uma característica indispensável e inseparável
da ciência e da pesquisa científica.
7 Tais enunciados não podem ser gerais demais porque, se forem, não podem ser
refutados. Como veremos mais tarde, os enunciados científicos têm que ser pas
síveis de serem submetidos a teste e acessíveis a serem mostrados como falsos
se realmente o forem.
14
A abstração, parte do poder da ciência, está sempre distante das
preocupações cotxiuns e do calor do relacionamento humano. Isto por
dffTnlrao; é parte dãTnatureza da ciência. Sem tal abstração, não há
ciência. O' mesmo quanto a objetividade, que também tende a fazer a
fiiinciã parecer fria e distante. Parece distante e fria porque os testes
das proposições científicas são feitos “la fora ’, o mais longe possível
das pessoas e suas emoções, desejos, valores e atitudes, incluindo os do
próprio cientista. Mas é isto precisamente o que deve ser feito. Deve-se
obedecer ao cânone da objetividade — ou abandonar a ciência.
15
pesquisa científica sistemática e- controlada. Aqui está um exemplo que \
nTSiTSjudãrá a compreender o que “empírico” significa para a ciência. \
Uma pesquisa científica foi feita para determinar se é possível
animais e seres humanos aprenderem a controlar reações do sistema
nervoso autônomo. Podem, por exemplo, diminuir as batidas cardíacas
ou aumentar a secreção da urina à vontade? (Miller, 1971, caps. 55, 56).
Tanto velhas quanto novas crenças dizem que isso não é possível. Então,
a generalização é: as pessoas não conseguem controlar reações gover
nadas pelo sistema nervoso autônomo. Acontece que a afirmação talvez
não seja verdadeira: descobriu-se que animais (e talvez pessoas) podem
ser treinados para fazerem coisas tais como aumentar e diminuir as
batidas cardíacas, aumentar e diminuit sua secreção urinária e até alterar
sua pressão sanguínea (Miller, 1971, Parte XI). Um enunciado empiri-
camente orientado seria: os animais podem, dentro de certos limites,
controlar reações do sistema nervoso autônomo, recebendo “instrução”
apropriada. Os animais podem ser ensinados a, por exemplo, aumentar
ou diminuir as batidas cardíacas e aumentar ou diminuir sua secreção
urinária. Não é fácil, mas já foi feito. São afirjnativas..empíricas, já que
estão baseadas em evidência científica.
Por ser empírica, não significa necessariamente que uma afirma
tiva seja verdadeira. Se baseada em pesquisa científica e evidência, é
mais provavelmente verdadeira do que uma afirmativa baseada intei
ramente em crenças. Entretanto, pode ainda não ser verdadeira. A
afirmativa acima, de que é possível aprender a controlar o sistema ner
voso autônomo até certo ponto, embora apoiada pela evidência da pes
quisa científica, pode acabar sendo refutada a longo prazo. Pode não
ser possível obter os mesmos resultados no próximo ou no ano seguinte,
ou na Austrália assim como na América. É possível que as descobertas
de pesquisa apoiando o enunciado fossem o resultado de alguma causa
temporária e não reconhecida, característica apenas da situação parti
cular em que foi feita a pesquisa. Não obstante, a probabilidade de uma
afirmativa baseada em evidência empírica ser verdadeira é maior do
que a probabilidade de uma afirmativa não-empírica ser verdadeira. Evi
dência empírica cuidadosamente obtida, como veremos, é um corretivo
saudável e necessário para as crendices do homem e um meio salutar
de diminuir sua ignorância. Evidência não-empírica, por outro lado,
pode e às vezes ajuda a perpetuar a ignorância, como fazem os velhos
provérbios. E, em resumo, a evidência empírica freqüentemente controla
nossa mania desenfreada de fazer afirmações sobre as coisas, afirmações
que podem ou não ser verdadeiras.
A palavra “empírica” então é importante porque mostra uma ma
neira de olhar o mundo e as pessoas profundamente diferente da
maneira tradicional, que procura explicações apelando para a autoridade,
16
senso comum, ou para a razão. O homem é basicamente egoísta? Po
demos citar a Bíblia, Freud ou Shakespeare; podemos dizer que é
auto-evidente ou óbvio que o homem é basicamente egoísta ou não-
egoísta; ou podemos raciocinar cuidadosamente na base da autoridade
e da observação e concluir que o homem é basicamente egoísta ou
não-egoísta. Esta é mais ou menos a maneira tradicional.
Os cientistas, entretanto, não estão satisfeitos com essa maneira.
Se acham que a questão é cientificamente respondível — muitas questões
não podem ser respondidas cientificamente — então eles abordam o
problema díferentemente. Embora possam apresentar uma explanação
teórica, sempre fica em suas cabeças uma pergunta a importunar: O
que dirá a evidência científica? Decidindo primeiro como definir e
medir o egoísmo, o cientista preparará um estudo ou uma série de
estudos para tentar determinar até onde o egoísmo motiva o comporta
mento humano e como isto é feito. Fará, então o estudo sob condições
controladas e, depois de analisar os resultados obtidos, chegará a con
clusões que parecerão saltar da evidência. A evidência, então, é o centro
de todo o processo. Sem ela as conclusões geralmente não têm valor
científico.
Alguns leitores podem ficar em dúvida quanto à importância desta
distinção entre abordagens empíricas e não-empíricas. Podem dizer que
é óbvio, até auto-evidente, que procuramos evidências para as afirma
tivas que fazemos. Pessoas racionais sempre farão isto. Mas a questão
é justamente esta: às vezes fazem, mas muitas vezes não. Nossos siste
mas de crenças — religiosas, políticas, econômicas, educacionais — são
sem dúvida poderosos e freqíientemente guiam nosso comportamento,
não a evidência. Parece que é muito difícil usar a evidência empírica
como hábito. Se não o fosse, muitos dos problemas sociais que enfren
tamos poderíam ser resolvidos, admitindo-se a existência de boa vontade
e motivação adequada. Para compreender a ciência e a pesquisa cientí
ficas, portanto, ê necessário um esforço contínuo e consciente, nada fácil,
porque a necessária atitude empírica exige no mínimo uma suspensão
temporária de poderosos sistemas de crenças. Em outras palavras, a
primeira e última corte de apelação da ciência é a evidência empírica.
17
*
Figura 13
18
Na teoria, duas variáveis, inteligência e motivação para a realiza-
çfio, são influências diretas; acredita-se que ambas influenciem a reali
zação escolar sem passarem pelas outras variáveis. Estas influências
diretas são mostradas pela figura 1.3: as setas de inteligência e motiva
ção para a realização vão para realização na universidade. Acredita-se
que as outras duas variáveis, situação econômica familiar e classe social,
tenham influência indireta na realização escolar; elas “atravessam” a
motivação para a realização. Acredita-se, por exemplo, que em geral,
quanto mais afluente a família, maior a motivação para a realização.
Igualmente a classe social influencia a motivação para a realização: ra
pazes e moças da classe média têm maiores motivos para desejarem
progredir que os jovens das classes trabalhadoras. A inteligência, além
de sua influência direta na realização escolar — quanto maior a inteli
gência, maior a realização — tem influência indireta na realização esco- <
lar através da motivação para a realização: quanto maior a inteligência,
maior a motivação para a realização.
Temos então uma teoria da realização escolar, que pode ser boa /
ou má, dependendo de quão bem explique a realização escolar. É bas- c
tante testável. Todas as variáveis são suscetíveis de mensuração satisfa
tória (embora uma teoria não tenha necessariamente que ter apenas5'.
variáveis mensuráveis) e há técnicas analíticas que podem permitir testes^’
bastante claros das relações especificadas na teoria. -■-<
Outras finalidades da ciência, além da teoria e explicação, foram-
propostas. Não precisamos elaborar as mais técnicas destas, pois geral
mente já são dedutíveis da teoria como propósito. Há um alegado pro
pósito da ciência, entretanto, que dá muitos problemas e que confundiu
um bocado a compreensão clara da finalidade da ciência. Essa alegada
finalidade está contida em afirmações como as que se seguem, todas
elas estreitamente relacionadas: “A finalidade da ciência é ,melhorar o
destino do homem”; “A finalidade da psicologia e sociologia é ajudar
a melhorar a sociedade humana”; “A finalidade da pesquisa educacional
é melhorar a prática e o pensamento educacional”. Sem dúvida, os
sentimentos por detrás de tais afirmativas são fortes — e não é de se
admirar. Parece óbvio que a finalidade da ciência é melhorar o destino
do homem; parece tão auto-evidente!
A confusão, sem dúvida, surgiu porque os efeitos dos progressos
científicos muitas vezes aumentaram o bem-estar do homem — mas
também feriram o bem-estar humano — principalmente através de aper
feiçoamentos tecnológicos possibilitados por pesquisas e descobertas
científicas desinteressadas. Mas isto não significa que o propósito da
ciênica seja melhorar o bem-estar humano, assim como seu propósito
não é ajudar a promover guerras. Uma interpretação mais exata é que a
melhoria da vida .pode ser subproduto da ciência, um produto afortu
nado, embora não necessário das descobertas e do trabalho científico.
19
Há um parodoxo aqui. Parece óbvio que o propósito da ciência é
melhorar a humanidade. Entretanto, é uma posição perigosa porque
conduz, entre outras coisas, a distorções. As distorções resultam de duas
ou três razões. Uma, a mistura de forte compromisso e a exigência de
programas sociais e políticos, por um lado, e a pesquisa científica de
problemas de tais programas, por outro, parecem induzir preconceitos
e o que foi chamado percepção seletiva. Isto significa que vemos o que
desejamos ou precisamos ver em vez do que realmente existe. Esta
tendência é tão forte que quase cheguei ao ponto de pensar que cièn-
tistas comportamentais não deveríam pesquisar coisas que advogam
apaixonadamente. Ou melhor, quando pesquisarem, devem criar e usar
salvaguardas excepcionalmente elaboradas contra suas próprias incli
nações.
Uma segunda razão para distorções é que tendemos a confundir
missões sociais e científicas e isto leva a distorcer o que vemos, a des
gastar nossa objetividade e, mais importante, nosso compromisso com
a objetividade. O desgaste do compromisso com a objetividade é peri
goso para um cientista, póis, como já ficou dito, a objetividade é uma
característica, .científica ..inconfundível e indispensável .S ua perda destrói
a proprja ciência.
Voltando ao argumento principal, a_ciêneia e_a pesquisa científica
são absolutamente^neutras. Os resultados de pesquisas científicas podem
e são usados tanto para bons propósitos quanto para maus. Fazemos uso
de bombas atômicas, instrumentos de destruição baseados na teoria
científica, pesquisa em física e campos relacionados; usamos também
descobertas atômicas para a dessalinização da água, para a criação de
energia praticamente ilimitada, e assim por diante. Bondade e maldade,
melhora e deterioração, felicidade e sofrimento humanos, são assuntos
para as pessoas que resolveram fazer certas coisas que têm boas ou más
conseqüências, que melhoram ou pioram as coisas, que promovem a
felicidade humana ou que aumentam seu sofrimento. Naturalmente os
resultados da ciência podem ser usados para ajudar a tomar tais deci
sões, e os cientistas, como seres humanos, podem participar na tomada
de decisões, mas a ciência em si, estritamente falando, não tem nada
a ver com as decisões. Isto porque a preocupação da ciência — e é a
única atividade humana em larga escala cuja preocupação é tão desin
teressada — diz respejta.apenas à compreensão e explicação de__fenô-
mçnos naturais.
Enfatizo fortemente a finalidade da ciência desta forma porque a
concepção errada exposta acima, levada ao extremo lógico de colocar
o bem-estar humano como finalidade fundamental da ciência, conduz
finalmente a um desgaste da própria ciência e à conseqüente diminuição
da compreensão dos fenômenos físicos e humanos. O último capítulo
20
deste livro examinará novamente este problema com mais detalhes. O
motivo por que o propósito da ciência como teoria foi enfatizado aqui
é que a tentativa de sua aceitação a esta altura muito nos ajudará a
jRímpreender o conteúdo deste livro. Esta ênfase nos manterá ligados à
essência e à natureza da ciência e não nos permitirá sermos distraídos
por considerações estranhas. Por exemplo, se falarmos do chamado
lubaproveitamento de crianças brilhantes, vamos poder focalizar a com
preensão do aproveitamento ao invés de remédios específicos para o
problema. Ao fazer isto, naturalmente, já teremos assumido que a com
preensão científica do problema pode aumentar as possibilidades nossas
e dos outros de encontrar soluções práticas para o problema.
21
2. C o n c e it o s c o m p o r t a m e n t a is c ie n t íf i c o s e
d e f in iç õ e s
Variáveis
22
algumas vezes exibe inteligência. Não é fácil ver o que “agressão” repre
senta. Para o psicólogo, “agressão” pode significar um estado interior
que predispõe a pessoa a certos tipos de comportamentos chamados
Igressivos”. Para o pesquisador psicológico, entretanto, “ agressão”
Blgnifica tipos diferentes de comportamentos que têm as características
de ferir outros ou a si próprio, física e psicologicamente. Devem ser
bastante específicos; devem definir “agressão” especificando de alguma
forma o que são comportamentos “agressivos”. Fazem isto para poderem
medir ou manipular a “agressão”. A idéia de "variável” deve ficar clara
depois que examinarmos tipos e exemplos de variáveis.
23
a um grupo de crianças um reforçamento maciço e a um ségundo grupo,
reforçamento regular. Esta manipulação, com efeito, cria uma variável.
Sempre que os pesquisadores preparam condições experimentais, eles
criam variáveis. Nós chamamos tais variáveis variáveis experimentais ou
variáveis manipuladas. Pode-se demonstrar que elas satisfazem a defini
ção dada acima, embora não façamos isto aqui.
Há, então, três tipos gerais de variáveis na pesquisa comporta-
mental: variáveis categóricas, variáveis medidas e variáveis experimen
tais ou manipuladas. O reforçamento, no estudo de Clark e Walberg, é,
como ficou dito, uma variável experimental. Classe social (classe média
e trabalhadora) no estudo de Miller e Swanson sobre classe social e
criação dos filhos, descrito no capítulo 1, é uma variável categórica.
Exemplos de variáveis medidas são inteligência, ansiedade, autoritarismo,
* aptidão verbal e realização escolar. São chamadas variáveis medidas
porque são “medidas” com um teste ou outro instrumento que produz
resultados que vão de altos a baixos.
24
Outros tipos de variáveis
25
Relações
Estudos e experimentos
26
dizer, simplesmente, que os sujeitos são designados para os grupos
IXperimentais de tal forma que qualquer um possa se tornar membro
de qualquer grupo, sem ser possível dizer de qual grupo ele participará.
Ê possível fazer-se um experimento sem designação aleatória, embora
não seja desejável. Vamos deixar o assunto de designação aleatória para
o capítulo 6, porque o assunto exige explicações mais completas e
detalhadas.
A segunda característica básica de um experimento foi mostrada
no capítulo 1 — manipulação. Agora podemos ser mais precisos: mani
pulação de variáveis independentes. (Variáveis dependentes quase nunca
são manipuladas.) Repetindo: isto si unifica mie o pesquisador faz coisas
diferentes com grupos diferentes de indivíduos. Suponhamos que eu
ensine quatro grupos de alunos do quarto ano com quatro métodos dife
rentes. Isto é uma manipulação. Suponhamos que eu queira estudar os
efeitos dos tipos de tomada de decisão na produtividade do grupo. Tenho
um grupo de 90 pessoas que divido em 3 grupos de 30, denominando-os
Ai, Aa e As. As pessoas do grupo Ai terão o máximo de oportunidades
de participar das decisões do grupo (as quais são uma parte da manipu
lação), as do grupo A2 uma ou outra oportunidade de participar,
e as do grupo A3 nenhuma oportunidade. Isto também é uma ma-
pipulação.
A manipulação experimental varia da mais simples à mais com
plexa. A manipulação da variável independente de Clark e Walberg foi
simples: dois grupos, um recebendo reforçamento maciço, o outro, re
gular. Para que o leitor não pense que toda ou mesmo a maioria das
manipulações se limitam a dois grupos, examinemos uma ligeira exten
são da manipulação até três grupos. Aronson e Mills (1959), num inte
ressante experimento sócio-psicológico, testaram a idéia de que quanto
mais dificuldade se encontrar para entrar em um grupo, mais os mem
bros deste grupo darão valor a ele. Os membros de um grupo receberam
uma iniciação severa, os de outro, uma iniciação suave e aos membros
do grupo restante não se exigiu nada para se tornarem membros do
grupo (o “grupo de controle”). (A manipulação incluiu a leitura, por
jovens do sexo feminino, de palavras que variavam em termos de
Obscenidade.) Foi predito que os membros do primeiro grupo valoriza
riam mais a participação no grupo, os membros do segundo, um pouco
menos, e os do terceiro — o grupo de controle — valorizariam menos
ainda. (A exnectativa foi confirmada pelos resultados.) Isto também é
uma manipulação: foram feitas coisas diferentes sistematicamente com
os três grupos. As virtudes e outras características deste poderoso método
de obter conhecimento serão exploradas mais tarde. Veremos também
que é perfeitamente possível manipular mais do que uma variável inde
pendente por ver.
27
Há vários tipos de estudo científico. Um experimento é apenas um
deles. Todos os outros são não-experimentais. Um levantamento de
opiniões é não-experimental. Assim é toda a investigação das relações
entre variáveis quando não há manipulação. O estudo de Miller e
Swanson sobre classe social e criação de filhos é um exemplo. Não
foi um experimento porque não houve manipulação de uma variá
vel independente. Freqüentemente a distinção é mal entendida. Estudos
que são não-experimentais são às vezes chamados experimentos. Entre
tanto, a distinção é muito importante porque as conclusões de um expe
rimento bem conduzido geralmente são mais fortes do que as conclusões
de um estudo bem conduzido que não seja um experimento. Voltaremos
a esta distinção no capítulo 8 ,
Dados
28
Apesar de seu uso específico, “ dados” também se refere a quase
qualquer evidência obtida em pesquisas. Pode-se até afirmar que “ dados”
e “evidência” são usados quase como sinônimos. As observações feitas
por ministérios de educação e anotadas sob determinada forma são cha
madas “dados”. Saídas de computador são chamadas “dados” . Pontos
obtidos em testes são chamados “dados”.
Variação e variância
29
e relacionados através das suas variações. O que significa esta afirmação
ligeiramente estranha? Virtualmente nenhum conhecimento científico
seria possível se o fenômeno não variasse. O psicólogo não poderia
estudar a inteligência se a inteligência das pessoas não variasse. O soció
logo não poderia estudar classes sociais e suas relações com outras
variáveis se as pessoas e grupos não diferissem em classes sociais. Diz-se
que um grupo de pessoas, por exemplo, alunos de quarta série, é alta
mente variável em inteligência. Outra maneira de dizer isto é: a variância
de inteligência da classe é grande. Por outro lado, a variância de inteli
gência de um grupo de candidatos ao doutorado pode ser pequena. Se
por ora o leitor puder confiar na veracidade destas afirmações sobre
variação, vamos apoiar esta confiança con. razões em um capítulo
posterior.
Embora não se discuta bastante estatística neste livro, é imperativo
que conheçamos alguns termos estatísticos e seu significado geral.
“Variância” é um termo tanto estatístico quanto geral. É geral enquanto
significa a variabilidade do fenômeno, como discutido acima. Os cien
tistas comportamentais usam-no muito desta forma. “Variância” é tam
bém uma medida estatística que expressa a variabilidade de qualquer
conjunto de medidas, e, assim, indiretamente, de qualquer conjunto de
indivíduos. 2 Os cientistas comportamentais falam muito sobre a va
riância de um fenômeno ou sobre a variância de uma variável afetada
pela variância de outra variável. O pesquisador educacional poderá per
guntar: “ Quanto da variância de realização é devida à variância de inte
ligência, à variância de motivação, à variância de background familiar?”
Isto é simplesmente uma maneira resumida e semitécnica de dizer: “As
crianças de alto grau de inteligência têm alta realização e as crianças de
inteligência inferior têm baixa realização? As crianças com alta motiva
ção se saem bem e as crianças com baixa motivação não se saem bem?
Crianças de ambiente familiar favorável se saem bem, enquanto
crianças de ambiente familiar desfavorável não se saem bem?
Esta é uma maneira de dizer que as variáveis covariam, variam
juntas de modos sistemáticos. Assim, os pesquisadores falam freqüente-
mente em covariância, um termo técnico que significa a variância com
partilhada por duas ou mais variáveis. Olhe novamente para a figura 1.1.
A parte sombreada representa a covariância ou a variância compartilhada
pelas duas variáveis.
Olhe os números na tabela 2.1. Os dois grupos de números em I
covariam perfeitamente. Os dois grupos de números, a e b, são os
mesmos: para um número alto em a, há um número alto em b; para
2 Uma-discussão técnica e geral do termo, das idéias por detrás dele e de como é
usado, pode ser encontrada em Kerlinger (1973, cap. 6).
30
Tabela 2.1 Três conjuntos de pares de postos * expressando covariâncias e
relações diferentes.
I II III
a b a b a b
1 1 i 5 i 3
2 2 2 4 2 5
3 .3 3 3 3 1
4 4 4 2 4 4
3 5 5 1 5 2
Probabilidade
31
de desassossego e ansiedade em nós induzidos pela incerteza do nosso
mundo. Eles nos oferecem um credo ou uma pessoa a seguir cegamente,
com promessas de grandes recompensas.
A ciência e a pesquisa comportamental não nos oferecem certeza.
(Nem a ciência natural!) Não oferece nem mesmo certeza relativa.
Oferece apenas conhecimento probabilístico: Se A for feito, então pro
vavelmente B ocorrerá. A afirmativa usada antes, “A frustração leva à
agressão.”, é na verdade incorreta. Uma afirmativa mais correta é: “A
frustração provavelmente leva à agressão”. Uma maneira de definir a
pesquisa comportamental pode ser dizer que ela é urn meio de ajudar a
reduzir a incerteza. A pesquisa empírica jamais pode nos dizer que
alguma coisa é certamente assim. Pode, entretanto, dizer: “As probabi
lidades de tal coisa ser assim ou «.«sado são de 70 para 30”.
A probabilidade e o pensamento probamiísuco são o núcleo da
moderna ciência e pesquisa comportamental. Infelizmente, é difícil defi
nir a probabilidade satisfatoriamente. Vamos usar uma abordagem
intuitiva, como sempre, mas o leitor fica avisado de que pode desa
gradar os especialistas. A probabilidade de um acontecimento é o número
de casos “favoráveis” dividido pelo número total de casos (igualmente
possíveis). (“Caso favorável” significa qualquer resultado estipulado ou
previsto.) Seja f = número de casos favoráveis. E p = número de
casos favoráveis dividido pelo número total de casos, N. Seja o caso
favorável à ocorrência de cara no lançamento de uma moeda. Então p é
a proporção de caras em N lançamentos, ou p = f/N . Já que há duas
possibilidades no lançamento de uma moeda, p = 1/ 2. O caso ou evento
favorável pode ser o 6 do dado. Então, p = 1/6: a probabilidade de
ocorrer um 6 é 1/6. Se houver 50 homens e 50 mulheres em determinada
amostra de 100 pessoas, a probabilidade de escolher um homem (ou
mulher) é 50/100 = 1/2 (num processo de seleção imparcial).
Isto tudo é muito simples. Mas a probabilidade pode ser complexa.
Nossa preocupação aqui, entretanto, é apenas com a compreensão preli
minar e intuitiva. Em geral, o leitor precisa compreender que todos os
enunciados científicos são probabilísticos. Sempre há incerteza. As ciên
cias naturais oferecem maior certeza do que as comportamentais. Aliás,
todas as disciplinas científicas são mais ou menos incertas. Todas as afir
mativas, em outras palavras, vêm acompanhadas com um valor p implícito
ou explícito. É por isso que a bibliografia da ciência comportamental
fala tanto em “tendências”.
O leitor não deverá ficar muito preocupado se não apreendeu com
pletamente os termos e expressões dados acima. Leva-se tempo para
acostumar-se a eles. O que precisamos a esta altura é uma familiaridade
geral. As lacunas serão preenchidas mais tarde. Em todo caso, agora
temos suficientes definições para continuarmos com a discussão principal.
3. P r o b le m a s , h i p ó t e s e s e v a r iá v e is
34
enunciados têm pouco ou nenhum significado. Naturalmente, têm signi
ficado para religiosos, políticos, pais, professores e novelistas, mas se
mantêm além do alcance da ciência.
Tais questões, propostas desta forma, não são testáveis, ou porque
lhes falta a forma de questões ou proposições testáveis (que discutire
mos mais tarde) ou porque a linguagem em que são expressas é tão
vaga que as torna cientificamente intratáveis. Eis outro exemplo da
educação. É um problema que, embora tenha intrigado e importunado
os pesquisadores de educação durante meio século, é virtualmente
irrespondível cientificamente, pelo menos desta forma: “ O que faz um
professor bem sucedido?” Para muitos educadores, isto pode não parecer
um problema. Eles acham que sabem a resposta; acham que sabem o
que é um professor bem-sucedido. Até agora, entretanto, o problema
não foi resolvido — num sentido científico.
Há diversas razões pelas quais ainda não foi resolvido. Para come
çar, a questão é inútil porque não há o enunciado de uma relação entre
variáveis. Portanto, não pode ser testada ou respondida cientificamente.
(Com toda a honestidade, talvez jamais seja respondida.) Por outro lado,
o problema é extremamente complexo: tem inúmeras facetas que não
são imediatamente aparentes, tornando-se difícil lidar com elas. Por
exemplo, o que se quer dizer com “bem sucedido”? Bem sucedido em
conseguir que os alunos aprendam, será? Aprender o quê? O que signi
fica “aprender”? O “sucesso” está ligado a certas características pessoais
e profissionais dos professores? Ao que os professores realmente fazem
em classe? Às suas atitudes? “Bem sucedido” também implica “mal
sucedido”. O que significa um professor mal sucedido? Este “mal su
cedido” significa o oposto de “bem sucedido”? Ou é diferente apenas?
Ou “mal sucedido” é uma idéia tão complexa quanto “bem sucedido”?
Em resumo, temos aqui uma questão complexa cuja dificuldade
úda. É de se admirar, então, que não tenha sido resolvida?
35
realização em leitura entre crianças negras carentes?” O problema geral
do estudo de Miller e Swanson pode ser colocado: ‘‘Mães de diferentesi
classes sociais usam tipos diferentes de criação?” Um problema maisi
específico (Ver tabela 1.1) é: “ O tempo de desmame de crianças difere
nas classes média e trabalhadora?” Estes problemas são bem específicos;
e, naturalmente, podem ser apresentados de maneira mais geral.
Há muitos anos Hurlock (1925) perguntou: “ Qual é o efeito de
diferentes tipos de incentivo no desempenho dos alunos?” Este problema
é mais geral. Eis outro (Etzioni, 1964): “O conflito aumenta ou impede
a eficiência de organizações?” Um interessante problema sócio-psicoló-
gico foi apresentado por Frederiksen, Jensen e Beaton (1968): “Como
o clima organizacional afeta o desempenho administrativo?” Berkowitz
(1959) fez esta importante pergunta: “Sob condições de deflagração
de hostilidade, como o anti-semitismo influi no deslocamento da agres
são?” Ou, quando frustradas, pessoas altamente anti-semitas exibem
comportamentos mais agressivos em relação aos outros, que pessoas
menos anti-semitas?” Em seu importantíssimo estudo inter-cultural sobre
“categorias naturais” de cognição, Rosch (1973) fez a seguinte pergunta:
“ Protótipos naturais de cor e forma facilitam a aprendizagem de cate
gorias de cor e forma?” 1
Repetindo, um problema de pesquisa científica em primeiro lugar
é unia questão, uma...sentença em-lõnna Jpterrogativã7 SegundõT uma
questão jjuejgeralmente pergunta alguma coisa a respeito- clãs relações
entre fenômenos ou variáveis. À resposta à questaoTe procurada nã pes-
quísaTClark e Walberg, baseando-se em suas descobertas, puderamafir-
mar que o reforçamento maciço melhorava a leitura de crianças negras
carentes. Miller e Swanson puderam afirmar que as mulheres da classe
média tinham tendência a desmamar seus filhos mais cedo que as mães
da classe trabalhadora.
Três critérios de bons problemas de pesquisa e proposições de pro
blemas podem ajudar-nos a compreender problemas de pesquisa. Pri
meiro, o problema deve expressar uma—relação, entre duas ou mais
variáveis. Pergunta: “A está relacionado com B?” “Como A e B estão
relacionados com C?” Embora haja exceções neste critério,_s.ãa. raras.
Segundo, o problema deve ser ~apresentado em forma interrogativa. A
interrogação têm a virtude de apresentar ó problema diretamente. No
exemplo de Hurlock, dado acima, o problema é apresentado diretamente
pela pergunta sobre a relação entre incentivos e desempenho.
36
Empírico da Ciência” no capítulo 1.) Testagem empírica significa que
seja obtida evidência real sobre a relação apresentada no problema.
Obter evidência na questão incentivos-desempenho de Hurlock signi
fica manipular (ou medir) incentivos, medir o desempenho do aluno e ava
liar o suposto efeito do incentivo sobre o desempenho. Às vezes é difícil
dizer claramente que o problema tem implicações de testagem empírica.
Entretanto, é preciso fazer a distinção para que a pesquisa tenha possi
bilidade de dar certo. As principais dificuldades com questões não-tes-
táveis são o fato de não serem enunciados de relações (“O que é o
conhecimento?” “Como se deve ensinar a ler?”), ou seus constructos ou
variáveis serem difíceis ou impossíveis de definir de maneira a poderem
ser manipulados ou medidos. Isto geralmente funciona com questões de
valor e moral, questões que indagam sobre o certo e o errado das coisas,
suas qualidades ou defeitos ou sua desejabilidade ou indesejabilidade.
Vamos nos concentrar novamente em juízos de valor. Tomemos afirma
tivas como: “A democracia é o melhor de todos os sistemas de governo” ;
“ Igualdade é tão importante quanto liberdade” e “ O casamento é bom”.
São juízos de valor; não são testáveis cientificamente. A não-testabilidade
de juízos de valor já foi discutida, mas a distinção entre jmzõT^eTãlõr
©“enuntrrados empíricos TmHEesFáveis êt a o ímjíõftãnte^que^âeVe^nKK^exa-
nMá4a"-de~TOv^'üm'^põuco màB'^nãIiHicãineníer' —“
—"TTízêr que alguma coisa é boa ou má, melhor ou pior, é dar um
julgamento humano. Só o homem pode dizer que uma coisa é boa ou
má — e não se discute. Nenhum procedimento científico pode conter
uma resposta sobre a rela~tiva desejabilidade, de uma coisa. Ãs afirma
tivas científicas dizem simplesmente: “ Se Tsto for verdade, então pro
vavelmente acontecerá aquilo”; “Se se frustram as pessoas, elas prova
velmente agredirão outras, agredirão objetos ou elas próprias”. Tais
afirmativas não têm comprometimento com virtude ou defeito, desejabi
lidade ou indesejabilidade, valor moral ou falta de valor moral. Nem
podem fazer tal comprometimento. Na verdade, o cientista, como pessoa,
pode fazer tal julgamento — e pode ser sábio ou tolo como qualquer
um — mas ao fazer isto ele sai fora de seu papel de cientista.
É neste sentido que a ciência é neutra. Não é neutra por haver
alguma virtude especial em ser neutra. É simplesmente a natureza da
ciência, que está em testar relações empíricas entre fenômenos ou variá
veis — e, para fazer isto, exige que o fenômeno seja de natureza a ser
observado, manipulado ou medido. Enquanto o cientista pode estudar
yalQres,_ c.omo_ valores, e sua_ relação.-com outros, .fenômenos —. por
exemplo, ele pode estudar como a posse de certos ...valores econômicos
influencia a maneira de as pessoas votarem (“O capitalismo é bom”.
“Ja propriedade privada é sagrada”) — ele não pode estudar proposi-
ções que incluam julgamentos éticos ou morais. Simplesmente não há
37
maneira de chegar aos referentes empíricos de palavras como “deveria”,
“conviría”, “bom”, “mau” e “ precisaria”.
/
Hipóteses
38
dicJa com um ou mais dos muitos testes disponíveis de capacidade
mental ou de deficiência mental. Naturalmente pode surgir um problema
difícil em decidir o que é ou não é “deficiência” . Mas o que interessa
aqui é determinar se_a_jza£Íáv^pod&-Rer—medi da.
A_hipótese “Privação na infância prodqjz deficiência mental mais
tarde” é uma hipótese _.p.orque-. enunGÍa uma—relação—conjetural_entre
variáveis aue podem ser manipuladas ou medidas. A relação é expressa
pela palavra “produz.^. Uma palavra- cm expressão de relação une de
alguma forma as variáveis: “produz”, “está positivamente relacionada
a”, “é uma função de”, e assim por diante. Um modo melhor de com
preender todas estas afirmativas, entretanto, é traduzi-las todas para
enunciados “se-então”. Embora não haja regras fixas para se escrever hi
póteses — há várias espécies, todas legítimas e úteis — a maioria pode
ser colocada na forma se-então: “Se p, então q”, p e q sendo contructos
ou variáveis. “ Se frustração, então agressão” ; “Se privação na infância,
então deficiência na realização escolar mais tarde”; “Se reforçamento,
então aumento na aprendizagem”. Em todos estes enunciados duas va
riáveis estão ligadas entre si como as palavras “se” e ‘então’ Colocado
muito simplesmente, uma hipótese é quase sempre ura enunciado de
uma relação,j j natureza da relação sendo especificada até certo ponto
pãlã"estrutura se-então do enunciado.
Consideramos hipóteses com duas variáveis apenas. Na pesquisa
comportamental moderna, entretanto, é mais provável haver mais de
duas variáveis. As hipóteses serão então: “ Se p, então q, sob as condi
ções r e s”. Se incentivo positivo (p), então aprendizagem aumentada
(q), dado sexo feminino (r) e classe média (s). Outra maneira de simbo
lizar esta hipótese é.: “Se p, e p 2 e p3, então q” ; “Se incentivo positivo
(pO e sexo feminino (p2) e classe média (p3), então aumento na apren
dizagem (q)”. Voltaremos mais tarde aos problemas multivariáveis, ou
“multivariados”. São muito importantes.
Em resumo,_hiPÓtescs,.sã.O-enunciados conieturais ,de relações e são
estas conjeturas que são testadas na pesquisa. Vejamos agora jx jrq u e
ás" hipóteses são importantes.
39
discutido no capítulo 1. Iste qu.er dizer que as hipóteses são uma fer
ramenta poderosa para o avanço do conhecimento porque, embora for
muladas pelo homem, podem ser testadas e mostradas como provavel
mente corretas ou incorretas à parte dos valores e crenças do homem.
Naturalmente, os cientistas querem que suas idéias sobre a realidade
concordem com a “realidade”.
Um psicólogo social, por exemplo, pode acreditar que um método
por ele criado de lidar com o preconceito, chamado método K, seja mais
eficiente do que outros em diminuir, o preconceito. Ele acha que se K
fosse usado sistematicamente em escolas de segundo grau e em univer
sidades, ajudaria a reduzir o preconceito contra as minorias onde quer
que fosse usado. Ele está dizendo que o método K é mais eficiente do
que outros métodos e mais eficiente do que não fazer nada. Se ele for
testar sua crença cientificamente, ele terá que achar um meio de ficar
de fora de sua crença, saindo para fora de si mesmo. As hipóteses aju
dam a fazer isto, O psicólogo social pode formular uma hipótese de que
o método K, depois de uso suficiente, resultará em maior diminuição de
preconceito do que, digamos, os métodos L e M (e talvez outros mé
todos ou nenhum método).
A hipótese agora é uma afirmativa “lá fora”, independente do pes
quisador. Está “fora dele” no sentido de que, apesar de sua crença
pessoal, predileções e inclinações — sua aversão pelo preconceito, por
exemplo — pode ser testada fora de suas crenças, predileções e viéses.
Embora esteja pessoalmente a favor do método K, sua crença de que o
método K seja superior não pode afetar o teste da hipótese e o resultado.
Assim, as hipóteses são meios especialmente potentes de preencher obie-
tivamente as lacunas entre uma crença pessoal e a realidade empírica.
"São ferramentas para testar a realidade e podem ser mostradas como
provavelmente corretas ou incorretas, independentemente do investigador.
As hipóteses têm outras virtudes. Uma delas é que podem ser, e
freqüentemente são, deduzidas da teoria. Qualquer teoria de importância
terá um número de implicações empíricas que podem ser deduzidas
dela. Foi escrito um livro inteiro (Dollard, Doob, Miller, Mowrer & Sears,
1939) sobre as implicações da hipótese geral de que a frustração produz
agressão. Na verdade, esta hipótese geral é bastante ampla para ser o
enunciado básico de uma teoria, a teoria da agressão. Tem implicações
empíricas. Por exemplo, se frustrarmos as crianças, elas agredirão outras
crianças, adultos ou elas próprias. Dollard e seus colegas até salienta
ram que se podem deduzir implicações marxistas da hipótese geral:J‘Se
o trabalhador TQ^-^plorado- treciBênciõ '“salários' baixos, trabalhando
horaiTêxtras e_agsim_par_diante), ele iicará frustrado. Se continuar frus-
trádõ ~Dormm~l&ne8-r3eríodoy.ele...acabará...se revoltando, e destruindo seu
frustrador. a burguesia”. A questão é que qualquer teoria, se realmente
40
for uma teoria, terá muitas implicações para serem testadas; ela gerará
(com ajuda, naturalmente) muitas hipóteses testáveis. Sem dúvida é
assim que as teorias são testadas.
Hipóteses e testabilidade
42
A semelhança de crenças influi mais em aceitar os outros que a
semelhança de raça? (Rokeach & Mezei, 1966). Este problema tão
controvertido, pergunta, com efeito, se a semelhança de crença é mais
poderosa do que a semelhança (e diferença) de raça em influenciar as
pessoas a aceitarem outras. Se um branco concorda com as crenças de
um negro, ele irá aceitá-lo mais do que aceitaria um branco de cujas
crenças ele discordasse? Se for conservador, por exemplo, ele aceitará
os conservadores negros em geral mais do que aceitaria brancos liberais?
São perguntas fascinantes, difíceis de responder. Temos aqui um pro
blema que é enunciado implicando termos quantitativos, já que vamos
usar “mais”. (Parece que a resposta é Sim, crença é mais importante
do que raça, mas não em todas as circunstâncias.)
Já foi dito que muitos, talvez a maioria dos problemas da pesquisa
comportamental, têm mais que uma variável independente. Aqui está
um enunciado de problema com três variáveis independentes: Como a
aptidão acadêmica, a realização no ginásio e o nível de aspiração influen
ciam a realização acadêmica? (Worell, 1959). Tais problemas com múl
tiplas variáveis estão mais próximos da realidade psicológica e social;
eles refletem com mais nitidez as complexas estruturas causais dos fenô
menos, neste caso, a realização acadêmica.
Eis uma hipótese derivada do primeiro problema dado acima. “ A
prática em uma função mental não tem efeito sobre a futura aprendiza
gem desta função mental” (Gates & Taylor, 1925). Observe a estrutura
se p, então q da hipótese: "Se prática numa função mental, então (não)
futura aprendizagem da função mental” . Observe também a forma nega
tiva da hipótese: “A prática (treino) não tem efeito” . Isto é raro. A
maioria das hipóteses especifica alguma direção do efeito. (A hipótese
foi corroborada.)
Uma hipótese mais convencional: “ Indivíduos que têm papéis
ocupacionais iguais ou semelhantes terão atitudes semelhantes em rela
ção a coisas significativamente relacionadas ao papel ocupacional”. Isto
significa, por exemplo, que os médicos manterão crenças e atitudes
semelhantes em relação a assuntos médicos. Se a hipótese for apoiada
pela evidência, conclüímos que a maioria dos médicos pensa igual no
que se refere a cuidados médicos.
Nossa hipótese final é uma hipótese que vem sendo cada vez mais
testada na pesquisa comportamental contemporânea: “ Pessoas anti-semi
tas deslocarão agressão para outros quando ua hostilidade estiver
deflagrada” (BerKowitz, 1959). Aqui há duas variáveis — anti-semitismo
e deflagração de hostilidade — que levam^ao^ieslo&amento da agressão.
A hipótese diz que o anti-semitismo (‘produzirá^ agressão deslocada
apenas sob a circunstância de deflagração de-hosíílidade. Isto é, a estru
tura do argumento é: Se p, então q, dado r; ou Se anti-semitismo, então
43
Figura 3.1
Variáveis
Obviamente, variável é uma coisa que varia, que tem valores dife-
rentesJVIêdimos, digamos, o nível de aspirãçaõ deüm gmpolíé'criãncas.
Para cada criança~oBfemos uma nota, algum tipo de número Dizemos
44
que medimos a variável “nível de aspiração”. Embora intuitivamentè
atraente, até instrutiva, esta definição não é realmente uma definição.
E também não é exata.
Uma variável é um símbolo ao qual são atribuídos algarismos.
Exempios de tais símbolos são A, x, M ou inteligência, nível de aspira
ção, ansiedade. A variável x pode assumir um conjunto dé valores numé
ricos, por exemplo, pontos obtidos em um teste de inteligência ou de
leitura. A variável A pode assumir os valores at, a2 e a3, e assim pôr
diante, que podem representar os valores numéricos obtidos por uma
medida de atitude feita com uma escala de sete pontos. Podemos obter
òs resultados de atitude de quatro indivíduos: a, = 6, a2 = 3, a.i = 5,
Ü4 = 4. A é uma variável. Se quisermos, podemos dar-lhe o nome de
Atitude em relação às mulheres.
Esta definição de variável é simples e geral, embora um pouco
afastada do senso comum. É geral porque abrange todos os casos conce
bíveis e tipos de variáveis. E, embora seja um tipo de definição que não
pertence ao senso comum — pode parecer estranho até — não é nada
complicada e é fácil de entender. Há símbolos que podem ser letras dc
alfabeto, palavras ou expressões curtas: X, Y, A, K, inteligência, atitudes
em relação às mulheres, ansiedade, classe social, nível de aspiração,
retenção, preferência religiosa, renda e assim por diante. Logicamente,
variáveis são propriedades que tomam valores diferentes. Algumas variá
veis podem ter muitos valores, até um número infinito (teoricamente:
por outro lado, variável podem ter um mínimo de dois valores. 3 Inteli
gência, retenção, atitudes em relação às mulheres, podem ter vários valo
res. Sexo tem apenas dois valores, geralmente 1 e 0, 1 sendo designado
para um sexo e 0 para o outro. Morto-vivo, empregado-desempregado
são também variáveis de dois valores ou dicotômicas. Classe social,
geralmente, tem dois, três ou quatro valores. Preferência religiosa é um
tanto diferente. Embora seja uma variável chamada nominal ou cate
górica (veja abaixo), os valores a ela atribuídos são invariavelmente 1 e 0,
mas por enquanto não vamos mostrar como isso é feito.
Antes de mudarmos de assunto, devemos observar que variáveis
são também conceitos e constructos. Um conceito e, Tiitúfalmenté, um
t-ermo—geral ~qüè expressa a suposta idéia central por trás de objetos
particulares relacionados. Quando os cientistas falam sobre os conceitos
usados em seu trabalho, chamam-lhes freqüentemente “constructos”.
“Constructo” é um termo útil porque indica a natureza sintética das
variáveis psicológicas e sociológicas. Expressa a idéia de que os cientistas
3 É possível, por definição, uma variável ter só um valor. Nestes caso é chamada
constante. Lidamos • quase que exclusivamente com variáveis de dois ou mais
valores.
45
freqüentemente usam termos de acordo com a necessidade e exigências
de suas teorias e pesquisas. Inteligência, aptidão, ansiedade, locus de
controle, agressão, autoritarismo, classe social, sexo e realização são
todos constructos. Se a definição de “variável” dada acima pode ser
satisfeita — isto é, se algarismos puderem ser atribuídos a objetos de
acordo com regras — então, podemos chamar de variável um cons-
tructo. Õ leitor encontrará freqüentemente estes termos na bibliogra
fia da psicologia e educação, mas eles nem sempre serão usados pre-
eisamente. Entretanto, deve ser lembrado que há diferenças entre eles.
Por exemplo, é bom saber que, embora seja teoricamente possível
transformar a maioria dos constructos em variáveis, nem sempre é pra
ticamente possível fazê-lo. Um exemplo, a repressão de Freud, foi dado
»anteriormente.
Definições operacionais
46
•Ilim por diante) é o resultado no teste de inteligência X, ou inteligência
i o que o teste de inteligência X mede. Esta definição nos diz o que
fazer para medir a inteligência. Diz ao pesquisador para usar o teste
tlc inteligência X. Realização pode ser definida citando um teste padro
nizado de realização, um teste feito pelo professor, ou notas dadas pelos
Ijofessores. Aqui temos três maneiras diferentes de definir operacional-
tnente o mesmo constructo. O leitor não deverá se preocupar com esta
Multiplicidade de definições operacionais; faz parte de sua flexibilidade
• força. Afinal, um constructo como realização tem várias facetas em •<
Momentos diferentes. Consideremos até o exemplo óbvio de diferentes
Areas de realização: leitura, aritmética, artes e assim por diante.
O
Vejamos um exemplo mais difícil. Suponhamos que queiramosO
definir a variável “consideração”. Pode ser definida operacionalmente;'
ftrrolando-se comportamentos de crianças que são presumivelmente com- j
portamentos que expressam consideração, e fazendo os professores obser-.-'
varem e classificarem os comportamentos das crianças numa escala de-
çinco pontos. Tais comportamentos podem ser: quando uma criança diz::
a outra: “com licença”, “desculpe”; quando uma criança entrega um*:
n sig
|finquedo pedido a outra; ou quando uma criança ajuda outra enS
uma tarefa. g
O tipo de definição discutido pode ser chamado uma definiçãi-
ifperacional medida. Ela mostra ao pesquisador como medir (e observaçB
uma variável. Lembre-se das variáveis de Miller e Swanson, classe
gocial e tempo de desmame. Há também definições operacionais experi
mentais que mostram ao pesquisador como manipular uma variável. Por
exemplo, o reforçamento pode ser definido operacionalmente dando os
detalhes de como os indivíduos devem ser reforçados — como Clark
e (Walberg fizeram. No estudo sobre os efeitos dos diferentes incentivos
sqjjre o desempenho de alunos em aritmética, já mencionado, Hurlock
(1925) elogiou algumas crianças, criticou outras e ignorou outras. A
frustração pode ser definida como um impedimento de alcançar uma
meta, uma definição constitutiva com implicações claras para a manipu
lação experimental. Isto foi muito bem realizado por Barker, Dembo e
Lewin (1943), que definiram frustração operacionalmente descrevendo
Crianças em uma sala de jogos “com um número muito grande de brin
quedos muito atraentes, mas inacessíveis.” (Os brinquedos foram deixados
atrás de uma tela de arame; as crianças podiam vê-los, mas não tocá-los.)
Como outras idéias apresentadas neste livro, a definição operacional
é uma invenção notável. Como ficou dito no início deste tópico, é uma
ponte entre conceitos ou constructos e observações, comportamentos e
atividades reais. Para esclarecer, veja a figura 3.2. A figura mostra os
dois níveis nos quais os cientistas operam: o nível dos constructos e
hipóteses (I) e o nível da observação e manipulação (II). Os dois níveis
47
Figura 3.2
48
Iuuh definições operacionais, entretanto, podem dar resultados dife
rentes. Se ambas forem “ boas” definições operacionais, devem estar em
jiifffeito acordo.
Em um interessante estudo mencionado anteriormente, Walster e
outros (1973) definiram uma de suas principais variáveis com muita
igbllidade. Tentaram, em sua pesquisa, encontrar a resposta para uma
Antiga pergunta: “As ‘mulheres difíceis’ são mais atraentes para os
liOmens do que as mulheres não tão difíceis?” Sujeitos do sexo masculino
tlpeberam cinco pastas contendo informações sobre uma mulher. Três
delas continham “formulários para a seleção de candidatos” , contendo
iin possíveis reações da mulher a cinco homens seus prováveis candidatos.
Illias reações eram anotadas como marcas feitas pela mulher numa escala
partindo de “escolhido com toda certeza”. Ou seja, cada “mulher”
llaera, presumivelmente, cinco marcas em cinco pastas, e estas marcas
lllflicavam-na como “fácil” ou “difícil”. Por exemplo, a que marcasse
um todas as escalas “escolhido com toda certeza” era uma mulher
"fácil”. Se, por outro lado, ela não se entusiasmasse com nenhum dos
ffn didatos. era “difícil”. A categoria mais interessante e decisiva foi a
mulher “seletivamente difícil” : ela não desejava nenhum dos outros
homens além de você (uma das pastas referia-se ao sujeito). Este proce
dimento, então, era a definição operacional de “dificuldade” da mulher,
Uma definição muito habilidosa.
Nos exemplos acima, observe que a definição operacional mostra
com bastante detalhe o que o pesquisador deve fazer para medir as
Üfiáveis. Holtzman e Brown especificamente relataram como a média
de notas seria calculada, e Walster e outros detalharam o procedimento
para obter medidas de “dificuldade”. Igualmente, em situações experi
mentais, as definições operacionais especificam o que os experimenta-
dores devem fazer para manipular uma ou mais variáveis independentes.
Elas dão as operações envolvidas.
Nada, entretanto, ficou dito sobre a qualidade das definições opera
cionais. Como as definições constitutivas, elas podem ser boas ou más,
bem ou mal concebidas. Tem havido críticas às definições operacionais
(e à filosofia do operacionalismo que as inspirou), que erraram comple-
tomente o alvo. Foi dito, por exemplo, que nenhuma definição opera
cional jamais pode expressar o significado completo e a riqueza de
Conceitos como agressão, repressão, ansiedade, autoritarismo, aprendi-
Mgem, realização e assim por diante. Exatamente. Jamais poderá. Mas
acontece o mesmo com as definições constitutivas! Definições operacio
nais são definições limitadas freqüentemente muito limitadas, cujo
pbjetivo é ajudar o pesquisador a chegar a aspectos da “ realidade”
fljOtnportamental. Há sempre o perigo de fracionar de tal modo um
conceito que este passe a ter pequena relevância para o seu "verdadeiro”
significado. Isto não implica, contudo, que seja impossível inventar e
usar definições operacionais que aproximem aspectos significativos da
“realidade” conceituai. Difícil, mas não impossível. Sem dúvida, o
sucesso científico em inventar e usar definições tão limitadas tem sido
gratificante. À medida que avançarmos em nosso estudo veremos exem
plos cada vez mais marcantes de definições operacionais e o ir e vir
entre os dois níveis de operação da ciência.
4
*
50
4. R e la ç õ e s e e x p lic a ç õ e s
KTkAi
mas de grupos minoritários e dos problemas de preconceito e discrimi
nação. Uma dessas relações é a que existe entre a discriminação contrai
grupos minoritários e a tendência à violência dos grupos minoritários.
Acredito, por exemplo, que quanto mais o grupo for discriminado, mais
seus membros apelarão para a violência. Coletei dados sobre oito grupos
e posso classificá-los em duas variáveis: discriminação e violência. Espe
cialistas classificaram os oito grupos conforme os graus de discriminação
usados contra eles, 1 significando a maior discriminação e 8 o mínimo
de discriminação. Obtive também estatísticas do total de violência que
caracterizou os oito grupos nos últimos cinco anos. (Não vamos nes;
preocupar agora de como isso foi feito.) A partir dessas estatísticas,
jçlassifiquei os oito grupos de alto a baixo em violência, 1 significando
glta violência e 8 baixa.
Os dois conjuntos obtidos estão na figura 4.1 A figura expressa uma
"relação”. Faz isto porque mostra dois conjuntos de números que foram
sistematicamente emparelhados: o primeiro grupo minoritário, o que
foi mais fortemente discriminado e que portanto recebeu o posto 1,
recebeu um posto 2 em violência. O segundo grupo, o segundo mais
fortemente discriminado (posto 2) teve o terceiro (3) lugar em violência
e assim por diante com os grupos restantes. Em resumo, os dois con
juntos de postos colocados em relação entre si, como na figura 4.1,
expressam uma relação.
Pode parecer um pouco estranho chamar os dois conjuntos de
©.úmeros uma “relação”. Mas não é. Aliás, é muito preciso e claro, como
Veremos. Todas as relações podem ser expressas de algum jeito, embora
nem sempre seja preciso usar números. O caso é que os dois conjuntos
de números, considerados conjuntamente como na figura 4.1, são uma
felação. Mais adiante veremos que as relações têm direção e magnitude.
No caso presente, a direção é positiva: os dois conjuntos de números
"vão juntos” um com o outro: os postos baixos em discriminação ten
dem a emparelhar-se com postos baixos em violência e postos altos com
postos altos. A magnitude da relação será discutida mais adiante neste
gBpítulo.
51
Figura 4.1
52
Conjuntos
Relações
no teste, Marie recebeu 131, Jacob 127 e assim por diante. Temos, então,
dois conjuntos, um de cinco nomes representando as cinco crianças e
um de cinco números representando os pontos feitos pelas crianças em
um teste de inteligência.
Talvez possamos tornar o exemplo um pouco mais interessante.
Estude a figura 4.3. O conjunto dos cinco resultados no teste de inteli
gência, X, está à esquerda. O conjunto da direita, S (de “sexo”), tem
dois membros, M e F, significando masculino e feminino. Os membros
dos dois conjuntos, X e S, estão ligados por linhas, assim: se um resul
tado em X é de um menino, trace uma linha até M; sc o resultado for
de uma menina, trace uma linha até F. Desta forma mostramos a relação
entre os resultados e as letras M e F, ou, mais geralmente, uma relação
entre inteligência e sexo. Podemos acreditar que as meninas (nesta
amostra, ou talvez em Amsterdã) são mais inteligentes que os meninos.
Para testar isto podemos calcular a média de pontos dos meninos e
meninas e compará-las. As médias são 125 para as meninas e 110 para
os meninos. Podemos concluir que as meninas são mais inteligentes
do que os meninos, sem dúvida uma conclusão arriscada! A questão
agora não é a adequação da conclusão mas o uso de conjuntos para
estudar uma relação.
Esta discussão bastante óbvia de conjuntos pode ser estendida a
números maiores de casos e variáveis mais complexas. Não importa
quantos casos e quão complexas as variáveis, os princípios básicos e as
regras são as mesmas. Mais objetivamente, definimos uma relação, uma
54
relação entre inteligência e sexo. Como? Ligamos simplesmente os
membros de um conjunto, X, aos membros de outro, S, usando a
jttgra simples para traçar as linhas, dada acima. Agora damos uma
lefinição abstrata de “relação” que é completamente geral e que se
aplica a todos os casos.
Uma relação é um conjunto de pares ordenados. Um par ordenado
iSo dois objetos de qualquer espécie em que há uma ordem fixa para
os objetos aparecerem ou para serem colocados. Na figura 4.2, Maríe,
131 é um par ordenado. O conjunto de pares ordenados são os dois
lonjuntos na figura 4.2, colocados juntos, os nomes em primeiro lugar
0 os pontos em segundo: -{ (Marie, 131), (Jacob, 127), (Annie, 119),
(Pieter, 108), (Jan, 95) }. Em outras palavras, “ordenado” significa
tomar os membros de um dos conjuntos, primeiro, e os membros do
OUtro, depois. O conjunto de pares mencionado é uma relação. Pode
nfio ser interessante, importante ou mesmo significativo, mas é uma
relação.
Na figura 4.3 também foi dada uma relação, embora um pouco
mais difícil de se ver. Se apresentarmos a relação de outra forma, como
na figura 4.4, é mais fácil ver. De novo temos um conjunto de pares
ardenados: j (131, F), (127,M), (119, F), (108, M), (95, M) }. Esta é,
por definição uma relação. Neste caso, entretanto, é um pouco mais
ggn;F:cativa: o conjunto de pares ordenados expressa uma relação entre
os pontos do teste de inteligência e o sexo dos participantes, ou, mais
§Jmplesmente, entre inteligência e sexo.
Figura 4.3
X s
Figura 4.4
56
c
Figura 4.5
57
A direção e a magnitude das relações
58
X = Discriminação
Figura 4.6
limas linhas mais tarde, quando veremos como elas expressam relações
dara e sucintamente.
Os pontos representados e a linha de regressão indicam que a
hipótese é apoiada por estes “dados”? A resposta é sim — indicam. Os
pOntos representados indicam que grandes valores de X, Discriminação,
iSo acompanhados por grandes valores de Y, Violência, valores médios
de X por valores médios de Y e valores baixos de X por valores baixos
de Y. O enunciado “ Se discriminação, então violência” parece estar
Correto. Especificamente, os grupos minoritários que sofreram a maior
jdiscriminação foram os mais violentos, e os grupos minoritários que
fCCeberam menos discriminação foram os menos violentos. A relação
nfio é perfeita — há exceções, por exemplo (3,1) e (7,4) no gráfico —
mas em geral se mantém.
Mas ainda não discutimos diretamente a magnitude da relação.
Dissemos que os valores altos de Y “acompanham” os valores altos
de X e valores menores de Y “acompanham” valores menores de X.
Naturalmente, este é um enunciado de magnitude, mas desejamos ser
nlXU precisos. Queremos saber até que ponto a relação é “forte” ou
"Ekca”. Se a direção da linha de regressão for da esquerda inferior
para a direita superior no gráfico e todos os pontos se encontrarem pre-
fiiiamente sobre a linha, a relação é “perfeita” e positiva. Tais relações
lltfeitas quase nunca acontecem na pesquisa comportamental. Às vezes
iodos os pontos •representados •se aproximam da linha. Quando isso
59
acontece, a relação é “forte” . Quando não, quando se encontram dis
persos relativamente longe da linha, a relação é “fraca” ou até se
aproxima de zero. (No último caso, a própria linha seria horizontal,
ou quase. Explicaremos isto mais adiante.)
Há meios ainda mais precisos de expressar a direção e magnitude
das relações. Um meio muito usado é através da correlação e do chamado
coeficiente de correlação. “Correlação” significa exatamente o que diz
a palavra: a co-relação entre dois conjuntos de valores ou a variação
conjunta dos valores de X e Y, como já foi explicado. “Coeficiente de
correlação”, um termo muito usado na pesquisa, é uma medida da inter
dependência, da variação conjunta, do aumento ou decréscimo simultâ
neo de dois conjuntos de valores numéricos. Por sua grande importância
na pesquisa, estudemos as idéias de relação, correlação, direção e magni
tude mais profundamente. ^
Embora do ponto de vista definicional seja correto dizer que uma
relação é um conjunto de pares ordenados, tal definição apenas esclarece
a idéia de uma relação. Não ajuda os cientistas a tirarem conclusões a
partir dos dados. Eles dèsejam saber a direção e a magnitude das rela
ções, como já ficou dito. A direção de uma relação é ela ser positiva ou
negativa (ou mais complexa). Se os dois conjuntos de medidas de um
conjunto de pares ordenados variam juntos — os pesquisadores dizem
“covariam” — na mesma direção, a relação é positiva. Se variam simul
taneamente (juntas) na direção oposta, a relação é negativa.
Na tabela 4.1 são apresentados três conjuntos de pares ordenados.
No conjunto A, os valores de X e Y têm a mesma ordem de postos.2
X Y X Y X Y
1 2 1 8 1 4
2 4 2 6 2 8
3 5 3 5 3 5
4 6 4 4 4 2
5 8 5 2 5 6
2 Os valores da tabela 4.1 não são postos. Entretanto, podem ser facilmente
convertidos em postos; por exemplo, os postos dos valores de Y em A são
5, 4, 3, 2, 1.
60
Por outro lado, no conjunto B a ordem de postos dos dois conjuntos
de valores é oposta, isto é, os valores altos de X são acompanhados por
valores baixos de Y [por exemplo (5,2), (4,4) ], e os valores baixos
de X são acompanhados por valores altos de Y [por exemplo (1,8),
(2,6) ]. Os pares de conjuntos de pares ordenados mostrados em C não
têm direção discernível; os dois não mostram tendência sistemática a
Variar de uma ou outra forma. O conjunto foi incluído na tabela para
Ilustrar o caso de “nenhuma relação”, ou, mais precisamente, relação
zero, e para contrastá-lo com os conjuntos A e B.
A magnitude de uma relação é a extensão na qual dois conjuntos
de medidas variam simultaneamente (covariam) positiva ou negativa
mente. No conjunto A da tabela 4.1, a magnitude da relação é alta
porque as ordens de postos de X e Y são idênticas. Igualmente alta é a
relação de B porque as ordens de grau são completamente opostas.
Entretanto, os dois conjuntos de números variam juntos: os números
mais baixos de Y acompanham os números mais altos de X, e os núme
ros mais altos de Y acompanham os números mais baixos de X. No
ÚOnjunto C, entretanto, não se percebe variação sistemática simultânea
dos dois conjuntos de números. É como se os números do segundo con
junto fossem incluídos ao acaso (e foram). Em tais casos, costuma-se
dizer que “não há relação” entre os conjuntos. É óbvio que esta é uma
maneira meio inexata de falar, porque qualquer conjunto de pares
ordenados é uma relação. Entretanto, na linguagem corrente da pesquisa,
os pares ordenados do conjunto C seriam mencionados como não mos
trando relação alguma. A expressão correta é “relação zero” .
Será possível ser mais preciso sobre as magnitudes das relações
dos conjuntos de medidas da tabela 4.1? Felizmente sim. Uma medida
muito útil da magnitude das relações é o coeficiente de correlação,
que já foi mencionado e explicado ligeiramente há pouco. É simples
mente um índice, em forma decimal, que indica a direção e a magnitude
da covariação de dois conjuntos de valores.3
Tais índices variam de —1,00, passando por 0,00, até +1,00.
+ 1,00 indica uma relação positiva perfeita, — os dois conjuntos de
61
pontos têm exatamente a mesma ordem de postos, por exemplo, como
em A da tabela 4.1 — e — 1,00 indica uma relação negativa perfeita,
como em B da tabela. O (zero), naturalmente, indica “nenhuma relação” ,
ou “relação zero” . Todas as frações decimais entre —1,00 e +1,00
são possíveis: —0,78; —0,51; —0,08; 0,12; 0,42; 0,83; e assim por
diante. Muitos coeficientes ou índices de relações como estes são usados
nas ciências comportamentais, mas neste livro estamos preocupados prin
cipalmente com a compreensão e interpretação de tais índices e não com
seu cálculo.4
Gráficos de relações
62
-L- -J-X
1 2 3 4 5 6 7
(A) Relação alta positiva (B) Relação alta negativa (C) Relação alta neutra
Figura 4.7
63
de uma teoria do preconceito, que essas características se combinam
para produzir o preconceito contra membros de grupos minoritários.
O pesquisador tem vários meios de. descobrir até onde está correto.
Suponhamos que ele construa uma escala para medir a extensão em
que os indivíduos possuam as características dadas acima. Chamemos
isto Escala A. Ele usa também outra escala, a escala AS, que pesquisas
anteriores mostraram medir o anti-semitismo, ou o preconceito contra
os judeus. Ele está estudando, então, um aspecto da relação entre autori
tarismo e anti-semitismo. Ele podería, naturalmente, ter medido as ati
tudes dos sujeitos em relação a negros, estrangeiros, índios e outros
grupos minoritários. Entre as várias pessoas que responderam às duas
escalas, suponhamos que foram selecionadas 10 para representar todo
o grupo e que os dez pares de pontos sejam os da tabela 4.2. (Dez
conjuntos de pares ordenados dificilmente bastariam para avaliar uma
relação com fidedignidade. Geralmente os cientistas comportarrientais
usam muitos mais. Entretanto, o princípio é o mesmo, quer se usem
10 ou 10.000 conjuntos de pares.)
O pesquisador quer saber a direção e a magnitude de sua relação:
seu sinal, positivo ou negativo, e até onde os dois conjuntos de valores
covariam. Primeiro, os dois conjuntos de valores, com os de autoritaris
mo sempre em primeiro lugar e os de anti-semitismo em segundo, são
um conjunto de pares ordenados e, portanto, uma relação. Ê fácil ver
a direção da relação: é positiva porque há uma tendência marcante
dos valores altos de A serem acompanhados por valores altos de As —
por exemplo, (6,2; 5,7), (5,9; 5,3) — e igualmente para valores A e AS
baixos — por exemplo, (3,5; 4,0), (3,9; 3,5).
Não é tão fácil avaliar a magnitude da relação, isto é, até onde é
pronunciada a tendência de os valores de A e AS “caminharem juntos” :
alta com alta, média com média e baixa com baixa. O exame de con
juntos de pares ordenados parece indicar que a covariação dos pontos,
seu “caminhar juntos”, é pronunciada. Para ver isto mais claramente,
os postos dos valores, postos de 1 a 10, com 1 indicando o valor mais
alto e 10 o niais baixo, estão indicados na tabela 4.2 ao lado dos pontos
de A e AS (entre parênteses). Observe que em geral os postos vão
juntos: os postos baixos de A combinam com os postos baixos de AS,
acontecendo o mesmo com os postos médios e altos. Resumindo, a
relação entre autoritarismo e anti-semitismo, nesta amostra, é positiva
e “substancial”. É “substancial” até onde? É possível e aconselhável
calcular os índices da magnitude das relações. Tais índices são chamados
coeficientes de correlação, como já ficou sabido. 6
64
•Anti-Semitismo (AS)
Autoritarismo (A)
5.7 (2)
6,2 ( 1)
5.3 (3)
5,9 (2)
4.7 (5)
5.7 (5)
5.8 (1)
5.1 (4)
4.4 (7)
4.8 (5)
4.5 (6)
4.5 (6)
3.9 (9)
4.2 (7)
4,8 (4)
4,1 (8)
3.5 (10)
3.9 (9)
4,0 (8)
3.5 (10)
a Os números entre parênteses são os postos dos valores, com 1 sendo alto e 10 baixo.
Figura 4.8
66
---------------------------------------- -—
c> Realização
145 51
125 57
118 60
110 48
100 54
97 35
90 32
Embora os sete círculos não se tenham colocado na linha reta que passa
0 mais próximo possível de todos os círculos simultaneamente — a linha
traçada no gráfico — eles se mantêm bastante perto dela. (Lembre-se
de que esta linha se chama linha de regressão.) Outro meio de ter alguma
Idéia da magnitude da relação é comparar os postos dos dois conjuntos
de pontos, como já fizemos. Isto fica para o leitor como um exercício.
Agora suponhamos que tomamos uma relação com direção negativa
e consideravelmente menor em magnitude. Tal relação é mostrada no
gráfico da figura 4.10. Suponhamos que ela mostre a relação entre a
afluência de um bairro e a delinqüência. Novamente temos sete pontos.
Desta vez, entretanto, estão mais espalhados; estão mais distantes da
linha traçada, o mais próxima possível de todos os pontos. Além disso,
a direção da linha, que agora corre da esquerda superior para a direita
inferior do gráfico, é diferente. Indica que a relação é negativa: à
67
medida que o bairro se torna mais afluente, há menos delinqüência.
Mas agora a relação é muito mais fraca do que era na figura 4.9, onde
os pares de pontos estavam mais perto da linha de regressão. Observe
que quatro dos pontos (os pequenos círculos) estão bem distantes da
linha. Em suma, a relação é negativa e não é muito forte.
Figura 4.11
68
Muitas variáveis, naturalmente, não têm nenhuma relação entre si,
n não ser por acaso: sua relação é zero ou próxima de zero. Isto quer
dizer que o conhecimento de uma variável não contribui para o conhe
cimento de outra variável. Não se pode dizer, por exemplo, que enquanto
uma variável aumenta a outra variável aumenta ou diminui. Tal situa-
I0 é mostrada na figura 4.11, onde 100 pares de números entre 0 e 100
! pram marcados. Os números foram obtidos de duas colunas de números
uiprováveis de um ou dois algarismos, numa tabela maior de tais
S i&ieros (Kerlinger, 1973, pp. 715 e 717, duas últimas colunas de
números de dois algarismos).7 Casualidade e números aleatórios, um
portante desenvolvimento técnico e científico moderno, serão expli-
E dos no capítulo 5. É suficiente dizer, por enquanto, que números alea
tórios são como o resultado do jogo de dados ou de moedas: não há
Ordem dedutível ou previsível de espécie alguma nos números. Não se
pode predizer — já que ambos os conjuntos de números são casuais —
nenhum número a partir de outro. Se aparecer um 90 em uma coluna,
pão se pode dizer que é provável que um número alto o acompanhe na
outra coluna, o mesmo para números baixos e médios. Em linguagem
Comum, os números dos pares estão todos misturados: todas as combi
nações possíveis podem ocorrer, mas não se pode prever um número
n partir de outro.
Compare a figura 4.11 com as figuras 4.9 e 4.10. Nas duas últimas
houve um “caminhar junto” sistemático dos números, embora tenha
havido consideravelmente menos “caminhar junto” na figura 4.10 do
que na 4.9. Mas pode-se ver que os círculos da figura 4.11 estão por
todo o gráfico e, mais importante, não há ordem discernível ou
^caminhar junto”. Este é um estado de relação zero.
Ainda temos muito o que dizer sobre relações neste livro. Elas são
o recheio e o núcleo da ciência. Compreender que o objetivo maior da
ciência é a explicação e que a explicação vem principalmente do estudo
das relações é compreender a base da ciência. Agora vamos tentar
amarrar as idéias de explicação e relações e, já que estamos no assunto,
falar da importante idéia de teoria.
69
pelo menos neste mundo, dizer-se diretamente o que uma coisa e. Tamais
poderemos chegar à “essência” total de alguma coisa (embora os místicos
nos digam o contrário). Em ciência _ queremos explicar fenômenos
naturais. Por exemplo, queremos explicar “preconceito , o que quer
dizer que vamos dizer como nasce, por que nasce, como caminha, o
que o afeta, o que ele afeta e assim por diante.
Explicar alguma coisa, pelo menos satisfatoriamente, certamente e
uma das tarefas mais difíceis que podemos empreender. Mais que isto,
é literalmente impossível explicar tudo sobre algum fenômeno, ou sobre
conjuntos de fenômenos. E explicar tudo sobre preconceito, por exem
plo, simplesmente não é possível, principalmente se quisermos^ que boa
parte de nossa explanação venha apoiada em evidência empírica. Em
outras palavras, a “verdade” absoluta é para sempre impossível. Mas
aproximações razoáveis a explicações de fenômenos naturais podem ser
dadas de maneira científica satisfatória.
O único meió, então, de explicar alguma coisa, é determinar de
que maneira esta coisa se relaciona com outras coisas. Assim a explica
ção do preconceito significa descobrir como o preconceito se relaciona
com outros fenômenos naturais. Se estivéssemos interessados apenas no
desenvolvimento do preconceito em crianças, teríamos que saber pelo
menos em que idade as crianças tomam consciência de “outros grupos .
A relação seria entre a idade e conhecimento ou consciência de
outros grupos.
Já dissemos que a ciência lida apenas com fenômenos naturais e
explicações “naturais” de tais fenômenos. Explicar o preconceito, por
exemplo, dizer que ele faz parte da natureza humana, que todo o indi
víduo é “naturalmente” preconceituoso em relação a grupos diferentes,
do seu, não é uma explicação no sentido científico porque usa um
termo “natureza humana” , que é tão vago que se torna inacessível a
observação científica. Onde encontramos “natureza humana”? Como
podemos medi-la? Ou pode-se dizer: “Deus fez grupos diferentes e as
diferenças levam à hostilidade” . Isto também não é uma explanaçao no
sentido científico. Invocar Deus como a causa das diferenças, retira a
afirmativa do âmbito da preocupação científica. Mais ainda, pode-se
retorquir que Deus fez todos os homens iguais. Dizer que diferenças
levam à hostilidade, embora uma afirmativa melhor porque pelo menos
implica a possibilidade de observação, ainda é vago demais para a obser
vação científica. Todas as diferenças de grupos? Algumas apenas? Que
espécie? Que espécie de hostilidade? Sob que circunstâncias? E assim
por diante.
Naturalmente há muitas “explicações” para o comportamento hu
mano e para fenômenos. “Doença é castigo pelo pecado”; “As depressões
econômicas são devidas aos judeus” ; “Os pretos são músicos matos .
70
Tais “explicações” são cientificamente sem valor porque não podem
ser submetidas a investigações científica e a testes. Sem dúvida, uma
grande contribuição da ciência é sua rejeição de “ explicações” que real
mente nada explicam. A explicação pode referir-se apenas a fenômenos
naturais, e “fenômenos naturais” significam ocorrências no mundo
Sflbservável. Qualquer fenômeno, para ser um fenômeno natural, precisa
ser observável, potencialmente mensurável ou manipulável. Não é neces
sário ser visto diretamente. Mas precisa haver alguma evidência de suas
gjiliifestações no mundo empírico. “ Preconceito”, neste sentido, implica
em certo tipo de comportamento.
Como, então, a ciência explica o preconceito — ou qualquer outro
fenômeno natural? Repetindo, pode ser explicado apenas pelas suas rela
ções com outros fenômenos. Necessariamente tais explicações são sempre
parciais e incompletas. Foi descoberto, por exemplo, que o autoritarismo
está positivamente ligado ao preconceito (Adorno e outros, 1950):
jessoas muito autoritárias tendem também a ser preconceituosas contra
J udeus, negros e estrangeiros. Descobriu-se também que se a maioria das
pessoas de determinado grupo de indivíduos tem crenças estereotipadas
(crenças relativamente fixas e rígidas) sobre membros de outro grupo, elas
então tenderão a ter atitudes negativas em relação aos membros do
OUtro grupo. Ficou dito também — e provado por evidência (Dollard e
OUtros, 1939) — que a frustração leva à agressão, que muitas pessoas
aão social e economicamente frustradas e dirigem a hostilidade resultante
para outros grupos. Temos aqui, então, fenômenos relacionados com o
preconceito: autoritarismo, estereotipia e frustração. Assim, temos uma
Jjtplicação parcial de preconceito.
Preconceito é um conceito ou constructo bastante difícil. Vamos
tomar um fenômeno ou variável igualmente complexo, mas talvez mais
ficilmente ilustrável, realização, e sintetizar uma explicação. Fazemos
isto usando um exemplo de uma explanação teórica semelhante àquela
dada quase no fim do capítulo 1. A importância das idéias justifica
o exemplo adicional. Suponhamos que queremos saber por que certos
âlunos não se saem bem na escola. Já sabemos que inteligência é uma
Variável explanatória: crianças abaixo de um certo nível de inteligência
tendem a não se sair bem na escola. 8 Mas muitas dessas crianças se
«aem bem — e muitas crianças de nível superior de inteligência não
fce saem bem. Apenas inteligência, então, é uma explicação parcial.
Ilibe-se também que crianças de classes sociais mais baixas não se saem
Ifio bem na escola, comparadas às crianças de classe média. Há muito se1
71
pensa também, embora sem apoio muito forte de evidência, que a mo
tivação — desejar ou não desejar sair-se bem — é uma variável impor
tante que influencia a realização escolar.
Agora vamos colocar uma “explicação” de realização escolar com
as três variáveis que acabamos de mencionar. Tenha em mente que este
exemplo é muito simplificado. A realização escolar é um fenômeno com
plexo, cuja explicação ainda confunde cientistas e educadores. Estamos
dando uma explicação apenas parcial e limitada com fim pedagógico.
Em todo caso, a “explicação” está representada na figura 4.12. As setas
indicam as relações ou influência. Uma seta de linha contínua e uma só
ponta indica “ influência” ; uma seta de linha interrompida e duas pontas
indica uma influência mútua, ou simplesmente uma relação. (“ Influência
geralmente implica um efeito numa só direção; “ relação” implica que a
influência pode ser numa direção ou noutra, ou em ambas.)
A explanação assim representada indica que inteligência e motiva
ção influenciam diretamente na realização escolar. As crianças mais inte
ligentes tendem a fazer melhor o trabalho escolar, e as crianças que estão
mais interessadas no trabalho escolar e mais desejosas de fazê-lo, fazem
um trabalho melhor. Inteligência e classe social e inteligência e motivação
influenciam-se mutuamente. Crianças de classe média, por exemplo, têm
em média pontos mais altos em testes de inteligência, e as crianças mais
altamente motiváveis são, em média, crianças de maior inteligência. A
motivação é influenciada diretamente pela classe social. Crianças das
classes trabalhadoras não se interessam tanto pelo trabalho escolar como
as de classe média, talvez porque o ambiente menos afluente não con
duza à aceitação entusiástica do aprendizado e do estudo. (Além disso,
72
a escola norte-americana ê uma instituição de classe média.) A classe
social não exerce efeito direto sobre a realização escolar, então, influen
cia a realização apenas indiretamente, através da inteligência e da moti
vação.
O objetivo deste exemplo não é sua adequação ou validade. Antes,
o objetivo é mostrar como é uma explicação comportamental científica
de um fenômeno e como as relações são o recheio de tal explicação.
O fenômeno da realização escolar é “explicado” pela relação entre, de
um lado, inteligência, motivação e classe social, e, de outro, realização
escolar — e também pelas relações entre inteligência, motivação e classe
social.
Todo o conjunto de variáveis e as relações especificadas entre elas
podem ser chamadas uma “tèoria”. Naturalmente, esta deveria ser
chamada uma “pequena teoria”, ou o embrião de uma teoria, porque
um fenômeno tão complexo quanto realização escolar dificilmente pode
ría ser explicado por três variáveis. Entretanto, a maioria das teorias
científicas consiste em tais relações sistemáticas entre variáveis. Uma
teoria, então, é um conjunto de constructos inter-relacionados (variáveis),
definições e proposições que apresentam uma visão sistemática de um
problema especificando relações entre variáveis, com a finalidade de
explicar fenômenos naturais.
Esta discussão sobre “explicação" em' ciência foi necessária para
tirar o mistério da explicação e da teoria científicas. Toda explicação,
paturalmente, usa relações. A diferença entre explicações científicas e
jSXplicações não-científicas de fenômenos, entretanto, é profunda. É inse
parável das palavras “sistemática”, “controlada” e “empírica.” A dife
rença deve ficar mais clara à medida que continuarmos discutindo.
73
5. P r o b a b ilid a d e e e s t a t í s t i c a
X
Vivemos num mundo probabilístico. Num inundo onde quase nada é
absolutamente certo. Muita coisa é relativamente certa, claro. Ê quase
certo que choverá em Nova Iorque ou Amsterdã durante os próximos 30
dias. É quase certo que algumas pessoas farão amor amanhã na Califór
nia! Mas nunca se garante certeza absoluta. Há limites nas certezas:
algumas coisas são virtualmente certas, como as que mencionamos. Entre
tanto, outras estão longe disso. Falamos probabilisticamente o tempo
todo, embora freqüentemente vivamos como se os acontecimentos da
vida fossem infalíveis. Os cientistas, entretanto, não apenas falam
probabilisticamente; eles vivem probabilisticamente em seu mundo de
pesquisas.
Uma das principais diferenças entre os vários ramos da ciência é o
grau de certeza dos acontecimentos e relações. Nas ciências naturais,
por exemplo, o grau de certeza é muito alto. Um físico pode expor uma
lei física e pôr alta confiança no comportamento de corpos físicos e em
acontecimentos. Aliás, müitas relações em física são chamadas leis ,
em parte pelo alto grau de certeza a elas associado. Entretanto, sempre
há margem para erro, embora a literatura popular e o próprio homem
pareçam confiar plenamente nas leis físicas e no comportamento de
objetos e acontecimentos.
Os acontecimentos e relações das ciências comportamentais sao
muito menos certos. Um químico diz que, se certa quantidade do produto
químico A for juntada a certa quantidade do produto químico B, haverá
uma explosão. A afirmativa e probabilística, embora sua probabilidade
de estar correta (na maioria dos casos) seja muito alta. Os psicologos,
por outro lado, podem dizer que se as crianças forem frustradas elas
mostrarão agressão, mas a probabilidade da afirmativa estar correta não é
tão alta assim. Quando um cientista político diz: “Quem é conservador
vota nos republicanos.”, a afirmativa é empiricamente válida porque as
pessoas com tendências conservadoras quase sempre votam nos republi
canos. Mas a afirmativa tem probabilidades bastante baixas em casos
particulares. Em média, os cientistas políticos provavelmente estejam
corretos. Mas se tentarem predizer quantos votos terá determinado indi
víduo, freqüentemente errarão.
74
A despeito das diferenças de graus de certeza', é importante com
preender que todas as ciências são probabilísticas. O pensamento do
dentista em todos os campos é fundamentalmente o mesmo. Entretanto,
os cientistas discordam radicalmente nos níveis de probalidade que comu-
mente se associam aos fenômenos e relações com que trabalham. Se
flllisermos compreender ciências como a psicologia e a sociologia, é
também importante termos capacidade de pensar e viver em paz com as
ifirmativas probabilísticas. Precisamos entender perfeitamente que cada
liserção, cada afirmativa de relação vem acompanhada de uma “ etique
ta" probabilística. Sempre que dizemos “Se p, então q”, o que dizemos é
"Se p, então provavelmente q”. O que acontece na vida se repete na
Ciência: a certeza é um mito, para sempre fora do nosso alcance.
A estatística é uma filha da probabilidade. Em parte é um instru
mento que mostra aos cientistas em que medida o resultado de suas
pesquisas é seguro, e, assim, quanto suas asserções são dignas de con
fiança. O principal resultado de Clark e Walberg, a diferença média de
realização em leitura entre os grupos experimental e de controle, provou
que sua hipótese sobre o efeito do reforço maciço no aproveitamento
em leitura de crianças carantes negras foi “empiricamente válido” .
("Empiricamente válido" significa que a evidência da pesquisa apoia
uma asserção sobre uma relação.) A única maneira, pelo menos que
Conhecemos hoje, pela qual poderíam avaliar a validade empírica da
afirmativa foi usar o raciocínio estatístico e probabilístico e métodos
estatísticos de avaliação. O que significa isto?
Quando obtemos o resultado de uma pesquisa, queremos saber se
podemos confiar nele. Se repetirmos o experimento várias vezes, obtere
mos os mesmos resultados a cada repetição? Se a resposta for sim, os
resultados são confiáveis. A diferença entre a média de pontos de leitura
OOS grupos de Clark e Walberg é confiável? Podemos acreditar que se
Clark e Walberg tivessem feito o mesmo experimento ou experimento
lemelhante três, quatro ou mais vezes, eles teriam conseguido os mesmos
OU resultados semelhantes: as mesmas ou diferenças semelhantes entre a
média de pontos de leitura do grupo experimental e do grupo de controle?
Um teste estatístico de seus resultados pode responder a esta pergunta.
Embora a finalidade deste livro não permita entrar nos detalhes de tais
testes estatísticos, precisamos ter uma compreensão geral de como estatís
tica e probabilidade “funcionam”, como usam as idéias de acaso e casua-
dade para ajudarem os cientistas a chegarem a conclusões sobre os
É ssultados de suas pesquisas.
Probabilidade e estatística são temas interessantes, intrigantes e até
Hlcinantes. Apesar das concepções errôneas associadas à sua natureza e
uso, ambas estão próximas da realidade porque se assemelham à natureza
c modelo de nossas vidas e penetram a essência de nosso pensamento e
75
comportamento. Tomemos como exemplo uma tomada de decisão.
Constantemente tomamos decisões sobre o que fazemos. Os resultados,
naturalmente, nunca são certos. Somos, então, calculadores quase esta
tísticos e probabilíticos — embora muita gente pudesse se irritar com a
idéia de que suas vidas e decisões têm natureza estatística. Afinal, a
estatística trabalha com números e minha vida não se baseia em números!
Mas nossas vidas são baseadas em números, explícita ou implicitamente.
Sempre há probabilidades numéricas associadas aos resultados de nossos
atos e decisões, embora raramente saibamos quais são essas probabiíi- •
dades.
Eis um paradoxo. A estatística e a probabilidade lidam essencial
mente com incertezas; na pesquisa, entretanto, elas nos ajudam a ter
mais certeza dos resultados que obtemos! Isto não significa que podemos
ter certeza dos próprios resultados, dos resultados em si, mas que pode
mos atribuir graus de certeza aos resultados com bastante precisão. Se fiz
uma experiência com um grupo experimental e um grupo de controle,
por exemplo, e obtive a diferença entre os dois grupos na direção pre
vista, posso garantir que esta diferença seja suficientemente grande para
justificar minha confiança de que é uma “diferença verdadeira” ? Poderei
dizer algo como: “A probabilidade de que a diferença de média de
pontos dos dois grupos não é fortuita, não é devida ao acaso, é alta.
Há apenas uma possibilidade em cem de que a diferença seja devida ao
acaso”. Embora probabilística, é uma afirmativa forte.
Probabilidade
76
§!OSsíveis). (“Favorável” significa favorável a um acontecimento cuja
probabilidade estamos avaliando.) Isto é expresso pela equação:
Jogue uma moeda uma vez. A probabilidade de dar cara é 1/2, pois
há duas possibilidades: /C , c/. Agora jogue duas vezes. Qual é a proba
bilidade de duas caras? Precisamos tomar cuidado. Há quatro possibili
dades. Da primeira vez pode dar cara ou coroa. Da segunda, cara ou
coroa. O número total de possíveis resultados é 4: [(Ci, C2), (Ci, c2)
(Ci, C2), (ci, c2) ], onde Ci = cara na primeira jogada, c2 = coroa na
gegunda jogada e assim por diante. O denominador da fração de proba
bilidade é 4. Já que há apenas uma possibilidade de duas caras, (Ci, C2),
a probabilidade de duas caras em duas jogadas é de 1/4.
Vamos mudar um pouco e ampliar o problema. Qual é a probabili
dade de sairem três caras em três jogadas? As possibilidade são dadas na
árvore da figura 5.1. As possibilidades de duas jogadas no problema
acima são dadas nos primeiros dois estágios da árvore, a “ Primeira
Jogada” e a “Segunda Jogada” . As probabilidades dos resultados estão
iBsinaladas também: são todas de 1/2. A terceira jogada simplesmente
acrescenta possibilidades. Para listar todos os rèsultados possíveis das três
Ogadas, procure-os nas ramificações do gráfico:
Í »(Ci, Ca, C3), (Ci, C2, C3), . . ., (ci, c2, C3)]. Há oito desses resultados,
c assim o denominador da fração de probabilidade é 8. Portanto, a proba
bilidade de três caras em três jogadas é de 1/8, já que há apenas um
caso de três caras: (Cj, C2, C3).
As probabilidades de outros eventos — qualquer resultado definido
6 chamado um evento — podem ser determinadas com facilidade. O
denominador é sempre 8. Qual é a probabilidade de duas caras e uma
Coroa? A probabilidade é de 3/8, porque há três desses eventos no
|ráfico. (Conte-os. Eles estão marcados na figura 5.1.) Pode-se também
Calcular a probabilidade de qualquer evento multiplicando as probabili-*
Terceira
jogada
Segunda
jogada 1/2
Primeira 1/2
■C3/
Figura 5.1
78
tm nomes dos eleitores (em pedaços de papel) numa urna, misturá-los
l'i;im e tirarmos um, qual é a probabilidade de sair üm republicano?
f de 40/100 = 0,40. (Costuma-se expressar probabilidades em forma
HCltnal.) Isto é óbvio e não é preciso nenhuma elaboração. Mas suponha
mos que vamos precisar de 30 pessoas para uma pesquisa. Quantos
ilclfflocratas e quantos republicanos vamos ter se tirarmos 30 pedaços
iltk papel da urna? Devemos ter 60/100 x 30 = 18 democratas e
fakA
UJ/100 x 30 = 12 republicanos. Teremos exatamente estes números?
lJi'B/avelmente não. Mas teremos números aproximados deles se mistu-
i.irmos bem os pedaços de papel depois de cada vez que tirarmos.
I)8vc ser algo assim: (18, 12), (19, 11), (20, 10), (17, 13), (16, 14), e por
il vai. Estas são as possibilidades mais prováveis. Se tirássemos 10 demo-
i rtttas e 20 republicanos, ou 1 democrata e 29 republicanos, ficaríamos
ffiulto surpresos. A primeira combinação é improvável, a segunda alta
mente improvável.
Aeaso
1. 2 3 4 5 6 7 8 9 10
9 0 8 0 4 6 0 7 7 8
7 2 7 4 9 4 7 8 7 7
6 2 8 1 9 3 6 0 3 9
7 9 9 I 6 4 9 4 7 7
3 3 1 1 4 1 0 3 9 4
8 9 2 1 3 9 6 7 7 3
4 8 3 0 9 2 7 2 3 2
1 4 3 0 0 2 6 9 7 5
3 1 8 8 4 5 2 1 0 3
2 1 4 8 9 2 9 3 0 1
Média 5,0 3,9 5,3 2,4 5,7 3,8 5,2 4,4 5.0 4,9 Média total = 4,56
80
0 + 1 + ••• 9)/10 = 4,5. Observe que seis das 10 médias estão
flcima de 4,5 e quatro abaixo de 4,5.
Só uma, a quarta, 2,4, afasta-se muito de 4,5. Quanto mais números
ae usar para calcular as médias, mais próximas elas provavelmente
ficarão da média teórica. Se, por exemplo, calcularmos a média de todos
OS 100 números na tabela 5.1, teremos 4,56, muito perto de 4,5. Tal
fiomportamento regularmente previsível de grandes conjuntos de números
é muito útil em pesquisa. Dá ao cientista um quadro de referência para
ftvaliar resultados no sentido de que ele possa conferir os resultados
Obtidos confrontando-os com os resultados “teoricamente” esperados ou
baseados no acaso.
82
1 2 3
1 3 2
2 1 3
2 3 1
3 1 2
3 2 1
84
Ipquisador manipulando duas variáveis ao mesmo tempo para estudar
ICU efeito separado e possivelmente conjunto sobre uma variável depen
dente. Suponhamos que um educador tenha motivos para acreditar que
ÍUétodos diferentes de ensino da leitura funcionem diferentemente com
tipos diferentes de material de leitura. As duas variáveis devem ser
Jtinipuladas ou manejadas de sorte que o manejo de uma não influencie
n Outra por causa do manejo ou manipulação ou por causa da natureza
dos variáveis. Suponhamos que o pesquisador usou dois métodos para o
tnsino da leitura, Ai e Aa, e dois tipos de material de leitura, Bt e B2,
Píespondentes a material difícil e material fácil. Suponhamos ainda que
f> método Ai leve muito mais tempo para aplicar que 0 método A2, e
que 0 espaço de tempo gasto em ensinar reduza a dificuldade de qualquer
lãfiterial de leitura. Haveria, então, uma falta de independência, porque
0 método Ai traz em si, por assim dizer, um fator relacionado com a
dificuldade do material (variável B). Em outras palavras, o método Ai
tanderá a funcionar melhor com material de leitura mais difícil, não por
Causa da natureza do método, mas simplesmente porque exige mais
tempo de ensino do que o método A2. Há, então, falta de independência
entre as variáveis A e B, já que um aspecto extrínseco da varíavel A,
eipaço de tempo de ensino, está relacionado com a variável B, dificuldade
do material.
Outro exemplo de falta de independência encontra-se na mensura-
çfio. Se, digamos, dermos um teste com dez itens a certo número de
grfanças e depois somarmos os pontos de cada criança nos dez itens
para obter 0 total — um procedimento comum — estamos assumindo
ue os dez itens são independentes e suas respostas também indepen-
S entes. Esta suposição é satisfeita razoavelmente em muitos testes e
ffiedidas e o procedimento é útil e válido. Mas suponhamos que pedísse
mos às crianças que numerassem os dez itens por ordem de importância
(OU qualquer outro critério). Os itens e suas respostas já não são mais
pendentes, porque antes que o item 1 seja escolhido como o mais
E jrtante, há 10 escolhas. Depois da primeira escolha, restam nove
! a serem escolhidos. Depois de escolher os nove primeiros itens
festa apenas um — e não há escolha. As respostas a itens posteriores,
om outras palavras, serão afetadas pelas escolhas anteriores. Isto é falta
íllemática de independência. Tal falta de independência afeta a esta
tística e sua interpretação. Isto não quer dizer que a ordem de postos e
ffiétodos semelhantes não possa ser manuseada probabilística e estatisca-
mente. Aliás, mostramos como um simples problema de ordem de postos
pode ser resolvido usando a teoria das probabilidades. Ela simplesmente
Ilustra a falta de independência. Em suma, muitas técnicas estatísticas
MlpCem independência e seu uso e interpretação com fenômenos ou pro-
éédimentos não-independentes pode nos confundir.
Fizemos esta digressão sobre a independência para tentar esclarecer
a concepção probabilística errônea esboçada antes. Os resultados \de
eventos casuais anteriores não afetam os resultados de eventos subseqüen-
tes — ou talvez devéssemos dizer que não devem afetar eventos
subseqüentes. Se a probabilidade de sair cara no primeiro lançamento de
moeda é de 1/2, será de 1/2 no décimo, no vigésimo, no qüinquagésimo,
sejam quais forem os resultados anteriores. Isto acontecerá a não ser
que se tenha feito alguma coisa para mudar a moeda ou o jogo, ou que
tenha havido alguma influência extrínseca atuando, como no experimento
sobre os métodos de ensino da leitura mencionado acima.
Acaso e pesquisa
86
outra. A falta de resultados sistemáticos e a insignificância das diferen
ças entre as médias estão mostradas na coluna denominada “Diferença”.
Tais resultados são característicos de resultados obtidos em bases for
tuitas ou casuais. Compare-os com as médias reais de Clark e Walberg
e a diferença entre elas ( + 4,76). A estatística, então, ajuda-nos a deter
minar ou avaliar se os resultados obtidos “realmente” diferem dos
resultados” que seriam obtidos sob condições de acaso.
Grupo Grupo
Experimento experimental controle Diferença
M, m2 Diferença M, _m 2 Diferença “
'' A l últimas três colunas são simplesmente uma continuação das três primeiras.
87
casual para avaliar os resultados de dados obtidos na pesquisa. Um
conjunto de 20 pares de médias e as diferenças entre as médias é mos
trado na tabela 5.3. Estas médias foram obtidas por um processo casual.
Um computador gerou 4.000 números aleatórios de 0 a 100. Depois
foram calculadas as médias de 40 conjuntos de 100 números cada um.
Essas médias foram emparelhadas, pondo-se a primeira média com a
vigésima primeira média, a segunda com a vigésima segunda, e assim
por diante.3 As diferenças, sob a coluna “Diferença”, foram calculadas
subtraindo em cada par a segunda média da primeira média.
Concentremo-nos nas 20 diferenças. Elas vão de — 10,37 a 9,72.
Há 9 diferenças positivas e 11 negativas. Isto se aproxima da expectativa
de casualidade, pois com números aleatórios esperamos aproximadamente
igual número de diferenças para mais ou para menos. (Deixemos os
sinais de mais ou de menos por ora, para simplificar a discussão.)
Suponhamos que fizemos um experimento com dois grupos e
obtivemos médias de 52,40 e 42,25. A diferença entre estas médias é
52,40 — 42,25 = 10,15. Usando as diferenças entre as médias da
tabela 5.3 com base casual, desejamos avaliar a chamada “ significância
estatística” da diferença 10,15. Um resultado “estatisticamente signifi-
cante” é o que se afasta “ suficientemente” da expectativa de acaso ou de
uma base casual. Os 10,15 obtidos diferem tanto do acaso? É um resul
tado estatisticamente significante?
Voltemos às diferenças da tabela 5.3. As duas maiores diferenças
são 10,37 e 9,72. Isto significa que 10 por cento (2/20 = 0,10) das 20
diferenças são maiores do que 9. Se quisermos aceitar cerca de 10 por
cento de risco de estarmos errados, podemos dizer que a diferença
obtida no experimento, 52,40 — 42,25 ou 10,15, excede à expectativa
de acaso. (Se tivéssemos levado em consideração os sinais das diferenças,
o risco teria sido menor. Por quê?)
Suponhamos, entretanto, que não estamos satisfeitos com 10 por
cento de risco. Queremos ter mais certeza de que nossa diferença experi
mental de 10,15 seja um afastamento “real” da expectativa casual.
Em outras palavras, queremos diminuir a probabilidade de fazer um
erro e aceitar o que realmente é uma diferença casual como uma “verda
deira” diferença. Assim dizemos que a probabilidade deve ser de 0,05,
ou 5 por cento, em vez de 0,10, ou 10 por cento. Cinco por cento de
20 é 1: 20 x 0.5 = 1. Neste caso tomamos apenas uma diferença, a
mais alta, 10,37. Conforme as diferenças dadas na tabela 5.3, há uma
probabilidade em 20, ou 5 por cento — a probabilidade é 0,05 — de
88
Obter uma média de 10,37 ou maior, por acaso. Obtivemos a diferença
de 10,15. Já que há só uma diferença tão grande na tabela, podemos
dizer que o resultado experimental obtido, a diferença entre a média
do grupo de controle e experimental, provavelmente não seja resultado
do acaso. Em outras palavras, há apenas uma possibilidade em 20, ou
uma probabilidade de 1/20 = 0,05, de que nossa diferença seja uma
diferença casual. Concluímos, então, que a média do grupo experimental
é estatisticamente maior que a do grupo de controle. Dizemos que a
diferença entre as médias é “estatisticamente significante”.
O leitor deve saber que este procedimento — chamado procedi
mento Monte Cario — não é o meio pelo qual os pesquisadores costumam
avaliar a significância estatística de seus resultados. A demonstração foi
feita apenas para mostrar a natureza do pensamento, para manufaturar,
por assim dizer, uma base casual com a qual avaliar um resultado
Experimental particular. Mas a idéia por detrás dos métodos mais sofisti
cados atualmente usados é muito parecida. Outra falha de nossa
demonstração foi usar apenas 20 pares de médias. Um procedimento
Monte Cario melhor teria usado 2.000 ou 20.000 médias e faria o
Computador emparelhar as médias ao acaso. Entretanto, a essência da
idéia esteve presente: foi avaliado um resultado experimental confron
tando-o com uma base causai.
89
descrição. Temos pouco interesse nele neste livro. O segundo propósito
é comparativo e inferencial. A média pode ser comparada às médias de
outros grupos. Médias de grupos diferentes, então, podem ser compa
radas com o fim de testar hipóteses e inferir se as hipóteses são ou não
confirmadas. Outras estatísticas além das médias podem ser igualmente
comparadas, naturalmente.
Uma estatística é uma medida calculada de uma amostra, como ficou
claro. Uma estatística é uma medida resumida: ela sumariza, ou expressa
em forma resumida, algum aspecto de uma amostra. A média expressa a
tendência central dos pontos, seu nível geral. Esta propriedade tem
grande utilidade, principalmente na pesquisa experimental, onde freqüen-
temente são comparadas as tendências centrais de grupos de resultados.
Lembre-se que foram comparadas as médias de grupos de reforçamento
maciço e regular no estudo de Clark e Walberg. O chamado desvio
padrão, outra estatística, expressa a variabilidade de um conjunto de
pontos; é uma expressão resumida de quanto é heterogêneo um conjunto
de pontos. Entre outras coisas, usando-a, pode-se avaliar a homogenei
dade ou heterogeneidade de diferentes conjuntos de pontos.
Uma população é um conjunto de todos os objetos ou elementos sob
consideração. Todas as crianças de 8 anos de Genebra, Suíça, são uma
população. Todos os homens de um exército são uma população. Amostra
é uma porção de uma população, geralmente aceita como representativa
da população. Para estudar e testar uma hipótese de Piaget sobre um
aspecto do pensamento das diferenças de 8 anos, podemos tirar uma
amostra de 100 dessas crianças da população de crianças de oito anos
de Genebra. Uma medida calculada dos resultados de todos os membros
de uma população é chamado um valor de população. Se calcularmos
uma média de todos os resultados de teste de inteligência de todas as
crianças de oito anos de Genebra, a média é um valor de população. Se,
entretanto, calcularmos a média da amostra de 100 crianças tiradas
da população, a média é uma estatística. Há muitas estatística, das quais
estudaremos algumas.
As idéias de valores de população e estatísticas e de população e
amostra, parecem confundir as pessoas, parcialmente, imagino eu, porque
a diferença entre elas é às vezes arbitrária, uma questão de definição.
Isto acontece particularmente na pesquisa comportamental porque fre-
qüentemente as populações são inacessíveis — até o recenseamento dos
Estados Unidos não pode cobrir todos os norte-americanos — e porque
as amostras podem ser tratadas como populações para propósitos de
pesquisa. Um exemplo simples é sexo. Homens e mulheres são amostras
de todos os seres humanos. Digamos que a população seja o conjunto
de todos os seres humanos de San Francisco. Os homens e as mulheres
de San Francisco são amostras dessa população. Mas o pesquisador pode
90
ter um bom motivo — seu problema pode incluir só mulheres —■para
estudar as características e comportamento somente das mulheres. As
mulheres de San Francisco, então, tornam-se a população. Agora,
Suponhamos que o pesquisador use um instrumento psicológico destinado
a medir as atitudes em relação às mulheres com todas as mulheres que
vivem em San Francisco. Ele calcula a média e o desvio padrão dos
resultados da medida de atitude de todas essas mulheres. A média e o
desvio padrão são valores de população.
É muito pouco provável, entretanto, que até o pesquisador mais
cuidadoso possa ou queira estudar todas as mulheres de qualquer cidade.
É muito mais provável que ele queira estudar uma amostra de mulheres
escolhidas em uma população. Suponhamos, neste caso, que a amostra
Consista de 700 mulheres de San Francisco. Se o pesquisador aplicar a
escala de atitudes às 700 mulheres e calcular a média e o desvio padrão,
estes serão estatísticos, porque foram calculados a partir de amostras.
O segundo propósito da estatística, ajudar a fazer inferências segu
ras a partir de dados de observação, centraliza-se nas palavras “ inferên-
oia” e “ segura” . Uma inferência é uma proposição ou generalização deri
vada pelo raciocínio, de outras proposições, ou da evidência. Na estatís
tica, as inferências podem ser tiradas de testes do que é chamado hipó
teses estatísticas. Da diferença de médias entre o grupo experimental e o
de controle do estudo de Clark e Walberg, do uso apropriado de um
teste estatístico e do raciocínio, “concluímos” que a média do grupo
experimental é maior que a média do grupo de controle. Isto é, temos
duas estatísticas, duas médias, calculadas dos resultados do grupo experi
mental e do grupo de controle. Subtraímos uma média de outra, neste
caso a média do grupo de controle da média do grupo experimental. Se a
diferença for “suficientemente grande”, o que quer dizer maior do que
Blguns valores concebidos como expectativa baseada no acaso, concluímos
que o grupo experimental obteve pontos mais altos de leitura em média.
Tal uso inferencial da estatística é o núcleo da estatística na pesquisa
Hmportamental contemporânea. A palavra "segura” , citada acima, refe-
e à estabilidade dos resultados obtidos e assim à estabilidade das
K irências feitas a partir dos resultados. Se obtivermos uma certa dife
rença entre as médias dos dois grupos, diferença igual ou semelhante
•parecerá outras vezes se o experimento for várias vezes repetido? Se
tivermos um certo conjunto de frequências em um cruzamento de
Variáveis ou tabulação cruzada, como no exemplo de Miller e Swanson,
no capítulo 1, obteremos padrões semelhantes de frequências — e iguais
ifastamentos das expectativas baseadas no acaso — se o estudo for
repetido? A estatística nos ajuda a responder tais perguntas, dando-nos
lltim meios poderosos de avaliarmos a estabilidade a validade empírica
hJo nossas inferências a partir de dados.
91
Concepção errônea da estatística
92
menos no que se refere a cada criança individualmente. Assim, todo o
procedimento é irrelevante à inteligência e realização de crianças verda
deiras. Argumentos semelhantes aplicam-se a toda a amplitude das ope
rações estatísticas.
É claro que este erro de concepção está baseado em idéias imper
feitas dos propósitos e usos da estatística. Todas as estatísticas são abstra
ções. Qualquer estatística em particular pode não corresponder aos resul
tados de um indivíduo em particular. Mas nem deveria! Seus propósitos
São muito diferentes. Adeptos dessa concepção errônea parecem querer
que a estatística mostre a “verdadeira realidade”, que faça alguma coisa
tnágica, enfim. Como toda a criaçao do homem, ela pode fazer apenas o
que lhe foi destinado, e isto sempre se limitou a aspectos especiais de
uma “realidade”. Uma média estatística é apenas uma média estatística,
mais nada. Não pretende ser “igual” a qualquer indivíduo. Mas pode ter
um poder explanatório considerável, até grande, quando usada e interpre
tada adequadamente.
O propósito da estatística, então, não é mostrar a chamada realidade
ou refletir as idiossincrasias dos indivíduos. Antes, seu principal propósi
to é ajudar os pesquisadores a chegarem ao significado de conjuntos de
dados. Assim, é de ajuda indispensável na interpretação de dados. Pode-se
dizer que a estatística disciplina os dados, agindo sobre eles de sorte a se
tirar inferências seguras de observações empíricas. Sem dúvida seria
difícil conceber a pesquisa comportamental moderna sem ela. Natural
mente, há perigos em seu uso. Pode-se ter dados inadequados e se acomo
dar numa espúria sensação de suficiência, mergulhando em cálculos e
Çperações estatísticos. Pode-se generalizar além dos dados e usar a
Estatística para acreditar e fazer os outros acreditarem que tal generali
zação é conveniente e correta quando, de fato, é inconveniente e errada.
A despeito dos perigos e dificuldades, a estatística, a teoria das probabili
dades por trás dela e a idéia fundamental e fecunda de acaso são ferra
mentas úteis e poderosas, cujo grande valor é nossa tarefa apreciar.
93
6. O d e lin e a m e n t o d a p e s q u is a e x p e r im e n t a l:
d e lin e a m e n t o s d e u m a sc v a r iá v e l
Pesquisa experimental
94
grupos, digamos de "privação”, também ao acaso. O outro grupo não
sofrerá “nenhuma privação”. A definição de experimento está satisfeita.
Haverá manipulação experimental e os sujeitos serão designados para
os grupos experimentais ao acaso.
Em princípio não faz diferença onde e como será feito o experi
mento. Muita gente acha que todos ou que a maioria dos experimentos
são feitos em laboratórios. Muitos são, mas muitos não. É até possível,
embora difícil, fazer-se um experimento em uma grande área geográfica.
Muitos experimentos da pesquisa comportamental são chamados experi
mentos de campo. Quer dizer simplesmente, feitos fora do laboratório,
"no campo”. Embora haja diferenças importantes entre experimentos de
laboratório e experimentos de campo, sua concepção essencial é a mesma.
95
Tabela 6.1 D elin e a m e n to do e x p e rim e n to de A ro n so n e M ills (1959).
S everidade d e iniciação
A2 A3
S evera S uave N enhum a
T ip o s de refo rçam en to
Ax A2
Maciço Regular
R esu ltad o s n a v ariáv el d e p e n d e n te (realização em
leitu ra)
96
Tabela 6.3 Delineamento experimental de uma só variável independente generalizado
C ondições experim entais
Aj A2 As ............................ Ak
97
Suponhamos que um educador queira testar a eficácia relativa de dois
métodos de ensino de certas operações aritméticas. A variável indepen
dente é métodos de ensino e a dependente a realização em aritmética.
Digamos que o experimentador disponha de um bom teste de realização
aritmética, a medida da variável dependente. Ele especifica cuidadosa
mente o que fará com os dois métodos de ensino — denominando-os
método A! e método A2. Isto é, ele define operacionalmente Y, a medida
de realização em aritmética e as condições experimentais, Ai e A2. Nada
disto é novo para nós.
Agora, entretanto, ele precisa dar um jeito de preparar dois grupos
de alunos e deve fazer isso de tal forma que possa assumir que, antes
do experimento começar, os grupos sejam estatisticamente “iguais” em
todas as variáveis possíveis que possam afetar a variável dependente,
realização em aritmética. Se ele não puder garantir que os grupos sejam
iguais antes de começar o experimento, as conclusões que tirar depois
serão questionáveis. Se os grupos não forem iguais, então o resultado
final poderá ser devido a outra influência ou influências outras que a
manipulação da variável independente. Suponhamos que a inteligência
afete a realização matemática — o que de fato acontece — e que um
dos dois grupos, sem o conhecimento do pesquisador, tenha crianças
que em média sejam mais inteligentes do que as do outro grupo. Daí,
depois de feito o experimento, suponhamos que a média de realização
aritmética do primeiro grupo seja maior do que a média do segundo
grupo. Esta média mais alta pode ser devida à inteligência superior do
grupo e não à manipulação experimental. Efeitos indesejáveis como este
devem ser controlados se o pesquisador quiser chegar a resultados em
que possa confiar.
Suponhamos ainda que inteligência e sexo afetem a realização em
aritmética. Um meio usado para “equalizar” grupos experimentais, para
controlar efeitos indesejáveis, foi “equalizar” os grupos designando-lhes
sujeitos sistematicamente de sorte que as variáveis indesejáveis ficassem
distribuídas igualmente entre os grupos. No caso particular de sexo e
inteligência, por exemplo, o pesquisador pode medir a inteligência das
crianças com um teste de inteligência e distribuir as crianças de inteligên
cia comparável entre os dois grupos, igualmente. Se ele tiver um total
de seis crianças (muito pouco, claro), e seus QIs forem 121, 119, 106,
109, 94 e 95, ele poderá colocar as de QI 121, 106 e 94 em Ai
e as de QI 119, 109 e 95 em A2. Com isto os grupos ficarão
aproximadamente iguais em inteligência. Depois, poderá distribuir meni
nos e meninas igualmente entre os grupos. Naturalmente ele poderá ter
que mudar a primeira distribuição com base na inteligência, já que é
possível que as medidas de inteligência das meninas sejam maiores (ou
as dos meninos), tornando impossível equilibrar os dois grupos na base
de ambas as variáveis.
98
Este método de designação de sujeitos a grupos está sendo abando-
nado por causa de uma grande limitação: controla apenas duas variáveis,
pteligência e sexo. E as outras variáveis que possam afetar a realização
em aritmética: aptidão numérica, classe social, atitudes e assim por
diante? Tais variáveis continuam sem controle. O que se pode fazer?
P o n to N ú m e ro P o n to N ú m e ro
N ú m ero in te l. Sexo c asu al N úm ero in tel. Sexo casual
1 147 F 26 16 108 F 3
2 141 F 13 17 104 M 22
3 137 M 29 18 104 M 23
4 136 F 11 19 103 M 21
5 132 M 19 20 102 M 19
6 128 M 14 21 101 F 5
7 128 M 10 22 101 M 17
8 126 F 27 23 99 F 24
9 .125 F 4 24 95 F 8
10 122 M 6 • 25 94 M 12
11 118 M 30 2o 92 F 18
12 115 F 7 27 90 F 16
13 115 M 2 28 90 M 20
14 110 F 28 29 89 M 25
15 109 F 15 30 87 F 1
100
tos, talvez mais, para fazer isto. Um computador leva um ou dois segun
dos 1 Naturalmente, é preciso que se escreva o programa para dizer ao
fpmputador o que deve fazer. Isto leva mais tempo, mas póde ser usado
para outros problemas semelhantes.) Os números que tirei da tabela,
na ordem em que foram tirados, são dados nas colunas da esquerda da
tabela 6.5 (30, 13, 16, . . .; 4, 25, 2, . . .; 19, 17, 18 . . .). Os três
grupos experimentais foram designados Ai, Aa e As. O QI e sexo de
cada sujeito são dados ao lado dos números aleatórios. Por exemplo, o
rimeiro sujeito da tabela 6.5 foi o décimo terceiro na tabela 6.4.
Í toa olhada na última tabela mostra que este sujeito tinha um QI de 87
C era mulher. O segundo sujeito da tabela 6 .5 era número 13 na tabela
e tinha um QI de 115 e era homem. Os 30 sujeitos, então, foram
distribuídos aleatoriamente a três grupos, junto cora seus QIs e designa-
çfies de sexo.
Será que consegui misturar os sujeitos de sorte a poder assumir
que os grupos sejam estatisticamente “iguais”? Jamais saberei exata-
ffiente, mas posso verificar até certo ponto. Primeiro calculo as médias
dos números dos sujeitos em cada grupo. Estas médias são dadas no
fim da tabela 6.5. São 14,7; 17,5; 14,3. A média dos números de 1 a 30
é 15,5. As discrepâncias são relativamente pequenas: 0,8; 2,0 — 1,2.
Tabela 6.5 Dados da tabela 6.4 rearranjados etn ordem casiial.
Ax a 2 a 3
30 87 F 4 136 F 19 103 M
13 115 M 25 94 M 17 104 M
16 108 F 2 141 F 18 104 M
9 125 F 6 128 M 23 99 F
21 101 F 15 109 F 29 89 M
10 122 M 27 90 F 1 147 F
12 115 F 22 101 M 8 126 F
24 95 F 26 92 F 14 110 F
5 132 M 20 102 M 3 137 M
7 128 M 28 90 M 11 118 M
101
(Se eu tivesse 50 ou 100 números em cada grupo, provavelmente elas
seriam menores. Por quê?) Segundo, calculo as medias de^ QI. um
cálculo importante porque quero "igualar” a inteligência nos tres grupos.
A média dos 30 QIs é de 111,67. Esta, então, é_a expectativa para cada
grupo. As médias calculadas para os grupos sao de 112,80, 108,3U e
113 70. As discrepâncias da expectativa são — 1,13, 3,3 /, Aoo, sao
pequenas. Finalmente, conto os homens (M) e mulheres (F) dos grupos.
Os números são dados no fim da tabela. Outra vez as discrepancias sao
pequenas. Portanto, a casualização “ aconteceu” : os grupos sao bastante
“iguais” em inteligência e sexo. Assumo que eles também sao iguais
em outras possíveis variáveis influentes.
Este processo de designar sujeitos aleatoriamente^ a grupos experi
mentais é um aspecto importante da casualização. Aqui esta uma detint-
ção um bocado formal e rígida do que acaba de ser ilustrado Casuali-
zacão é a designação de objetos (sujeitos, tratamentos, grupos) de um
universo a subconjuntos do universo de tal maneira que, para qualquer
designação dada a um subconjunto, todo membro do^umverso tem igual
probabilidade de ser escolhido para a designação. Nao ha total garantia
de que a casualização “igualará” os grupos, mas a probabilidade de
igualar é relativamente alta.
Há outra forma de expressar esta idéia, citando um principio fun
cional, o princípio de casualização: já que, em procedimentos aleatórios,
todo membro de uma população tem igual probabilidade de ser escolhido,
membros com certas características distintas — homem ou mulher, al o
ou baixo grau de inteligência, republicano ou democrata, dogmático ou
não-dogmádco, e assim por diante — se selecionados, provavelmente
serão contrabalançados a longo prazo pela seleção de outros membros
da população com a quantidade ou qualidade “opostas da caracterís
tica. Isto não é uma lei da natureza. É simplesmente uma afirmativa
do que acontece mais freqüentemente quando se usam procedimentos de
casualização.
102
de maneira engenhosa.4 63 jovens mulheres foram designadas aleatoria
mente a 3 grupos de 21 cada e submetidas a três condições experimen
tais: (1) condição severa, na qual os sujeitos tinham que ler palavras
Obscenas e descrições de atividades sexuais; (2) condição suave, na qual
iffiS sujeitos liam palavras relacionadas a sexo, mas não obscenas; e (3)
©ondição de controle, onde os sujeitos não precisavam fazer nada.
Foi usado um procedimento bastante elaborado. Parte de sua inten
ção era mostrar a filiação ao grupo como pouco atraente. Todos os
Sujeitos tiveram que ouvir a uma suposta discussão dos atuais membros
do grupo que “em geral se dedicavam a uma das discussões mais desinte
ressantes e inúteis que se possa imaginar” (Aronson e Mills, 1959,
p. 179). A variável dependente foi a avaliação da discussão e seus partici
pantes (presumivelmente membros do grupo) pelas moças. Aronson e
Mills acreditavam que os sujeitos dos três grupos avaliariam diferente
mente a discussão e os participantes: a condição severa mais favora
velmente, a condição suave em seguida e a de controle em último lugar,
menos favorável (e realisticamente). Se pudermos aceitar a validade do
raciocínio implícito de Aronson e Mills, que quanto mais altas as avalia
ções da discussão estúpida e de seus participantes mais os sujeitos valori
zavam sua entrada para o grupo, então a hipótese derivada da teoria da
dissonância cognitiva (ver nota de rodapé n.° 4) estava apoiada pela
evidência experimental.
As médias de todas as avaliações da discussão e participantes foram:
condição severa: 195,3; condição suave: 171,1; controle: 166,7. Os
resultados parecem apoiar a hipótese: os sujeitos do grupo da condição
severa avaliaram a discussão e os participantes da maneira mais favo
rável, os da condição suave avaliaram-nos menos favoravelmente e os de
controle menos favorável que todos. Já que os sujeitos foram designados
aos três grupos aleatoriamente, os pesquisadores puderam considerar
entre eles, depois, como devidas à manipulação, às condições diferentes,
os grupos “iguais” estatisticamente antes do experimento e as diferenças
Mas, como sempre, perguntamos: as três médias e as diferenças entre elas
poderíam ter aparecido por acaso? Um teste estatístico que determinou
a significância estatística das diferenças mostrou que as médias obtidas
e as diferenças provavelmente não poderíam ter aparecido por acaso.
Conforme um desses testes, diferenças tão grandes quanto as observadas
poderíam ter ocorrido por acaso menos que uma vez em 100. Ê uma boa
evidência para validade empírica da hipótese.
O modelo básico discutido neste capítulo tem muitas aplicações na
pesquisa comportamental, embora se deva confessar que não tem sido
4 A h ip ó te se d eriv a d a te o ria d a disso n ân cia co g n itiv a ("devida a F estin g er) q u e diz
q u e, q u a n d o id éias o u co m p o rta m e n to s c a u sa m co n flito em u m in d iv íd u o , ele
lu ta rá p a ra re c u p e ra r -o eq u ilíb rio e re d u z ir a “ d isso n â n c ia co g n itiv a” . O le ito r
verá a d isso n ân cia p ro d u z id a n o s sujeitos d o e x p erim en to .
103
muito usada a não ser nesta forma de duas condições. Os pesquisadores
comportamentais, principalmente os psicólogos, parecem preferir o tipo
de modelo discutido no próximo capítulo. Sempre que duas ou mais
condições experimentais de uma variável independente precisam ser com
paradas e estudadas, como no estudo de Aronson e Mills e no de Clark
e Walberg, e possamos supor que as condições experimentais funcionam
na maioria das circunstâncias ou têm efeitos fortes, o delineamento de
uma só variável indenpendente é útil e apropriado.
Esse delineamento tem, entretanto, uma grande limitação. Se a
variável experimental funcionar apenas em conjunção com uma ou mais
variáveis independentes, então, o modelo não é apropriado. No próximo
capítulo, onde consideraremos a pesquisa experimental com mais de uma
variável independente, veremos quando e por que o delineamento de
uma só variável independente pode ser impróprio.
Talvez a coisa mais importante que o leitor possa tirar deste capítulo
seja a aplicabilidade e a força dos procedimentos aleatórios. Uma das
grandes forças dos experimentos é poderem usar casualização. E o único
método defensável inventado para aumentar a probabilidade da validade
dos experimentos e das inferências feitas a partir deles, aumentando a
probabilidade de “igualdade” dos grupos experimentais em todas as
variáveis independentes possíveis. Seu uso dá grande força ao pesquisador
para fazer inferências partindo de dados e chegar a conclusões sobre
teorias e hipóteses.
104
7. D e lin e a m e n t o d a p e s q u is a e x p e r im e n t a l:
d e lin e a m e n t o s f a t o r ia is
106
experimentarão os dois tipos de apelo. Suas reações a estereótipos de
membros de grupos minoritários podem ser obtidas, e a diferença entre
as médias dos dois grupos pode ser avaliada quanto à significância
^statística. O paradigma deste experimento aparece na parte superior
esquerda da tabela 7.1 (A, na tabela). É o já familiar delineamento de
dois grupos.
Mas suponhamos que os psicólogos sociais tenham motivos para
acreditar — em bases teóricas ou experimentais — que a maneira de
expressão usada ao fazer tais apelos faça uma diferença. Isto é, que
acreditem que um apelo inflamado tenha mais efeito do que outro calmo
e objetivo. Eles poderão, naturalmente, testar a crença ou hipótese, num
experimento separado. O paradigma de tal experimento é o mesmo que o
do primeiro, tabela 7.1 (A). Está na parte superior direita da tabela (B).
É possível, naturalmente, que cada um desses experimentos possa
ser feito. E podem apresentar diferenças grandes entre as médias. Os
psicólogos sociais, entretanto, não estão interessados na idéia de experi
mentos separados. Têm outra, muito mais interessante: “Por que não
fazer os dois experimentos ao mesmo tempo e estudar os efeitos separados
dos apelos, assim como do modo de expressão, e também estudar e avaliar
seus efeitos conjuntos sobre a variável dependente?” Assim eles fazem.
) paradigma ou modelo do delineamento de tal experimento é dado
na parte inferior da tabela 7.1 (C). Este modelo permitirá três testes
em um único experimento. O primeiro teste avaliará os Apelos, Moral e
Pragmático. O segundo avaliará os Modos,-de Expressão, Inflamado e
(C)
A pelos
M oral P rag m ático
Ai A»
AiBi
In flam a d o
M odo d e Bi m ed id as da
expressão -------------- v a riá v e l ------------
C alm o depe rtdcnte
Bs
• AiBi AiBi
Calmo. Estes dois testes têm a mesma forma. É como se fossem feitos
dois experimentos separados e avaliadas as diferenças entre os dois
grupos, em cada experimento. • . .
O terceiro teste é mais interessante. Serve para avaliar a interação,
o trabalho mútuo das duas variáveis independentes em seu efeito conjunto
sobre a variável dependente. Significa avaliar o efeito da variável A em
diferentes níveis da variável B. É possível, por exemplo, que o apelo
moral seja mais eficiente do que o pragmático apenas quando feito em
tom inflamado. Ou pode ser que o pragmático seja mais eficiente do que
o moral quando feito em tom calmo. Quando uma variável independente
tem efeitos diferentes em diferentes níveis ou aspectos de outra variável
independente, este efeito diferencial chama-se interação. Diz;-se que duas
variáveis interagem para afetar uma variável dependente. Os delinea-
mentos fatoriais podem ter mais de duas variáveis independentes e,
portanto, é possível estudar mais de uma interação, mas vamos nos
restringir em geral ao caso de duas variaveis independentes.
A idéia de testar várias hipóteses em um experimento e uso do
tipo de delineamento para fazer isto, mostrado na tabela 7.1 (C), influen
ciaram fortemente a pesquisa científica comportamental. E não e a toa.
É uma maneira elegante, eficiente e poderosa de fazer as coisas. Precisa
mos, então, examiná-la muito cuidadosamente. Ao fazer isso, vamos nos
lembrar de que os princípios que discutimos até agora são os mesmos
aqui: casualização e designação aleatória, avaliação dos efeitos de
variáveis independentes sobre variáveis dependentes e a solução dos
problemas de pesquisa usando delineamentos de pesquisa e testes estatís
ticos. Vamos voltar ao nosso experimento hipotético para ilustrar as
idéias básicas
Os psicólogos sociais designaram 15 indivíduos ao acaso a cada
célula da tabela 7.1 (C), num total de 60 sujeitos. Havia, naturalmente,
quatro grupos correspondentes às quatro células da tabela (C). Para
abreviar a conversa sobre o experimento e para enfatizar a ^ função
dupla” de cada célula da tabela, as designações A e B foram inseridas
nos cantos da tabela 7.1: AiBt, A2B1, A1B2, A2B2. A, naturalmente,
representa a variável Apelos e B, Modos de Expressão. Ai e A2 e Bi e B2
representam as categorias de A e B. Ai e A2 são Apelo Moral e Apelo
Pragmático; Bi e B2 são Modo de Expressão Inflamado e Modo de
Expressão Calmo. Estamos mais interessados, porém, nas designações
conjuntas. . n
A,Bi é a junção, ou intersecção, das variáveis A e B no ponto Ai e üi,
a saber a célula da esquerda superior denominada A1B1. 3 A2B1 é a
108
Junção das variáveis A e B no ponto A2Bi , a célula superior direita.
As duas células restantes são, igualmente, as outras duas junções de
A e B. Vamos imaginar que foi feito o experimento. Os pesquisadores
puseram os sujeitos de cada grupo a examinar duas pessoas que discutiam
lObre judeus. Uma delas fez observações depreciativas a respeito dos
Judeus. A outra respondeu tentando mostrar à primeira por que não
devia falar daquele jeito. As respostas da segunda, entretanto, diferiam
de quatro maneiras e cada uma correspondia às quatro células da tabela
7,1 (C). Os sujeitos designados para a célula superior esquerda, A1B1,
ÍUviram-na usar o apelo moral, dito de maneira inflamada, e os da célula
inferior esquerda, A1B.2, ouviram-na usar o apelo moral dito de maneira
Calma. Os sujeitos da célula superior direita, A2B1, ouviram-na usar 0
ftpelo pragmático em tom inflamado e, finalmente, os da célula direita
Inferior, A2B2, ouviram o apelo pragmático dito em tom calmo. Dois dias
depois de feito o experimento, foram medidas as atitudes dos sujeitos em
felação aos judeus. (Os detalhes de procedimento usados no experimento
e como as atitudes foram medidas, não nos preocuparão aqui.)
É necessário observarmos três pontos importantes em relação a
este experimento e aos delineamentos fatoriais em geral. Primeiro, dois
jjíperimentos estão incluídos em um. Um deles testa a relação entre modo
de apresentação e a variável dependente e o outro, a relação entre apelos
e a variável dependente. Segundo, com a designação aleatória dos sujeitos
aos quatro grupos (as quatro células), e o cuidado ao fazer o experi
mento, pode-se assumir que os dois tratamentos — apelo e modo de
gpresentação — são independentes um do outro. Embora a independência
tenha sido amplamente discutida no capítulo 5, sua importância justifica
maior elucidação. As duas variáveis são ortogonais entre si. “ Ortogonal”
quer dizer em ângulo reto, o que significa que as variáveis são inde-
gftndentes, justificando considerar um experimento como dois. Nem
tómpre é fácil entender isto, mas é muito importante. Quando duas
Sfariáveis são independentes uma da outra, são não-correlacionadas. Se
Udéssemos calcular a correlação entre elas, obteríamos zero ou próximo
zero. Isto significa que o efeito de cada uma delas, na variável depen-
Í pode ser considerado e avaliado separadamente. Se a correlação
entre elas não fosse zero, fosse 0,50, por exemplo, não seriam indepen
dentes; parte do efeito de uma delas sobre a variável dependente podería
le dever à outra.
O terceiro ponto é o mais interessante. Se na realidade as duas
«fiáveis independentes funcionam juntas de algum jeito, para afetarem
a Variável dependente, este efeito pode ser estudado e avaliado. Suponha-
109
mos que os psicólogos sociais não estejam realmente interessados nas
variáveis independentes separadamente. Eles acham que não foi apenas
o apelo que fez efeito, mas os apelos combinados com os modos de
apresentação. Eles acham especificamente, que o apelo moral funciona
apenas quando apresentado de forma inflamada, que fazer um apelo
moral de maneira calma e racional é inútil; é preciso emoção para passar
convicção. (Como prova o sucesso de pregadores fundamentalistas e de
políticos demagogos.) Inversamente, acreditam que o apelo pragmático
exige tom calmo e racional de apresentação, para surtir efeito. Esta
linha de raciocínio é mais interessante e, naturalmente, mais complexa.
Está sendo adotada a chamada hipótese de interação: as duas variáveis
interagem para afetar a variável dependente.
Vamos fabricar alguns resultados para ilustrar diferentes resultados
possíveis do experimento. Aí então veremos como as perguntas da
pesquisa podem ser respondidas pelos dados obtidos no experimento.
A tabela 7.2 contém 4 resultados dos vários possíveis. As entradas
numéricas são médias. Assumimos que a variável dependente, atitude em
relação aos judeus, foi medida numa escala de 7 pontos, com 7 indicando
uma atitude altamente positiva e 1 uma atitude altamente negativa.
As médias grifadas são as significativamente diferentes.' Por exemplo,
em ( I ) , 6 e 4 estão grifados, o que significa que M a i é significativamente
maior do que MA2 (indicado na parte inferior dos dados por Ai > A2, Ai
é maior do que A2). As diferenças entre as médias A e B, consideradas
separadamente, são chamadas efeitos principais. Se, por exemplo, M a i é
comparada a MA2, isto é um efeito principal — da variável A.
As quatro estruturas, ou subtabelas, não são cruzamentos, que já
foram estudados quando examinamos os dados do estudo de Miller e
Swanson, em forma de freqüências e porcentagens. Eles mostram simples
mente um meio conveniente de apresentar o delineamento e os dados
de um estudo e análise fatorial. O 6 da célula A1B1 de (I) é uma média
calculada com os pontos de atitude dos 15 sujeitos da célula. O 4 na
parte de baixo da tabela é a média calculada com os 30 sujeitos da
coluna A2. As outras médias foram calculadas da mesma forma. Os dados
de um delineamento fatorial são quase sempre apresentados desta forma
prática e rapidamente interpretável. Os efeitos das variáveis separadas —
neste caso, apelos e modos de apresentação, ou A e B — assim como os
efeitos conjuntos podem ser vistos claramente colocando as variáveis uma
contra a outra desta forma.
Os dados em (I) indicam que o apelo moral, Ai foi muito maior
que o apelo pragmático, A2. Obviamente não houve diferença entre as
médias de modo de apresentação (5 e 5) e, portanto, nenhuma diferença
entre Bi e B2. Os dados em (II), por outro lado, indicam uma diferença
grande entre apresentação inflamada e calma, Bi e B2, e nenhuma dife-
110
Tabata 7.2 Quatro conjuntos de possíveis resultados obtidos em um modelo de
Qpirlmento fatorial fictício (médias)a.
(I) (II)
Moral pragmático Moral pragmático
Ai A2 Ai A2
1 calmo 6 4 5 Calmo 4 4
B. A,B2 A 2B2 Ba A,B2 A2B2
6 4 5 5
A, > Az B, A2
(III) (IV) .
Moral pragmático Moral pragmático
Ai A2 Aj Ai
Calmo 5 5 5 Calmo 4 6
Ba A,B2 A 2B2 Ba A,B2 A 2B2
5,5 4,5 5 5
A,Bi A 2B1 A,B, )> A 2B1
A 2B2 > A 1B2
6 As entradas nas células e nas margens são médias. Médias grifadas indicam
diferenças significativas.
112
(Conhecimento de tais delineamentos e sua análise. Recomenda-se, então,
o estudo de um bom texto de planejamento estatístico (por exemplo,
fêidwards, 1972).
Há um grande número de outros delineamentos experimentais usado
nas ciências comportamentais. Não vamos estudá-los neste livro, não
|>orque não tenham importância, mas por causa de nossa ênfase em
idéias conceituais básicas e em complexidades técnicas. O leitor achará
útil a discussão excelente, mas um bocado difícil, de Campbell e Stanlev
(1963).
Vamos tentar dar mais vida ao assunto citando três estudos nos
guais acha-se finamence ilustrada a força do delineamento e da análise
fatorial. Embora às vezes seja difícil encontrar bons exemplos de certas
outras técnicas, absolutamente não é difícil encontrar usos do delinea
mento fatorial de bons a excelentes, principalmente em pesquisa psico
lógica. Os psicólogos perceberam rapidamente as virtudes — e talvez a
Qualidade estética — do delineamento fatorial para implementar seus
propósitos teóricos e experimentais.4
113
Aronson e Gerard deram também uma breve explicação teórica (no
fim de seu relato) derivada da teoria da dissonância cognitiva (Festinger,
1957). Esta teoria diz, em parte, que se alguém faz alguma coisa que seja
incongruente com, digamos, a percepção de si mesmo ou da situação, sen
tirá um desconforto psicológico ou “dissonância cognitiva” . Em relação à
afirmação de Parkinson, se uma pessoa gasta mais tempo do que o
necessário em uma tarefa, isto criará dissonância cognitiva porque o
excesso de tempo gasto é incongruente com uma avaliação realista e
correta do tempo necessário para cumprir a tarefa. Para reduzir a disso
nância cognitiva, a pessoa precisa aumentar a importância e a complexi
dade da tarefa: “Afinal, é muito importante; leva tempo” . Conseqüente-
mente, ela poderá perder o mesmo tempo ou até mais da próxima vez
que fizer tarefa semelhante ou a mesma.
As variáveis independentes foram tempo, incentivo e sexo. Vamos
nos preocupar apenas com tempo; incentivo, sexo e todas as interações
não eram significantes. Metade dos sujeitos recebeu 5 minutos para
fazer uma tarefa; a outra metade recebeu 15 minutos. A tarefa, que era
extremamente fácil, exigia apenas 5 minutos. Consistia em escolher vários
argumentos de uma lista e colocá-los em uma sequência lógica. Mais
tarde pediu-se aos sujeitos que preparassem uma palestra de 2 minutos
sobre atletismo e que gastassem o tempo que precisassem para prepararem
um discurso convincente. A variável dependente era o tempo gasto pelos
sujeitos a prepararem o discurso (em segundos). Metade dos sujeitos
recebeu também um incentivo para terminar mais cedo, para contraba
lançar “o efeito de excesso de tempo” . Esta variável não era significante,
como fora indicado.
Os sujeitos na condição excesso de tempo (15 minutos) gastaram
uma média de 468 segundos na segunda tarefa, enquantos os sujeitos do
mínimo de tempo (5 minutos) gastaram uma média de 321 segundos na
segunda tarefa. Esta diferença foi estatisticamente significante. A evi
dência, então, indica que os sujeitos do grupo excesso de tempo sem
dúvida levaram tempo demais para terminarem a tarefa.
O leitor poderá querer saber se este resultado é generalizável, isto é,
se ele se aplica a outras pessoas em situações reais de trabalho. Diz-se
freqüentemente que experimentos, como estes são triviais, porque têm
pouca ou nenhuma aplicabilidade além do laboratório. Deve-se ter em
mente, entretanto, que a finalidade do experimento — e da maioria de
tais experimentos — foi testar uma implicação de uma teoria. E isto se
conseguiu com sucesso. Sua intenção não foi fazer mais do que isso.
Se os pesquisadores quisessem saber alguma coisa a mais em relação à
sua aplicabilidade em outras situações, ele teriam feito mais pesquisas
em outras situações com amostras representativas de pessoas. Este ponto
freqüentemente mal entendido será discutido novamente no próximo
capítulo.
114
Raça, sexo e admissão a faculdades
115
deles indicava que o candidato era homem branco, outro quarto homem
preto, outro mulher branca e o último mulher negra. Al em disso,
incluíram-se três níveis de capacidade do candidato. Na verdade, havia
então três variáveis independentes, raça, sexo e capacidade e 12 tipos
de formulários, correspondentes a um delineamento fatorial. 2 * 2 x .
As 240 escolas foram designadas aleatoriamente às 12 células do modelo.
Havia, então, 20 escolas por célula. Á principal variável dependente era
aceitação ou rejeição do suposto candidato: uma escala de cinco pontos,
partindo de rejeição direta (1) a aceitação com apoio oú oferecimento de
ajuda financeira (5). Foram incluídas outras variáveis dependentes e inde
pendentes, também, mas não vamos nos preocupar com elas.
Os pesquisadores esperavam que os homens fossem preferidos as
mulheres e pretos a brancos. (Na época do estudo as escolas estavam
procurando alunos pretos.) Estavam errados. A análise de variância fato-
rial mostrou que os efeitos principais de raça e sexo não eram significa
tivos, nem a diferença entre médias de brancos e pretos (3,38 e 3,18).
Foi descoberta uma interação muito mais interessante e não antecipada,
aliás. Isto está apresentado na tabela 7.3, que mostra as médias dos
homens e mulheres (resultados médios na variável aceitação, homens e
mulheres) de acordo com os três níveis de capacidade.
Estude cuidadosamente esta tabela: é importante metodologica e
socialmente. As médias dos três níveis de capacidade foram significativa
mente diferentes. Mas isto é uma descoberta não muito importante, já que
reflete meramente o costumeiro hábito de rejeitar candidatos de capaci
dade inferior. A diferença entre a média de homens e mulheres de 3,41
e 3,15 não foi significativa. Evidentemente não houve discriminação
global com base em sexo. A interação de capacidade e sexo em seu efeito
conjunto na aceitação, entretanto, foi estatisticamente significante. Para
interpretar a interação, podemos omitir as médias do nível médio de capa
cidade (3,48 e 3,48), já que são iguais. As médias de alta capacidade são
3,75 e 4,05, não muito diferentes. No nível ato de capacidade não há
discriminação de sexo. Veja, agora, as médias de baixa capacidade, 3,00
e 1,93. Esta diferença relativamente grande é o principal motivo para a
interção significativa. Evidentemente os candidatos homens de baixa
116
Capacidade são significativamente mais aceitos do que as mulheres de
baixa capacidade. A discriminação parece ser exercida sobre o nível
baixo de capacidade. Os autores afirmam que esta descoberta concorda
com a observação feminista de que apenas mulheres excepcionais podem
transcender estereótipos sexuais e serem julgadas objetivamente. Mulhe
res de capacidades mais modestas são julgadas primeiro como mulheres
— e assim como “inferiores.”
Este é um excelente exemplo da força do delineamento fatorial e da
utilidade de estudar interações. Provavelmente não teria sido possível
revelar a descoberta importante e interessante deste estudo sem a idéia
de interação das variáveis independentes em seu efeito sobre uma variável
dependente.
117
que resolver um problema. Foi perguntado aos sujeitos se gostavam ou
não do parceiro por meio de pontos que iam de 0 (“sim, definitiva
mente”) a 23 (“ definitivamente não”). Esta medida de apreciação era a
variável dependente. A previsão era de que os sujeitos mais anthsemitas
exibiríam mais agressividade deslocada induzida pela hostilidade provo
cada do que os sujeitos menos anti-semitas. Isto deveria ser mostràdo
pela menor apreciação pelos parceiros de trabalho por parte dos sujeitos
de alto grau de anti-semitismo. Esta é, então, uma hipótese de interação:
a deflagração de hostilidade deve funcionar diferentemente nos diferen
tes graus de anti-semitismo.
As médias de apreciação pelo parceiro, como função da deflagração
de hostilidade, A, e anti-semitismo, B, são dadas na tabela 7.4. Nenhum
dos efeitos principais foi em e de si próprio significativo. Sua interação,
entretanto, foi significativa. Quando foi despertada a hostilidade, indi
víduos com alto grau de anti-semitismo reagiram como mais agressividade
deslocada (menos apreciação pelo parceiro) do que indivíduos com
baixo grau de anti-semitismo. A hipótese de interação ficou apoiada —
uma descoberta de importância tanto prática quanto teórica.*7
Alto anti-semitismo
b2 18,4 14,2
Baixo anti-semitismo
Bs 12,2 16,3
Um retrospecto conceituai
118
como especificando as relações entre as variáveis. Agora temos ferra
mentas conceituais e metodológicas para nos ajudar a compreender
melhor como os cientistas comportamentais tentam explicar os fenômenos.
Eles separam as variáveis entre dependentes e independentes, usando a
gegunda para explicar a primeira. A explicação mais simples possível
consiste em relacionar uma variável independente com uma variável
dependente. Exemplos disto são os estudos de Clark e Walberg, Aronson
® Mills. O leitor encontrará muitos exemplos semelhantes na bibliografia.
A base conceituai do delineamento e análise de tais pesquisas é um
anunciado da forma “ se p, então q” . Não importa haver dois grupos
gxperimentais, como no estudo de Clark e Walberg, ou mais de dois
grupos, como no de Aronson e Mills, a concepção de explicação é a
mesma.
Mas as explicações às vezes são mais complexas, como no estudo de
Walster, Cleary e Clifford, no de Berkowitz e no de Aronson e Gerard.
Mais de uma variável independente é usada para estudar a variável
dependente. No caso mais simples, a concepção subjacente é “se p, então
q, sob a condição r”. Esta é a base conceituai de muitos estudos publica
dos. Muitos outros estudos, entretanto, usam base conceituai mais com
plexa: eles avaliam os efeitos separados e combinados de mais de duas
variáveis independentes sobre uma variável dependente. A base concei
tuai é “se p, então q, sob as condições r, s, e t”. Este exemplo tem quatro
variáveis independentes: p, r, s e t. Não importa quantas variáveis sejam
usadas e como estejam simbolizadas, a abordagem básica é a mesma:
o efeito de uma ou mais variáveis independentes sobre uma variável
dependente é estudado.
119
8. P e s q u is a e x p e r im e n t a l e n ã o - e x p e r im e n t a l
/■
120
Milgram fez diversas perguntas relacionadas e desejava respostas
empíricas: “Que fatores influenciam a disposição do indivíduo para
obedecer a uma autoridade?”, “ Como a autoridade afeta a obediência?”,
“Se o indivíduo que der ordens a uma pessoa tiver status de autoridade,
isso a compele a maior obediência?”, “ Por que indivíduos aceitam
ordens que os compelem a comportamentos ‘imorais’, comportamentos
que infligem sofrimento a indivíduos desprotegidos?”, “Quando as
pessoas obedecem a uma ordem que atenta contra a moralidade comum,
como elas reagem psicologicamente, como justificam seu comportamen
to?” É um conjunto formidável de perguntas a que poderemos responder
apenas parcialmente.
O procedimento experimental foi o seguinte: duas pessoas chegam
ao laboratório de psicologia para trabalharem juntas em um estudo de
memória e aprendizagem. Uma será o “professor” e a outra o “ aluno” .
O verdadeiro sujeito experimental será o professor. Ele é avisado de
que a finalidade do experimento é estudar os efeitos da punição na
aprendizagem. O aluno — sempre a mesma pessoa, um ator que recebeu
instruções de como reagir — está sentado em uma cadeira, braços
amarrados para evitar movimentos e com um eletrodo preso ao pulso.
O pesquisador diz ao aluno que ele aprenderá uma lista de pares de
jpalavras. Se fizer um erro, levará um choque. O professor observa tudo
isso e é levado para a principal sala experimental e instruído sobre como
usar um impressionante gerador de choque, que tem um painel de 30
chaves rotuladas de 15 a 450 volts, e também etiquetas com as palavras
“Choque leve” e “Perigo — choque violento”. .
O professor então recebe a ordem de “ensinar” o homem da outra
sala, lendo pares de palavras — dia bonito; caixa azul; e assim por
diante. Nos testes de aprendizado, o professor lê as palavras-estímulo e
em seguida quatro respostas prováveis, por exemplo: azul: céu, tinta,
caixa, lâmpada (Milgram, 1974, p. 19). O aluno escolhe a resposta que
acha correta apertando um de quatro botões. Se a resposta for correta,
o professor vai para o conjunto seguinte. Se estiver incorreta, deve
aplicar um choque no aluno. O professor receberá ordem de aplicar
§hoques cada vez mais fortes a cada resposta incorreta. Se o sujeito fizer
$ erguntas, deve ser informado de que os choque podem ser muito dolo
rosos mas que não causam danos permanentes aos tecidos. (Na verdade,
0 aluno não recebeu um choque sequer.)
Depois de iniciados o ensino e aprendizado e durante o experimento,
0 sujeito, talvez perturbado por ter que aplicar choques em outra pessoa,
ferguntou ao pesquisador se deveria continuar a fazer aquilo. O pesquisa
dor estimulou-o com um entre quatro comandos: “ Por favor, continue” ;
"O experimento exige que você continue”; “É essencial que você con-
tinue” e “Não há outra escolha, você tem que continuar” . Estes coman
dos eram dados em seqüência e apenas se o sujeito se recusasse a obe
decer.
O aluno-cúmplice do pesquisador deu sempre o mesmo conjunto de
respostas ou reações ao procedimento. Não teve a menor reação até o
choque de 75 volts, quando soltou um leve gemido. Aconteceu a mesma
coisa com os choques de 90 e 105 volts, mas aos 120 o aluno gritou
que os choques eram dolorosos. Aos 135 volts a “vítima” gemeu dolo
ridamente e aos 150 gritou pedindo para ser solto e que se recusava
a continuar. Reagiu de maneira semelhante mas com maior intensidade
aos choques subseqüentes e aos 180 volts gritou que não podia suportar
a dor. Aos 270 volts gritava em agonia e aos 300 recusou-se a continuar
dando respostas.
O sujeito (o professor) a esta altura — e anteriormente — pedia
orientação ao pesquisador, que o instruiu a considerar ausência de res
posta como falta de reação e a continuar o experimento. Depois dos
330 volts não .se ouviu mais nada do aluno.
A questão é: até onde os sujeitos vão? Chegarão aos 450 volts?
Ou se recusarão a uma certa altura? Eles obedecerão ou desobedecerão?
Este é o núcleo do experimento. Milgram variava as instruções para dife
rentes grupos de indivíduos. Por exemplo, ele manipulou a proximidade
do aluno com o professor, predizendo que, quanto mais distante o aluno
ficasse do professor, choques mais fortes o professor aplicaria. Usou
também outras variações de controle. Um grupo de sujeitos, por exemplo,
passou por um experimento com o pesquisador (a autoridade) ausente.
Com outro grupo foi feito o experimento num prédio de escritórios de
uma cidade distante da Universidade de Yale, onde foi feita a maioria dos
outros experimentos. Isso foi para controlar o possível efeito de autori
dade de uma universidade de prestígio (veja abaixo).
Os experimentos, então, usaram diversas variáveis independentes e
uma variável dependente, obediência, medida pelo nível de choque os
sujeitos antes de concluírem a série de choques ou até se recusarem a
continuar participando do experimento.
Os resultados desafiam o senso comum e violam a moralidade
comum.1 No primeiro experimento, onde a proximidade foi a variável
independente, 26 dos 40 sujeitos na situação básica remota continuaram
os choques até o máximo de 450 volts! (Lembrem-se de que as chaves
122
de 275 a 450 volts estavam indicadas com a etiqueta “ Perigo — choque
violento” e que as voltagens numéricas e as designações verbais estavam
claramente indicadas.) Cinco sujeitos deram 300 volts antes de desistirem
e oito aplicaram entre 315 e 360 volts. A maioria foi, então, muito
obediente, e todos, no mínimo, aplicaram choques mesmo acreditando
que eram violentos. Entretanto, quanto mais próximos estavam de suas
“vítimas”, menos obedeciam. Entretanto, um número considerável deu o
tratamento completo às vítimas.
É tentador estudar as implicações psicológicas deste notável estudo.
Meu principal objetivo, entretanto, ao citá-lo com tantos detalhes, não é
psicológico, mas metodológico. Quero que o leitor perceba claramente
que estamos tratando de um assunto altamente controvertido, difícil e
discutível, e confiar nos resultados também é difícil. Quero ilustrar
o fato de que, outras coisas mantidas constante, um experimento inspira
maior confiança do que um estudo ex post jacto. Se os resultados de
Milgram forem empiricamente válidos — e, apesar de certas fraquezas
metodológicas, parecem ser — encontramo-nos diante de um fato muito
perturbador relativo a muitas pessoas: elas ferirão cruelmente outras
pessoas obedecendo a uma autoridade reconhecida e a despeito de seus
escrúpulos morais. E não são monstros hitleristas; ao contrário, são na
maioria pessoas decentes e moralmente sadias, que normalmente jamais
sonhariam em agredir outras pessoas. Podemos então confiar nos resul-
tados(? (Parece que a resposta é “Sim”.)
A maioria das pessoas, quando indagadas sobre o que elas ou outras
pessoas fariam em tal situação, afirma que nem elas nem os outros
aplicariam choques às vítimas ou que o fariam apenas com choques
fracos. É este precisamente o objetivo de Milgram e parte do significado
psicológico central de sua descoberta: gente decente e bondosa compor-
ta-se cruelmente dada as circunstâncias apropriadas — e a principal
circunstância é a autoridade. Então, podemos acreditar nele? Eu aplicaria
choques em uma pessoa a mando de outra e apesar dos protestos da
vítima?
Controle
124
porque os pesquisadores podem ter controle quase total sobre o que
podem fazer e como o fazem.
126
estado agêntico. Outro experimento pode ainda ser variar a força e
legitimidade da autoridade do experimentador. Provavelmente a profun
didade do estado agêntico e o grau de obediência dos sujeitos podem
ser afetados diferentemente por diferentes forças e níveis de legitimidade
da autoridade.
Chama-se a essas possibilidades experimentais “flexibilidade” . Essa
característica dos experimentos, junto com a .capacidade de manipular
variáveis, de casualizar sujeitos e condições e chegar a um controle
relativamente firme e cerrado sobre a operação das variáveis constitui
um método muito poderoso de testar teorias e hipóteses e aumentar o
conhecimento. Isto não significa que todos os experimentos aumentam
significativamente o conhecimento. Sem dúvida, muitos são mal conce
bidos e mal executados. Não há garantia de validade ou valor, em
outras palavras, só porque um estudo é experimental. Mas o potencial
está presente. Antes de estudarmos a pesquisa ex post jacto, será bom
examinarmos tanto os pontos fortes como os pontos fracos dos experi
mentos, mas especialmente dos experimentos de laboratório.2
127
encontra sob o controle do pesquisador. Infelizmente, poucos estudos
são replicados.
“Replicação” é um termo mais amplo que “repetição’! ou “dupli
cação”. Significa repetir um estudo, mas geralmente com variações. Num
sentido estrito, a duplicação simples jamais é possível, porque são usados
sujeitos diferentes, pode ser acrescentada uma variável, outra pode ser
excluída, a replicação terá que ser feita em outra ocasião, quando as
condições podem ter mudado e o local da pesquisa pode, e muitas vezes
deve, sèr mudado. Em todo caso, se as relações obtidas são as mesmas
ou semelhantes sob replicação, sua validade empírica fica reforçada.
A replicação do experimento básico de Milgram, longe da Universidade
de Yale, é um exemplo deste fortalecimento da validade empírica dos
resultados da pesquisa.
Os experimentos têm fraquezas. Uma delas é que as variáveis inde
pendentes dos experimentos de laboratório raramente têm muita força
se comparadas à força de variáveis “naturais” fora do laboratório.
O experimento de Milgram parece ser uma exceção. A maioria dos
estudos experimentais, entretanto, não tem a força dramática dos estudos
de autoridade-obediência. Isso é uma desvantagem porque torna difícil
descobrir os efeitos de tais variáveis. Sem dúvida, as relações que existem
realmente podem não ser descobertas, confundindo talvez cs cientistas
em relação ao verdadeiro estado de coisas em um campo definido.
Quando um pesquisador estuda os efeitos da repetição sobre a memória,
pode ser muito difícil detectar tais efeitos, especialmente a curto prazo.
Um motivo para a precisão e a estatística aperfeiçoada do laboratório
encontra-se na necessidade de detectar os efeitos de variáveis indepen
dentes fracas.
A experimentação é frequentemente criticada com base em duas
acusações relacionadas: artificialidade e falta de generalidade. Ê difícil
saber se a artificialidade dos expèrimentos é realmente uma fraqueza.
Há muito pouca dúvida de artificialidade. Sem dúvida, já que variáveis
manipuladas são inventadas, são quase por definição “artificiais”. Por
outro lado, muitas vezes é incrível até que ponto os experimentos podem
ser tornados realísticos. Leia o livro de Milgram e veja se pode acusar
seus experimentos de artificiais. Um ponto mais sutil é que uma certa
quantidade de artificialidade faz parte natural da experimentação. Pesqui
sadores sofisticados naturalmente sabem disso. Eles acreditam também
que, por causa da artificialidade e efeitos fracos, se uma relação for
percebida em um laboratório, é substancial a probabilidade dé que, outras
coisas mantidas constantes, a relação será mais forte em situações mais
realistas. Muitos pesquisadores pouco ligam à artificialidade. Dirão que
estão testando teoria e que não têm interesse em aplicações de sua
pesquisa. Sua posição é bem colocada. Muito freqüentementé, pesquisas
128
consideradas teóricas e não práticas vierain a produzir resultados com
consequências práticas de longo alcance (veja Comroe & Dripps, 1976;
■Deutsch, Platt, & Senghaas, 1971; Townes, 1968). Voltaremos a este
problema no fim do livro.
Em geral os resultados de experimentos de laboratório não podem
ser generalizados além do laboratório. Só porque certos resultados foram
obtidos em laboratórios não se pode dizer que resultado idêntico ou
semelhante ocorrerá fora do laboratório — embora possa, e muito bem.
Deve-se mostrar, através de pesquisas posteriores, que os resultados se
aplicam ao campo. Isto falan do num se n tid o estrito . Fica-se intrigado com
a pesquisa de Milgram e com algumas outras enérgicas pesquisas de labo
ratório. As descobertas de Milgram são aplicáveis a escolas, corporações,
igrejas, exércitos e outros grupos? Não se pode dizer enquanto não se
fizer mais pesquisa. Minha opinião é que Milgram apresentou um forte
argumento, mas a pesquisa precisa ser estendida a situações de campo.
(Mas como fazer isso?) Ê possível que a relação entre autoridade e
obediência possa ser furada quando estudada em certos tipos de situações
reais.
Ao pensar na aplicabilidade da experimentação de laboratório à
vida real, deve-se ter em mente que o objetivo básico da experimentação
não é descobrir o que acontecerá ou ò que funcionará em situações de
vida. O objetivo básico é estudar as relações e testar hipóteses derivadas
da teoria sob condições cuidadosamente controladas e limitadas. Sem
dúvida, muita pesquisa — um exemplo claro é a medicina — é feita em
laboratório, principalmente para determinar o que aconteceu ou o que
acontecerá. Por exemplo, tal ou tal método de terapia surtirá efeito?
Embora muitíssimo útil, tal experimentação, cientificamente falando, é
periférica à base conceituai da experimentação científica. Se esta inter
pretação assaz purística está ou não completamente correta não é, entre
tanto, importante. O que importa é não esperarmos que a experimentação
em laboratório faça o que não foi encarregada de fazer: generalizar
para situações de vida real.
Talvez o leitor compreenda tudo isso melhor se focalizarmos rapida
mente outra crítica relacionada a experimentos e experimentação na
pesquisa comportamental. Freqüentemente afirma-se que os experimen
tos de laboratório são triviais. Há pouca dúvida de que muitos experi
mentos são triviais. É importante saber, contudo, o que o crítico está
dizendo. Ele está dizendo que os experimentos são artificiais, e com isso
quer dizer que não são a própria vida. Assim, são triviais. O núcleo da
crítica é que os experimentos não têm generalidade. Seus resultados não
se aplicam a pessoas reais em situações de vida real.
O argumento é mais fundamentalmente irrelevante do que errôneo
porque os experimentos e seus resultados não foram feitos para serem
129
aplicados à vida real, como ficou dito há pouco. O experimento é uma
invenção especializada cujo propósito está quase totalmente divorciado
da vida real. Seu propósito é especificamente ficar separado e prbtegido
do “barulho” exterior. Seu propósito científico é estudar as relações e
testar as proposições derivadas da teoria no ambiente menos contami
nado que se possa conseguir. Seu propósito não é melhorar as condições
humanas e sociais. Portanto, uma crítica com base na possibilidade de
generalização é, rigorosamente falando, irrelevante. É como criticar
alguma coisa por não ser o que não pode ser de forma alguma.
Pesquisa não-experimental
130
mos, por exemplo, que eu esteja interessado em relações equitativas em
geral e especificamente em como as pessoas lidam psicologicamente com
a inequidade.3 Posso formar grupos diferentes de indivíduos e fazer os
grupos sofrerem' formas ou quantidades diferentes de inequidade. Isto é,
eu manipulo equidade ou inequidade. É uma forma de controle porque
as diferenças em eqüidade entre os grupos vêm inteiramente de mim.
Elas não acontecem “lá fora”, por assim dizer. Um bom exemplo, com o
qual já estamos familiarizados, é o experimento de Aronson e Mills no
qual três grupos de mulheres jovens foram sujeitas a diferentes graus de
iniciação desagradável antes de supostamente se juntarem a um grupo.
Na pesquisa ex post facto, a manipulação de variáveis independen
tes não é possível. Esta é a característica fundamental da pesquisa não-
experimental: variáveis independentes chegam ao pesquisador como esta
vam, já feitas. Já exerceram seus efeitos, se os havia. Se eu estivesse
estudando como as pessoas lidam psicologicamente com a inequidade e
minha pesquisa fosse não-experimental, eu não poderia fazer grupos
diferentes de indivíduos sofrerem inequidade em graus diferentes, à
vontade. Eu provavelmente teria que procurar encontrar grupos dife
rentes de indivíduos que já tivessem provado a inequidade e depois
estudar como eles lidam psicologicamente com ela. A diferença entre a
abordagem experimental e não-experimental é grande, então. Aliás, a
diferença é tão grande que temos abordagens muito diferentes, problemas
de pesquisa e graus diferentes de confiança nas inferências que fazemos
dos dados de pesquisa.
Nos experimentos, já que temos controle virtual das variáveis inde
pendentes e da situação na qual as variáveis independentes operam,
podemos ter mais certeza — nunca total, claro — de que variações
concomitantes observadas numa variável dependente são devidas à
influência das variáveis independentes. Em estudos que não são experi
mentos, nossa confiança, outras coisas mantidas constantes, deve ser
menor, principalmente por causa da falta de controle manipulativo das
Variáveis independentes.4 Em muitas pesquisas não-experimentais obser-
132
câncer pulmonar e fumo? De forma nenhuma. Mas estamos tolhidos pela
principal dificuldade da pesquisa não-experimental.
É possível que o cigarro não seja realmente uma “causa” do câncer
pulmonar? Vamos imaginar que houvesse um síndrome psicológico,
chamado “discombulismo”, e que as pessoas discombulistas fossem alta
mente propensas ao câncer pulmonar. Suponhamos que os discombulistas,
além de outras características — hiperatividade, nervosismo, insônia,
temperamento volúvel e uma leve paranóia — tivessem uma forte predis
posição a contrair câncer pulmonar e fumassem cigarros, violentamente.
Em outras palavras, o discombulismo é a causa básica do câncer, não o
cigarro. Fumar é simplesmente uma característica concomitante. Acontece
aparecer no síndrome discombulístico. O pesquisador, não sabendo nada
a respeito do discombulismo, nota repetidamente a presença do câncer
entre pacientes que fumam demais. A correlação entre câncer e fumo é,
naturalmente, alta, e o pesquisador é conduzido a acreditar que o fumo
causa o câncer de pulmões.
Fantástico? Um pouco. Mas não impossível, certamente. O fato é
que a pesquisa não-experimental é mais vulnerável a conclusões errôneas
do que a pesquisa experimental.
134
mento das crianças — aliás, mais importantes do que qualquer outro
conjunto de variáveis, com exceção, talvez, das atitudes das crianças
(sentido de controle do ambiente, por exemplo). As variáveis da escola
— diferenças entre escolas em instalações, currículo e corpo docente —
não foram tão responsáveis pelas diferenças em realização quanto as
variáveis de ambiente familiar ou as de atitude. Esta foi a descoberta
mais controvertida, que vem sendo debatida e mal entendida. Muita
gente concluiu incorreta e apressadamente que o relatório Coleman afir
mava que as escolas e suas instalações, currículos e corpo docente não
eram importantes! É uma conclusão absurda, que ilustra uma das dificul
dades de interpretar os complexos resultados da pesquisa. Uma interpre
tação mais aproximadamente correta — e “correta” apenas no contexto
do estudo — é que as variáveis de escola não são muito responsáveis
pelo aproveitamento depois das variáveis de ambiente familiar. Explicar
esta afirmativa adequaoamente levar-nos-ia muito longe técnica e concei-
tualmente. Vamos, portanto, abandonar esta explicação e outras desco
bertas e vamos nos concentrar na natureza não-experimental do estudo.
O estudo de Coleman usou, ao máximo, técnicas modernas de
pesquisa de maneira competente e deu ao povo dos Estados Unidos
uma informação sobre as condições da educação no país que continuarão
sendo debatidas por mais uma década. Devemos compreender, entre
tanto, que é pesquisa ex post facto. Aqui as dificuldades se tornam
dramáticas porque as conclusões da pesquisa podem afetar importantes
decisões políticas em educação.
Consideremos a conclusão mencionada: as 'variáveis escolares con
tribuem menos para a previsão do aproveitamento do que as variáveis
de ambiente familiar. Há pouca dúvida de que esta conclusão seja
empiricamente válida na pesquisa de Igualdade. Mas consideremos a
possibilidade — certamente remota — de ser possível fazer grandes
estudos nos quais as variáveis escolares possam ser sistematicamente
manipuladas e avaliados seus efeitos sobre a realização. O resultado
poderia ser muito diferente porque a designação aleatória (de classes,
digamos) para as condições experimentais e a manipulação de variáveis
Independentes podem conduzir a resultados menos ambíguos. Saberia
mos, em outras palavras, que as influências de outras variáveis inde-
fpendentes foram minimizadas. Coleman e outros analisaram os dados
de maneira a aproximarem as descobertas de uma abordagem experi-
ental (através da chamada regressão múltipla e métodos relacionados),
Ê as de forma alguma isto é a mesma coisa. A influência de outras
possíveis variáveis independentes é difícil de controlar, e só o “controle
tatístico” é possível em contraste com os poderosos controles experi-
E entais de manipulação, casualização e isolamento.
E stu d o d e ig u aldade e lib e rd a d e
Liberdade 1* 3 10 8
Igualdade 12 9 1 9
136
outros grupos e não são fam osos por apoiarem a igualdade. Negros,
por outro lado, apóiam fortem ente a igualdade. Brancos desempregados
provavelmente não colocarão a igualdade em grau alto. Se os valores
Obtidos aparecem como se esperava, isto é evidência favorável à teoria
explícita ou implícita e à validade do instrumento de mensuração.
Os efeitos da privação
137
Não é provável que crianças que viveram em instituições vivam mais
tarde em áreas de classes inferiores? Assim sendo, a diferença observada
em inteligência pode ser devida Iargamente ao ambiente de classe infe
rior, que é menos orientado verbal e culturalmente do que o ambiente
de classe m édia.6
Esta mesma pesquisa poderia ter sido feita experimentaímente? Ê
concebível, mas dificilmente possível. Pode-se tomar uma grande amostra
de crianças recém-nascidas e designar metade delas a instituições, aleato
riamente. A outra metade ficará com sua família. Os controles serão
• usados cuidadosamente. Depois de um período de anos, a média de
inteligência dos dois grupos será comparada. Ê evidente a impossibili-
' dade de tal procedimento com crianças. Devemos, portanto, tomar as
coisas como estão e estudá-las — de modo ex posl fado. Agora vamos
examinar uma abordagem experimental ao problema da privação.
Durante alguns anos os pesquisadores da Universidade da Cali
fórnia, em Berkeley, estudaram os efeitos posteriores da privação em
' animais (Bennett, Diamond, Krech & Rosenzweig, 1964). A especifici
dade de suas pesquisas foi o exame físico e a mensuração de partes do
cérebro e de secreções químicas do cérebro feitos de modo relativamente
direto. A pesquisa deve ser classificada entre as poucas pesquisas compor-
tamentais mais significantes de nossa época. A simples façanha técnica
de medir os prováveis efeitos da privação sobre a fisiologia do cérebro é
impressionante. Os pesquisadores, entretanto, fizeram mais do que isto.
Só um de seus estudos será resumido a seguir
Bennett e outros (1964) basearam-se na hipótese de que uma expe
riência diferencial muito cedo na vida dos animais levará a mudanças
quantitativas no cérebro. Usaram, em um estudo, três grupos experi
mentais de ratos: Complexidade Ambiental e Treinamento (CAT), Condi
ção Isolada (Cl) e Condição Social (CS). Em CAT, de 10 a 12 animais
foram abrigados durante a amamentação em grandes gaiolas com equipa
mento “interessante” com que podiam brincar e que podiam usar.
Foi-lhes permitido também sair todos os dias das gaiolas para brincar e
explorar. Em Cl (isolados), os animais foram mantidos sozinhos em
gaiolas numa sala silenciosa, onde não nodiam ver nem tocar outros
animais. Os ratos do grupo de controle (CS) foram mantidos sob condi
ções comuns de colônia, três em cada gaiola, e expostos a atividades na
sala, mas sem tratamento especial. (Foi feito um tipo de casualização
138
na etapa de análise.) O estudo inicial foi replicado um certo número de
vezes, mas somente o ambiente enriquecido (CAT) e o ambiente empo
brecido (Cl) foram usados nas replicações.
Essas condições foram mantidas durante 80 dias. Os animais foram
então mortos e seus cérebros analisados. Amostras de várias partes do
cérebro foram medidas, pesadas e analisadas suas secreções químicas.
Os anatomistas que fizeram as análises não sabiam a que grupos experi
mentais pertenciam os animais.
Os resultados foram incríveis. Havia diferenças enormes de peso
do córtex cerebral entre os ambientes enriquecido e o empobrecido.
0 peso médio em miligramos do córtex total dos ratos estudados durante
P período de 1960 a 1963 foi de 700 (CAT) e 669 (Cl). A diferença
foi estatisticamente significativa. Evidentemente, as experiências enrique
cidas alteraram o peso do córtex dos ratos. Uma "análise de controle”
do resto dos cérebros dos animais não mostrou diferenças significativas.
Foi o córtex cerebral que aumentou de peso em relação ao resto do
cérebro.
Os pesquisadores de Berkeley mediram uma certa enzima nos cére
bros dos animais e encontraram diferenças entre os grupos que viriam
apoiar as descobertas relativas ao peso. Mediram também a espessura'-
M Ç\
do córtex dos ratos: os córtices dos ratos de experiência enriquecida
estavam cerca de 6 por cento mais espessos do que os dos ratos na
condição de isolamento.
A evidência experimental, então, confirmou a hipótese do ambiente
enriquecido. Testes de hipóteses alternativas — idade dos animais e
tensão de isolamento, por exemplo — não mudaram as descobertas.
Parece haver pouca dúvida de que a experiência enriquecida tem efeitos
físicos fundamentais sobre o cérebro — pelo menos em ratos, sob as
Condições do laboratório de Berkeley. Esses resultados serão aplicáveis
ao cérebro e condições humanas? Ninguém sabe.7 Por motivos óbvios
não se pode fazer pesquisa experimental semelhante com sujeitos huma
nos. Futuros progressos técnicos em tecnologia e pesquisa cerebral pode
rão possibilitar isso. Mas até alcançarmos tais progressos, a pergunta não
pode ser respondida de maneira não-ambígua. Os pesquisadores, usando
seres humanos como sujeitos e interessados em efeitos da vida real, como
os efeitos de ambientes de gueto, devem fazer principalmente pesquisas
ex post jacto, nas quais indivíduos desenvolvidos fora e dentro do gueto
140
variáveis independentes não são manipuláveis. Os pesquisadores cujc
principal interesse se concentra na natureza da inteligência ou na estru
tura dos valores e atitudes, por exemplo, precisam conformar-se com a
pesquisa não-experimental. Sua natureza não-experimental faz a pesquisa
menos significativa, menos científica? Em todo caso, ambos os tipos
de pesquisa devem e deverão ser feitos e o estudante de ciência e
pesquisa comportamental deve compreender as forças e fraquezas de
ambas.
Adendo
141
de os sujeitos resolverem problemas tenha melhorado çomo resultado de
sua exposição ao problema. Ou, depois de um certo período de tempo,
os sujeitos poderíam ter melhorado com qualquer método; sua compre
ensão dos vários aspectos da solução de problemas pode ter amadurecido.
Pode bem ter sido o método que tenha ajudado na solução de
problemas, mas jamais isso poderá ser dito sem ambigüidade enquanto
não for usado pelo menos mais um grupo. Aí então, pode-se comparar
os resultados obtidos com o método com os resultados obtidos sem o
método ou com outro método — com todas as outras condições mantidas
iguais.
Em resumo, um delineamento de pesquisa tendo apenas um grupo
experimental é sempre insatisfatório teoricamente. Se eu disser ao pes
quisador que não foi o método que melhorou a solução de problemas
mas, antes, que foi sua personalidade e entusiasmo, para os quais o
método funcionou como veículo, o que ele poderá dizer? Nada! Pelo
menos nada convincente. Se ele tivesse usado um segundo grupo experi
mental, cujos membros tivessem todos as mesmas condições do primeiro
grupo, menos o método, e os resultados favorecessem o primeiro grupo,
então o pesquisador teria uma base sólida para me responder. Ele pode
ría dizer: "Não, não foi minha personalidade nem meu entusiasmo,
porque eu também ensinei o segundo grupo e tentei fazê-lo exatamente
do mesmo jeito que fiz com o primeiro grupo. Portanto, a diferença
de resultado entre os grupos deve ser creditada ao método”.
Embora o argumento ainda tenha fraquezas, é muito mais forte
dò que era. Virtualmente todas as conclusões científicas, então, exigem
comparações. A função das comparações é isolar o efeito da variável
independente crucial, por assim dizer. Isto significa, essencialmente,
mostrar que alguma outra influência não produziu o efeito observado;
apenas a influência prevista na hipótese o produziu.
A despeito desta exigência óbvia de reforçar a inferência, há um
considerável corpo de pesquisa no qual, com efeito, é usado apenas
um grupo. Em algumas pesquisas sobre reforçamento, por exemplo, os
efeitos do reforçamento são avaliados, reforçando-se um grupo de ani
mais. As respostas dos animais são observadas para avaliar o efeito do
reforçamento. Em algumas pesquisas sobre a memória, um estímulo,
como iluminação, pode ser variado, e os efeitos das variações na memo^
rização de letras pelos mesmos sujeitos pode ser medido. Não afirmamos
aqui que tal pesquisa seja incorreta. Um dos métodos importantes de
ciência, por exemplo, é determinar funções (equações matemáticas), que
expressem as relações exatas entre estímulos e respostas. E na pesquisa
de reforçamento em animais, dificilmente se discute se é o reforçamento
— algum tipo de alimento, por exemplo — que produz as respostas.
Há pouco perigo de confusão quanto ao efeito da variável independente.
142
A maioria de outras pesquisas nas ciências comportamentais, entretanto,
não é controlada tão simples e facilmente.
Os estudos de Milgram descritos neste capítulo aproximam-se do
limite da definição de experimento. Note que todos os sujeitos experi
mentais, em qualquer “experimento", receberam o mesmo tratamento:
todos receberam a mesma instrução para administrar choques. A defi
nição de experimento, portanto, não foi satisfeita pela situação experi
mental básica, mas pelas variações introduzidas: o pesquisador presente
ou não presente: fazer o experimento em outro local que a Universidade
de Yale; distância entre professor e aluno.
O essencial deste adendo é que a definição básica e o significado da
palavra “experimento” não são as únicas definições e significados da
palavra em uso atualmente. A posição tomada neste livro, entretanto, é
que no mínimo uma comparação se faz necessária — isto é, um mínimo
de dois grupos experimentais---- para um experimento se tornar um
“verdadeiro” experimento. Isso necessariamente não elimina a possível
adequação de definições mais limitadas em algumas situações. Simples
mente determina o que se acredita ser um padrão adequado para se
fazerem inferências de dados experimentais.
143
9. O b s e r v a ç ã o e m e n s u r a ç ã o d e v a r iá v e is
144
patente entre os oficiais depende muito mais de funções de comando
que de funções de ensino). Eles seriam, portanto, menos eficazes como
professores do que os oficiais não interessados em fazer carreira.
Getzels e Guba mediram o conflito dos oficiais com uma escala espe
cialmente elaborada para a pesquisa. Verificaram também a validade da
escala comparando as médias das notas de diferentes escolas da Força
Aérea, variando em grau de envolvimento com assuntos militares. Como
previram, quanto mais militar a escola, menor o conflito e vice-versa.
Tiveram também que “observar” o desempenho no ensino e a eficiência.
Isto foi conseguido, fazendo os oficiais professores darem notas de
eficiência uns aos outros. Em outras palavras, Getzels e Guba “obser
varam” conflito e eficiência de ensino. O que fizeram, na realidade,
foi “medir” ambas as variáveis. O que significa isto?
M ensuração
Figura 9.1
146
ficar relações.2 Os valores da figura 9 .1 indicam que os juizes acredi
tavam que os negros sofriam a maior discriminação (6,1), índios ameri
canos vindo em segundo lugar (5.7) chegando aos ingleses, que, como
se esperava, sofreram a menor discriminação (1,3).
A figura representa uma relação porque tem um conjunto de pares
ordenados. É também mensuração, já que os números (classificações
MWídias) foram atribuídos a objetos (grupos) de acordo com regras. As
regras incluíram a especificação da escolha dos especialistas, ou juizes, a
escala numérica usada, de 1 a 7, e a variável medida, discriminação.
É uma “boa” mensuração? Ainda não sabemos. Pode ser e pode não ser.
Nò capítulo 4, foi usada ordenação em postos, em vez de pontos
numa escala. Apesar de isto mudar a natureza do procedimento de
Ür-nsuração, principalmente os números usados para serem atribuídos aos —3
gfojetos, não representa mudança na concepção de mensuração como
numerais atribuídos a objetos conforme regras. Ê aconselhável estudar 3
UNlVEftSSÍM
outro exemplo de mensuração antes de continuarmos a discussão.
M ed in d o in teligên cia
147
rismos. (Veja capítulos 2 e 3 e note a similaridade de definições de
“variável” e “mensuração”.) “Inteligência” é o símbolo.
Pode-se pensar em maneira diferentes de medir inteligência. Pòde-
mos pedir a especialistas que observem um grupo de indivíduos e que
atribuam notas e eles, correspondentes às quantidades percebidas de inte
ligência. Ou, mais provavelmente, podemos usar um teste de inteligência
aceito e testado, como por exemplo o famoso teste Stanford-Binet. Este
teste, com as instruções que o acompanham, constitui uma definição
operacional de inteligência. Os números fornecidos pelo teste — chama
dos quocientes de inteligência ou QIs, com alguns testes — serão atri
buídos aos indivíduos e provavelmente refletirão as diferentes magnitu-
des de suas inteligências. Volte à figura 4.2, onde cinco pessoas, Marie,
[acob e outros receberam números que eram notas de testes de inteli
gência: 131, 127 e assim por diante. No capítulo 4 estávamos ilustrando
uma relação. Mas a figura também representa mensuração.
Há pouca dúvida de que algumas medidas de inteligência não são
adequadas. Há pouca dúvida igualmente de que mesmo as melhores
medidas de inteligência não são válidas em algumas situações. Por exem
plo, se vários membros de um grupo de indivíduos cuja inteligência
esteja sendo medida eventualmente ficam doentes durante o teste,
lançam-se dúvidas sobre os resultados da mensuração. Ou se um grupo
de crianças foi criado em um lugar distante onde tenha havido pouca
estimulação cultural, as medidas usuais de inteligência não serão válidas
no sentido de medir a “verdadeira” inteligência das crianças. (Provavel
mente sejam válidas, entretanto, como medida do que se chama sua
“inteligência funcional”, ou sua capacidade de competir num ambiente
classe média americano.) Isto entretanto não significa que medir inteli
gência não seja realmente mensuração ou que inteligência não possa ser
medida. Sem dúvida, a maioria dos psicólogos concorda que inteligência
pode e tem sido medida com grande sucesso.
Fidedignidade
Estude os números da tabela 9.1 cuidadosamente. Considere que
eles são o resultado de uma tarefa de julgar, ou dar notas, entregue a
quatro juizes que foram instruídos para julgar cada um de cinco geren
tes de escritórios quanto à competência ao dirigir um conjunto de tarefas
administrativas. Os cinco gerentes foram, individualmente, observados
por quatro juizes. Os julgadores usaram uma escala de sete pontos, 6
significando altíssima competência e 0 competência muito baixa. Uma
das primeiras perguntas que fazemos em qualquer procedimento de
mensuração é: Quão fidedigno é?
148
iTabela 9.t Notas dadas por quatro juizes à competência de cinco pessoas —
fidedignidade alta.
Juizes
1 6 6 5 4 21 5,25
2 4 6 4 3 17 4,25
3 4 4 5 2 15 3,75
4 3 1 3 1 8 2,00
5 1 2 2 0 5 1,25
Agora, voltemos aos dados da tabela 9.1. Queremos saber até onde
as notas dos juizes à competência dos gerentes são fidedignas. Neste
exemplo fictício, a fidedignidade é muito alta. Cada um dos quatro
juizes chegou aproximadamente à mesma ordem de postos para os cinco
gerentes. Lembre-se que o que queremos é uma estimativa da competên
cia de cada um dos gerentes. Não estamos interessados nos juizes. Sua
tarefa é aumentar a fidedignidade das notas globais dos gerentes, assim
como classificá-los. Se somarmos as notas em cada linha e depois calcu
larmos as médias das notas de cada pessoa (por exemplo, para a pessoa 1:
(6 + 6 + 5 + 4)/4 = 21/4=5,25), temos um conjunto de médias para cada
pessoa. Perguntamos: Quão próximas estão estas médias das “verdadeiras
notas” ou “da verdadeira classificação” da competência de cada indi
víduo? É possível obter uma resposta apenas aproximada.
Este meio aproximado de determinar a fidedignidade das classifi
cações é baseado em todas as classificações e todas as médias calculadas
a partir das classificações dos quatro juizes. Se os indivíduos classificados
diferem em competência — se os indivíduos não diferirem no que
estiver sendo medido, a fidedignidade não pode ser realmente calculada
— então, as médias da coluna denominada “Média” deveríam diferir.
Quanto mais diferirem, maior a fidedignidade. Se o procedimento de men
suração for bom, então aproximadamente a mesma ordem de postos da
médias das classificações deve aparecer em mensurações subseqüentes,
assumindo-se que os juizes sejam especialistas e competentes. Observe
que as ordens de postos dos cinco indivíduos tendem a ser a mesmas
para cada juiz. Por exemplo, a notas dos juizes a e b das cinco pessoas
tendem a caminha juntas: foram feitas avaliações altas do indivíduo 1
(6 e 6) e baixas do indivíduo 5 (1 e 2). As avaliações dos indivíduos
2, 3 e 4 não são inconsistentes com estas avaliações extremas.
150
Igualmente, se examinarmos as classificações dos juizes c e d, nova
mente encontramos correspondência geral nas classificações. Tal concor
dância produzirá classificações médias (coluna denominada "média”)
que diferem claramente umas das outras, desde que, naturalmente, os
indivíduos realmente difiram uns dos outros em competência. Quanto
maiores estas-diferenças, mais alta a fidedignidade, outras coisas manti
das constantes.
Sem dúvida o leitor ainda está um pouco confuso. Vamos então
inventar uma situação altamente contrastante. Suponhamos que todo o
procedimento de julgamento tenha sido não-fidedigno. Suponhamos que
os juizes não soubessem comc apreciar a competência e, além disso, que
tenham sido descuidados. Quase certamente tal situação resultaria em
um conjunto de classificações de baixa fidedignidade. Damos um exem
plo na tabela 9.2. Os números (classificações) da tabela são números
aleatórios, gerados por um calculador programável.
Tabela 9.2 Notas dadas por quatro Juizes à competência de cinco pessoas —
fidedignidade baixa.
Juizes
1 2 5 6 1 • 14 3,50
2 5 2 6 4 17 4,25
3 2 3 1 5 11 2,75
4 3 1 3 2 9 2,25
S 6 3 4 4 17 . 4,25
■B»-------■------
151
Veja agora as classificações da tabela 9 1. Há uma concordância
geral entre os quatro conjuntos de classificações, como já observamos.
Se o juiz a dá à pessoa 1 uma nota alta, o mesmo fazem os juízep b, c
e d — acontecendo o mesmo para os quatro juizes nas notas baixas.
Há, em outras palavras, uma alta concordância entre os julgadores. Na
medida em que as classificações concordam, elas são fidedignas.
Outra diferença, talvez mais sutil entre as duas tabelas, está nas
médias das pessoas. (As médias dos itens, embora importantes em algu
mas situações, não são importantes aqui. Em geral, elas não afetam a
fidedignidade tanto quanto as médias das pessoas.) Os dois conjuntos
de médias foram reproduzidos na tabela 9.3. A primeira diferença a
notar é que as médias de 9.1 são mais variáveis que as médias de 9.2.
As amplitudes, que são índices — embora grosseiros — de variabilidade,
são 5,25 — 1,25 = 4, para 9.1 e 4,25 — 2,25 = 2, para 9.2. Já que
as notas de 9.2 eram na realidade números casuais, então, as cinco
médias de 9.2 deveríam ser quase as mesmas. (Por quê?) A amplitude
refletiría, naturalmente, esta falta de variabilidade.
Vamos voltar e examinar a tabela 5.1, um conjunto de 100 números
arranjados em grupos de 10. Examine as médias dadas nas tabelas 5 .2
e 5.3, também calculadas a partir de números aleatórios. Passe os olhos
pelas discussões das três tabelas. Observe, na tabela 5.1, que as 10
médias são muito parecidas. A expectativa baseada no acaso é 4,56,
a média total. Já que as 10 médias são médias de números aleatórios,
elas devem ficar bem próximas dessa expectativa baseada no acaso. Os
números aleatórios, por definição, não são fidedignos. São números sem
sistema ou regularidade, e fidedignidade significa, entre outras coisas,
que os números são sistemáticos; eles mostram regularidade.
Uma definição de fidedignidade pode ser dada negativamente: fide
dignidade é falta de “erro” em um conjunto de medidas. O “ erro” aqui
significa, com efeito, flutuações casuais, ou aleatórias. “Erro” é a varia
bilidade, as flutuações das medidas, não devidas ao que quer que esteja
sendo medido. Na medida em que um conjunto de medidas tem tal
variabilidade, não é fidedigno. (Tal variabilidade não deve ser confun
dida com a variabilidade dos indivíduos, há pouco discutida, uma varia
bilidade que reflete diferenças entre indivíduos. Veja abaixo.) Os núme
ros aleatórios, naturalmente, refletem apenas um ir e vir, subir e descer,
uma variabilidade não sistemática.
As médias dos cinco especialistas, “ Grupo Experimental”, tabela
5.2, são muito parecidas com as médias da tabela 9.3, “baixa fidedigni
dade.” Não são muito diferentes. E não deveríam ser: foram calculadas
de números aleatórios. Igualmente, as médias da tabela 5.3 nãc são
muito dissemelhantes. Mas as médias da tabela 9.3, “Alta Fidedigni
dade”, diferem tanto quanto podem, se compreendermos que as médias
152
sfio sempre menos variáveis do que os números dos quais são calculadas.
A amplitude maior provavelmente reflita mais exatamente as diferenças
individuais em competência das cinco pessoas, cuja competência está
eendo medida. Se as médias se assemelham a médias calculadas a partir
de números aleatórios, então provavelmente serão iguais entre si; não
diferirão muito. Se obtivermos números numa situação real de mensu-
ração que se assemelhem a números aleatórios, então, sua fidedignidade
será baixa. Eles não podem refletir com exatidão as diferenças individuais
das pessoas medidas.
Tabela 9.3 Médias das pessoas tiradas das tabelas 9.1 e 9.2.
Alta Baixa
Pessoas fidedignidade Pessoas fidedignidade"
(tabela 9.1) (tabela 9.2)
1 5,25 2 4,25
2 4,25 5 4,25
3 3,75 1 3,50
4 2,00 3 2,75
5 1,25 4 2,25
153
cando fidedignidade muito baixa (“nenhuma” fidedignidade) e 1,00 indi
cando fidedignidade perfeita. As notas da tabela 9.1 , então, são alta
mente fidedignas, enquanto que as da tabela 9 .2 não oferecem nenhüma
fidedignidade.
O exempo usado para ilustrar a fidedignidade vem usando classifi
cações provavelmente porque são mais fáceis de compreender do que se
usássemos um teste e itens de teste. O mesmo raciocínio, entretanto, se
aplica aos testes. Substitua simplesmente “juizes” por “itens”. As pessoas
classificadas são as mesmas; a única diferença é que agora serão “testa
das” em vez de “avaliadas.” Isto é, qualquer teste ou escala consiste
em certo número de itens, cada um destinado a medir a mesma coisa,
assim como os juizes deviam avaliar ou medir a mesma coisa. Por
exemplo, suponhamos que temos que medir autoritarismo. Podemos usar
a conhecida escala F. Aqui estão dois dos itens (Adorno e outros, 1950,
pp. 255-257):
Obediência e respeito à autoridade são as virtudes mais importantes
que uma criança deve aprender,
A ciência tem seu lugar, mas há muitas coisas importantes que
jamais poderão ser compreendidas pela mente humana.
Os sujeitos respondem a estes itens numa escala de acordo-desacordo.
Quanto mais concordarem, mais autoritários acredita-se que sejam.
São usados muito mais que dois itens. (Em geral, quanto mais
itens, maior a fidedignidade, contanto que todos meçam a mesma coisa
e a meçam igualmente bem.) Se os dois itens dados acima medem a
mesma coisa, devem produzir aproximadamente a mesma ordem de
postos para os indivíduos. Se isto ocorrer, então, a escala de dois itens
será fidedigna. Do contrário, não é fidedigna. O mesmo raciocínio é
estendido aos vários itens de um teste ou escala. Se tivéssemos 40 itens
em um teste de inteligência, cada um deles seriam um “juiz” : produzirá
ordem semelhante de postos de inteligência entre os indivíduos.3
3 Note, entretanto, que itens individuais são muito menos fidedignos do que testes
inteiros. Entretanto, itens de fidedignidade relativamente baixa podem, quando
usados em número suficiente, produzir um teste ou escala fidedigna. É um
aspecto ou princípio útil, que torna possível obtermos testes fidedignos de caracte
rísticas humanas.
154
não nos aproximarmos da “verdadeira” nota dos indivíduos (ou objetos)
medidos? É um dos principais motivos para se fazer a mensuração.
Temos que confiar nos resultados obtidos. Devemos saber, por exemplo,
que se medirmos a competência ou a criatividade ou ainda a dominância
ou inteligência de um grupo, obteremos as mesmas notas ou notas
semelhantes em uma mensuração subseqüente dos mesmos indivíduos.
Isto significa, entre outras coisas, que obteremos as mesmas ordens de
postos das notas, ou parecidas.
Vejamos a relação entre duas variáveis, inteligência e competência.
Digamos que queiramos saber o papel que a inteligência desempenha
em certa espécie de competência. Se uma ou ambas as medidas de inte
ligência e competência não forem fidedignas, então não será possível
determinar com exatidão de que maneira estão relacionadas — ou “ corre
lacionadas”, como se diz. A magnitude da relação pode ser alta, mas se
uma ou ambas as medidas não forem fidedignas, a relação calculada
será baixa, simplesmente por falta de fidedignidade. Se aceitarmos a
magnitude da relação calculada pelo seu valor aparente, vamos nos
desviar seriamente. Suponhamos que a magnitude da relação tenha sido
UNlVEf
realmente alta, mas a medida de competência não seja fidedigna e que
não saibamos que não era fidedigna. Podemos acreditar que a relação
entre inteligência e competência seja baixa ou nula. Podemos então
concluir que inteligência tem pouco a ver com o tipo de competência
que estávamos tentando medir. Tal conclusão seria, naturalmente, errada.
Igualmente, no uso prático de medida de variáveis, a fidedignidade é
um aspecto indispensável da mensuração. Que ádianta um teste de inte
ligência de crianças que não seja fidedigno? Que adianta uma medida
de atitudes em relação a grupos minoritários que não seja fidedigna?
Se os testes e as escolas não forem fidedignos, as predições que fazemos
com eles — e eles são instrumentos de predição, assim como medidas
de variáveis — são inúteis ou piores que inúteis, pois podem nos
desviar de conclusões relativas a habilidades e atributos dos indivíduos
que estamos medindo, assim como a relações entre as habilidades e
atributos.
Validade
156
preender a abordagem científica geral à observação do comportamento
e à mensuração de variáveis. Por sua vez, esta compreensão nos dará
melhor fundamento para avaliarmos algumas controvérsias fundamentais
sobre mensuração que importunam tanto os cientistas quanto os leigos.
T ip o s d e va lid a d e
157
Medindo dogmatismo
158
Em outras palavras, o trabalho de Rokeach foi dirigido tanto para
a teoria por trás da escala D quanto para as propriedades da escala,
um exemplo claro de validação de constructo. “Validação de constructo”
talvez seja uma expressão mais exata do que “Validade de constructo”
para expressar o que está envolvido. O pesquisador tenta de várias
formas obter provas que apoiem a teoria por trás de uma medida assim
como sobre a medida. É um processo divergente e convergente no qual
as deduções da teoria são testadas de maneiras diferentes com a idéia
de que a evidência de testes diferentes convergirá para a validade da
medida. A validação de constructo é, então, essencial à própria ciência
em seus testes de deduções e implicações derivadas da teoria. É uma
importante conquista da mensuração e da pesquisa comportamental, uma
conquista que está revolucionando a mensuração psicológica e socio
lógica. 5
M ensuração em perspectiva 5
ÍV iV i
tamental. Freqüentemente planeja-se e executa-se cuidadosamente uma
investigação, com pouquíssima atenção à mensuração das variáveis da
pesquisa. Eis um caso interessante que demonstra a falta de preocupação
com a fidedignidade. Um pesquisador planejou um conjunto elaborado
de experimentos para testar uma teoria de atitudes. A cadeia de racio
cínio das implicações experimentais da teoria parecia válida. Se é
verdade, como prevê a teoria, que isto e aquilo 'são assim, então aconte
cerá isto e aquilo. O procedimento experimental foi cuidadosamente
planejado e executado para testar as deduções. Foram feitas predições
estatísticas específicas sobre as diferenças entre grupos experimentais.
Nenhuma das predições resultou como fora predito! Sem dúvida, virtual
mente nenhuma das diferenças eram estatisticamente significativas. O
conjunto de experimentos foi um fracasso completo. Foi como se os
números analisados fossem números aleatórios. Por quê? Por que a
teoria era falha? Por que o experimento foi mal conduzido? Por que
os sujeitos foram mal escolhidos?
O verdadeiro motivo parecia ser a mensuração da variável depen
dente. O pesquisador passara grande parte de sua vida profissional
dizendo aos alunos que, para medir adequadamente uma variável, era
159
necessário usar um certo número de itens para medir a variável. Depen
der de um ou dois itens, como fazem muitos pesquisadores, é loucura
porque se sabe muito bem, e pode ser facilmente demonstrado, que um
ou dois itens simplesmente não oferecem segurança suficiente para justi
ficar seü uso. Se for feito um experimento e for medida a variável
dependente com apenas um ou dois itens, haverá uma alta probabili
dade de que, mesmo se existirem diferenças significativas entre os dois
grupos, estas não serão detectadas simplesmente porque a medida da
variável dependente não será suficientemente fidedigna para “pescar” as
diferenças! Se havia diferenças verdadeiras entre os grupos experimen
tais, como fora predito, elas não tinham grande probabilidade de serem
detectadas.6
Todos os campos da realização humana têm sua dose de mitologia
e absurdo. A mensuração, infelizmente, é particularmente sobrecarre
gada por ambos. Parte da causa são as atitudes negativas em relação à
mensuração psicológica. Mas a ignorância e os mal-entendidos provavel
mente tenham a maior parte. Uma das maiores dificuldades parece ser a
má compreensão do objetivo básico da mensuração. Acredita-se, por
exemplo, que os psicólogos medem as pessoas, e que não se pode medir
pessoas. É verdade que não se pode medir as pessoas. Mas os cientistas
na realidade não medem as pessoas nem dizem que medem (pelo menos
não deviam dizer que medem). Eles medem variáveis, assim como nos
experimentos eles não manipulam pessoas, mas variáveis. Eles medem,
sim, o comportamento das pessoas, os indicadores observáveis de
constructos hipotéticos, como inteligência e dogmatismo. Ninguém pode
medir inteligência diretamente. “ Inteligência” é um constructo usado
para resumir um conjunto incrivelmente complexo de comportamentos
que têm a característica comum de serem “inteligentes.” Acreditar que
os psicólogos medem pessoas, então, é ingenuidade. Criticar a mensuração
porque ela não mede pessoas é ingênuo também.
Sem dúvida, todo procedimento de mensuração, mesmo de variáveis
relativamente “simples”, é altamente indireto, complexo e freqüente-
mente difícil. Em vista dessas dificuldades, o êxito dos cientistas compor-
tamentais em medir variáveis comportamentais é notável. E tem sido um
êxito, apesar dos críticos que afirmam ter sido um fracasso. Eis algumas
variáveis que têm sido medidas com êxito: inteligência, aptidões (verbal,
numérica e assim por diante), atitudes (em relação a uma variedade de
objetos), introversão, coesão (de grupos), necessidades, classe social,
autoritarismo, dogmatismo. Podemos enumerar muitas outras. Isto não
significa que a mensuração de tais variáveis seja perfeita, ou que poderá
160
vir a ser perfeita. Ao contrário, vem carregada de dificuldades, sendo
a maior de todas, naturalmente, a validade. Mas os cientistas, principal
mente os psicólogos, conhecem as limitações e as dificuldades e são geral
mente muito cuidadosos em suas avaliações e no uso de testes e escalas
e seus resultados.7
Como qualquer outra coisa, os testes e medidas devem ser usados
com cautela e discrição. Quando falamos de mensuração em ciências
comportamentais, colocamo-nos em nível muito diferente do que quando
falamos de mensuração em ciências naturais. Devemos ter sempre muito
cuidado em verificar a fidedignidade e validade de nossas medidas.
Devemos entender que os chamados erros de mensuração desempenham,
infelizmente, um grande papel em nossas medidas. Em ciências naturais,
há muito menos problemas de fidedignidade; consegue-se geralmente um
alto grau de precisão e exatidão com a ajuda de poderosos instrumentos
de mensuração. Validade é mais um problema, mas nem de perto o
problema que há com variáveis como inteligência, ambiente familiar,
atmosfera escolar, atitudes em relação a estrangeiros, criatividade e assim
por diante. Contudo, mensuração é mensuração nas ciências naturais e
nas ciências comportamentais. A definição básica e os procedimentos
gerais são os mesmos. Não é menos legítimo e científico medir as atitudes
e opiniões das pessoas, por exemplo, do que medir a circunferência da
terra ou a força dos terremotos. Se existem variáveis, elas são potencial
mente mensuráveis, embora os graus de precisão, exatidão e validade
variem amplamente.
Investigação sociológica
162
realidade da pesquisa. Outro motivo é por termos que nos dirigir a um
grande corpo de estudos variados que parecem ter as características
comuns de usar variáveis sociológicas, ser não-experimentais, dirigir-se
freqüentemente para problemas sociais importantes e usar um conjunto
de técnicas analíticas relacionadas. Muitas dessas pesquisas foram chama
das “levantamentos” {survey research) ou “estudos de campo” .
Para sermos mais concretos, vejamos os sumários de quatro inves
tigações sociológicas. O fato de incluírem “variáveis psicológicas” não
muda sua natureza basicamente sociológica.
Resposta
Tabela 10.2 Classe social e tempo de desmame, estudo de Miller e Swanson (1960).
(reprodução da tabela 1.1) a.
Cedo Tarde
33 22 55
Classe média
(60%) (40%)
31 48
17
Classe operária
(35%) (65%)
50 53 103
164
Stouffer.2 As mães de classe média desta amostra desmamaram seus
filhos mais cedo que as mães de classe operária. (Veja mais detalhes
na discussão do capítulo 1.)
Tabela 10.3 Valores orientados para pessoas e mudança de escolha ocupacional. 1952.
Continuaram Abandonaram
professores o ensino
165
Professores ou Abandonaram o Ensino. (Escolha Ocupacional) é uma
variável sociológica, que é estudada em relação a uma variável psico
lógica, Orientado para Pessoas e Não-Orientado para Pessoas. As res
postas da amostra foram analisadas em uma tabela de porcentagens
(calculadas a partir das freqüências).
O último estudo citado nesta seção não pode ser exatamente chama
do levantamento ou estudo de campo. £, entretanto, o que está sendo
chamado neste capítulo, investigação sociológica. Ê também um exemplo
de um novo,tipo de estudo que cada vez mais está sendo feito, à medida
que arquivos de dados vão sendo construídos abrangendo os resultados
de muitos estudos. Hyman, Wright e Reed (1975) desejavam respostas à
pergunta extremamente importante, mas raramente formulada empirica-
mente: “Que duração têm os efeitos da educação formal?”
Uma das grandes dificuldades em estudar os efeitos.de longo alcance
da escolarização e de programas ou mudanças sociais é a dificuldade
que os pesquisadores têm em seguir as pessoas ao longo do tempo. Os
estudos que seguem as pessoas através do tempo chamam-se estudos
longitudinais. Se quisermos avaliar os efeitos de longo alcance das
escolas e da escolaridade, devemos estudar as pessoas quando estão na
escola, logo após saírem da escola e em momentos posteriores. Mas esta é
uma das espécies de pesquisa mais difíceis de fazer por diversas razões
práticas e técnicas que não podemos citar aqui. Ê suficiente dizer que
há pouca evidência empírica longitudinal na questão dos efeitos duráveis
da escolarização.
Hyman e seus colegas resolveram, o problema da dificuldade em
responder à sua pergunta sobre os efeitos duráveis da escolarização,
fazendo análise secundária de dados coletados em diversos levantamentos
nacionais. Com efeito, eles combinaram e compararam os resultados de
vários levantamentos relacionados com a sua pergunta. Isto é, extraíram
informação sobre o nível de escolaridade de milhares de norte-americanos
de 54 levantamentos, com um total de cerca de 80.000 indivíduos.
Os levantamentos foram feitos durante o período de 1949 a 1971. Foram
escolhidos de modo a agruparem-se em tomo de quatro pontos no tempo,
permitindo.uma aproximação aos estudos longitudinais. O leitor, cuja
acuidade crítica, deve estar bem desperta com nosso estudo anterior, verá
neste estudo, seus problemas e resultados, um ótimo exercício de inter
pretação crítica.
Na tabela 10.4, alguns resultados do estudo de Hyman e outros
são dados de forma muito sumarizada e condensada. Estes resultados são
166
Tabela 10.4 Nível de escolaridade e porcentagens médias de conhecimento acadê-
mico de quatro grupos de idade nos anos 60, estudo e Hyman e outros (1975). *
Sr-----------------
Nível de escolaridade
íUEstes três itens e as entradas na tabela foram escolhidos entre muitas tabelas
"■melhantes, quase que arbitrariamente. A maioria dos itens usados pelos levanta-
intos, entretanto, foram semelhantes quanto a serem conhecimento funcional
operadas através do tempo. A maioria dos estudos sobre os efeitos da
escolarização é feita em um ponto do tempo. A relaçao pode, natural
mente, ser estudada desta forma, mas os resultados nada nos dizem a
respeito dos efeitos da escolarização através do tempo.
Hvman e outros, numa excelente tentativa de “simular» o aspecto
longitudinal, usaram dados de levantamentos nacionais e categorizaram
os dados obtidos durante diferentes períodos de tempo pela categori
“ Idade», dada na tabela 10.4. Nela há quatro grupos de idade, ou seja:
25-36 37-48 49-60 e 61-72. Os autores argumentaram que os eteitos
da escolarização seriam mostrados pelo conhecimento, aumentado com a
escolarização aumentada e que os padrões de diferenças seriam
mos ou semelhantes em diferentes grupos.
Pela tabela 10.4 ficou claro que a resposta principal dos autores
ficou respondida: da escola primária até a universidade, a quantidade de
conhecimento aumenta e aumenta de forma parecida nos quatro grupos
(diferentes níveis de idade). Esta descoberta repete-se monotonamente
nas tabelas de Hyman e outros. Raramente se vê tal consistência de
resultados e demonstração de poder de “replicação», se se puder chamar
os diferentes níveis de idade e os vários testes de conhecimento, rep
cações. -
A pergunta incômoda volta sempre, entretanto: “Podemos acreditar
nos resultados? É possível que esses resultados fortes sejam espúrios no
sentido de que não é a escolarização que gera maior conhecimento quant
mais alto se chega no sistema educacional, mas uma outro variavel ou
variáveis?» , , . A .
Consideremos a inteligência. É possível que o nível de «iteligencia
diferente dos participantes da amostra produziu as diferenças observad
em percentagem nos três níveis de escolaridade? Parece bastont^ plJ 3 a í
supor que indivíduos mais inteligentes sobem mais no sistema escol
do q u e indivíduos menos inteligentes. Se for este o caso, sem duvida
os resultados da tabelá 10.4 (e outros semelhantes) levam a conclusão
errada. Não é a escolarização, mas a inteligência que influencia. Ou,
talvez mais exatamente, é a educação e m t e h g e n c i a . ^
(1975 P 294) usaram a frase certa que expressa a dificuldade frustrante
que os analistas de resultados de pesquisaenfrentamprmcipalmemeem
pesquisa não-experimental: “terrível indetermmancia’ . N aR ataenm
neste estudo há outras variáveis que contribuem para a tem yd indeter
minância. Vamos nos concentrar rapidamente apenas em inteligência. ^
Hvman e outros controlaram variáveis concorrentes e explicações
concorrentes de forma competente. Sem dúvida eu recomendo seu livro
ao leitor como modelo de raciocínio cuidadoso, objetividade cientifica
exposição clara e o uso de material de pesquisa de arquivo para testar
questões práticas importantes. Usa também profusamente o raciocínio
de hipóteses alternativas que já encontramos em capítulos anteriores, mais
especialmente no capítulo 9 sobre pesquisa experimental e não-experi-
mental. Vamos dar uma rápida olhada, entretanto, no que talvez seja a
parte mais fraca de Hyman e outros, isto é, nos argumentos sobre inte
ligência.
Os autores dizem que a variável que se desejaria poder controlar é
a inteligência, medida durante a infância, antes que os resultados dos
testes pudessem ter sido influenciados pela escolarização. Mas tais
medidas necessárias ao controle direto, dizem eles, estão além do alcance
de qualquer pessoa; os sujeitos do levantamento já estão adultos, tarde
demais para medir inteligência antes da influência da escolarização. (A
escolarização, naturalmente, tem uma forte influência sobre a inteligên
cia medida através de testes.) Reciprocamente, a mensuração da inteli
gência de crianças vem cedo demais para medir ós efeitos duráveis da
escolarização.
Para apoiar seu argumento de que a inteligência não produziu os
efeitos por eles relatados, eles usaram argumentos opostos. Primeiro,
as características sociais e biológicas tiveram sua influência diminuída
como critérios de seleção escolar. Mais e mais crianças têm alcance à
educação nos últimos anos. A inteligência deveria, portanto, ter um
grande papel em determinar a realização. Segundo, padrões antigos,
mais rigorosos, de desempenho acadêmico nas escolas do país, foram
relaxados. Assim, estudantes de gerações mais recentes conseguem prosse
guir na sua formação e subir mais no sistema èducacional, embora sua
inteligência seja mais limitada. O primeiro argumento, então, diz que a
inteligência desempenha um papel maior e o segundo diz que desem
penha um papel menor. Hyman e outros afirmam que os dois argumen
tos levam à conclusão de que a contribuição da inteligência deve ter
mudado com o tempo. Portanto, se for descoberto, como ocorreu em sua
análise, que os efeitos da educação não variam através de períodos de
tempo e grupos de idade, então, inteligência não é a explicação. Eles
citam também resultados de outros estudos em que, segundo afirmam, a
influência geral da inteligência sobre a realização educacional é modesta
(uma conclusão possivelmente duvidosa).
Minha conclusão é que os resultados de Hyman e outros são empiri-
camente válidos, tendo em vista a magnitude dos efeitos — as diferenças
de porcentagens — e sua notável consistência através do tempo. Mas
ainda estou preocupado com a possibilidade de que uma parte substan
cial dos efeitos observados seja devida à inteligência. A conclusão mais
exata provavelmente seja que tanto inteligência quanto escolaridade
tenham influências substanciais e conjuntas duradouras sobre o conhe
cimento. Eu teria gostado de ver a inteligência controlada. Mas isto não
era diretamente possível. Mesmo assim os pesquisadores fizeram o
máximo que puderam nas circunstâncias. 4 Pode-se mesmo dizer que suas
“análises de controle” (veja especialmente o capítulo 3) são exèmplos
excelentes de controle na análise de materiais e problemas difíceis e
controvertidos. De fato, todo o estudo é um ótimo exemplo de investi
gação sociológica cuidadosa e competente.
Levantamentos
4 Minha dúvida aumenta, entretanto, pelo que Hyman e outros (1975, p. 25)
dizem, a respeito de um rápido teste de inteligência (vocabulário) aplicado em
um dos levantamentos usados por eles. Os adultos escolarizados tiveram notas
mais altas. Em outras palavras, há uma relação positiva entre inteligência e efeitos
da escola. Em pesquisa, principalmente em pesquisa educacional, muitas vezes se
deseja que todas as pessoas tenham exatamente a mesma inteligência!
170
Os levantamentos descritivos procuram determinar a incidência e
distribuição das características e opiniões de populações de pessoas,
obtendo e estudando as características e opiniões de amostras pequenas
e presumivelmente representativas de tais populações. São usadas ampla
mente pelo governo, pelas firmas e organizações. O propósito básico das
levantamentos usados desta forma não é científico, mas antes orientado
para a ação e para diretrizes de ação. Entretanto, os levantamentos des
critivos têm tido efeitos muito fortes sobre a pesquisa comportamental
em geral, principalmente através de seu procedimento sofisticadíssimo
de amostragem e entrevista. Já discutimos amostragem aleatória e suas
características. Para fins práticos é altamente desejável que as amostras
estudadas sejam representativas. Desejamos dizer que o resultado obtido
em um estudo de grande escala é representativo. Se a amostra for sem
dúvida representativa, então, os resultados obtidos por meio dela podem
ser generalizados para toda a população. Se 80 por cento de uma amostra
respondem favoravelmente a uma questão sobre uma possível diretriz
do governo, por exemplo, aCredita-se que, se se fizesse a mesma pergunta
a todas as pessoas de um país, um estado, uma cidade ou uma organi
zação, perto de 80 por cento delas seriam favoráveis.
Há várias maneiras de tirar amostras para fins de levantamento,
mas a única que dá uma razoável garantia geral de ser representativa é
alguma forma de amostra aleatória. Frequentemente os levantamentos
usam o que se denomina procedimento de amostragem aleatória estrati-
ficada, que mostrou várias vezes ter uma alta probabilidade de ser
representativa.
A tabela 10.5 contém evidências notáveis e asseguradoras da
representatividade de grandes amostras aleatórias de todos os Estados
Unidos. O método consiste em verificar a incidência de características
sociológicas prontamente disponíveis de uma amostra com as mesmas
características obtidas no censo mais recente — ou com outra fonte
de confiança de tais dados.
s O leitor curioso pode perguntar: pode-se confiar nos cálculos do censo? Afinal,
as cifras do censo, embora presumivelmente valores de população, têm um número
de fontes de erro que reduzem sua exatidão ideal. Há alguns até que dizem que
confiam mais nos cálculos das amostras que nas cifras do censo. Em todo caso,
as cifras do censo são geralmente bastante exatas. E, afinal, é preciso usar
alguma coisa para verificar os cálculos das amostras!
6 Para um breve relato destes levantamentos e outros estudos aplicados, veja
Likert e Hayes (1957). i
172
anuais foram, evidentemeníe, altamente eficazes e forneceram informação
nacional exata sobre a renda e suas fontes, poupança, dívidas, bens de
consumo, intenções do consumidor e assim por diante.
Levantamentos de interesse para os pesquisadores comportamentais
têm focalizado pessoas e fatos vitais relacionados a elas, suas crenças,
opiniões, atitudes, valores, motivos e comportamentos. Apesar de que a
habilidade na realização de entrevistas, bem como o uso de formulários
cuidadosamente planejados predominam nos levantamentos, usam-se
também outros métodos de observação. Em resumo, o levantamento é
uma forma de investigação sociológica (com fortes implicações psico
lógicas, naturalmente) amplamente usada, especialmente para metas
práticas e de formulação de diretrizes, e que influenciou a pesquisa com-
portamental principalmente com seu procedimento de entrevista e amos
tragem, como já foi mencionado. Os resultados foram, notavelmente,
exatos e generalizáveis. Podemos confiar em tais resultados, se obtidos
através de amostragem aleatória feita pelas melhores organizações espe
cializadas em levantamentos. Vamos dirigir nossa atenção agora para
uma forma de análise comum e importante que é usada em levanta
mentos e em outras formas de investigação sociológica.
Análise de freqüências
8 Há uma razão estatística por trás desta regra. Veja Kerlinger (1973, pp. 162-166)
para a explicação técnica. Damos uma explicação não-técnica mais adiante.1
174
midade religiosa. Observe como a força da relação se mostra clara
mente nas duas tabelas. Se as porcentagens fossem calculadas de outra
forma, pelas colunas, a direção da relação ficaria expressa incorreta
mente e talvez levasse a conclusão errada. Tais tabelas calculadas incorre
tamente já foram publicadas. (Não importa se as porcentagens forem
calculadas por linhas ou por colunas, contanto que a regra de calcular
da variável independente para a variável dependente seja seguida.)
car as atitudes, mas não os distúrbios. O que se deseja dos dados é uma
resposta à questão: “Qual é a probabilidade de distúrbios, dada a atitu
de?” Pode ser mostrado que essa probabilidade é obtida calculando-se
as porcentagens (mais exatamente, as proporções) das freqüências origi
nais através das linhas. As freqüências originais das quatro células da
tabela foram obtidas das freqüências de P e NE (105 e 126) dadas pela
comissão. As porcentagens, então, foram calculadas da atitude para os
distúrbios, ou nas linhas. Estas porcentagens estão na tabela 10.7 (os
valores foram arredondados). São equivalentes a dizer: “Se atitude, então
distúrbio”.
Tomando essas porcentagens como probabilidade, lê-se, por exem
plo: “A probabilidade de distúrbios, dada a concordância com a afirma
tiva: ‘Às vezes eu odeio os brancos’, é 0,55 (ou 55 por cento)”. Ê óbvio
que essas probabilidades ou porcentagens contam uma história diferente
da do relatório da Comissão. Nesta tabela toma-se importante o desa
cordo com a afirmativa. Dado o desacordo com a afirmativa, a probabili
dade é de 0,68 de que indivíduos não se envolverão. Dado o acordo, a
probabilidade é de 0,55 de que os indivíduos participarão dos tumultos.
Mais importante, as porcentagens ou probabilidades na tabela 10.7 estão
em consonância com as ordens do Presidente; as da tabela 10.6 parecem
não estar em consonância com elas.
Este exemplo é particularmente difícil porque, neste caso, podem
ser oferecidos argumentos razoáveis para ambos os métodos de calcular
as porcentagens, já que a atribuição e objetivo da comissão foram, entre
tanto, determinar por que ocorriam as perturbações, o peso do argumento
parece cair para o lado do cálculo de porcentagens da tabela 10.7 e
contra o da tabela 10.6. O enunciado correto do problema, na forma
“se p, então q”, é: se atitude, então perturbação e não se perturbadores,
então atitude.
O exemplo foi explanado mais extensamente para dar ao leitor algo
mais que a oportunidade de um rápido olhar para um problema de
análise e interpretação interessante e importante. Pode-se ter ganho
também maior compreensão da análise de cruzamentos simples. O pro
blema substantivo é importante tanto teórica quanto praticamente. O
176
Taòe/a 10.7 Respostas de participantes em distúrbios (P) e pessoas não-envolvidas
(NE), com porcentagens calculadas por linhas. F envolvidas
NE
177
investigação sociológica, porque tal abordagem provavelmente esteja mais
próxima da natureza da ciência, como em grande parte do estudo experi
mental e não-experimental de relações. Quando possível e conveniente,
a experimentação deveria ser feita em laboratório e no campo, pelos moti
vos dados anteriormente. Quando possível, as variáveis deveriain ser
medidas usando escalas de valores que pudessem ser atribuídas aos obje
tos medidos. Isso não significa que a pesquisa não-experimental não seja
importante e necessária. Não significa também que a mensuração que
permita apenas contagem9 — como a contagem de Stouffer de respostas
Sim e Não (tabela 10.1), ou a contagem de Hyman e outros de números
de indivíduos em diferentes níveis de escolaridade (tabela 10.4) — não
seja necessária e importante. Em suma, ambas as abordagens são
necessárias e indispensáveis na pesquisa comportamental.
A investigação sociológica, então, é uma parte extensa e muito
importante da pesquisa comportamental contemporânea. Pode-se até dizer
— e certamente seria dito por alguns pensadores — que é mais impor
tante do que a investigação experimental. Considere os levantamentos
e os estudos em larga escala como o relatório Coleman, Igualdade de
Oportunidades Educacionais. Pode-se dizer ou mesmo tomar por implíci
to que, por haver menos controle e menos certeza de inferência, a
pesquisa não seja importante? Um dos objetivos deste livro é ajudar o
leitor a compreender a tela enorme onde está pintada a pesquisa experi
mental e a riqueza e variedade de cores que os cientistas comportamen-
tais usam na pintura. Foram dados grandes passos científicos neste século,
principalmente na conceitualização de problemas de pesquisa e na meto
dologia. A investigação sociológica fez e continuará a fazer parte impor
tante, ativa e criativa do esforço geral.
178
11. A a b o r d a g e m m u lt iv a r ia d a :
r e g r e s s ã o m ú lt ip l a e p a r t iç ã o d a v a r iâ n c ia
179
realização entre alunos da primeira escola é maior que as diferenças de
realização na segunda. Mais •especificamente, a amplitude das notas de
realização na primeira escola é maior que a amplitude das notas de
realização na segunda escola. Este significado de variância é geralmente
associado a diferenças individuais entre crianças em características psi
cológicas. Pode também ser associado, entretanto, a diferenças entre
objetos e grupos. Diz-se, por exemplo, que as notas médias de realização
de classes, ou escolas, diferem. Aqui estamos falando sobre as variâncias
de classes e escolas. A idéia de diferenças individuais, então, é geral,
desde que definamos “individual” de maneira ampla.
O segundo significado ou uso de variância é mais sutil e mais
técnico, mas muitíssimo útil, como veremos. Aqui os pesquisadores
falam sobre a quantidade de variância em uma variável dependente
sendo “devida a” ou “explicada por” uma manipulação experimental
ou por outras variáveis. Por exemplo: “A manipulação de autoridade
explicou 20 por cento da variância das medidas de obediência”. Supondo
que houvesse dois grupos experimentais, a afirmativa significa que a
diferença média entre os dois grupos — ou a variância entre os dois
grupos — foi “responsável” por 20 por cento da variância total das
medidas da variável dependente, obediência.
Um enunciado mais complexo que reflete este segundo significado
da variância e seu uso é: “A inteligência foi responsável pela maior
parte da variância de realização. As atitudes das crianças e seu ambiente
familiar foram também responsáveis por substanciais porções da variân
cia. As variáveis escolares foram responsáveis apenas por uma pequena
porção da variância”. Este enunciado especifica a influência na variabili
dade de uma variável dependente, realização, de quatro variáveis inde
pendentes: inteligência, atitudes, ambiente familiar e variáveis escolares.
O enunciado sobre a manipulação de autoridade como sendo res
ponsável por 20 por cento da variância de obediência é um enunciado
univariado: só uma variável independente, autoridade, afeta a variável
dependente, obediência. O enunciado mais complexo especifica a influên
cia sobre a variabilidade de uma variável dependente de quatro variáveis
independentes. Ê uma afirmativa multivariada: diz-se que mais de uma
variável independente influencia uma variável dependente.1
Naturalmente encontramos tais problemas em capítulos anteriores.
Por exemplo, os delineamentos experimentais fatoriais foram discutidos no
capítulo 7. Aqui e ali em outros capítulos foram mencionados problemasi
180
Biultivariados. A variação f a variância foram também discutidas. Agora
pfecisamos ir mais adiante e mais a fundo.
^ Vamos examinar a realização de crianças do ponto de vista de
Variância. Queremos conhecer as principais influências sobre a realização
escolar, e obtivemos em uma pesquisa com 300 crianças, digamos, seis
medidas de variáveis consideradas de influência sobre a realização. Preci
samos estudar as relações bastante complexas entre, por um lado, a reali
zação verbal medida por um teste compreensivo de realização verbal, e,
por outro, inteligência, motivação, atitude em relação à escola, ambiente
familiar classe social e sexo. Admitimos que dispomos de medidas válidas
c fidedignas de todas as variáveis.
Primeiro, consideremos a figura 11,1, que se acredita representar
0 efeito apenas da inteligência sobre a realização. A área total do círculo
representa a variância total das notas dos testes de 300 crianças do nono
ano, digamos. Sabemos que uma porção desta variância total, que repre
senta as diferenças individuais das crianças no teste de realização, é
devida a diferença na inteligência das crianças. Isto é, algumas crianças
realizam mais e melhor porque têm inteligência superior; algumas não
realizam tanto nem tão bem porque têm menos inteligência. A porção
da variância "devida” a inteligência é representada na figura pela área
sombreada. 2 Ela ocupa cerca de um terço da área do círculo. É bastante
realfstico: muitas vezès a inteligência é responsável por toda essa variân
cia de realização verbal. Se considerarmos a área total do círculo igual
Variância
devida à
Inteligência
130%)
Variância de
realização
Figura 11.1
2 Expressões que implicam “causa” são difíceis de evitar. Por exemplo, expressões
como devido a” “variância explicada por”, “influências” e outras têm pelo menos
umi ligeira conotação causai. Não é intencional, todavia. É um subproduto da
piguagem, que é sempre rica em atribuições causais. Voltaremos mais tarde a
Hlta diticuldade.
a cera por cento, podemos mostrar aproximadamente quanto da variância
de realização é “explicado” por inteligência e pelas outras variáveis.
Neste caso, a inteligência é responsável por cerca de 30 por cento.
Sabemos, naturalmente, que a inteligência não é a única variável
de influência. A área maior, nao sombreada, expressa a variancia nao
explicada pela inteligência (70 por cento). Se soubéssemos mais sobre
realização, poderiamos sombrear mais o círculo. Aliás, se tivéssemcs
conhecimento completo — se conhecéssemos todas as influências sobre
a realização — poderiamos sombreá-lo inteiro. Provavelmente jamais
poderemos conhecer todas as influências. Sem dúvida, raramente pode
mos sombrear mais da metade do círculo quando falamos sobre reali
zação. Em todo caso, tomemos outras variável, ambiente familiar. Na
figura 11.2 a variância de realização devida ao ambiente familiar é
mostrada. É cerca de 10 por cento da variância total, digamos.
As figuras 11.1 e 11.2 expressam os efeitos separados de inteli
gência e ambiente familiar. Se essas duas variáveis fossem completa
mente independentes ou não relacionadas uma com a outra — se a
magnitude da relação entre elas fosse zero — então a situação quanto à
variância se parecería à da figura 11.3. A área sombreada total ocupa
30% + 10% = 40% da área total e as duas áreas sombreadas não
se sobrepõem. Se é satisfeita a condição de independência (a falta de
superposição na figura), então pode-se dizer que 40 por cento da variân
cia de realização são devidos à inteligência e ambiente familiar, juntos.
No melhor de todos os mundos de pesquisa possíveis, as variáveis
independentes seriam independentes uma das outras ou não-correlacio-
nadas. (Naturalmente não é por serem independentes umas das outras
Variância
explicada por
ambiente familiar
( 10%)
Variância de
realização
Figura 11.2
182
Variância de
ambiente
familiar
( 10% )
Variância de
Inteligência
(30%)
Variância de
realização
Figura 11.3
184
mais de uma variável independente. Sob tais condições simples e “puras”
podem-se calcular os coeficientes de correlação entre cada uma das
variáveis independentes e a variável dependente, somar os r 2 separados
e concluir quanto da variância total de realização é explicado pelas
variáveis independentes. Na figura 11.3, por exemplo, soma-se 0,30 +
0,10 = 0,40; ou 40 por cento da variância é explicada. Pode-se ainda
falar inequivocamente sobre as contribuições separadas à variância de
realização das duas variáveis independentes: neste caso das duas
variáveis independentes, 30 por cento e 10 por cento.
O mesmo raciocínio e cálculos podem ser aplicados a todas as seis
variáveis independentes mencionadas anteriormente — contanto que as
seis variáveis sejam independentes entre si. Uma situação hipotética,
mostrando os coeficientes de correlação entre cada uma das seis variáveis
independentes e realização, é mostrada na figura 11.4. Embora o exem
plo seja fictício, as porcentagens de variância indicadas não são irrealis
tas, embora sejam provavelmente grandes demais comparadas às propor
ções de variância obtidas em pesquisas verdadeiras. A questão é a adição
das variâncias sob a condição de independência e a interpretação das con
tribuições separadas à variância de realização. A variância total explicada
é 0,30 -f- 0,10 + 0,08 + 0,10 + 0,06 -j- 0,02 = 0,66, ou 66 por
cento da variância de aproveitamento é explicada pelas seis variáveis.
A grande dificuldade neste não-melhor-dos-mundos-da-pesquisa,
entretanto, é que variáveis independentes como estas são quase sempre
correlacionadas, e às vezes substancialmente. (Daremos exemplos de
pesquisas reais mais adiante.) Por exemplo, há uma correlação positiva
entre inteligência e ambiente familiar. Suponhamos que seja r = 0,30,
Ambiente familiar
( 0 ,10)
teligência
,30)
Sexo
( 0 ,02)
Ftyura 11.4
185
um número não irrealista. Então inteligência e ambiente familiar têm
algum a coisa em comum ( r 2 = [0,30] 2 = 0,09), o que significa natu
ralmente que elas não são independentes uma da outra. Isto quer dizer
que a suposição de independência das variáveis independentes aceita
antes é falsa, que por sua vez significa que as interpretações dos dados
feitas antes são também falsas!
Olhe a figura 11.5, onde está esboçada a nova situação de correla
ção das três variáveis. As correlações entre inteligência e realização, e
entre ambiente familiar e realização são ainda as mesmas. Mas agora a
correlação entre inteligência e ambiente familiar já não é mais zero,
como na figura 11.3, mas 0,30. Isto, na figura 11.5, é equivalente a
0,302 = 0,09, ou 9 por cento das variâncias de inteligência e ambiente
familiar são compartilhados. Não podemos mais falar sobre o efeito da
inteligência sobre a realização sem levar em conta até certo ponto o
ambiente familiar. Em outras palavras, quando há correlações maiores
que zero (ou menores que zero) entre as variáveis independentes, a
interpretação dos resultados da pesquisa é mais difícil e complexa.
Representar a situação da figura 11.4, quando as variáveis são
correlacionadas, é difícil. Tal figura não apenas se torna confusa por
causa das superposições das variâncias: a verdadeira situação (as corre
lações entre as variáveis e suas covariâncias) pode ultrapassar e ultra
passa as duas dimensões da superfície do papel. Vamos abandonar, pelo
menos temporariamente, os diagramas e mudar de assunto, mas sem
abandonar o tema principal.
Ambiente
familiar
( 0 , 10)
realização
Figura 11.5
186
Regressão múltipla
188
modo geral. A resposta à segunda questão é bastante complexa. Vamos
tentar, de qualquer maneira, dar uma resposta aproximada.
HEA e RCS
AA e RCS
189
A análise de regressão múltipla analisa eficiente e prontamente
situações como esta. Primeiro, calcula-se uma chamada equação de
regressão. Pode ser também chamada equação de predição. Com duas
variáveis independentes, a equação fica assim:
Y’ = a + bi Xi -}- ba X2
Valerá a pena o leitor perder tempo e se dedicar a compreender esta
equação. É teórica e praticamente importante e útil. Y’ representa a
variável dependente, ou pode representar a nota predita para qualquer
indivíduo da amostra estudada, a pode ser desconsiderada: é uma
constante usada para ajustar os valores calculados produzidos pela
substituição de valores apropriados na equação. Xi e X2 representam
os valores ou notas nas duas variáveis independentes, bi e l>2 são chama
dos coeficientes de regressão. Expressam os pesos relativos das duas
variáveis independentes na predição. (Mas veja abaixo).
Os X’s — Xi, X2, . . XK — são notas nas variáveis 1, 2 . . . k.
Isto é, se tivéssemos duas variáveis independentes, como na equação
acima, e 200 sujeitos, cada um dos sujeitos teria 2 notas, uma em
Xi e uma em X2. Um coeficiente b expressa o peso que uma determinada
variável independente tem na situação de regressão, “bi Xi” significa
que qualquer valor de qualquer indivíduo na variável independente 1 é
pesado (multiplicado) por bi. “b2 X2” e, se houvesse mais variáveis
independentes, outros b ’s e X’s, têm significado semelhante. Um coefi
ciente baixo significa que a variável à qual 0 coeficiente está ligado
recebe menor peso na equação. Um alto coeficiente, naturalmente, tem
0 significado oposto.
Suponhamos que tenha sido calculada uma equação de regressão
a partir de um conjunto de dados:
Y’ = 0 ,1 0 + 0 ,6 8 X i + 0,39X 2
190
Os valores preditos, ou Y’, dados os dois conjuntos de valores de
Xi e X2, são 3,02 e 8,85. O indivíduo 41 recebe um valor consideravel
mente mais alto em Y’ porque sua nota em Xi é alta e Xi tem mais
peso (0,68) do que X2 (0,39). O oposto é verdadeiro, embora muito
menos precisamente, para o indivíduo 7; sua nota mais alta (4) é X2,
que pesa menos que Xi.
Equações de regressão, tais como a dada acima, permitem a melhor
previsão possível partindo-se de determinados conjuntos de dados.
Nenhuma outra equação ou método (por exemplo, pode-se simplesmente
somar os valores Xi e X2 para descobrir os valores de Y’) oferecerá
predição tão boa.
Se fossem usados números aleatórios em vez de notas verdadeiras
de teste, então a predição seria inútil por que as correlações entre
Xi e Y e X2 e Y estariam próximas de zero. Na medida em que Xi e X2
se correlacionam com Y, a predição será “boa” . As “melhores” predições
são obtidas quando as variáveis independentes, Xi, X2, . . , XK, estão
alta ou substancialmente correlacionadas com Y, a variável dependente,
e as correlações entre as variáveis independentes são baixas. Quanto
mais altas as correlações entre as variáveis independentes, menos as
variáveis sucessivas contribuirão para a predição, e mais difícil e
ambígua será a interpretação.
O que a análise de regressão múltipla faz essencialmente é estimar
os pesos relativos dos coeficientes de regressão a serem ligados aos X’s,
tomando em consideração as relações (correlações) entre os X’s e Y e
entre os X’s. Por exemplo, na equação de regressão dada acima, 0,68
indica a influência relativa de Xi sobre Y, levando em conta a correlação
de Xi com Y e a correlação entre Xi e X2.
Na equação de regressão dada acima, os b’s foram os coeficientes
de regressão. Se as variáveis independentes forem medidas com diferentes
escalas de mensuração — por exemplo, os valores Xi podem ter dois e
três algarismos e os valores X2 podem ter apenas um algarismo — haverá
dificuldade de interpretação, porque um b pode ser maior ou menor que
outro simplesmente por causa da escala de mensuração. Alguns pesqui
sadores preferem portanto usar uma forma de peso de regressão padroni
zado chamada pesos beta, ou /3’s. Tais pesos de regressão geralmente
são calculados rotineiramente por programas de computador e têm certas
virtudes interpretativas. (Têm fraquezas também.) Mais importante, eles
podem ser comparados um com outro.3 Se calcularmos os betas do
estudo de Holtzman e Brown, obteremos a seguinte equação:
192
independentes fossem zero. A figura 11.5 expressava a variância de
realização explicada por duas variáveis independentes, mas as duas
, variáveis independentes eram, elas mesmas, correlacionadas. É muito
difícil desenhar tal figura com três ou mais variáveis independentes,
tentando representar visualmente todos os r2s. É niuito possível fazê-lo,
entretanto, se usarmos o raciocínio Y e Y ’ que acabou de ser discutido.
A análise de regressão múltipla sempre fornece um R e um R2.
R2 é um índice da quantidade máxima de variância de Y explicada por
todos os X’s, como já ficou dito. Suponhamos que temos uma variável
dependente, realização em leitura, (Y), e duas variáveis independentes,
aptidão verbal (Xi) e motivação de realização (X2). (Motivação de reali
zação é uma medida de quanto o estudante está orientado no sentido
de melhorar na escola.) Suponhamos ainda que a equação de regressão é
a dada acima e que R2 é 0,51. Este R2 é a porcentagem da variância
de realização em leitura devida à melhor combinação estatística possível
de aptidão verbal e motivação de realização. A situação é mostrada na
figura 11.7.
O círculo total representa a variância de Y, realização em leitura,
a variável dependente. A parte sombreada do círculo indica, como sem
pre, a variância de Y explicada por uma combinação de Xi e X2, aptidão
verbal e motivação de realização. A parte em branco indica a variância
da Y não explicada por Xi e X2. É chamada variância residual. Neste
caso é 100 — R2, ou 1,00 — 0,51 = 0,49 ou 49 por cento da variância
de Y. (0,51 é subtraído de 1,00 porque 1,00 é o maior valor que R2
pode ter.) Parte da variância residual é variância de erro, erros casuais
e erros de mensuração. Mas pesquisas futuras usando outras variáveis
Variância de Y
não explicada
por Xi e Xz
Variância de Y
(total do círculo)
Figura 11.7
independentes podem ser capazes de reduzir esta variância residual. Por
exemplo, se acrescentássemos medidas de aptidão aritmética, classe social
e ambiente familiar à análise de regressão, a área sombreada sem dúvida
aumentaria, diminuindo a parte em branco. Em outras palavras, a
predição de realização em leitura melhoraria, e a quantidade de vanancia
desconhecida seria assim diminuída.
Dois estudos
194
cionais. O instrumento era administrado em entrevistas nas casas das
crianças. Em resumo, foi medido o ambiente de aprendizado da casa
com o instrumento, sob a suposição de que o ambiente familiar da
criança tinha poderosa influência sobre sua capacidade mental e reali
zação.
Marjoribanks desejava estudar a influência das forças ambientais
sobre o desenvolvimento entre cinco grupos étnicos canadenses: índios,
canadenses franceses, judeus, italianos do sul e protestantes anglo-saxões.
A variável dependente do estudo era desenvolvimento mental; foi medida
por quatro subtestes de um conhecidíssimo teste de capacidade mental,
o SRA, Teste de Capacidades Primárias: Verbal, Numérica, Espacial,
W4
Raciocínio. Assim, havia na realidade quatro variáveis dependentes, ou
quatro aspectos da variável dependente básica, capacidade mental. Havia
(X I
duas variáveis independentes: força ambiental e grupo étnico, ou etnia.
tvv
A pergunta básica, então, foi: “Como a força ambiental e a etnia afetam
o desenvolvimento mental?” Marjoribanks desejava saber como cada
variável independente afetava separadamente o desenvolvimento mental
e como afetavam o desenvolvimento mental em conjunto.
A amostra consistiu de 37 famílias, 18 de classe média e 19 d
classe inferior de cada grupo étnico, ou um total de 185 famílias.
Os cinco grupos étnicos diferiam significativamente nos perfis das quatro
capacidades mentais. As maiores diferenças estavam na capacidade
verbal, como já era de se esperar. Estamos mais interessados, entretanto,
na análise de regressão múltipla de Marjoribanks, na qual as caracterís
ticas aditivas (e subtrativas) de R2 foram usadas. Vamos examinar os
resultados de capacidade verbal e de capacidade de raciocínio.
O R que expressava a correlação entre capacidade verbal, por
um lado, e a combinação de ambiente e etnia, por outro, foi 0,78.
Isto é, a correlação entre os Y’ previstos, fornecidos pela equação de
regressão que incluía as duas variáveis independentes, ambiente e etnia,
e os Y’s obtidos, as notas verdadeiras de capacidade verbal, foi 0,78.
Elevando esse R ao quadrado, Marjoribanks obteve R2 = 0,782 = 0,61.
Isto foi interpretado como antes: 61 por cento da variância de capaci
dade verbal foram explicados por etnia em combinação com o ambiente,
uma porção substancial da variância. Aparentemente, podemos dizer
que os fatores ambientais e participação no grupo étnico '■— as diferenças
entre os grupos étnicos — têm uma forte influência na capacidade
verbal. E é certamente uma informação importante e valiosa. Diz-nos
pouco, entretanto, das “influências” separadas das duas variáveis.
Marjoribanks então calculou as análises de regressão separadas, uma
entre capacidade verbal e ambiente e outra entre capacidade verbal e
etnia. Os R2 foram: 0,50 para capacidade verbal e ambiente e 0,45 para
capacidade verbal é etnia. Para obter estimativas das influências sepa-
radas de cada uma dessas variáveis, ele subtraiu seus R2’s obtidos separa
damente do R2 obtido das duas juntas. O último, lembre-se, era 0 61.
Portanto, o efeito separado do ambiente é calculado subtraindo o R de
etnia, ou 0,45, de 0,61: 0.61 — 0,45 = 0,16. Assim, 16 por cento da
capacidade verbal era explicada apenas pelo ambiente. O efeito separado
da etnia foi obtido de maneira semelhante: o R2 de ambiente ioi
subtraído do R2 de ambiente e etnia: 0,61 — 0,50 = 0,11. Assim,
11 por cento da variância de capacidade verbal foi explicado pela etnia,
ou participação no grupo étnico.
Este procedimento aparentemente complexo é até bem simples.
Calcula-se o R2 do efeito conjunto das duas variáveis. Isto fornece a
variância total de capacidade verbal devida a ambas as variáveis
trabalhando juntas, por assim dizer. Subtrai-se, então, por sim vez, os
R2 devidos a cada variável. Isso mostra os cálculos de influencia de
cada variável livres da influência de outra variável. E a variância do
efeito conjunto de ambas as variáveis que ainda não foi explicado.
Afinal os efeitos separados do ambiente e etnia somam apenas a:
0,16 + 0,11 = 0,27. Assim, sobram: 0,61 — 0,27 = 0,34. Este R
é a parte da variância total resultante tanto do ambiente quanto da etnia,
e que é devido a ambas as variáveis trabalhando evidentemente juntas
sem poderem ser separadas. Em outras palavras, as duas variáveis tem
influências separadas e uma influência conjunta que não pode ser
desmembrada.
No que se refere à melhor predição de capacidade verbal, a análise
acima não importa. Marjoribanks pode dizer simplesmente que 61 por
cento da variância de capacidade verbal são devidos a ambiente e etnia,
e em futuras situações podemos usar ambas — e outras, talvez para
predizer capacidade verbal. A explicação científica, entretanto, exige
mais que isso. Queremos conhecer as influências relativas de variáveis
independentes em seus efeitos sobre uma variável dependente. Queremos
explicar com maior profundidade e detalhes possíveis o fenômeno de
interesse e não apenas predizê-lo. Marjoribanks, em sua análise, preten
deu tanto a predição quanto a explicação. Vou tentar expressar estas
idéias de uma maneira um tanto diferente.
Alguns resultados da análise de regressão múltipla de Marjoribanks
foram dados na tabela 11.1. Das quatro variáveis dependentes, apenas
as análises de capacidade verbal e de capacidade de raciocínio estão
incluídas na tabela. As variâncias totais de ambas as capacidades juntas,
Ambiente + Etnia, são 0,61 para capacidade verbal e 0,22 para capaci
dade de raciocínio. O 0,61 é a proporção (ou porcentagem) da variancia
de capacidade verbal resultante do ambiente e da etnia. A cifra compa
rável para capacidade de raciocínio é 0,22, muito menos. Estas podem
ser consideradas as variâncias “totais” explicadas, e desejamos calcular
196
bs contribuições separadas das duas variáveis independentes, ambiente
0 etnia. O ambiente responde por 0,50 da variância da capacidade
verbal. A etnia responde por 0,45 da variância. As cifras comparáveis
para capacidade de raciocínio são 0,16 e 0,08. Portanto, vamos nos
concentrar em capacidade verbal para reforçar a discussão anterior.
As proporções 0,50 para ambiente e 0,45 para etnia não são,
entretanto, estimativas “puras” das contribuições à variância de capaci
dade verbal dessas variáveis porque uma parcela de cada proporção de
variância é compartilhada pela outra variável independente. Portanto,
essa parte devida à outra variável deve ser subtraída da contribuição
conjunta de ambas as variáveis. Estes restos são indicados por A — B e
A — C na tabela. A — B = 0,11, por exemplo, significa: da contribui
ção “total” conjunta do ambiente e da etnia (A), 0,11, ou 11 por cento,
restara depois de subtrairmos o efeito do ambiente, ou 0,61 — 0,50
= 0 , 11.
Se voltarmos a usar os círculos das figuras anteriores, as coisas po
dem ficar claras. Na figura 11.8 usamos o método de descrição de variân
cia da figura 11.6. O círculo superior representa a variância de capaci
dade verbal, os dois inferiores as variâncias de ambiente e etnia. A área
sombreada entre capacidade verbal e ambiente representa 0,50 da
tabela 11.1 e a área sombreada entre capacidade verbal e etnía repre
senta os 0,45 da tabela 11.1. A área demarcada com linhas mais escura à
esquerda representa a variância de capacidade verbal devida ao ambiente
apenas (0,16), enquanto que a área semelhante à direita representa a
variância de capacidade verbal devida a etnia, apenas (0,11). Observe
Variável Variável
dependente independente R*
p-------------------------------------------------------------------------------------
Capacidade verbal Ambiente + Etnia (À) 0,61
Ambiente (B) 0,50
Etnia (C) 0,45
Efeito da etnia apenas = A —B = 0,11
Efeito do ambiente apenas = A — C = 0,16
Capacidade de raciocínio Ambiente + Etnia (A) 0,22
Ambiente (B) 0,16
Etnia (C) 0,08
Efeito da etnia apenas = A — B = 0,06
Efeito do ambiente apenas = A — C = 0,14
198
primeiro que eram todas, em substância, positivamente relacionadas,
indicando que todas estavam medindo mais ou menos a mesma coisa.)
0 leitor deve também ficar alerta. Como todos os métodos de análise
estatística, este revela apenas as estimativas dos valores dos R2. Às vezes
os R2’s podem ser tendenciosos e enganosos. Analistas e pesquisadores
competentes não usarão os R2’s sozinhos em suas análises e interpre
tações. Usarão também coeficientes de regressão, as correlações originais
de onde os R2’s emergem, outras estatísticas e resultados de outros
pesquisadores.
Talvez, acima de tudo, os pesquisadores serão extremamente cuida
dosos em fazer afirmativas causais. Embora tenhamos usado expressões
como “explicada por” e “efeitos”, implicações causais, embora talvez
inevitáveis por causa de conotações de linguagem, não foram intencio
nais. Na pesquisa de Marjoribanks, é particularmente importante ater-se
a esta orientação. Quando falamos da influência da etnia na capacidade
verbal, por exemplo, certamente pensamos na influência que o grupo
étnico exerce sobre a criança em sua capacidade verbal — por motivos
óbvios. Mas a afirmativa de pesquisa mais exata é que há diferenças de
habilidade verbal entre, digamos, canadenses anglo-saxões e canadenses
franceses. Mas essa é uma diferença funcional em capacidade na língua
inglesa. Não queremos dizer que ser anglo-saxão de alguma forma
“causa” uma melhor capacidade verbal em geral do que ser canadense
francês. A maneira mais segura de raciocinar provavelmente seja pèla
afirmativa condicional tão enfatizada neste livro: “ Se p, então q”, com
uma relativa ausência de implicação causai.
200
E S poIítlc<? da ”ação sob anáIise era mais baixo do que se esperava
^ d e v e ria ^ lS X M e Comu™ a&°>Jurbanização, educação e agricultura,'
21 4R m * f bt d ?ma n°ta de desenvolvimento político de cerca de
f v 4? ' ^ asÍ 01 p°ns,deravelmente mais baixa, 14,50. Em todo ca«o o
de. Cutrigbt é bom exemplo de pesquisa sócio-científlca
contemporane3 sobre um fenômeno interessante e importante, o desenvol-
^ ^ maneÍra “ “ Uise de
12. A abordagem multivariada:
análise fatorial
202
explicações e razões se multiplicarem, vamos terminar em confusão, ou
com uma situação tão complexa que não poderemos dominá-la. Mas parte
de tudo isso é questão de fé. Temos fé em que haja geralmente uma
explicação mais simples para a maioria dos fenômenos. O fato de isso
nem sempre ser verdade não muda a fé. Em todo caso, buscar explicações
mais simples, e depois testar suas implicações, são preocupações científi
cas fortíssimas.
Um dos mais poderosos métodos já inventados para reduzir a com
plexidade de variáveis a maior simplicidade é a análise fatorial. Análise
fatorial é um método analítico para determinar o número e natureza das
variáveis subjacentes a um grande número de variáveis ou medidas.
Ajuda o pesquisador, com efeito, a saber que testes devem ficar juntos
— quais os que virtualmente medem a mesma coisa, em outras palavras,
e o quanto medem a mesma coisa. As “variáveis subjacentes”, nesta defi
nição, são chamadas ‘‘fatores". Alguém chamou a análise fatorial a rainha
dos métodos analíticos. Por quê? Vamos tomar um exemplo famoso, inte
ligência e sua natureza, para tentar compreender esta invenção notável e
a definição dada acima. Inteligência é um bom exemplo por. causa de seu
interesse intrínseco, prático e -teórico, e porque muito se conhece a
seu respeito agora — embora grande parte ainda continue um mistério.
Antes de começarmos esta discussão, vamos fazer uma digressão para
definir certos termos e' expressões comumente usados na análise fatorial
e na análise multivariada.
206
A tabela 12.1 dá apenas uma pequena parte dos resultados de
Thurstone e Thurstone. Para ilustrar, escolhi apenas três dos seus sete
fatores: Verbal, Número e Percepção. Para o que queremos agora,
entretanto, eles são suficientes. Os nomes de oito dos 60 testes
de Thurstone e Thurstone aparecem no lado esquerdo da tabela. Os
números no corpo da tabela são como coeficientes de correlação e são
chamados “cargas fatoriais”. (Veja definição dada anteriormente.) Quan
to maior o número que acompanha um teste — por exemplo, o teste
Vocabulário tem 0,66 sob Verbal, 0,02 sob Número e —0,01 sob
Percepção — mais o teste está associado ao fator. Estas cargas indicam
que o teste Vocabulário percente ao fator Verbal e não aos fatores
Número ou Percepção.
Examine as cargas sob Verbal. Os três testes mencionados acima
têm as cargas substanciais de 0,66, 0,66 e 0,67. Os outros cinco testes
tê cargas próximas de zero (0,01, — 0,03, e assim por diante). Um ana
lista deverá concluir que estes testes têm alguma coisa em comum —
lembre-se de nossas discussões anteriores sobre correlações, correlações
ao quadrado e variância compartilhada. Os três testes medem alguma
coisa em comum. Se as cargas fossem 1,00, 1,00 e 1,00 (pouquíssimo
provável), o analista concluiría que estariam medindo a mesma coisa
perfeitamente. Se as cargas fossem 0,00, 0,00 e 0,00 (também impro
vável), ele concluiría então que não estariam medindo a mesma coisa.
Já que o elemento ou elementos comuns aos três testes que têm
cargas substanciais estão claramente associados a palavras, o analista
pode concluir aue o “fator” básico comum é capacidade verbal, Assim,
é denominado “Verbal”. Raciocínio semelhante aplica-se aos cinco testes
restantes e dois fatores. Os testes Adição, Mutiplicação e Indefinição
de Números têm cargas substanciais de 0,64, 06,7 e 0,40 no segundo
fator. Eles compartilham processos mentais associados a operações
numéricas. Assim, o fator é chamado “Número”.
Dois dos testes, Faces e Leitura ao Espelho, têm cargas no terceiro
fator, Percepção, e em nenhum outro. O teste Identificação de Números,
entretanto, tem carga no terceiro fator e também no segundo. Isto quer
dizer que é um teste mais complexo. Pode-se dizer que faz parte das
essências da Percepção e do Número. Tais casos ocorrem freqüentemente
em investigações de análise fatorial.
207
deverá ser alto, se o teste for fidedigno. Se dois testes medirem a mesma
coisa, digamos capacidade verbal, a correlação entre eles, depois de
aplicados à mesma amostra de indivíduos, deverá ser alta, ou pelo menos
substancial. Embora todos os itens possam ser diferentes — dois testes
diferentes de vocabulário, por exemplo — todos eles mais ou menos mos
tram um aspecto da capacidade verbal. Portanto, os indivíduos deveríam
respondê-los de maneira semelhante e deveríam ser classificados pelos
dois testes quase da mesma forma.
Por outro lado, a correlação entre dois testes que medem coisas
muito diferentes, digamos, capacidade verbal e dogmatismo, deveria
ficar próxima de zero. Não há relação sistemática entre os dois conjuntos
de notas fornecidas pela mesma amostra de indivíduos. Naturalmente,
se houve uma relação no momento desconhecida entre capacidade verbal
e dogmatismo — e bem pode haver — então deve haver alguma corre
lação, positiva ou negativa, maior que zero entre os dois testes. Pode ser
que pessoas mais verbais sejam mais dogmáticas. No momento, entre
tanto, não conhecemos nenhum motivo para que haja uma correlação
entre as duas variáveis.
Estas duas condições de correlação estão expressas na figura 12.1.
Cada círculo representa a variância de um teste, como já se fez anterior
mente. (Aconselhamos o leitor a rever rapidamente os capítulos 4, 9 e
principalmente 11. A compreensão da análise fatorial pode ser matsrial-
mente ajudada pela compreensão das relações, correlações, mensuração
e variância compartilhada). Consideremos a situação do diagrama rotu
lado (A). CVi representa Capacidade Verbal 1, o primeiro teste de capa
cidade verbal; CV2 naturalmente representa o segundo teste. Os dois
círculos, cada um representando a variância de seu teste, se sobrepõem
em uma grande área. A situação é comparável à da figura 11.6 do
Figura 12.1
208
capítulo 11, só que aquela figura era mais complexa. No caso presente,
a correlação é cerca de 0,90 porque a maior parte das variâncias dos
dois testes é compartilhada: cerca de 80 por cento (r2 = 0,902 — 0,81).
Isto quer dizer que provavelmente os dois testes estão medindo a mesma
coisa, capacidade verbal.
A situação na figura 12.1. (B) é bem diferente. Nenhuma variância
é compartilhada. A correlação entre os dois testes, capacidade verbal
(CV) e dogmatismo (D) é zero. Eles medem coisas muito diferentes.
As duas condições representadas na figura 12.1 mostram com que
os analistas fatoriais trabalham, a saber, variância compartilhada e os
limites dentro dos quais eles trabalham: entre correlação alta ou substan
cial e correlação zero. Eles procuram descobrir as unidades que formam
a base dos testes e medidas estudando e analisando as correlações entre
os testes, e, partindo das correlações, as variâncias compartilhadas.
O método de análise fatorial possibilita-lhes descobrir as variâncias com
partilhadas dos testes e medidas e determinar as relações entre as diversas
variâncias compartilhadas. Esta conversa é bastante abstrata. Vamos ser
mais concretos e específicos.
Testes
1 2 3 4 5 6
210
eles exigem conhecimento verbal, manipulação verbal e raciocínio verbal.
Como seria a matriz das correlações se a metade dos testes exigesse um
tipo diferente de conhecimento, manipulação e raciocínio, digamos,
conhecimento numérico e matemático? A psicóloga prepara três novos
testes, um para medir o conhecimento matemático, outro para manipu
lação matemática e o terceiro para raciocínio matemático. Ela administra
esses teste e três dos testes verbais a uma amostra de pessoas e inter-
correlaciona os seis testes.
Se a crença geral de que inteligência é unidimensional estiver
correta, então a matriz correlações que a psicóloga obtiver deverá ser
muito semelhante à da tabela 12.2; isto é, todos os seis testes deverão
estar positiva e substancialmente correlacionados uns com os outros.
Mas se a crença da psicóloga, de que a inteligência é bidimensional,
estiver correta, então como deveria ser a matriz de correlações? Na
tabela 12.3, à esquerda, é dada uma “matriz-alvo”. Pode ser também
1 2 3 4 5 6 1 2 3 4 5 6
2 São dadas apenas as partes superiores das matrizes. Isto é possível porque as
matrizes são simétricas, i.é., suas metades inferiores (abaixo da diagonal da es
querda superior à direita interior), se ciadas, mostrarão as imagens especulares da
metade de cima das matrizes (acima da diagonal).
212
6 523 14
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
Figura 12.2
213
“representa” o fator, por assim dizer. Cargas iguais ou maiores que 0,40
(às vezes 0,30; às vezes outro critério) são consideradas suficientemente
grandes para merecerem interpretação. Obviamente, todas as cargas
neste exemplo são substanciais. Isso era de se esperar porque todas as
correlações entre os testes foram substanciais. Não percamos mais tempo
com este exemplo tão simples. Em vez disso, voltemos ao exemplo mais
realístico de duas dimensões da tabela 12.3.
Decidimos anteriormente, pela simples inspecção das correlações da
tabela 12.3, que havia duas dimensões ou fatores, porque os testes 1, 2
e 3 estavam correlacionados uns com os outros e não com os testes
4, 5 e 6 e que os testes 4, 5 e 6 estavam correlacionados uns com os
outros e não com os testes 1, 2 e 3. É como se tivéssemos um conjunto
de testes para medir a inclinação religiosa e outro conjunto para medir
aptidão musical. (Supomos que a inclinação e a aptidão não sejam rela
cionadas.) Vamos nos aprofundar mais. A análise fatorial é essencial
mente um método para determinar o número de fatores existentes em
um conjunto de dados, para determinar quais testes ou variáveis perten
cem a quais fatores e em que extensão os testes ou variáveis “pertencem
a” ou estão “ saturados com” o que quer que seja o fator. Se analisarmos
fatorialmente a matriz de correlação da tabela 12.3, obteremos final
mente uma tabela como a dada na tabela 12.4.
Tabela 12.4 Solução final da análise fatorial dos dados da tabela 12.3.
214
Na maioria dos casos de pesquisa real, com mais variáveis correlacio
nadas de maneira complexa, não é possível “ver os fatores” como acon
teceu na tabela 12.3. Em outras palavras, os dados da tabela 12.4
demonstram o óbvio, o que já sabemos. Foi por isso precisamente que
o exemplo foi manufaturado: para demonstrar o óbvio numa tentativa
de mostrar o que é análise fatorial e o que faz.
Repetindo, se as cargas fatoriais são grandes ou substanciais, aceita
mos que os testes ou variáveis com os quais estão associadas estão “em”
aquele fator. Dizemos que o teste está “ carregado” em um fator. Por
exemplo, os testes 1, 2 e 3 estão “carregados” no fator A, e os testes
4, 5 e 6 estão “carregados” no fator B. Mas as cargas dos testes 1, 2 e 3
no fator B são baixas e insubstanciais e as cargas dos testes 4, 5 e 6
no fator A são baixas e insubstanciais. Em análise fatorial, tanto cargas
altas quanto baixas são importantes na interpretação. Pode-se até dizer
que a situação “ideal” seria a que possuísse cargas fatoriais altas e baixas
e sem valores intermediários. Embora raramente ocorram tais situações,
é bom lembrá-las porque elas definem fatores nítidos relativamente não
relacionados uns com os outros.
A interpretação da tabela 12.4 é fácil. Já que 1, 2 e 3 são testes
verbais, e têm altas cargas no fator A, e já que os testes 4, 5 e 6 têm
cargas baixas em A, o fator é obviamente um fator verbal. Nós o
B (Matemático)
1.0
0,6 -
0,5 -
0,4 -
0,3 -
A (Verbal)
-0,4 - 0,3 -0,2 -0,1 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
- 0,1 -
- 0,2 -
-0,3 -
-0,4 - .
I iíiura 12.3
chamamos, então, "verbal”. Análise e raciocínio semelhante se aplicam
ao fator B. Nós o chamamos “Matemático”. Para esclarecer mais ainda
o que diz a tabela 12.4, vamos representar. Isto foi feito na figura 12.3.
Dois eixos, A e B, foram colocados em ângulo reto. Lembre-se de que
dissemos que os eixos são ortogonais um ao outro. Os valores empa
relhados de A e B da tabela 12.4 são então representados, simplesmente.
Por exemplo, o 0,83 do teste 1 em A e o 0,07 do teste 1 em B são
representados pelo ponto indicado por "1” no gráfico da figura 12.3.
Os cinco pares restantes são representados de modo similar.4
Os blocos, 1, 2, 3 e 4, 5, 6, aparecem claramente. Estão dentro de
um círculo, no gráfico. Os testes 1, 2 e 3 estão bem próximos entre si e
também próximos de A, e altos em A ; os testes 4, 5 e 6 estão próximos
e altos em B. E, muito importante, os dois blocos estão distantes um
do outro. Um é tipo A e o outro tipo B. Os dois fatores e os testes que
os. “definem” são tipos de entidades muito diferentes. Quando eu examino
os três testes de A, para descobrir sua “natureza”, o que é, eu vejo que
todos os três testes são verbais. Quando eu examino os testes B, por
outro lado, descubro que eles compartilham operações, processos e com-
preeensão matemática.
Este exemplo, naturalmente, é muitíssimo simplificado. A maioria
dos domínios nas ciências comportamentais tem mais de dois fatores.
Dificilmente estudaríamos apenas seis testes. As verdadeiras correlações
e matrizes de correlação raramente são tão favoráveis como esta com a
bela estrutura ortogonal que é a figura 12.3. Geralmente, então, o
216
R
Cl.
f-w
217
Exemplos de análise fatorial em pesquisa
218
Figura 12.5
• ■U
219
fatorialmente os resultados e ver depois se testes novos aparecem juntos
em um novo fator? Foi isso que Guilford e seus colegas fizeram, muitas
vezes com ótimos resultados. Uma dessas descobertas, ou talvez confir
mações, é o conjunto de fatores que se acreditava estarem, e que até
certo ponto se descobriu estarem, associados à criatividade. Foi desco
berto, por exemplo, que uma diferença importante entre as capacidades
de pensar é o pensamento convergente e o pensamento divergente e que
o último está relacionado com a criatividade. (Pensamento convergente é
tipo comum de raciocínio analítico dedutivo. Pensamento divergente está
associado com a elaboração, originalidade, flexibilidade, criatividade e
respostas fluentes e variadas.)
Como foi destacado antes, a análise fatorial foi usada com as
aptidões, atitudes, traços de personalidade e até variáveis de ambiente.
Além do mais, não é necessário que as correlações que sejam analisadas
fatorialmente sejam calculadas apenas a partir de testes. Nos últimos anos
a análise fatorial vem sendo cada vez mais usada com itens, para deter
minar os fatores num único teste ou escala. Tem sido usada também
para analisar fatorialmente as correlações entre as pessoas. Daremos
exemplos das duas possibilidade depois.
Em outras palavras, o método é mais que um método; é também
uma abordagem no sentido de que busca e identifica relações subjacentes
entre as variáveis. Neste contexto, os testes são variáveis, os itens são
variáveis e até pessoas são variáveis. Os exemplos que serão resumidos
representam, cada um, diferentes aspectos da abordagem da análise
fatorial a problemas e dados. No primeiro exemplo os pesquisadores
buscam os fatores por trás da atitude em relação aos pretos. No segundo
exemplo, pessoas foram tratadas como variáveis e analisadas fatorial
mente. E no terceiro e último estudo a ser resumido, os fatores subja
centes a atitudes sociais foram estudados principalmente para testar
uma teoria estrutural de atitudes.
220
facetas. O estudo que vamos examinar agora é um excelente exemplo
dessa abordagem.
Woodmansee e Cook (1967), num conjunto de estudos sobre o pre
conceito contra os negros, mostraram inegavelmente que tais atitudes são
multidimensionais. Sem dúvida, qualquer concepção simplória de atitu
des étnicas como unidimensionais tem pouquíssimo apoio da análise
fatorial da pesquisa de atitude. Em seus estudos, os dois propósitos
principais de Woodmansee e Cook eram determinar os componentes
(fatores) de atitudes raciais, em particular atitudes em relação aos pretos,
e construir uma escala válida e fidedigna, ou, mais exatamente, construir
um conjunto de escalas para medir tais atitudes.
Em seu primeiro estudo, eles administraram uma escala de atitudes
existentes, de 120 itens, a 593 estudantes universitários norte-americanos
brancos, do Nordeste, Meio-Oeste e Sul. No segundo estudo, revisaram a
escala de atitudes com base no resultados do primeiro estudo e adminis
traram a escala a 609 estudantes semelhantes. O terceiro estudo se
concentrou em melhorar mais ainda a escala, obter evidência da fide-
dignidade e validade da versão final da escala e continuar a investigação
dos fatores subjacentes às atitudes em relação aos pretos.
Vamos nos concentrar nos resultados da análise fatorial de Wood
mansee e Cook. Eles encontraram 11 fatores. O quadro multidimensional
que eles oferecem é interessante e importante tanto científica quanto pra
ticamente. Vamos ter em mente, quando lermos o que se segue, que cada
fator pode ser um modo diferente de perceber os negros, reagir a eles,
de ter crenças em relação a eles. Mas antes de irmos mais adiante,
precisamos ver o que são realmente os fatores. Tem havido muito
mistério em relação aos fatores e análise fatorial. Algumas coisas que já
foram ditas serão necessariamente repetidas, mas tal repetição pode nos
ajudar a compreender fatores.
221
pouquíssima aprovação e 6 forte acordo ou aprovação. Os itens serão
palavras soltas e frases curtas que se descobriu serem capazes de medir
atitudes sociais com validade e fidedignidade. São elas, igualdade para as
mulheres, controle de natalidade, propriedade privada, negócios. Deseja
mos descobrir os fatores subjacentes à escala de atitudes de quatro itens.
(Não se esqueça de que naturalmente usaríamos muito mais itens
e pessoas.)
As seis pessoas responderam à escala como fora indicado, resultando
nas médias ou pontos dados na tabela 12.5. A pessoa 3, por exemplo,
desaprovou, ou pelo menos não aprovou, igualdade para as mulheres e
controle de natalidade. Deu a cada um deles a nota relativamente baixa
de 2. Por outro lado, aprovou fortemente propriedade privada e negócios;
deu-lhes 5 e 6 respectivamente. Faça um confronto entre a pessoa 3 e a
pessoa 6, que mostraram padrões opostos: aprovação de igualdade para a
mulher e controle de natalidade e relativa desaprovação de propriedade
privada e negócios. Estes provavelmente sejam os exemplos mais claros
da tabela. Os outros membros da amostra deram respostas mais compos
tas e menos claras.
Tabela 12.5 R esp o stas d e seis p essoas a q u a tro iten s d e a titu d e s o c i a l'.
Ite n s
1 2 3 4
Ig u a ld a d e p / C o n tro le da P ro p rie d a d e
Pessoas as m u lh eres n a ta lid a d e p riv a d a N egócios
1 1 2 4 2
2 1 3 2 2
3 2 2 5 6
4 5 6 5 5
5 6 5 3 4
6 6 6 2 1
222
Wltre as notas das colunas 1 e 3 e 1 e 4 e entre 2 e 3 e 2 e 4 parecem
ser baixas; é difícil e mesmo impossível, perceber padrões regulares de
^caminhar juntas”.
As correlações entre os pares de referentes foram calculadas; estão
na tabela 12.6. As correlações formam um padrão muito claro, semelhan
te ao padrão da tabela 12.3, onde foram mostradas as correlações entre
seis testes de inteligência. Igualdade para as mulheres e controle da natali
dade estão altamente correlacionadas, como nossa inspeção anterior nos
levou a crer. Propriedade privada e negócios estão também altamente
Ig u a ld a d e p a ra C o n tro le d a P ro p rie d a d e
as m u lh eres n a ta lid a d e p riv a d a N egócios
Ig u a ld a d e p a ra
as m u lh e re s 1,00 0,91 - 0 ,1 5 0,04
C o n tro le d a
n a ta lid a d e 0,91 1,00 —0,23 - 0 ,1 1
P ro p rie d a d e
p riv a d a - 0 ,1 5 - 0 ,2 3 1,00 0,81
N egócios 0,04 - 0 ,1 1 0,81 1,00
F ato res
Iten s A B
224
propriedade privada e negócios possam ser apenas aspectos superficiais
de um fator mais fundamental do que conservadorismo, o nome adotado
para o fator. Terceiro, os resultados da análise fatorial podem ser invali
dados por dificuldades e deficiências técnicas. A análise fatorial é com
plexa e tem problemas técnicas complexos. Por exemplo, freqüentemente
é difícil saber quantos fatores existem em um conjunto de dados. Se for
extraído o número “errado” de fatores, os dados podem levar a con
fusões. Embora os computadores e programas de computadores possibili
tem fazer análise fatorial bastante simplesmente, eles não dão, entretanto,
uma resposta realmente satisfatória ao problema do número de fatores.
Em todo caso, deveriamos estar agora em melhor posição para ler e
compreender o estudo de Woodmansee e Cook e os outros estudos resu
midos abaixo. Assim, voltemos a Woodmansee e Cook.
225
possível que relatos de que esta variável independente não tenha tido
nenhum efeito sobre aquela variável sejam deficientes, porque “aquela
variável” talvez não seja de fato “ aquela variável”, mas apenas um
aspecto dela.
O fator A de Woodmansee e Cook, “Política de Integração-Segre-
gação”, como o nome indica, centralizou-se nas posições dos sujeitos
sobre a conveniência da segregação e integração raciais. Os itens do
fator B expressavam “Aceitação em Relações Pessoais Intimas” : até onde
os sujeitos aceitariam negros em relações relativamente íntimas inter
pessoais? O fator C, “ Inferioridade do Negro”, tem sido tradicionalmente
associado às atitudes em relação aos negros no sentido em que tais
atitudes focalizaram-se na percepção dos negros como inferiores aos
brancos. (Outro fator, “Opiniões aviltantes”, relacionou-se intimamente
com o Fator C.) O fator D, “ Superioridade do Negro”, é um pouco
surpreendente. Seus itens atribuíam características que faziam os negros
superiores aos brancos, por exemplo: “Eu acho que os negros têm uma
espécie de coragem silenciosa que poucos brancos têm”.
Com os fatores restantes não precisamos nos preocupar. A questão é
que a análise fatorial das intercorrelações de grande número de itens que
Woodmansee e Cook usaram mostraram que as atitudes em relação aos
negros constituem um domínio complexo de 11 facetas ou fatores que
refletem vários aspectos de atitudes em relação aos negros: integração e
segregação, relações pessoais, inferioridade do negro, superioridade do
negro, e outras. Se alguém quiser, por exemplo, mudar as atitudes em
relação aos negros, terá que decidir que aspectos de tais atitudes deverão
ser mudados. Certamente as atitudes em relação aos negros estão longe
de ser uma variável unidimensional simples. Seu estudo e compreensão
requerem, obviamente, uma abordagem multidimensional.
226
números são usados para iritercorrelacionar os conjuntos de respostas
dos diferentes indivíduos uns com os outros.
Em outras palavras, a metodologia Q focaliza-se principalmente nas
correlações entre os indivíduos. Se, por exemplo, dois indivíduos respon
dem a uma Q-sort cujos itens são itens de atitudes, digamos atitudes em
relação aos negros, e se a correlação entre os arranjos feitos por eles
for alta, então suas atitudes em relação aos negros são semelhantes.
Além disso, se um número suficiente de indivíduos responde ao mesmo
Q-sort, as respostas ao Q-sort podem ser intercorrelacionadas e analisadas
fatorialmente. Os fatores resultantes são chamados fatores de pessoas
(persons factors). Vamos examinar resumidamente um estudo que usou
esta interessante abordagem.
Sontag (1968), para estudar a relação entre as atitudes dos professo
res em relação à educação, sua variável independente, e suas percepções
dos comportamentos de professores, sua variável dependente, construiu
um Q-sort para descrever os comportamentos dos professores. Alguns dos
itens são dados abaixo. Sontag acreditava que os julgamentos dos pro
fessores sobre a desejabilidade dos diversos comportamentos de professo
res é influenciada por suas atitudes básicas em relação à educação.
Por exemplo, um professor cujas atitudes são “progressistas” conside
raria um certo conjunto de comportamentos de ensino desejável, enquanto
que um professor “tradicional” consideraria desejável outro conjunto de
comportamentos.
De fato, Sontag descobriu que professores progressistas e tradicio
nais, medidos por outros instrumento planejado para medir tais atitudes,
discordavam em suas percepções de comportamentos desejáveis de ensino.
Nosso interesse, entretanto, se concentra apenas nos fatores que ele
obteve com o Q-sort de comportamento de professor. É possível deter
minar os itens de um Q-sort aos quais as pessoas de um fator de péssoa-
■pessoas que se correlacionam altamente umas com as outras — têm
reações comuns ou semelhantes.
Sontag descobriu quatro de tais fatores tanto no primeiro como no
segundo graus de ensino. Itens selecionados dos arranjos fatoriais, associa
dos com o ensino de professores de segundo grau, juntamente com os
nomes que Sontag lhes deu, são vistos na tabela 12.8.
O leitor poderá talvez fazer uma idéia da natureza desses
fatores lendo os itens algumas vezes. “Preocupação com os Estudantes”
está obviamente centralizado no aluno: para os professores que
acham esses comportamentos desejáveis, as necessidades e pontos de
Vista dos alunos parecem soberanos. “ Estrutura e Assunto”, por outro
lado, está centralizado nas coisas ensinadas: para os professores que os
acham desejáveis, o conhecimento, a competência, a disciplina e o
planejamento e estrutura do ensino parecem importantes. A análise
227
fatorial das percepções das pessoas sobre os comportamentos de ensinar,
no estudo de Sontag, resultou em preciosa, compreensão das diferentes
percepções do ensino.
“ A p re se n ta ç ã o G e ra l d o A ssu n to ”
A p re se n ta a u la s b e m p lan e ja d a s.
E m su as a p re se n ta ç õ e s m o s tra b o m c o n h e c im e n to d o a ssu n to .
A p ro v eita-se d o in te re sse d o a lu n o ao p re p a ra r as a u la s.
“ P re o c u p a ç ã o co m o s a lu n o s”
M a n té m su a s p ro m e ssa s co m os a lu n o s.
E n sin a os a lu n o s a serem sensíveis à s n ecessid ad es d o s o u tro s.
M o stra in te re sse p e lo p o n to d e v ista d o s alunos.
“ E s tr u tu ra e A s s u n to ”
T ra n sm ite aos a lu n o s o q u a n to g o sta d o assunto.
D e sp e rta a a te n ç ã o dos alu n o s d u ra n te as aulas.
E m su as a p re se n ta ç õ e s m o stra b o m co n h e c im e n to d o assu n to .
“ N o rm a s e R eg ras”
E n fa tiz a o re s p e ito p elo s colegas ta n to q u a n to pelo p ro fe sso r.
A ju d a os a lu n o s a serem c o n stru tiv a m e n te crítico s em s u a a b o rd a g e m d o a ssu n to .
E n sin a o re s p e ito p o r to d o s os g ru p o s étnicos.
228
tizam a importância da religião e da igreja, expressam fé no capitalismo,
na propriedade privada e nos negócios, adotam a disciplina e o dever e
acreditam que as relações sociais devem se apoiar na autoridade. Há
muitas exceções, mas estes dois quadros em geral se conformam à
“realidade” da pesquisa. São muito mais complicados ainda, natural
mente, mas as descrições gerais são exatas.
Do ponto de vista do presente sumário da pesquisa, entretanto,
existe outra crença popular — endossada também por cientistas sociais
— que tem implicações teóricas e práticas importantes: que o liberalismo
e o conservadorismo foram uma única dimensão de atitudes sociais, com
liberais extremos, até radicais, de um lado, e conservadores extremos, até
reacionários, do outro. Da mesma forma, os conceitos sociais e as
questões estão dentro desta única dimensão. Naturalmente há cientistas
sociais que acreditam que as atitudes sociais são mais complexas, que há
vários fatores do liberalismo-conservadorismo. Entretanto, os vários fato
res são ainda concebidos como contendo questões e crenças tanto liberais
quanto conservadoras. Em outras palavras, o conservadorismo e o libe
ralismo são considerados como que apoiados em uma mesma dimensão,
ou únicas dimensões, que têm tanto questões conservadoras quanto libe
rais (ou gente) nas mesmas dimensões. Neste ponto de vista, conservado
rismo e liberalismo, conservadores e liberais, são concebidos como opos
tos: o que um aceita o outro rejeita. É a isso que se chama concepção
bipolar. Uma dimensão bipolar é a que tem duas extremidades, uma
positiva e outra negativa.
Anos atrás questionei essas idéias porque-os resultados de minhas
pesquisas pareciam contradizê-las, ou no mínimo lançar sérias dúvidas
sobre elas. Depois de trabalhar com essas idéias e pesquisar mais,
publiquei o que chamei teoria de atitudes dos referentes criteriais (crite-
rial referents theory of attitudes) (Kerlinger, 1967). Essa teoria pode ser
chamada uma teoria estrutural, porque esboça a estrutura fatorial geral
e algumas das características das atitudes sociais. Contradizia a validade
da concepção bipolar das atitudes sociais e dizia que o conservadorismo
e o liberalismo eram “ ideologias” separadas e distintas, ou grandes
conjuntos de crenças, não necessariamente opostas uma à outra. (O radi
calismo de direita ou de esquerda foi excluído de consideração, embora
ficasse dito que as atitudes podem ser bipolares no quadro de referência
do radicalismo.) Isto significa que há conjuntos de indivíduos que
têm atitudes predominantemente conservadoras ou predominantemente
liberais em relação a questões sociais, mas que indivíduos conservadores
não se opõem necessariamente a colocações liberais, e indivíduos liberais
não se opõem necessariamente a colocações conservadoras. Em resumo, é
pegada a crença comum de bipolaridade e afirmada uma vida distinta e
separada tanto para o liberalismo quanto para o conservadorismo.
A teoria é muito maior, naturalmente, mas isto é suficiente para
ilustrar o uso da análise fatorial, neste caso para testar uma teoria estru
tural de atitudes. A teoria foi testada um certo número de vezes nos
Estados Unidos, usando escalas de atitudes que consistiam de itens de
sentenças — por exemplo, “A primeira preocupação de qualquer socie
dade é a proteção dos direitos de propriedade” (conservadora) e “ É pre
ciso haver controle de natalidade mais efetivo se o mundo quiser resolver
seus problemas sociais e políticos” (liberal) — e itens referentes (palavras
e frases curtas expressando idéias sociais) — por exemplo, “propriedade
privada”, “competição” (conservadoras) e “igualdade”, “medicina sociali
zada” (liberais). As escalas foram aplicadas a grandes grupos de indi
víduos em partes diferentes do país e as correlações entre os itens foram
analisadas fatorialmente.
Os resultados das análises fatoriais foram altamente semelhantes
em quase todas as amostras. Foram obtidos seis ou mais fatores, e na
maioria dos casos itens liberais apareceram juntos em certos fatores e
itens conservadores apareceram juntos em outros fatores. Os dois tipos
de itens raramente apareceram juntos nos mesmos fatores. Já que os
fatores são relativamente independentes uns dos outros, parece que libe
ralismo e conservadorismo, conforme definidos pelos itens, são entidades
separadas e distintas. Além disso, uma chamada análise fatorial de segun
da ordem, uma análise fatorial das correlações entre os próprios fatores,
mostrou que os fatores com itens liberais eram correlacionados positiva
mente e igualmente os fatores com itens conservadores. Houve pouca
evidência nesses estudos de bipolaridade, isto é, itens liberais aparecendo
com cargas negativas em fatores conservadores e itens conservadores
aparecendo com cargas negativas em fatores liberais. Os estudos Q
também apoiaram os resultados acima sumarizados. A teoria estrutural,
então, parece ser apoiada pela evidência desses estudos.
Para dar ao leitor uma idéia dos resultados obtidos nesses estudos,
os arranjos fatoriais de um dos mais recentes deles (Kerlinger, 1972)
são dadas na tabela 12.9. O principal propósito do estudo foi testar a
teoria dos referentes criteriais descrita acima, usando os próprios refe
rentes como itens. Outro propósito foi entender melhor a natureza das
atitudes sociais determinando através da análise fatorial os fatores subja
centes às atitudes sociais. Os dados da Tabela 12.9 servem a este
propósito.
Uma escala de atitudes sociais de 7 pontos e 50 itens de palavras e
frases curtas (veja tabela 12.9), todas presumivelmente relacionadas a
atitudes sociais, foi administrada a amostras de estudantes pós-graduados
em educação em Nova Iorque, Carolina do Norte e Texas. Embora os
dados de cada um desses estados fossem analisados separadamente, as
230
amostras do Texas e Carolina do Norte foram combinadas para formar
uma amostra grande (N = 530), dando assim resultados de análise
fatorial de maior confiança. (A análise fatorial exige amostras grandes,
principalmente por causa dos erros de mensuração e muitas variáveis
estarem sendo analisadas.) Os resultados da amostra de Nova Iorque
■
F ato res lib erais
231
foram usados para comparar com os resultados das amostras combinadas
do Texas e Carolina do Norte. Estamos preocupados apenas com a
amostra combinada. Os dados foram analisados fatorialmente e foram
extraídos seis fatores das intercorrelações dos 50 itens referentes. Os
resultados da análise fatorial estão dados na tabela 12.9.
Três dos seis fatores tinham itens conservadores, segundo fora
previamente determinado, e três fatores tinham itens liberais, também
segundo determinações prévias. Esta determinação de liberal e conser
vador é, naturalmente, importante. Os julgamentos foram feitos com base
na literatura sobre pesquisas anteriores em conservadorismo e liberalis
mo (Hartz, 1955; Kirk, 1960; Rossiter, 1962), pesquisas anteriores,
antologias de medidas de atitudes (Robinson, Rusk & Head, 1968;
Robinson e Shaver, 1969: Shaw & Wright, 1967), e experiência e
conhecimento. Não é difícil ver que livre empresa, religião e conteúdo
são referentes conservadores e que direitos civis, igualdade e medicina
socializada são referentes liberais. Em todo caso, a maioria dos referen
tes designados como conservadores e liberais resultaram ser empirica-
mente “corretos’, no sentido de que se agrupavam em fatores predomi
nantemente conservadores ou liberais, como fora predito pela teoria.
Vale a pena estudar a tabela 12.9. Note primeiro que, com apenas
uma exceção, pureza racial no fator Direitos Civis, não há cargas nega
tivas na tabela. Segundo, todos os itens em qualquer arranjo fatorial
ou são conservadores ou são liberais, mas não ambos. Por exemplo,
todos os itens do fator “Liberalismo Social” são itens liberais, enquanto
que todos os itens no fator “ Conservadorismo Econômico” são conser
vadores, com uma possível exceção, conhecimento científico.
Terceiro, e mais importante do ponto de vista deste capítulo, note
o tema comum o caráter de cada fator. Você concorda com o nome
dado? Tem nome melhor? Note, por exemplo, que um item, segurança
nacional, não se encaixa direito no fator “Conservadorismo Econômico” .
Então, “ Conservadorismo Econômico” não é correto? (Nem sempre se
conseguem fatores “perfeitos”, naturalmente). Conhecimento científico
parece não combinar. A. coisa principal a notar, entretanto, é que a
maioria dos itens, às vezes todos, participam de uma idéia central, algum
núcleo de significado de atitude que possibilita identificar o fator. Além
do mais, já que os primeiros três fatores participam da característica
geral de terem itens conservadores, pode-se especular que existe um
fator “geral” de conservadorismo. Da mesma forma, talvez nos últimos
três fatores, cujos itens são todos liberais, definam um fator geral de
liberalismo. A evidência deste estudo e outros, mesmo na Espanha e
na Holanda, onde foram feitos estudos semelhantes (Kerlinger, Midden-
dorp & Amón, 1976) indicam que assim é.
232
Análise fatorial: uma apreciação
234
13. A a b o r d a g e m m u lt iv a r ia d a :
c o r r e la ç ã o c a n ô n ic a , a n á lis e d is c r im in a n t e
e a n á lis e d e e s t r u t u r a s d e c o v a r iâ n c ia
236
melhor à questão da pesquisa sobre o efeito do reforçamento sobre a
realização, incluindo ambas as variáveis em um experimento. Por quê?
Qual poderá ser a vantagem? Uma resposta é que os métodos de reforça
mento podem afetar os dois tipos de realização diferentemfente e que as
diferenças podem não surgir nos dois experimentos e surgir em um experi
mento que inclua ambas as variáveis dependentes.
Há muitas situações práticas em que indivíduos têm que ser
“designados” para grupos diferentes com base em seu nível diferente de
traços, capacidades, experiência e assim por diante. Por exemplo, nas
escolas as crianças são “ designadas” para grupos de aprovados e repro
vados com base em seu esforço e realização. Candidatos a emprego em
uma companhia são designados para grupos de contratados e não
contratados com base em sua capacidade e experiência. Os psiquiatras
designam pessoas mentalmente doentes para categorias como neurótico,
esquizofrênico e maníaco-depressivo, com base em testes e observações.
Nestes casos o pesquisador considera o pertencer ao grupo como a
variável dependente e os vários testes e outros aparatos como variáveis
independentes. Embora haja apenas uma variável dependente, como na
análise de regressão múltipla, os métodos de análise empregados em tais
situações são considerados e denominados análise multivariada.
Um último exemplo mais complexo antes de entrarmos em maiores
detalhes. Roe e Siegelman (1964) acreditavam que experiências no início
da vida levavam a diferenças posteriores em orientação para pessoas. Seu
interesse em orientação partia da suposição de que a orientação para
pessoas influenciava os interesses por diversas ocupações. Um indivíduo
fortemente orientado para pessoas, mais provavelmente se tornaria um
professor, ou um aconselhador, por exemplo. Para testar a hipótese,
aplicaram dois conjuntos de testes a diversos alunos de quarto ano
de faculdade. O primeiro conjunto media variáveis associadas ao ambien
te familiar, primeiras experiências de atividades sociais, proximidade de
mãe e pai, interesse e energia que pai (ou mãe) demonstravam em
atividades outras que o trabalho e a família. As variáveis do segundo
conjunto refletiam a orientação em relação a pessoas, por exemplo,
curiosidade em relação a pessoas, desejo de relações pessoais íntimas,
calor humano e sociabilidade. Sua hipótese era que relacionamentos
intensos e satisfatórios no início da vida resultavam em adultos princi
palmente orientados para pessoas, enquanto relacionamentos inadequa
dos e insatisfatórios resultavam em adultos orientados para aspectos não
pessoais do ambiente.
Esta pesquisa é multivariada porque tem diversas variáveis inde
pendentes e diversas variáveis dependentes. O problema é como estudar
a relação entre elas. A coisa mais óbvia a fazer é simplesmente correla-
cionar cada uma das variáveis independentes com cada variável depen
dente e então estudar as muitas correlações. Se as primeiras experiências
de atividades sociais se correlacionam altamente com, digamos, uma
medida de orientação em relaçao a pessoas, — isto é, quanto mais cedo
a experiência de atividade sociais, maior a orientação para pessoas__,
então provavelmente os pesquisadores poderão concluir que as primeiras
experiencias influenciam a orientação posterior. Pode-se ainda calcular
todaj as correlações entre todas as variáveis e analisar fatorialmente as
correlações. Esta pode ser uma boa maneira de atacar o problema porque
os resultados da análise fatorial deveríam mostrar as relações entre as
primeiras experiências e as orientações.
Outro meio de abordar o problema analítico, um meio mais apro
priado porque seus resultados irão referir-se diretamente à hipótese
original,^ é calcular um índice composto para as variáveis independentes
e outro índice composto para as variáveis dependentes, e correlacioná-los.
Foi este o método usado por Roe e Siegelman.1 A correlação entre os
dois índices compostos, calculada de forma a aumentar a correlação
entre os dois conjuntos de variáveis, 8 medidas para cada conjunto, foi
de 0,47. Esta correlação canônica, como é chamada, foi estatisticamente
i^icando uma relaçao moderada entre as primeiras expe
riências e a orientação para pessoas.
O método possibilita ao pesquisador, além de obter a correlação
total entre os dois conjuntos de variáveis, obter estimativas das influên
cias relativas das variáveis separadas nos índices compostos. No caso
presente, a variável independente mais influente foi a variável chamada
“Primeiras experiências de atividades sociais”, e a variável dependente
mais importante foi a chamada “Orientação para pessoas”, calculada de
escala apropriada e itens de inventário. A hipótese de Roe e Siegelman
foi confirmada, uma vez que a correlação canônica foi estatisticamente
significante. Alem do mais, foi obtida informação sobre quais variáveis
contribuíram mais para a correlação entre os dois conjuntos de variáveis.
O método ora descrito é chamado análise de correlação canônica.
E o mais geral dos métodos multivariados, no sentido de que outros
métodos multivariados podem ser considerados casos especiais de corre
lação canônica. 12 É igualmente poderoso e elegante, embora a interpre
tação de seus resultados possa ser difícil e até ambígua. (O porquê
238
disto não poderá ser explicado aqui porque a explanação exige recursos
técnicos além da finalidade do livro. Em geral, quanto mais complexa
uma análise, mais difícil a interpretação.) Para dar ao leitor maior idéia
e compreensão do método, inventamos um exemplo fictício e o vestimos
com variáveis relacionadas à aprendizagem de língua estrangeira. Deve
ser enfatizado, entretanto, que o exemplo é inteiramente fictício. Aliás,
eu não conheço nenhuma pesquisa real que sequer seja semelhante ao
problema e suas variáveis.
1 12 9 9 10,00 11 10 10,50
2 10 8 11 9,67 9 8 8,50
3 14 11 11 12,00 9 9 9,00
4 21 10 8 13,00 7 7 7,00
5 24 19 20 21,00 12 14 13,00
6 18 16 21 18,33 14 12 13,00
7 15 17 14 15,33 7 15 11,00
8 20 14 10 14,67 18 16 17,00
3 Deve ser enfatizado que um R2 tão alto é improvável. Neste exemplo foi
inventado para dar um efeito dramático.
240
Em vez de duas análises separadas, é possível usar uma análise
que inclua as três variáveis independentes e as duas variáveis depen
dentes? É possível analisar as relações entre os dois conjuntos de
variáveis em outras palavras? Os ingredientes de tal análise são dados
na tabela 13.1. As notas Xi, X 2 e X 3 foram calculadas em cada linha,
produzindo as médias_ de 10,00, 9,67, 12,00 e assim por diante, na
coluna encimada por X. As notas de Yi e Y2 foram igualmente calcula
das, resultando em médias_de 10,50, 8,50, 9,00 e assim por diante,
na coluna encimada por Y. Temos então, um componente X e um
componente Y que são, neste caso, as médias das notas X de cada
indivíduo e as médias das notas Y de cada indivíduo. A correlação
entre o componente X, X, e o componente Y, Y, é 0,54. Se elevarmos
ao quadrado esse r, obteremos 0,29. Se aceitarmos os X’s como represen
tativos das três variáveis X e os Y’s como representativos das duas
variáveis Y, então a correlação entre as três variáveis X, por um lado,
e as três variáveis Y, por outro, é 0,54, e 29 por cento da variância de
Y é compartilhada com X.
O procedimento descrito não seria usado comumente em pesquisas
reais. Nós o usamos para ilustrar uma idéia, a idéia de determinar
a correlação entre, conjuntos de notas em vez de notas isoladas, neste
caso a correlação entre o conjunto X e o conjunto Y. Na maioria de
pesquisas reais com conjuntos de variáveis X e Y, usaríamos análise
de correlação canônica, que calcula, entre outras coisas, o máximo
possível de correlação entre conjuntos de variáveis X e Y. Correlacionar
as médias de X e Y não calcula corretamente* a “ verdadeira” relação
entre os dois conjuntos de notas. Não calcula a correlação máxima
possível dados os dois conjuntos de notas e todas as relações entre eles.
Portanto, neste caso, dá uma estimativa muito baixa.
Vamos voltar à nossa discussão sobre análise de regressão múltipla.
Lembre-se que um coeficiente de correlação múltipla expressa a correla
ção entre a “melhor” combinação de variáveis independentes, ou X’s, e
uma variável dependente, Y. A correlação canônica estende a idéia a
mais de uma variável Y. Embora os cálculos sejam complexos, as idéias
básicas são simples. O coeficiente de correlação, entre as médias das
variáveis X e as médias das variáveis Y da Tabela 13.1, foi 0,54.
Se tivéssemos calculado a correlação entre as variáveis X e Y usando
análise de correlação canônica, teríamos produzido um chamado coefi-
ilente de correlação canônica que seria o máximo de correlação possível
entre os conjuntos X e Y das notas, dadas aquelas notas e as relações
entre as variáveis X, entre as variáveis Y e entre os conjuntos de
variáveis X e Y. A correlação canônica entre os conjuntos de notas X e Y,
então, seria maior do que a correlação obtida por nosso procedimento
§implificado usando as médias das notas X e Y. (A correlação canônica
241
é, na verdade, 0,99, muitíssimo alta. Mas raramente ocorre correlação
canônica tão alta com dados comportamentais. Neste caso é devida à
natureza sintética das notas e a alta correlação de 0,80 entre X2 e Y2.)
Além disso, a análise de correlação canônica produz taxas das
contribuições relativas das variáveis dependentes e independentes sepa
radas da correlação canônica. Por exemplo, no exemplo da aprendizagem
da língua, poderíam ser calculados pesos semelhantes às cargas fatoriais
discutidas no capítulo 12, e esses pesos diriam ao pesquisador que
variáveis ou variável independente tiveram influência relativamente maior
sobre que variável ou variáveis dependentes. Os resultados de uma
análise de correlação canônica dos dados da tabela 13.1, por exemplo,
mostraram que vocabulário, X2, e leitura do italiano, Y2, eram muito
mais importantes que as outras variáveis na determinação da correlação
canônica. Em outras palavras, a análise, se bem sucedida, determina a
magnitude da relação total entre os dois conjuntos de variáveis ou
medidas, e também indica que variáveis, quer dependentes quer indepen
dentes, contribuem mais para a relação entre os conjuntos. Embora
ainda haja muito a comentar a respeito da análise canônica, incluindo
as limitações do método e certas. dificuldades de interpretar dados
canônicos, vamos abandonar a discussão. Nosso objetivo de sugerir as
idéias básicas foi conseguido.
Análise discriminante
242
Em muitas situações de pesquisa, então, os pesquisadores designam
pessoas a grupos com base em sua participação no grupo. Isso parece
quase tolice: Como o pesquisador pode designar pessoas a grupos dos
quais elas já fazem parte? Um ponto é que ele pode não saber a que
grupos elas pertencem, e se uma de suas variáveis é aquela que expressa
ffiarticipação como membro de um grupo, então ele terá que dar um
pito de determinar a participação no grupo. Isso, por sorte, geralmente
não é difícil. Ele poderá fazê-lo examinando registros ou simplesmente
fazendo perguntas bem dirigidas às pessoas.
Suponhamos, entretanto, que se deseja predizer uma variável de
participação em um grupo. Temos agora que ampliar nosso raciocínio.
Em algumas situações as pessoas ainda não estão “em um grupo” mas
serão “designadas” a ele pelo pesquisador com base em informações
obtidas por outras variáveis que não sejam as de participação em grupos.
Vejamos o que significa isso, porque muita pesquisa comportamental
tem o caráter essencial de “predizer” a filiações grupais.
Foi dado anteriormente um exemplo famoso: a previsão do câncer
do pulmão pelo fumar cigarros. O pesquisador, com efeito, designa
pessoas a um grupo de câncer no pulmão ou sem câncer no pulmão com
base no conhecimento do hábito de fumar cigarros. Quanto maior a
relação entre o cigarro e o câncer, mais bem-sucedida a predição. Os pes
quisadores educacionais designam crianças a grupos de aproveitamento
adequado e a grupos de aproveitamento inadequado com base nos resul
tados de testes de aptidão, notas, medidas de atitude, medidas de classe
social, sexo e em outras variáveis e medidas. Os-professores, igualmente,
designam alunos de ginásio a grupos de conceitos — A, B, C, D e F,
por exemplo — com base no desempenho, em testes, trabalhos de aprovei
tamento, tarefas especiais e até julgamentos pessoais.
O leitor sem dúvida se lembrará que a isso chamamos mensuração
nominal. Se uma pessoa tem tal ou qual característica, que seja designada
ao Grupo Ai; se, por outro lado, tem esta ou aquela característica,
j|esignar-se-á ao Grupo A2; e assim por diante para outras características
e grupos. Um ponto-chave é que os indivíduos sejam designados não
aos grupos a que realmente pertençam, mas aos quais “deveríam perten
cer” com base em evidências sobre os indivíduos que são independentes
de participação em grupos. Isto é, a participação no grupo é “predita”
baseada em evidência obtida independentemente e à parte da partici
pação no grupo, mas que se sabe, ou se acredita, ser capaz de prever
essa participação no grupo com eficiência.
O longo aparte acima foi necessário a fim de compreendermos o
método de análise discriminante e a respectiva pesquisa que dizem
(Despeito à predição de participação em um grupo. Análise discriminante é
uma forma muito útil de análise multivariada, cuja principal tarefa é
predizer a participação em um grupo. A pesquisa deste tipo é feita mais
ou menos da maneira que segue. Um pesquisador deseja compreender,
por exemplo, o problema da aquisição de linguagem. Algumas pessoas
podem aprender a falar e compreender uma língua estrangeira com
relativa facilidade; outras pessoas têm enorme dificuldade. Por quê?
Suponhamos que o pesquisador identifique primeiro dois grupos de
indivíduos. Um grupo será chamado “bons aprendizes” porque parecem
ter aprendido bem o italiano e com relativa facilidade, e o outro grupo
“maus aprendizes” porque, depois de um ano de estudo, o grupo fala
e compreende mal ou com dificuldade o italiano. Num esforço de
compreender as diferenças entre os dois grupos, o pesquisador lhes aplica
três testes, os mesmos usados antes: memória, vocabulário e eognição de
relações. Ele raciocina que se o coeficiente de correlação canônica for
tão alto no primeiro estudo, então talvez as três variáveis usadas antes
como variáveis independentes, se usadas juntas, serão capazes de uma
previsão bastante exata do sucesso ou falta de sucesso em aprender um
idioma estrangeiro.
A idéia é muito parecida com as idéias discutidas no capítulo 11,
vários testes ou medidas foram usados para “predizer” o desempenho
em alguma variável dependente. Por exemplo, Holtzman e Brown (1968)
usaram medidas de aptidão acadêmica e hábitos e atitudes de estudo
para preverem notas no segundo grau. Em vez de médias de notas,
uma variável contínua, eles poderíam ter usado uma medida de sucesso
no segundo grau. Tal medida pode ser obtida pedindo aos professores
que categorizem cada aluno como “bem-sucedido” ou “malsucedido.”
Ou o critério de terminar ou não o ginásio pode ser usado para indicar
“bem-sucedido” e “malsucedido” . Em outras palavras, é usada a partici
pação em um grupo, uma variável dicotômica, ou de dois valores.
A quantificação é simples: atribua 1 a ‘bem-sucedido” e 0 a “malsuce
dido.” Se for feita agora uma análise regressão múltipla, com aptidão
acadêmica e medidas de hábitos e atitudes de estudo como variáveis
independentes e a variável dicotômica, “sucesso”, como a variável depen
dente, teremos, com efeito, uma análise discriminante.
244
fiados por três especialistas atuando como juizes e considerados “bem-
lucedidos” ou “malsucedidos” em falar holandês. Quatro deles foram
fiaracterizados pelos juizes como “malsucedidos” ; são as pessoas de
a 4 na tabela 13.2 e receberam 0 para indicar sua falta de sucesso
1 12 9 9 Sem sucesso 0
2 10 8 11 Sem sucesso 0
3 14 11 11 Sem sucesso 0
4 21 10 8 Sem sucesso 0
5 24 19 20 Sucesso 1
6 18 16 21 Sucesso 1
7 15 17 14 Sucesso 1
8 20 14 10 Sucesso 1
245
buição foi feita. deliberadamente para realçar as correlações. Em
pesquisas reais, entretanto, usam-se outros e melhores métodos.
Se for feita uma análise de regressão múltipla com os dados da
tabela 13.2 e se for bem sucedida — com os dados da tabela 13.2 foi
bem sucedida: R2 = 0,85 —, então a equação de regressão obtida pode
ser usada com futuros alunos. Digamos que um novo grupo de estudantes
está para começar a estudar o holandês. Poderemos aplicar-lhes os três
testes e, usando a equação de regressão obtida na análise anterior,
calcular uma nota predita para cada um deles. Essas notas podem então
ser usadas para indicar provável “sucesso” ou “falta de sucesso” em
aprender holandês.
A equação de regressão calculada com os dados da Tabela 13.2 é:
Y’ = — 0,99 + 0,01Xi + 0,14X2 — 0,01X3
Suponhamos que as notas de um indivíduo sejam Xi = 12, X2 = 9, e
X 3 = 9 (notas da Pessoa 1 na tabela 13.2). Então, substituindo essas
'■c notas na equação acima, Y’ = 0,06. Suponhamos que as outras notas de
outro indivíduo sejam Xi = 24, X2 = 19 e X3 = 20 (notas da Pessoa
5 na tabela 13.2). Substituindo na equação, obtemos Y’ = 1,23. Pode
mos então predizer que o primeiro aluno não se sairá bem e o segundo
sim. Estamos, com efeito, predizendo participação em um grupo, ou
predizendo 1 ou 0. A nota predita do primeiro aluno, de 0,06 está
próxima de 0; portanto, provavelmente ele não terá sucesso. A nota do
segundo aluno de 1,23 está próxima de 1; ele, portanto, provavelmente
terá sucesso.
Naturalmente 0 procedimento é falível, como todos o são. Nossas
predições são probabilísticas: dizemos apenas, com base nas três notas,
que um estudante provavelmente se sairá bem ou não se sairá bem.
Dada uma “boa” equação de regressão, ou de predição, acertaremos
uma boa proporção de vezes que usarmos a equação. Mas poderemos
errar às vezes. Leitores insatisfeitos com tal falta de predição perfeita
podem se consolar com o pensamento que sem o conhecimento fornecido 1
pelos testes quaisquer predições feitas — talvez baseadas na intuição,
experiência ou outros critérios mais ou menos subjetivos — provável- -
nente, não seriam tão boas.
Em todo caso, a análise discriminante é uma ferramenta poderosa
com problemas tanto práticos quanto teóricos. O uso prático foi ilustrado
com 0 exemplo dado acima. O uso teórico é sugerido pela equação de
regressão. A própria equação revela pistas para a relativa importância das
três variáveis independentes em sua suposta influência no aprendizado
de uma língua — se,, sem dúvida, o aprendizado do holandês puder
ser considerado representativo do aprendizado de idiomas e se a amostra,
246
cujos dados determinaram a equação e outras estatísticas de regressão,
for igual a outras amostras de estudantes de idiomas.4
u„.
Ui
Q (
o
2 t
0
(ri
D
t3
Figura 13.1
248
apenas resolver este problema em particular mas também compreender
como funciona este fascinante método multivariado. Vamos fazer uma
breve digressão geométrica para ilustrar como funciona a análise discn-
minante. Ao fazer isso, vamos tomar de empréstimo e adaptar uma bela
demonstração apresentada por Tatsuoka (1970, pp. 5-7) em seu lúcido
manual sobre análise discriminante. Esta demonstração, alem de elucidar
a análise discriminante, joga mais um pouco de luz sobre a analise
multivariada em geral, em parte porque aborda o problema de concei-
tualizar espaços de k (mais de duas) dimensões.
6 - '
5 + +
(1,5) (3,5)
4 o
(5,4)
3 + ©
(1,3) (3,3)
2 0
(3,2)
1
I L
1 2
Figura 13.2
249
de propósito.) Designá-lo para um dos grupos é questão que requer
estudo. m m
250
por íos representados estão circulados separadamente e a linha ondulada
#l»cre eles acentua essa separação. Temos agora dois conjuntos de pontos ■
^rrespondentes aos dois grupos de ossos e as medidas associadas á eles.
O “sistema” pode ser usado para a identificação e categorização de ossos
incontrados no futuro. As regras são: Tome as medidas Xi e X2 do osso;
ffcpresente estes valores em um gráfico como 0 da figura 13.3; trace
Uma perpendicular à linha Y e leia o valor; se for maior de 0,95,
ftribua-o ao chimpanzé, do contrário, atribua-o ao homem.
Este exemplo, então, ilustra mais ou menos como funciona a análise
Éíscriminante. No exemplo com sete medições de ossos, em vez de serem
Usados apenas Xi e X2, são usados Xi, X2, X3, X4, X5, X ô e X7. O enten
dimento intuitivo, que usamos no exemplo acima, nos abandona agora.
As idéias básicas, entretanto, são as mesmas, ou pelo menos semelhantes.
As sete medidas ou variáveis são usadas em uma regressão múltipla para
jpredizer a participação no grupo. Os grupos originais de 40 ossos huma
nos e 40 ossos de chimpanzés são usados de modo similar a sujeitos
em um experimento psicológico ou educacional para fazer a análise de
ègressão. A variável dependente é a participação no grupo. A regra
Í umtitativá é simples: se for osso de chimpanzé, atribua 1; se for osso
humano, 0. O método discriminante então faz 0 que está representado
na figura 13.3: “projeta” uma combinação linear das sete variáveis ou
medidas numa linha Y para produzir o máximo de separação possível
dos dois grupos. Naturalmente não faz isso. A análise dos dados produz
um conjunto de pesos que são usados em uma equação discriminante
(regressão). As sete medidas de novos sujeitos_— neste caso os sujeitos
são ossos — são inseridos na equação para obter notas discriminantes,
que são então usadas para categorizar os sujeitos ou ossos.
Suponhamos que a equação discriminante do exemplo das duas
medidas dado acima tenha sido:
Y = 0,80Xi - 0,40X2
e Xi = 2 e X2 = 5. Então,
Y = (0,80(2) - (0,40) (5) = -0 ,4 0
Isto está bem abaixo da “nota de separação” de 0,95 dada anteriormente
(a média das seis medidas na linha Y da figura 13.3); portanto, o fóssil
é um osso humano. Note também que o mesmo resultado podería ter
sitio obtido representando o ponto (2,5) na figura 13.3 e depois traçando
uma perpendicular à linha Y.
Volta a Howells
251
nante” calculadas para os 40 ossos humanos e para os 40 ossos de
chimpanzé. As sete medidas do osso desconhecido produziram uma
nota discriminante de 59,40. Isto, naturalmente, está próximo da média
humana de 61,42, e o osso é classificado como humano. A probabilidade
do osso ter pertencido a um ser humano e não a um chimpanzé é alta.6
A análise discriminante e outras formas de análise multivariada são,
naturalmente, muito mais complexas. Entretanto, as idéias básicas são
relativamente simples — depois de compreendidas. O principal ponto dos
exemplos é que muitos problemas das ciências comportamentais são
complexos demais para serem resolvidos adequadamente por métodos
mais simples. É exigida a abordagem multivariada. Naturalmente jamais
deve-se usar método complexo onde um método simples resolve. A
questão é: Um método simples resolverá? A resposta a esta questão é
inseparável do problema e do julgamento do pesquisador.
Em um sentido mais geral, a análise discriminante é um método
de atribuir indivíduos a grupos com base na informação sobre os indi
víduos em duas ou mais variáveis. Até aqui usamos apenas variáveis
dependentes dicotômicas e dissemos que isso nada mais é que regressão
múltipla com uma variável dependente dicotômica, geralmente quantifi
cada como ■{1,0}-. A análise discriminante, entretanto, de forma alguma é
limitada a tais variáveis dicotômicas. Por exemplo, Cooley e Lohnes
(1962) usaram o método para discriminar três grupos usando medidas
de valores e personalidade como preditores (variáveis independentes).
Os três grupos eram um grupo de pesquisa, estudantes que faziam
um trabalho de pós-graduação para fazer pesquisa básica; um grupo de
ciência aplicada, pessoas que continuam em ciência e engenharia, mas
que não pretendem fazer pesquisa; e um grupo não-científico, dos que
deixam o campo para entrar em áreas que têm contato imediato com
pessoas. Alunos de seis faculdades responderam às medidas de personali
dade e valores e três anos depois, como ficou descrito acima, sua partici
pação nos três grupos ficou determinada. Cooley e Lohnes diferenciaram
os membros dos grupos e conseguiram descrever algumas diferenças
grupais.
A análise discriminante foi usada principalmente para pesquisa
aplicada. Seu uso é geral como se segue. Com base na teoria, conheci
mento prévio, ou palpite, medidas apropriadas de capacidade, personali
dade e outras variáveis, são aplicadas a membros de grupos conhecidos.
É feita a análise discriminante e calculadas as equações discriminantes
(como a equação de regressão descrita acima). As equações então são
usadas para predizer a (posterior) participação de indivíduos em um
6 No fim de seu trabalho Howells diz que seu colega, Patterson, voltou à região
onde foi encontrado o fóssil e encontrou outras provas confirmando a conclusão
discriminante.
252
grupo cuja participação no grupo não é conhecida, como fizemos uo
exemplo dos ossos. Um psicólogo, por exemplo, pode usar um conjunto
de testes com amostras selecionadas de meninos delinqüentes e não delin-
qüentes e calcular a equação discriminante para “predizer” delinqüência,
participação ou não participação no grupo de delinqüentes ou não delin
qüentes. Eh) outras palavras, ele calcula a equação com indivíduos cuja
participação no grupo é conhecida, delinqüentes e não delinqüentes.
Pode então usar a equação para predizer a posterior participação no
grupo, a delinqüência ou não delinqüência posterior de outros indivíduos.
Ele simplesmente aplica as mesmas medidas a outros indivíduos e, com
base nas notas que eles obtem, calcula sua futura participação nos grupos,
sua futura delinqüência ou não delinqüência. Isto, naturalmente deve
ser feito com grande cuidado e reserva. Afinal, a aplicação de uma
equação obtida com um grupo pode não ser aplicável a outro grupo por
vários motivos. Não obstante, a análise discriminante é um esquema de
predição útil e poderoso em pesquisa aplicada.
Suponhamos, agora, que um pesquisador básico esteja interessado
em descrever as diferenças entre grupos e em compreender porque os
grupos são diferentes. Ã análise discriminante pode ser usada para
ajudá-lo em tal descrição e compreensão. Na verdade, foi usada assim
por Cooley e Lohnes na pesquisa sumarizada acima. Este uso do método
é mais científico do que simplesmente predizer participação em um
grupo, porque Cooley e Lohnes estavam tentando entender por que são
feitas as escolhas de carreiras, saber alguma coisa dos determinantes de
suas personalidades e valores, e não. apenas predizer tais escolhas. Esta
diferença entre os objetivos da pesquisa básica e aplicada é importante
e está muito bem ilustrada pelo uso básico e aplicado da análise discri
minante.
Este ponto é tão importante que deveria ser mais discutido. Vamos
voltar ao exemplo de aprender holandês, ilustrado pelos dados ^da
tabela 13.2. Os educadores interessados no ensino de línguas estrangeiras
deveriam usar normalmente um método como a analise discriminante
preditivamente. Isto é, eles querem saber como predizer acertadamenté
o bom resultado no aprendizado do holandês. Geralmente querem saber
quais estudantes terão sucesso e quais os que provavelmente terão dificul
dades. Assim, talvez, eles poderão individualizar melhor o ensino. Os
pesquisadores mais orientados para a pesquisa básica, por outro lado,
mais provavelmente quererão saber por que e como alguns indivíduos
têm mais sucesso que outros. Para eles, a predição é mais um subproduto
do método. Provavelmente eles estarão mais interessados no aprendizado
da linguagem como fenômeno natural a ser explorado e compreendido.
Este esboço das duas orientações gerais da pesquisa está um pouco
pxagerado, naturalmente. O professor de holandês, sem dúvida, também
253
estará interessado em como e por que alguns indivíduos têm mais
sucesso que outros. E o pesquisador básico quererá saber se poderá
predizer o aprendizado bem sucedido e mal sucedido. Entretanto, a
distinção continua e é sempre importante. O ponto a ser ilustrado é que
a análise discriminante — e, logicamente, outras abordagens e métodos
mui tivariados — pode ser muito bem usada para ambos os propósitos.
Voltaremos à distinção básico-aplicada no capítulo 16.
7 Por minha discussão vai parecer que Jõreskog foi o único responsável pela
análise de estruturas de covariância. Mas este modo de falar é por conveniência
apenas. Realmente, houve várias pessoas importantes no desenvolvimento da meto-
254
estruturas de covariância significa, essencialmente, a análise da variação
simultânea de variáveis que se encontram em uma estrutura, um edifício,
ditado pela teoria. O sistema faz vários tipos de análise multivariada
tas de tal maneira que não temos necessidade de perguntar que forma
E e análise está sendo feita. Isto acontece porque as possibilidades analíti
cas fazem parte 'dç um sistema mais amplo. Em outras palavras, Jõreskog
criou uma fórmula matemática e estatística abstrata que pode ser expressa
em equações algébricas e sua formulação abarca diversos métodos multi
variados.
Os programas de computador foram integrados ao sistema (veja a
nota n.° 7) de tal forma que uma concepção de pesquisa é ^‘realizada
com o uso do programa do computador. É uma descrição bastante
abstrata do sistema de Jõreskog, sendo insatisfatória para uma compre
ensão adequada. Para entendê-la melhor, vamos tomar dois exemplos.
O primeiro é de análise fatorial, porque é a maneira mais clara e fácil
de mostrar a idéia do sistema. Deve ser enfatizado, entretanto, que o
uso real do sistema envolve problemas mais intrincados e complexos.
Sem dúvida, uma de suas molas mestras é sua capacidade de lidar
eficientemente com conjuntos de variáveis relacionadas de maneiras com
plexas. O segundo exemplo é de análise de trajetória. Vamos explicar
mais adiante o que é análise de trajetória (path analysis).
dologia, cujas contribuições Jõreskog reconhece (por exemplo, Bock & Bargmann,
1966- Wilev, Schmidt & Bramble, 1973). Entretanto, Jõreskog juntou varias abor
dagens e métodos de análise em um (ou dois) sistemas gerais nos quais a mate
mática, a estatística e a tecnologia do computador foram integradas. De fato, os
dois sistemas de Jõreskog foram vagamente denominados pelos nomesi dos pro
gramas de computador usados para melhorar o sistema: ACOVb e nií>KE.u. a
primeira das duas referências dadas acima (1974) usa a mais simples das duas
abordagens, ACOVS. A segunda referência (1976) usa LISREL, que e mais geral
e mais complexa. É também mais poderosa. Na descrição acima limito-me a um
aspecto simplificado do núcleo da pesquisa e teoria do sistema.
255
A concepção comum de atitudes sociais é bastante diferente.
Enquanto a “teoria” ora mencionada, e dada com mais detalhes no
capítulo 12, diz que o conservadorismo e o liberalismo são entidades
distintas e separadas, idéias populares geralmente aceitas dizem que as
atitudes são bipolares. Um concepção bipolar, ou com duas extremidades,
de atitudes sociais implica que princípios e pessoas conservadoras
acham-se em um extremo de um continuum de atitudes sociais e prin
cípios e pessoas liberais acham-se no outro extremo do continuum. Isto
significa que não apenas os conservadores adotam princípios con
servadores, mas qtie também se opõem a princípios liberais — e a mesma
coisa para liberais e princípios liberais.
Argumentos racionais podem e foram aventados para ambas as
concepções. Mas o que diz a evidência empírica? A evidência empírica,
obtida em diversos estudos, a maioria usando a análise fatorial (por
exemplo, Kerlinger, 1972; Kerlinger, Middendorp, & Amón, 1976),
parece apoiar a relativa independência do conservadorismo e liberalismo.
Mas o assunto ainda não foi resolvido. Como as duas concepções, ou
teorias, poderão ser testadas com o sistema de Jõreskog?
Vamos usar o exemplo de itens de atitude, do capítulo 12. Suponha
mos que aplicamos quatro itens de atitude, dois sabidamente liberais,
igualdade para as mulheres e controle da natalidade — e dois conhecidos
como conservadores — propriedade privada e negócios — a seis pessoas.
(Novamente, muito mais itens de atitude de afiliação “conhecida” e
“desconhecida” seriam administrados a muito mais pessoas.) Os resulta
dos são aqueles da tabela 12.5, e são reproduzidos, para facilitar a
referência, na tabela 13.3. As correlações entre os itens foram relatadas
Tabela 13.3 Respostas de seis pessoas a quatro itens de atitude social (repro
duzidas da tabela 12.5) ’
Itens
1 2 3 4-
1 1 2 4 2
2 1 3 2 2
3 2 2 5 6
4 5 6 5 5
5 6 5 3 4
6 6 6 2 1
* Os números na tabela são as classificações feitas por seis pessoas, dos quatro
referentes em uma escala de 1 a 6, 1 indicando baixíssima aprovação e 6 indi
cando forte aprovação.
256
na tabela 12.6 e estão reproduzidas aqui na tabela 13.4. Os resultados
de análise fatorial desta matriz de correlação, dados originalmente na
tabela 12.7, aparecem novamente na tabela 13.5. Estes resultados pare
cem apoiar a concepção de independência e dualidade, porque os dois
itens liberais estão carregados em um fator (cargas grifadas) e os dois
conservadores em outro fator (também grifadas). As cargas negativas
são baixas e sem conseqüências. Se uma concepção bipolar estivesse
correta, obteríamos um fator com os dois itens liberais com substancial
carga positiva e os dois itens conservadores tendo substanciais cargas
negativas.
Usando a abordagem de Jõreskog, estabelece-se primeiro a situação
teórica com diagramas. Os diagramas da figura 13.4 expressam as duas
alternativas. À esquerda (A) da figura está a hipótese de dois fatores.
Os números 1, 2, 3, 4, representam os quatro itens de atitude, 1 e 2
sendo igualdade para as mulheres e controle da natalidade e 3 e 4, pro
priedade privada e negócios, itens conservadores. Os círculos represen
tam os fatores presumidos, L e C, ou liberalismo e conservadorismo.
As setas representam a influência ou determinação nas direções de L
para 1 e 2 e de C para 3 e 4. Isto é, o fator L “determina” ou está
subjacente aos itens 1 e 2 e o fator C “determina ou está subjacente
aos itens 3 e 4.
Tabela 13.4 Correlações entre quatro itens de atitude social de seis pessoas
(reproduzidas da tabela 12.6).
Fatores
Itens A B
257
(Vide texto para explicação dos símbolos)
Figura 13.4
258
Tabela 13.6 Matrizes alvos, ou matrizes hipóteses, expressando hipóteses alter
nativas para a estrutura fatorial da matriz de correlação da tabela 13.4.a
Hipótese de Hipótese de
dualidade bipolaridade
I II I II
1 0 -1 0
1 0 1 0
0 1 1 0
0 1 -1 0
259
Uma das idéias básicas e centrais do sistema de Joreskog é a com
paração das matrizes de covariância. Uma matriz de correlação é um
tipo de matriz de covariância. Assim, para o que nos interessa, pode
mos dizer que uma das idéias centrais do sistema é comparar as matri
zes de correlação, uma fornecida pelas correlações entre as variáveis
obtidas e outra produzida por uma manipulação matemática da matriz
hipótese, como mostramos acima, e os resultados forçados pelas exigên
cias da hipótese ou hipóteses.
Para concretizar um pouco o que queremos dizer, vamos considerar
as duas matrizes, I e II na tabela 13.7. A matriz I e a mesma matriz de
correlações observada entre os quatro itens de atitude social já relatados
na tabela 13.4. A matriz II é um conjunto de correlações “forçadas”,
produzidas por um método bem conhecido, a partir das cargas fatoriais
da tabela 13.5. A operação foi simples: a matriz foi multiplicada por
si mesma. (Não precisamos nos preocupar com os detalhes. O leitor
interessado poderá consultar um texto de álgebra de matrizes ou uma
seção de álgebra de matrizes de um texto de estatística, por exemplo,
Cooley e Lohnes, 1971, pp, 15-20; Sullins, 1973; Tatsuoka, 1971,
capítulo 2.) Quando se faz isto, obtém-se a matriz II da tabela 13.7.
Queremos expressar e testar as implicações quantitativas da hipótese
de dualidade e as da hipótese de bipolaridade. As duas hipóteses ficaram
expressas de maneira simples nas matrizes alvo da tabela 13.6. Queremos
encontrar uma forma de operar sobre os fatores obtidos da tabela 13.5
para transformar as cargas fatoriais num conjunto que expresse a hipótese
1 2 3 4 1 2 3 4
Matriz residual
1 2 3 4
260
de dualidade e num outro conjunto que expresse a hipótese de biçola-
íridade. A operação se resume em usar os modelos teóricos expressos na
tabela 13.6 e em fazer com que os dados da tabela 13.5, as cargas
ifatoriais obtidas, se pareçam o máximo possível aos modelos expressos
na tabela 13.6. Quando foi feito isto, foram obtidas as duas matrizes
fatoriais da tabela 13.8.
Hipótese de Hipótese de
dualidade bipolaridade
I II I II
Matriz residual
1 2 3 4
262
mente. É a concepção e o uso das chamadás variáveis latentes no sistema.
Uma variável latente é uma variável não-observada, que é usada para
“explicar”, ou que é incluída em hipóteses como estando influindo sobre
outras variáveis latentes ou variáveis observadas. Foi dado um exemplo
no figura 13.4 onde liberalismo (L) e conservadorismo (C) eram
variáveis subjacentes não observadas que se supunha “explicarem” os
quatro itens (ou variáveis) do exemplo. Para tornar a coisa mais clara
e para abordar o sistema de Jõreskog mais de perto, examine-se a
figura 13.5 onde a situação à esquerda da figura 13.4 é representada
mais de acordo com as linhas de Jõreskog.
L (liberalismo) e C (conservadorismo) são variáveis latentes, ou
não-observadas, que supostamente estão subjacentes às quatro variáveis
observadas (itens), estando L subjacente às variáveis 1 e 2, e C às
variáveis 3 e 4. As variáveis observadas são dadas em quadros e as
variáveis latentes em círculos. As setas de um sentido indicam a direção
de influência — por exemplo, L influencia 1 e 2. As setas de dois sentidos
indicam correlação — por exemplo, r,2 é a correlação entre as variáveis
1 e 2. Os e’s indicam os erros de mensuração nas variáveis observadas.
Fornecidos os dados — neste caso as correlações entre os quatro itens
-—, o sistema calcula a influência de L nas variáveis 1 e 2 e a influência
de C em 3 e 4. Estas influências são simbolizadas por ai e a2 (para L)
e as e at (para C), cujos valores são calculados pelo sistema. O sistema
calcula também a correlação entre L e C e as variâncias de erro ei, e2, e3
e e4. A análise então continua ao longo das linhas delineadas acima.
O objetivo da figura 13.5 é mostrar que o método, diferentemente
da maioria dos outros métodos de análises multivariadas, calcula os
efeitos das variáveis latentes sobre as variáveis observadas e até as
relações entre as variáveis latentes. Este é, naturalmente, o material
básico da construção e testagem de teorias. É também muito semelhante à
Figura 13.5
263
análise fatorial. Lembre-se da inteligência fluida e cristalizada de Cattell,
fatores de segunda ordem que podem ser também concebidos como
variáveis latentes. A diferença é que em análise de estruturas de cova-
riância a idéia é generalizada e aplicada a todo tipo de situações teóricas
e analíticas. Além disso, a análise fatorial é um caso especial do sistema
geral. Assim as teorias podem ser formuladas, testadas e comparadas
para mostrar sua congruência com os dados observados.
264
cado pela seta entre n Ach e Ach. Mas presume-se, SSE e Inteligência
exercem efeito indireto sobre Realização por seu efeito direto sobre Ach.
(Embora SSE e Inteligência estejam eles próprios correlacionados — isto
é indicado pela seta curva de dois sentidos entre eles — não são
considerados como afetando um ao outro.)
Os analistas de trajetória chamam a formulação acima de um modelo
causai: pelo seu uso podem ser determinadas algumas idéias de causas e
efeitos. (Evitaremos aqui comentar o espinhoso problema causa e efeito.)
Então, pelas correlações entre as variáveis do modelo, eles calculam os
coeficientes de trajetória (path coefficient). Um coeficiente de trajetória é
simplesmente um peso de regressão fornecido pela costumeira análise
de regressão. Por exemplo, a regressão de n Ach sobre SSE e Inteligência
(isto é, SSE e Inteligência são as variáveis independentes e n Ach a
variável dependente) produz coeficientes de regressão (coeficientes beta)
de 0,40 para a trajetória de SSE a n Ach e 0,04 para a trajetória de
Inteligência até n Ach. Estes valores indicam que SSE tem um efeito
substancial sobre n Ach, mas que Inteligência tem efeito pequeno.
Então, faz-se à regressão de Realização sobre SSE, Inteligência e
n Ach (isto é, Realização, a variável dependente, é predita pelas outras
três variáveis). A análise fornece coeficientes, como se segue: de SSE a
Realização, 0,01; de Inteligência a Realização, 0,50; de n Ach a Reali
zação, 0,42. Estes coeficientes de trajetória foram ligados a suas traje
tórias na figura 13.6. Naturalmente, a costumeira análise de regressão
teria produzido nesta situação estes últimos coeficientes. A diferença
entre uma análise de regressão comum e a análisfe de trajetória é, entre
tanto, que as trajetórias de SSE e Inteligência até n Ach foram acrescen
tadas porque o pesquisador acredita, com base ou raciocínio teórico,
que estão agindo tanto influências diretas quanto indiretas. Em outras
palavras, as três variáveis não apenas afetam diretamente Realização;
SSE e Inteligência afetam Realização também indiretamente através de
n Ach. (Note a semelhança de raciocínio ao fenômeno de interação já
estudado.) É uma análise das influências na Realização mais rica, mais
sofisticada e provavelmente mais exata do que as que obtemos pela
análise de regressão comum, neste caso principalmente porque já “expli
camos” n Ach a caminho de “explicarmos” Realização.
Quando examinamos o diagrama de trajetória da figura 13.6, vemos
que duas das trajetórias têm coeficientes de trajetória próximos de zero:
de SSE a Ach, 0,01 e de Inteligência a n Ach, 0,04. Já que uma das
metas da ciência não é apenas a explicação, mas também a explica
ção parcimoniosa, perguntamos: Se suprimirmos estas duas trajetórias
e recalcularmos os coeficientes de trajetória no modelo resultante mais
jjjarcimonioso, será que um teste com os dados originais, como o feito
com o modelo de análise fatorial acima, mostrará um bom acordo entre,
(0,30)
Figura 13.6
Figura 13.7
266
T
Tabela 13.10 Correlações originais, A, correlações forçadas, B, e matriz residual,
quatro variáveis, segundo modelo.
Matriz residual
1 2 3 4
1 0,00 0,00 0,00 0,01
2 0,00 0,00 0,04 0,01
3 0,00 0,04 0,00 0,02
4 0,01 0,01 0,02 0,00
■F-
da figura 13.7, são dadas à direita, B. Subtraindo-se a matriz B da
matriz A obtém-se a matriz residual, dada na parte inferior da tabela.
É óbvio que as correlações produzidas a partir dos coeficientes de traje
tória são muito semelhantes às correlações originais: nenhum dos resíduos
é maior, de 0,04. Concluímos, portanto, que o modelo de trajetória da
figura 13.7 é consistente com os dados.*9 Evidentemente, a “explicação”
por trás do modelo da figura 13.7 é satisfatória. Já que é uma “expli
cação” mais simples que o modelo da figura 13.6, vamos aceitá-la como
“melhor” porque é mais parcimoniosa e produz correlações que concor
dam com as correlações originais.
É preciso destacar um ponto importante. O fato de modelo teórico
ser consistente com os dados obtidos não significa que a teoria em que
se baseia o modelo seja necessariamente “correta.” Na verdade, mais de
um modelo pode ser consistente com os dados obtidos. Então, neste
caso, embora o modelo da figura 13.7 seja consistente com as correla
ções obtidas, o próprio modelo pode ou não ser a explicação teórica
267
"correta.” O método exposto pode, portanto, ser considerado como
possuindo a virtude da negativa. Se um modelo não for consistente com
os dados, provavelmente não será “correto”. Mas se for consistente com
os dados, pode ou não estar “ correto”. Sua “correção”, em outras pala
vras, tem que ser julgada em outras bases, além da estatística. Esta é
uma das dificuldades de todas as teorias e explicações científicas (e de
c-utros tipos). Podem, ser mostradas como provavelmente incorretas, no
sentido de não serem consistentes com a evidência empírica, mas jamais
poderão ser mostradas como absolutamente corretas. Uma explicação
pode ser mostrada como provavelmente “melhor” que outras explica
ções alternativas, mas o cientista jamais poderá ter certeza de que seja
a última palavra. Se o leitor voltar à discussão sobre o fumo e o câncer
de pulmões no capítulo 8, talvez compreenda melhor o que lá ficou dito
a respeito de explicações e explicações alternativas.
Na discussão acima nada ficou dito sobre análise de estruturas de
covariância. Aliás, foi uma descrição mais ou menos convencional da
análise de trajetória. Ficou omitida a análise de estruturas de covariância
para que o leitor pudesse ter; uma visão geral da abordagem de análise
de trajetória no quadro de referência costumeiro da regressão múltipla.
Tentaremos mostrar agora, embora rápida e incompletamente, como a
análise de trajetória é um caso especial da análise de estruturas de
covariância e como o problema analítico da pesquisa pode ser abordado
no quadro de referência da estrutura de covariância.
Em análise de estruturas de covariância, os problemas representados
nas figuras 13.6 e 13.7 podem ser resolvidos com exatamente os mesmos
resultados. Pode ser feito mais, entretanto. Primeiro pode-se calcular as
variâncias de erros de mensuração associadas às medidas falíveis das
variáveis. Tal cálculo mudará então a solução, incluindo os coeficientes
de trajetória. A análise de trajetória geralmente admite a inexistência de
erros, tornando-se assim vulnerável à crítica. Segundo, as variáveis laten
tes podem ser postuladas e calculada sua influência. Por exemplo, no
modelo da figura 13.6, pode-se pensar que uma variável latente tenha
influência tanto sobre n Realização quanto sobre Realização.
Terceiro, a análise de estruturas de covariância permite testes da
significância estatística do acordo entre modelos teóricos e dados obser
vados. Além disso, modelos teóricos alternativos podem ser testados
para verificar-se sua congruência comparativa com os dados observados.
Por exemplo, a congruência entre as correlações originais e as correlações
forçadas da tabela 13.10, pode ser testada estatisticamente. Se as dife
renças entre as duas matrizes, mostradas na matriz residual da tabela
13.10, forem relativamente grandes, indicando falta de acordo entre
teoria e dados, o teste estatístico indicará. Se o teste estatístico não
mostrar significância, então, o acordo ou congruência será aceitável.
268
Finalmente, a estimativa das magnitudes dos valores dos coeficien
tes de um modelo — em análise de trajetória os coeficientes de trajetória,
por exemplo — é feita simultaneamente. No .exemplo de análise de
trajetória dado atrás, os coeficientes de trajetória foram calculados
sucessivamente. Por exemplo, no problema da figura 13.6 os coeficien
tes levando de SSE e Inteligência a n Realização foram calculados
primeiro e depois que os coeficientes de SSE, Inteligência e n Reali
zação a Realização foram calculados. Em análise de estruturas de cova
riância, entretanto, todos são calculados ao mesmo tempo, por assim
dizer, incluindo a estimativa das influências das variáveis latentes, se as
houver, e dos erros. Isto é, toda a informação é levada em conta de
maneira verdadeiramente multivariada. Deve ficar óbvio que a análise
de trajetória é um caso especial ,da análise de estruturas de covariância.
Como sempre, precisamos terminar a discussão com uma nota de
cautela. Embora poderosa, a análise de estruturas de covariância não é
a resposta perfeita aos problemas teóricos e analíticos. Não pode — ou
não devia poder — ser usado para análises comuns. É perda de tempo
e trabalho usá-la, por exemplo, para uma análise fatorial exploratória
comum. Deveria ser usada apenas para testar modelos teóricos relativa
mente complexos ou hipóteses alternativas complexas. Uma segunda limi
tação é que as suposições por trás de seu uso são bastante rigorosas,
tornando-a, pelo menos teoricamente, inaplicável em algumas situações
de pesquisa (por exemplo, com variáveis dicotômicas). Esta limitação do
sistema pode ser superada com o tempo. Há uma ou duas outras limi
tações, que vamos ignorar aqui. Em suma, a análise de estruturas de
covariância é uma estratégia rica, poderosa e um método de ataque aos
problemas de pesquisa, desde que estes sejam guiados pela teoria e
sejam de tal natureza que as suposições do método pdssam ser razoavel
mente satisfeitas. Pode-se dizer até que o método é um grande avanço
fia conceitualização e metodologia mostrando uma nova direção e sofisti
cação na pesquisa comportamental.
Conclusão
270
14. O c o m p u t a d o r
■Ái, DO
Não se pode compreender a pesquisa comportamental moderna sem
compreender o computador, uma das mais fortes influências contem
porâneas na pesquisa. Não é apenas pelo fato de mais problemas poderem
ser atacados hoje do que antes dos anos 50, os primeiros anos do compu
tador digital eletrônico de alta velocidade. A própria natureza dos proble
mas que estudamos é diferente; mesmo nossa abordagem a problemas é j UJ
i
diferente. O
Por exemplo, as técnicas analíticas multivariadas estudadas nos últi
mas capítulos são hoje facilmente alcançáveis pelo pesquisador porqug
há computadores, centros de computação, e programas multivariados dê:
computador a disposição. Sabendo disso, o pesquisador fica livre para
conceber uma enorme variedade de problemas de pesquisa que, digamos,
na década de 50 ele nem pensaria, simplesmente porque não havia meios
de fazer os cálculos necessários. A simples quantidade de cálculos, em
outras palavras, afetou drasticamente a natureza e a substância da teoria
e dos problemas.
O computador tornou-se tão intimamente ligado ao pensamento dos
esquisadores que é difícil fazer uma idéia da época em que eles não
E fdstiam. Eu me lembro bem deste tempo, mas agora penso como poderia
istir profissionalmente sem eles. E assim é com a maioria dos pesquisa-
ores psicólogos, sociólogos, economistas e educadores. Não podemos
imaginar o que é trabalhar sem um computador.
Vamos tomar um ou dois exemplos. Agora a análise fatorial é
usada quase rotineiramente para determinar o que os testes e escalas
medem. Pode-se construir um teste de aptidão, como Thurstone fez há
muitos anos atrás, e incluir o que se acredita ser três ou quatro tipos
271
de medidas de aptidão: verbal, numérica e espacial, por exemplo, O teste
mede realmente as capacidades especificadas? Um meio importante de
responder a esta pergunta é aplicando o teste a grandes números de
crianças ou adultos e depois analisar fatorialmente as correlações entre
os itens do teste. Lembre-se que análise fatorial, entre outras coisas, é
um método de análise que ajuda o pesquisador a determinar como os
testes ou medidas se agrupam. Determina também como os itens de
testes ou escalas se agrupam. Se alguns itens medirem, presumivelmente,
aptidão verbal e outros itens medirem aptidão numérica, então cada
conjunto deve se agrupar na análise. As correlações entre os itens verbais
deveriam ser positivas e ' substanciais, e as correlações entre cs itens
numéricos deveriam ser também substanciais, enquanto que a correlação
entre os dois tipos de itens, entre os presumíveis itens verbais e numéri
cos, deveria ser mais baixa (porque estão medindo coisas diferentes).
A análise fatorial, como já dissemos, faz tais análises satisfatoriamente
— com a ajuda do computador. (Veja capítulo 12, especialmente o
exemplo da escala de atitude e as tabelas 12.5, 12.6 e 12.7.)
Antes dos computadores entrarem em uso geral sabia-se — embora
não muito bem — que a análise fatorial de itens era necessária para
uma validade satisfatória e para outros estudos em mensuração. Tais
estudos, entretanto, eram raros, quase inexistentes.1 O simples volume
dos cálculos afastava essas idéias de consideração, embora alguns pes
quisadores se lembrassem dessa abordagem com melancolia. Assim, um
meio eficiente de se estudar a validade das medidas, de saber até certo
ponto o que realmente medem os testes e os itens era coisa virtualmente
inalcançável antes do moderno computador tornar-se comum. Hoje essas
análises são rotineiras.
No capítulo 11 vimos que a regressão múltipla é um meio poderoso
de estudar os efeitos juntos e separados de diversas variáveis indepen
dentes sobre uma variável dependente. Fazer regressão múltipla, aliás,
1 Em 1958 Kaya e eu (Kerlinger & Kaya, 1959) queríamos uma análise fatorial
das correlações entre os itens de uma escala de 20 itens de atitude a fim de
confirmar nossa idéia a respeito do domínio da atitude e dos itens. Nós mesmos
calculamos os 190 coeficientes de correlação em uma calculadora mecânica de
mesa. Nem é preciso dizer que levamos várias horas. Entretanto, o pensamento
de fazer análise fatorial nos amedrontava, embora ambos já o tivéssemos feito
“à mão". Levamos a matriz de correlação ao falecido Irwin Lorge, que tinha o
privilégio de possuir um dos primeiros computadores bem primitivos. Lorge fez
a análise fatorial, sem rotações ao custo de aproximadamente USS 600,00. O
trabalho levou horas, se bem me lembro. Kaya e eu fizemos as rotações à mão,
o que levou de 10 a 20 horas. Pode-se entender por que os pesquisadores hesi
tavam em planejar uma análise fatorial de itens. Hoje uma análise completa de
dados e itens semelhantes, de todas as estatísticas dos itens até as rotações de
eixos fatoriais, leva menos de 20 segundos no computador que uso atualmente!
272
fcsige a solução de diversas equações simultâneas. Um meio comum de
íe fazer isso exige o cálculo do inverso da matriz de correlações entre
as variáveis independentes. Fazer isto "à mão” com duas variáveis inde-
§endentes é fácil. Fazê-lo com. três variáveis independentes é mais difícil,
mas é possível. Fazê-io com quatro variáveis é muito mais difícil, perde-se
ftempo, é frustrante e pode-se errar. Um computador resolve facilmente
em questão de segundos. Até uma calculadora programável manual
pode manejar três variáveis independentes em cerca de dois minutos.
A questão é que os cálculos de um método poderoso como o da regressão
Jpúltipla estão agora à mão dos pesquisadores que não mais precisam
enfrentar a perda de tempo e as probabilidades de erro que as calcula
doras do passado ofereciam.
Mais um exemplo e, desta vez, um bastante complexo, que é a
análise de estruturas de covariância, descrita no capítulo 13. A análise
de estruturas de covariância é quase impossível de ser feita em uma
calculadora de mesa. Partes das computações são tão complexas que
podem ser feitas apenas por computador e isto em questão de segundos.
Assim podemos dizer que este método flexível, poderoso e frutífero de
abordar a teoria e o teste da teoria, tornou-se possível apenas com o
advento de computadores de alta velocidade. Sem dúvida, o método,
para começar, jamais teria sido concebido se seus autores não tivessem
trabalhado pensando na possibilidade do computador. E o mesmo serve
para quase toda análise multivariada com mais de, digamos, seis ou
sete variáveis. A influência do computador na pesquisa das ciências com-
portamentais tem sido muito grande. E estavamos falando apenas dos
efeitos dos cálculos. Os computadores tiveram grande efeito, natural
mente, em áreas não computacionais. Neste capítulo, vamos nos restringir
aos efeitos dos computadores em cálculos com números.
274
gorretamente e contanto que seu programa seja adequado. Infelizmente,
boa parte do que sai de um computador é inexato e até sem significado.
Mas isto não é culpa do computador; é culpa das pessoas que usam o
Computador. Grande parte desse rendimento questionável é provavel
mente devido a ignorância. Vamos voltar a este assunto mais tarde. O fato
é que os computadores modernos são de toda confiança, máquinas
exatíssimas em que se pode confiar para a maioria das análises em
pesquisa comportamental.
Entretanto, os computadores não são infalíveis. Não se pode confiar
inteiramente neles porque eles têm limitações. Se forem feitos cálculos
prolongados com números muito grande ou muito pequenos, os resultados
Üos cálculos podem exceder a capacidade do computador. Suponhamos
que eu tenha um pequeno computador com espaço para resultados não
maiores do que o número 1.000.000 ou sete lugares. Mas que eu tenha
que fazer o seguinte cálculo:
4672 X 543 + 117/0,005.
O resultado, naturalmente é maior que 1.000.000 e meu computador
não poderá resolver. Mas as capacidades dos computadores modernos
são maiores que 1.000.000, e eles podem acomodar a maior parte das
necessidades de computação das ciências comportamentais.
As vezes, entretanto, acontecem inexatidões, mesmo com os progra
mas mais bem escritos. (“ Programa” será definido mais adiante.) Por
exemplo, grande parte da análise multivariada depende de uma operação
matemática conhecida como inversão de matriz (já mencionada). O
inverso de uma matriz é como um recíproco ou um divisor ou um deno
minador em aritmética. Embora em álgebra se possa dividir facilmente
b por a, ou b/a, para produzir, digamos, c, ou c = b/a, não é possível,
em um sentido rigoroso, dividir u’a matriz de números por outra matriz
de números. Em vez disso, é calculada uma matriz inversa, e a primeira
matriz é multiplicada pela matriz inversa. Para se calcular inversos de
matrizes são necessárias várias multiplicações. Se os números forem
grandes, a capacidade do computador pode ser excedida. Se, como às
vezes acontece em análise multivariada, os números são pequenos — os
coeficientes de correlação são pequenos, e dois ou três multiplicados
juntos produzem números menores ainda porque são frações2 — então,
as muitas multiplicações poderão produzir números muito pequenos que
levarão a inexatidões e resultados confusos.
A confiabilidade do computador está relacionada a sua “ductili-
jiade” . "Ductilidade” significa “ tratabilidade”. Uma pessoa tratável faz o
275
que os outros querem que ela faça. Um computador faz o que a pessoa
lhe diz para fazer. Fazendo isso é estúpido: faz exatamente o que lhe
mandarem; jamais mostra inteligência ou senso comum. Não existe um
programador de computador que uma vez ou outra não tenha dito:
“Seu idiota! Não era isso que eu queria.” Então pode-se dizer que os
computadores são estúpidos e tratáveis. É uma característica excelente
porque significa grande confiabilidade e segurança. Também exige muito
das pessoas que usam e programam os computadores. Elas têm que
explicar tudo o que computador deve fazer para atingir qualquer meta.
E isto, naturalmente, não é fácil de fazer. Em resumo, um programador
não pode omitir nada. Um computador faz fielmente os erros que é
mandado fazer! Não faz nada mais nem nada menos do que mandam
suas instruções!
Outra característica dos computadores e da computação não é
realmente uma característica da máquina. Ê inerente às pessoas trabalhan
do com a máquina. Os computadores parecem exercer uma fascinação
infinita sobre muita gente. Isto é particularmente verdadeiro para quem
programa com êxito o computador para fazer um trabalho útil. O prazer
é como o prazer do pianista que aprendeu e toca uma peça musical
desafiadora ou um jogador de xadrez jogando com um oponente igual.
É como se se fosse empurrado para conquistar não apenas a análise
que se precisa mas também o computador e a própria pessoa. A preocu
pação intensa e a concentração exigidas parecem se unir em uma expe
riência psicológica altamente compensadora. Em resumo, os programa
dores de computadores muitas vezes ficam viciados, ligados ao compu
tador.
Esta característica leva a resultados produtivos. Resolvem-se proble
mas que não teriam solução sem tais investimentos de preocupação,
concentração, energia e tempo. Mas os resultados podem ser também
negativos. É possível alguém se absorver a tal ponto, programando a
máquina, chegando a se esquecer das razões porque a programou! Weizen-
baum (1976, capítulo 4) descreveu de maneira incrível os “picotadores”
(hackers) de computador, indivíduos que virtualmente vivem para e com
o computador. Eles não programam tanto quanto “picotam” . Embora
tecnicamente brilhantes — às vezes, seu conhecimento de computadores
e programação é profundo — , pouco estão ligando para o que estão
programando. Weizenbaum diz que têm uma preocupação neurótica
não tanto de resolver ou ajudar a resolver problemas importantes, mas
de dominar a máquina, adquirir poder.
O exemplo extremo de Weizenbaum é dado para ilustrar a incrível
fascinação desta máquina complexa e poderosíssima. Embora o “pico-
tador” de Weizenbaum seja u’a manifestação neurótica dessa fascinação,
resta dúvida de que muita gente, talvez a maioria dos que lidam freqüen-
276
temente com computadores, se torna obcecada. Não há nada de mal
em um interesse profundo; muitas vezes ele leva a realizações criativas.
Mas o computador tem uma dimensão a mais; ele é basicamente uma
ierramenta para auxiliar a resolver problemas. Se isto ficar esquecido na
preocupação com a máquina propriamente dita, então a coisa se torna
um jogo. A maioria dos jogos é inofensiva e sua perseguição com avidez
não prejudica ninguém. Mas a perseguição ávida ao computador sem
preocupação pela finalidade científica e técnica de seu uso, pode conduzir
a banalidades sem significado ou, pior ainda, à erosão dos valores
científicos.
277
mação, não precisamos lidar com a linguagem e suas diferenças. Mas
vamos discutir e ilustrar rapidamente a linguagem usada para programar
outra invenção notável, a calculadora programável de bolso. Essas lingua
gens “menores” têm a virtude de uma relativa simplicidade, considerável
flexibilidade e capacidade. Além disso, as calculadoras programáveis
estão se tornando muito comuns e logo serão mais amplamente usadas
e bastante acessíveis a qualquer bolso. Sem dúvida, dentro de cinco
anos elas provavelmente preencherão diversas necessidades dos pesquisa
dores comportamentais para cálculos menores.
Fortran é uma língua intermediária — assim como o Algol, o Pascal
e outras linguagens semelhantes — que permite ao pesquisador se comu
nicar com o computador. Usa alguns comandos ou afirmativas básicas
em inglês, como: READ, WRITE, GO TO, CONTINUE, DO e IF.
Esses comandos podem ser entendidos literalmente: read (leia) tais e
tais dados; write (escreva, ou imprima) os resultados, go to (vá para)
uma outra parte do programa, if (se) uma quantidade computada for
positiva (por exemplo), go to (vá para) tal parte do programa, mas if
(se) for negativa ou igual a zero, go to (vá para) tal outra parte do
programa. A força e flexibilidade das linguagens de computador não
podem ser exageradas. Quase não existe operação lógica ou numérica
que não possa ser realizada com ele.
Suponhamos que desejamos somar dois números, 6 e 4, e pôr o
resultado em um lugar de armazenagem rotulado SUM. Uma instrução
Fortram para fazer isto, é:
SUM = 6 + 4
Mas isto é limitado demais porque certamente vamos querer usar a opera
ção de adição novamente. Então escrevemos:
SUM = A + B
Agora, quaisquer dois números podem ser lidos pelo “leitor” do compu
tador e podem ser armazenados nos “lugares” chamados A e B. Então
A e B.poderão ser usados mais tarde em quaisquer operações aritméticas
assim como adição. As outras operações aritméticas são manejadas da
mesma forma. Por exemplo, a multiplicação e a divisão são feitas da
seguinte maneira:
RESULT1 = A * B (multiplicação)
RESULT2 = A/B (divisão)
(O asterisco é a versão Fortran para "x”, multiplicar. “/ ” é a versão
Fortran para ” dividir.) As operações são combinadas facilmente,
como a combinação seguinte das quatro operações aritméticas básicas:
278
RESULT3 = ((RESULT1 + RESULT2) * A) / (A — B)
Se A = 6 e B = 4, então RESULT3 = 76,50.)
Este uso da Fortran em nível tão baixo, embora não seja particular
mente interessante ou poderoso, ilustra três pontos importantes relativos
a Fortran e à programação. Primeiro, as equações Fortran não são como
as equações algébricas comuns. Elas sempre querem dizer que o enun
ciado à direita é colocado no “lugar” marcado à esquerda. Um termo
apenas pode ficar à esquerda, qualquer número de termos ou expressões,
à direita. O enunciado SUM = A + B, acima, significa: No lugar
chamado SUM coloque a soma de A + B. Segundo, o resultado de uma
operação pode ser rotulado de quase qualquer coisa, desde que sejam
satisfeitas duas ou três regras simples (por exemplo, o nome pode ter
de uma a sete letras, números ou ambos: C, SUM, RESULT2, e assim
por diante).
Terceiro, os computadores modernos têm muita capacidade de
armazenagem, e os lugares de armazenamento são alcançados simples
mente por seus nomes ou rótulos. No exemplo acima, cada um dos valo
res, A, B, SUM, RESULT2 e RESULT3, está armazenado em lugares dife
rentes e facilmente acessíveis e rotulados como indicado. A armazenagem
e os lugares de armazenamento do exemplo acima podem ser concebidos
assim (embora não seja realmente feito assim): i.;
\-JLi
o t;
— ------- ---------- r _ - < P
O -4
6 4 10 24 1,50 76,50 Ci p
C& l
10 (Read in N.)
SUMX = 0.0 (Inicializa SUMX)
30 1 = 1 + 1 (Ajusta I para 1.)
40 (Read in X (I).)
100 SUMX = SUMX + X (I) (Soma Xi a SUMX)
105 IF (I.L.T.N) GO TO 30 (Enunciado condicional:
veja o texto)
AN = N (Põe N em AN)
107 AVER = SUMX/AN (Calcula a média)
110 (Print SUMX and AVER.)
END
280
O computador volta agora à afirmativa 30, que soma 1 a I de
povo. No 40, é lido X (2), e no 100 é somado a SUMX. Se X (1) = 15 e
X (2) = 17, então SUMX agora é igual a 32. É feito novamente o teste
no comando 105, e uma vez que I, ou 2, é menor do que 100, o compu
tador volta novamente para 30. I é novamente incrementado, o X (I)
|eguinte é somado a SUMX, novamente é feito o teste em 105 e nova
mente o computador volta para 30. O procedimento continua até o 100.°
X, ou I = 100. Depois que X (100) é somado a SUMX, é feito nova
mente o teste IF na afirmativa 105, mas desta vez, já que I == 100
e, portanto, não é menor do que N, o computador não voltará a 30.
Em vez disso, continua até depois de 105.
A continuação do programa calcula simplesmente a média, chamada
AVER, depois de converter N em AN, o. que é feito para mudar o número
inteiro N em um número decimal para que a aritmética de SUMX/AN
possa ser feita. (Em Fortran, denominações de variáveis que começam
com I, J, K, L, M e N, são variáveis de números inteiros; todas as outras
são variáveis decimais. O leitor não precisa se preocupar com esta
distinção.) É calculada então a média AVER, no comando 107 e SUMX
e AVER são impressos pelo comando 110 (não dado). O programa e os
cálculos terminam então com a instrução END.
Isto é suficiente para dar ao leitor um pouco do gosto da linguagem
de um computador, como a Fortran, e uma idéia e como o computador
“trabalha”.
A princípio o procedimento pode parecer enfadonho, mas funciona, e
muitíssimo bem. Em um computador de grande porte, ò programa acima
tomaria apenas um ou dois segundos. Além disso, poderiamos facilmente
somar os quadrados de todos os X, calcular a soma dos quadrados, o
desvio padrão, se desejássemos e com pouquíssimo acréscimo de tempo
do computador. Ler os dados e imprimir os resultados levam mais tempo
do que os próprios cálculos, que são feitos tão rapidamente que se
apertássemos o botão para iniciá-los, eles estariam feitos antes de soltar
mos o botão!
Seria quase tolice usar computador tão grande para computações
tão simples. Se em vez de um X, tivéssemos 30 X’s, ou variáveis, e
quiséssemos calcular todas as médias, desvios padrão e correlações entre
os X ’s, não seria tolice. E isto é feito fácil, rápida e exatamente com
uma programação Fortran (ou outra). Naturalmente, o programa será
mais complexo. E se alguém quiser fazer outras análises, como análise
fatorial ou análise de regressão múltipla, então, o programa torna-se
mais longo e complexo. (Mostramos apenas uma pequena fração das
possibilidades da Fortran.) Entretanto, os procedimentos básicos são
■Semelhantes.
Computadores-calculadores programáveis
282
ser rotulado, A, B, e assim por diante: LBL A, LBL B. Nosso programa
tem dois subprogramas, A e B. O objetivo de A é somar os X e determi
nar o número de casos, N. O objetivo de B é calcular a média. Ambos
são feitos facilmente com seis comandos apenas. Em A, STO + 1 é
equivalente ao comando Fortran SUM = SUM + X (I). Toma um
número digitado pelo usuário e soma-o ao conteúdo da locação 1. Se X
fosse necessário a uma operação posterior, poderia ser armazenado para
esse fim. Isso poderia ter sido feito inserindo-se o comando STO 3 (ou
STO 4, STO 5) imediatamente após LBL A e antes de STO + 1.
Os dois comandos, 1 e STO + 2, são um “contador”. Eles incre
mentam os casos na locação 2. O número que estiver antes de STO + 2
sera somado áo conteúdo do lugar de armazenagem 2. Quando todos os
X’s tiverem eiitrado, a locação 2 conterá N, o número de casos. A afirma
tiva RCL 2 significa “Recall 2,” ou “chame tudo o que estiver na loca
ção 2”. Isto é conveniente porque mostra ao usuário qual é o número de
casos. A instrução RCL 2, em outras palavras, traz o que estiver em
2 para o display. A afirmativa final de LBL A é RTN, ou “volte”
(return). O computador interrompe a execução do programa e volta ao
início de LBL A.
Usando computadores grandes, grava-se (perfura-se) os X em cartões
ou fitas, e o computador os lê. Em calculadoras pequenas programáveis,
os X’s são digitados (embora haja um meio para a calculadora ler dados
de cartões plásticos). Com nosso pequeno programa, digita-se o primeiro
X ou X! e depois aperta-se A. A calculadora toma o valor introduzido e
soma ao conteúdo da locação 1. Se, por exemplo, introduzirmos 15,
este 15 ficará na locação 1. 1 é somado à locação 2, ou 0 + 1 = 1.
Isto é chamado de volta da locação 2 e mostrado. A calculadora volta
então a LBL A, pronta para nova entrada X. Vamos dizer que X2 seja 21.
Este é somado ao conteúdo da locação 1, ou 15 + 21 = 3 6 , e 3 6 fica
na locação 1. Novamente 1 é somado à locação 2, ou 1 + 1 = 2.-
Quajndo todos os X tiverem entrado, digamos, 40, aperta-se a chave
B que ativa LBL B. B chama de volta os conteúdos das locações 1 e 2,
e divide o primeiro pelo segundo ou, SXi|N, a média, naturalmente, que
aparece no display. Fica também depositada na locação 3 pela instrução
STO 3 para provável uso futuro. Se 0 programa for necessário para
cálculos semelhantes no futuro, pode ser gravado num pequeno cartão
plástico (já mencionado), guardado e usado em outra ocasião, introdu
zindo simplesmente o cartão na máquina. O programa assim escrito, está
■pronto para operar com dados novos, assim como um programa Fortran
é gravado em cartões ou fita e pronto para ser usado quando necessário.4
283
Outros usos e operações dos computadores
284
maior do que a entrada apropriada na tabela t — há muitos t’s na tabela
correspondentes aos números de casos nos grupos experimentais ^ o
resultado é considerado estatisticamente significante. (Para mais discus
sões desses testes estatísticos, veja o Apêndice no fim do livro.)
Os livros de estatística sempre contêm tabelas t — e outras tabelas
, usadas com testes estatísticos. Estritamente falando, entretanto, o compu
tador tornou tais tabelas obsoletas parcialmente. O computador pode
calcular de maneira bastante exata o t específico de que se necessita.
Tudo o que é preciso é o que se denomina uma sub-rotina para fazer a
aproximação necessária.5 Os valores tabelados para os diferentes t são
valores de distribuição. São valores esperados por acaso para vários N’s.
Suponhamos que o pesquisador obtenha uma diferença entre duas médias
e calcula t, que, digamos, é 3,714. Procurando a entrada apropriada na
tabela ao nível de significância de 0,05, ele encontra que o t na tabela é
2,010. Seu í é 3,714, maior do que o da tabela. Já que a entrada de
2,010 na tabela é o valor esperado por acaso — o valor esperado se
houvesse apenas uma diferença casual entre as duas médias , eles
podem concluir que as duas médias são significantemente diferentes.
O cálculo de valores de distribuição, como para a distribuição t, é
difícil porque envolve cálculos tediosos. O computador calcula valores da
distribuição usando procedimentos de aproximação sucessiva. (Uma
forma simples de tal procedimento vem ilustrada adiante.) Dentro de
alguns anos os programas de computador que incluam distribuições esta
tísticas provavelmente terão tais procedimentos de aproximação “embu
tidos” na maioria dos programas estatísticos. Quando um t, por exemplo,
for calculado, o computador calculará também, através de um procedi
mento de aproximação, a probabilidade que o t calculado (calculado
dos dados) ocorra por acaso. Por exemplo, a aproximação da probabili
dade que í = 3,714 tenha ocorrido por acaso é apenas de 0,0003, ou
3 chances em 10.000. Fiz uma HP-67 realizar os longos cálculos repeti
tivos _ muitos loops, aliás, para efetuar a aproximação — usando um
programa fornecido pela companhia. A calculadora levou cerca de 30
segundos para fazer o trabalho. Um computador grande faria o mesmo
trabalho em muito menos tempo, numa pequena fração de segundo
Em resumo, embora as tabelas de valores de distribuição talvez não se
tornem obsoletas, elas não serão tão úteis e necessárias quando são
agora.
285
U m e x e m p lo d e a p r o x im a ç ã o : r a iz q u a d r a d a
286
quadrada se deseja é introduzido na calculadora. A calculadora divide
este número por 2. Isto é ineficaz, mas sempre funciona. A calculadora
então usa o algoritmo acima sucessiva e repetidamente ate obter a ra_iz
quadrada. O processo geralmente convergirá rapidamente para a solução
correta.
Para ver como funciona, vamos pôr 15 na máquina. As iterações
sucessivas — eu fiz a calculadora parar depois de cada loop para poder
ver o resultado de cada iteração e assim cada aproximaçao antes das
soluções finais — eram:
15
4,75000 1/2 7,5 +
7,5 / J
15
3,95395 1/2 4,75 +
4,75
15
3,87381 1/2 3,95395 +
3,95395
15
3,87298 1/2 3,87381 +
3,87381
397,96785
200,97890
104,43979
59,82175
43,18256
39,97684
39,94831
39,84810
287
e 39.848102 = 1587,8714. Note como os números sucessivos convergem
para o número final correto. O procedimento funciona com números
menores de 1? Tente V 0,75. As iterações resultantes:
1,18750
0,90954
0,86707
0,86603
e
0,866032 = 0,75.
288
algoritmo programado e, talvez, o hardware para o logaritmo não funcio
nem tão depressa como para tirar a raiz quadrada.
289
negligenciadas. Hoje tal negligência é muito menos provável. Embora
estes melhoramentos não sejam inteiramente resultantes da disponibili
dade dos computadores, há pouca dúvida de que os computadores ajuda
ram a dar condições possíveis para melhoramento. Em resumo, o compu
tador libertou o pesquisador para coisas melhores.
A terceira influência benéfica do computador é mais sutil. A simples
presença de um centro de computação, que a maioria dos pesquisadores
acabará usando, afeta a vida e o pensamento de todos os que o cercam.
É uma manifestação física da matemática, ciência, pesquisa e tecnologia.
Seu staíus, como manifestação de uma das mais altas realizações tecno
lógicas e intelectuais, é uma lembrança constante dos valores que influen
ciam nosso pensamento e nosso trabalho. O grande investimento feito
pelas universidades — e outras instituições e organizações sociais — em
computadores e pessoal técnico, penetra as vidas dos pesquisadores. E um
des principais valores é a solução objetiva de problemas e comunicação.
O computador é, então, um poderoso símbolo de intelectualidade, princi
palmente intelectualidade científica. Como tal, ele reforça e apoia normas
e critérios científicos e intelectuais. Não é de admirar que pintores,
^escritores, historiadores e filósofos se preocupem com ele. Eles temem
que sua influência poderosa possa desequilibrar a universidade e até a
sociedade. E eles podem ter razão.
A quarta influência já foi mencionada neste capítulo. Os problemas
de pesquisa que não podiam ser prontamente abordados, estão agora ao
alcance. Já mencionamos análise fatorial e outras formas de análise
multivariada. Vamos tomar um exemplo bem diferente ainda não discu
tido aqui: a análise de conteúdo. Os cientistas políticos, historiadores,
psicólogos e sociólogos, entre outros estudiosos, sempre analisaram mate
rial documentário a fim de estabelecerem fatos e tendências e para estu
dar relações. Este estudo documentário é extremamente laborioso. Os
historiadores poderíam passar meses ou anos em bibliotecas para estuda
rem e documentarem um assunto. Sem dúvida, a imagem do intelectual
sempre foi a da pessoa que mais ou menos cava, vasculha e grava
pacientemente os resultados de suas escavações. Grande parte do trabalho
de um estudioso era deste tipo. Embora cansativo, não era possível de
ser evitado.
Graças ao computador e ao desenvolvimento da análise de conteúdo
dentro das ciências comportamentais, a abordagem do intelectual, sua
perspectiva e tjrabalho estão mudando drasticamente — ou talvez eu
deva dizer, mudarão drasticamente porque muitos estudiosos ainda não
foram afetados. Jamais haverá um verdadeiro substituto para o julga
mento humano que o estudioso tem que fazer constantemente. E provavel
mente sempre haverá uma certa quantidade de trabalho maçante. Mas o
computador pode eliminar muito desse trabalho maçante. Com uma
290
lista bem feita de conceitos-chave, nomes e assuntos, o levantamento
bibliográfico feito por computador — depois que a própria bibliografia
foi posta nos bancos de memória do computador — é agora possível.
A carga da pesquisa bibliográfica será grandemente aliviada. Depois
que o estudioso seleciona as fontes que deseja na lista que o computador
fornece para sua pesquisa, o computador pode ainda reproduzir a fonte
ou expedir instruções para fazê-lo.
Vamos tomar um exemplo mais interessante. Análise de conteúdo
é um método de analisar e estudar as comunicações — documentos de
toda espécie, inclusive documentos existentes e documentos produzidos
deliberadamente para fins.de pesquisa, livros, cartas, etc.. . de
modo sistemático, objetivo e quantitativo para medir variáveis ou realizar
outros propósitos de pesquisa. Suponhamos que desejamos estudar os
sistemas de valores de grupos ou países diferentes e que certas palavras
ligadas a valores foram descobertas em pesquisas anteriores como capazes
de diferenciar grupos sociais, palavras como igualdade, disciplina, reali
zação, religião e liberdade.
Um “ dicionário” de tais palavras pode ser colocado na memória
do computador. Amostras aleatórias de publicações-chave — editoriais,
discursos políticos e artigos de revistas, por exemplo em diferentes
países podem ser analisados. Seleções inteiras são perfuradas nos cartões
e lidas no computador. O computador examina os cartões, destaca as
palavras relativas a valores que foram colocadas em seu dicionário,^
depois analisa os “dados” contando, categorizando e calculando as esta
tísticas apropriadas. O grande trabalho de estudar e analisar os texto§
é evitado e o pesquisador pode se concentrar no que é impor ntfe
a teoria por trás do trabalho, o “dicionário” e seu conteúdo, a seleção
dos materiais para análise e outros assuntos substantivos e metodologicós.
Outro benefício dos computadores é que pessoas trabalhando em
diferentes campos entram em contato não apenas com os especialistas
de computadores, mas também com trabalhadores de outros campos.
Acontece, ocasionalmente, que um pesquisador, diante de um problema
analítico ou de computador desconhecido em seu campo, descobrirá com
alguém de outro campo que o problema já foi resolvido. Isto acontece
especialmente no contato com matemáticos. A maioria dos pesquisadores
comportamentais não se destaca por seus pendores matemáticos e as
vezes tomam conhecimento de que um problema analítico que os con
funde já fci resolvido por matemáticos ou estatísticos matemáticos.
O último benefício a ser mencionado vem do caráter internacional
dos computadores e da ciência da computação. As linguagens de compu
tadores, embora escritas em inglês, ou no que pode ser chamado de
uma forma de inglês, são na verdade, internacionais. No mundo inteiro,
os programas são escritos em Fortran, Algol e outras linguagens de
computador. As instalações de computador compartilham programas
internacionalmente. Certos pacotes de programas muito conhecidos e
usados podem ser encontrados nas universidades de Nova Iorque, Berkeley
e Amsterdã, para mencionar três instalações muito distantes. É também
muito comum usuários e especialistas de computadores de diversos
países se encontrarem em centros de computação e muitas vezes compar
tilharem seu conhecimento e know-how. A palavra ''Computador” e
certas outras a ela relacionadas, tornaram-se parte de línguas naturais.
Como a música e a matemática, a linguagem de computador é uma
espécie de linguagem internacional.
O efeito deste intercâmbio e influência internacionais ajuda a demo-
lir barreiras nacionais e sociais. Naturalmente, a ciência e a tecnologia
sempre tiveram esse caráter internacional e às vezes ajudaram a destruir
barreiras. A influência do computador pode ser maior, entretanto, pela
necessidade de as instituições terem centros de computação e know-how
fisicamente presentes dentro ou próximos das instituições. Os benefícios
para as ciências comportamentais vêm principalmente do crescente com
partilhar de metodologias — a análise de estruturas de covariância discu
tida no capítulo 13 é um excelente exemplo — e conhecimento ampliado
da teoria e pesquisa.
As desvantagens do computador foram muito discutidas por vários
observadores. Elas são complexas e muito menos óbvias do que as vanta
gens no sentido em que seu caráter negativo e até sua influência nociva
sao mais discutíveis. Veremos por que quando discutirmos e examinarmos
duas ou três delas.
A. primeira e mais óbvia desvantagem do computador é sua possível
violação do sigilo. Uma das regras ou valores importante que governam
a pesquisa da ciência oomportamental é que toda informação sobre
indivíduos e grupos é confidencial. A privacidade e os direitos dos indi
víduos devem ser cuidadosamente salvaguardados. Os dados coletados
sobre indivíduos não devem ser identificáveis. Mas se os nomes dos indi
víduos entrarem no computador com seus dados, torna-se muito fácil a
indivíduos ou organizações inescrupulosas obterem informações indivi
duais e violarem a privacidade e os direitos de indivíduos e grupos.
Infehzmente isto foi feito e o computador levou a culpa. O problema terá
que ser resolvido se este importante valor tiver que ser preservado.
A segunda influência nociva vem dos problemas levantados pela
pergunta. Os computadores podem pensar? De chofre, a maioria das
pessoas sensatas responderá prontamente — Não, é claro que os computa
dores não pensam — pelo menos como o ser humano “pensa”. O
problema é que a pergunta e sua resposta são muito complexas. É certo
que os computadores só fazem o que são instruídos para fazer. Mas as
vezes não se sabe direito para o que foram instruídos. Além disso, sua
292
busca incessante e implacável de possibilidades lógicas pode dar resul
tados surpreendentes. Isto é, os resultados de certa linha de pensamento
não podem ser conhecidos porque as possibilidades são muitas. Levaría
mos semanas, e até anos, para explorar algumas possibilidades apenas.
Mas podemos escrever um programa e instruir o computador a explorar
as possibilidades e imprimir os resultados. Em outras palavras, onde uma
pessoa pode levar adiante um procedimento apenas por tempo limitado
e com possibilidades limitadas, um computador pode segui-lo por minu
tos, horas e até dias (com grande despesa, claro) e explorar muitos
mais e até todas as possibilidades. Isto é “pensar"? Se não for pensar,
precisamente, é coisa muito parecida.
A capacidade do computador fazer operações repetitivas e variadas
a alta velocidade então, ajuda seus usuários a acompanhar as conseqüên-
cias de idéias e modelos complexos. Este grande poder tem uma aura
de magia que deixa muita gente desconfiada ou até com medo dos
computadores. Além disso os computadores podem simular processos
de pensamento humano com grande sucesso. Um exemplo famoso é um
programa de computador que pode demonstrar teoremas lógicos. Estas
demonstrações às vezes são muito difíceis até para especialistas em lógica.
O computador pensa quando resolve esses problemas? Um exemplo mais
conhecido e mais famoso é a incrível capacidade que o computador tem
para jogar xadrez. Os computadores podem derrotar a maioria dos joga
dores de xadrez (mas não os melhores). Eles “pensam" quando fazem
isso?.
O assunto é altamente controvertido e discqtível. Alguns dizem que
o “pensamento” de um computador é indistinguível do das pessoas. Ou
tros, que há uma diferença profunda. Provavelmente não haja uma solu
ção satisfatória para a dificuldade, querendo isto dizer que não é possível
responder à pergunta, Os computadores podem pensar? (A pergunta foi
até considerada sem sentido.) Talvez a melhor resposta tenha sido a
de Turing (1956), que anos atrás disse que para testar a pergunta é só
dar o problema que estiver exigindo pensamento a um computador e a
um especialista humano. Se um observador especializado não puder
discernir nenhuma diferença fidedigna nas soluções apresentadas, então
o computador pode “pensar” . Há pouca dúvida de que muito do que
os computadores fazem parece ser uma forma de pensamento. E não há
dúvida também de que os computadores podem simular efetiva e repeti
damente conhecidas características do pensamento humano. Vamos deixar
este problema embaraçoso e voltar a assuntos mais fáceis — com enorme
alívio, confessemos. 1*
7 O leitor pode ter uipa visão geral dos problemas envolvidos lendo Lindsay e
Norman (1977, pp. 593-599) que analisaram um problema particular chamado
Outra desvantagem do computador tem suas raízes na relativa facili
dade de uso do computador, a grande e fácil disponibilidade dos chama
dos “pacotes” de programas e a força e velocidade das máquinas moder
nas. Estas caracterítsicas e condições possibilitam aos indivíduos com
insuficiente conhecimento dos métodos usados, produzir análises que
podem e, às vezes, são absurdas. Tais usuários dependem muito de que
o computador faça por eles seu trabalho e pensamento. O mau uso de
pacotes de programa de análise fatorial é um exemplo freqüente e proble
mático. Métodos objetivos para análise fatorial convenientes para uso
em computadores foram elaborados e são amplamente acessíveis. O pro
blema é que um método completamente objetivo nem sempre produz uma
solução satisfatória para um problema de análise fatorial. O julgamento
humano tem que entrar no negócio em dois ou três lugares cruciais.
Por exemplo, uma parte importante da análise fatorial é o número
de fatores a serem rotados depois da extração dos fatores. (Veja no
capítulo Í2, nota de rodapé número 4, uma breve explanação de fatores
rotados.) Não há resposta completamente satisfatória para a questão:
Quantos fatores devem ser rotados? Há respostas e métodos objetivos,
mas que podem dar respostas enganadoras senão completamente erradas.
O único meio bastante satisfatório no presente envolve métodos objetivos
e o julgamento do pesquisador. A desvantagem, então, é a tendência dos
pesquisadores se tornarem dependentes demais do computador e, em
fazendo isto, perderem a compreensão real dos dados e da metodologia
com que trabalham, e abandonar o controle sobre sua pesquisa e seus
resultados.
Mais insidiosa e prejudicial é a forte tendência dos usuários dos
computadores em todo mundo, de depender dos chamados “pacotes” de
programas para a solução de seus problemas analíticos. Um “pacote” é
um programa generalizado que pode manejar todos os problemas de certo
tipo. É escrito para ser "geral” para uma classe de problemas analíticos;
meu problema, o seu problema e o problema dos outros podem ser feitos
com ele. Por exemplo, há "pacotes” para fazer análise fatorial, análise
de regressão múltipla e alguns deles são muito bons, sem dúvida. Outros
têm aspectos questionáveis. Muitos dos usuários de tais programas sabem
pouco ou nada a respeito do computador e do que ele pode ou não
pode fazer; e, pior, eles sabem pouco a respeito dos métodos empacota-
294
dos nos programas. Dependem totalmente dos programas do computa
dor. Os terríveis resultados se mostram repetidamente. Ocorreu a pouca
gente, mesmo a pesquisadores, que tamanha dependência é perigosa, e
até perniciosa. Ela não leva apenas a resultados incorretos e confusos;
ela enfraquece a capacidade de muitas pessoas potencialmente talentosas.
Baixa ainda a qualidade geral da pesquisa nas ciências comportamentais.
A desvantagem final a ser discutida é a mais enganadora, complexa
e difícil de ser descrita. O poder, a aplicabilidade universal e a tremenda
velocidade do computador ajudam a gerar espanto e medo em muita
gente. (Naturalmente, quando a automação torna o trabalho obsoleto,
seguem-se a aversão e o ódio.) O computador é encarado como uma
força misteriosa cujo efeito derradeiro será o de destruir a humanidade.
O trabalho do computador e as pessoas que o usam são olhadas como
perigosas ameaças à integridade e peculiaridade existencial de homens
e mulheres. Em resumo, o computador, muitas vezes junto com a ciência,
é percebido como um inimigo da humanidade.
Fato e ficção se unem aqui. O fato é que tais- atitudes são muito
reais e exercem grande influência (veja Lee, 1970, para um estudo
de âmbito nacional de tais atitudes). A ficção é que o computador, essen
cialmente uma máquina, embora potente é antropomorfizado; recebe uma
“realidade” e um “poder” que não possui. Os computadores não desuma-
nizam as pessoas; as próprias pessoas se desumazinam. Os computadores
são produtos humanos e uma parte da estrutura social; devem ser contro
lados pelos homens e mulheres e pela estrutura social. Se a desumaniza-
cão for uma ameaça, então preste atenção a coisas mais profundas do
que .o computador.
Corno sempre, a resposta, se é que há uma resposta, não é culpar a
ciêrtôia, a tecnologia, os métodos e os computadores pelas mazelas huma
nas. Embora não haja dúvidas de que o homem e seus poderosos produtos
ajudam a formar os seres humanos, também não resta dúvidas de que
os males da sociedade são curados apenas pelos homens e mulheres
trabalhando juntos para efetuar curas.
Esta homilia por demais moralista nos leva a nossos últimos capítu
los. Neles discutiremos algumas das importantes e controvertidas questões
associadas à ciência e à pesquisa. Veremos que o computador é apenas
uma pequena parte de um maior e mais difícil complexo de problemas.
15. Concepções errôneas e controvérsias:
questões metodológicas
Objetividade
296
cialistas sobre o que está sendo observado. Isto significa que a ciência
procura afastar os procedimentos científicos das preocupações humanas.
Todas as formas de conhecimento são influenciadas por valores, atitu
de e outras predileções. Jamais é possível ser-se completamente objetivo.
Em outras palavras, a objetividade é sempre uma questão de grau. Mas
a ciência insiste no ideal e no critério da objetividade como sendo indis
pensável. Sem objetividade não pode haver ciência.
Como ficou salientado no capítulo 1, o critério de objetividade
permite aos cientistas saírem de dentro de si próprios. Eles estabelecem
procedimentos “lá fora”, longe de si mesmos. A idéia é proteger os proce
dimentos de predileções e influências. Esta é a essência e o núcleo de
métodos científicos empíricos. Um dos testes de objetividade é se, a
partir de uma descrição de uma pesquisa, um outro investigador compe
tente é capaz' de replicá-la. Se for possível e se os resultados forem os
mesmos ou semelhantes, isto é apoio parcial para a “validade” da pes
quisa. A objetividade é uma das razões principais porque as explicações
científicas, apoiadas por evidência empírica objetiva, são consideradas
mais dignas de confiança do que outros métodos de se obter conheci
mentos.
As críticas à objetividade vão desde as mais ingênuas às mais sofisti
cadas. O núcleo da crítica, entretanto, parece tomar duas formas. A pri
meira já foi mencionada e discutida no capítulo 1. A objetividade, dizem,
leva ao distanciamento, à frieza, à inumanidade. O distanciamento e
a frieza da ciência destroem os valores humanos e desumanizam o
homem. Assim, a ciência é fundamentalmente perniciosa. Além disso,
não se pode confiar em conhecimento adquirido em sistema tão desumano
porque a ele falta sabedoria verdadeira e profunda, que vem apenas
da percepção intuitiva de verdades espirituais e humanas. A ciência é
reducionista: ela reduz o todo essencial dos seres humanos e o mundo
para dissecar fragmentos de conhecimento, que são, em essência, distor
ções da realidade. Os psicólogos, em tentativas objetivas de estudarem
a inteligência e a personalidade humanas, não compreendem a própria
essência da inteligência e personalidade, todos indivisíveis e impossíveis
de serem reduzidos ,a conceitos e números. A objetividade, em vez de
ser uma ferramenta neutra para o cientista, é de fato um poderoso inimigo
do homem e da verdade — pelo menos é o que dizem.
O segundo argumento é mais sofisticado e exerce maior influência,
principalmente na Europa, onde faz parte dos ataques marxistas^ à
objetividade. Diz-se — com bastante verdade, por sinal — que ninguém
pode ser verdadeiramente objetivo. Quando os cientistas colocam a
objetividade como um ideal, estão enganando-se a si próprios e aos
outros. Todos nós, inclusive os cientistas, somos conduzidos por nossos
valores e motivos. Não podemos ser objetivos. Marxistas e ideólogos
semelhantes vão mais além. Dizem, por exemplo, que os valores da
sociedade influenciam as hipóteses e as pesquisas de cientistas burgueses
e, se esses valores forem corruptos, como o são na sociedade capitalista,
então a pesquisa e os resultados são inevitavelmente corruptos. A objeti
vidade, então, é um mito burguês; é uma arma de opressão.
Dizem ainda que é mais importante conhecer a história de uma
hipótese do que testá-la. Isto significa que o que é importante é a história
e a origem das hipóteses na ciência capitalista ocidental. Quem formula
as hipóteses é a pergunta-chave. Elas vêm de cientistas apoiados pelo
establishment? Se assim for, elas são tendenciosas e suspeitas. Este tipo
de raciocínio e o raciocínio menos ideológico de críticos da pesquisa
comportamental sociológica e psicológica se juntam em seu ataque à obje
tividade.
No capítulo 1 foi respondido um argumento relacionado. Vamos nos
limitar aqui a breves observações centralizadas principalmente na con
fusão de duas definições de objetividade. A definição científica de objeti
vidade ficou dada atrás e elaborada no capítulo 1: acordo entre juizes
especialistas, “juizes” sendo definidos como pessoas ou máquinas. A
essência desta definição se refere a procedimentos, ela é de ordem meto
dológica: dá uma regra geral metodológica. A regra, em essência, diz:
todos os procedimentos devem ser públicos; devem ser replicáveis; devem
estar separados do investigador. E isso é tudo que significa.
Os críticos da objetividade, entretanto, baseiam seus argumentos
numa definição que se concentra no investigador. Eles, ou pelo menos
seus argumentos, pressupõem que a objetividade seja uma característica
ou traço cientista. Eles estão dizendo, com efeito, que os cientistas
reinvindicam a objetividade para si próprios, que eles, como classe de
indivíduos, são mais objetivos do que os não-cientistas. Eu estou exage
rando um bocado e sei que algumas críticas à objetividade são mais
sofisticadas do que indica o meu resumo de seus argumentos. Entretanto,
a confusão causada pela definição implícita ou explícita de objetividade
como um traço dos cientistas impede a comunicação e enfraquece a
compreensão de objetividade como um procedimento científico.
Os cientistas não reivindicam nenhuma objetividade pessoal (natu
ralmente há exceções). Eles insistem na objetividade como um procedi
mento metodológico que pode e deve ser colocado à parte dos cientistas
e suas predileções. Em resumo, os procedimentos devem ser públicos.
Os argumentos contra a objetividade expostos acima, não tocam neste
ponto. O primeiro argumento, de que a objetividade é distanciada, fria
e desumana, é correto. E tem que ser desta forma. É precisamente esta
separação da pesquisa científica das preferências humanas, aliada à
insistência em testes objetivos empíricos das hipóteses — que, uma vez
enunciados publicamente, ficam eles próprios fora dos seres humanos —
298
que aumentou de maneira tão notável nosso conhecimento. Que a objeti
vidade leva à destruição de importantes valores humanos, faz parte de
uma mitologia mais ampla. Sem dúvida, a prática da ciência leva ao
desafio de valores estabelecidos por causa de sua natureza básica de
indagação crítica. Mas que destrua valores humanos ou o próprio homem
é absurdo. Se os valores ou os homens tiverem que ser destruídos, os
homens farão isso. Os procedimentos podem nos desumanizar apenas
quando permitimos que o façam.
O segundo argumento também tem pouco peso, a não ser com
aqueles que querem acreditar nele. Naturalmente todos nós somos influen
ciados por nossas preferências. O fato de podermos ou não ser pessoal
mente objetivos é discutível. Mas a questão não é esta. A questão, como
já observamos, é que os procedimentos da ciência são objetivos — e não
os cientistas. Os cientistas, como todos os homens e mulheres são cpináti-
cos, dogmáticos, ideológicos — influenciados pelas forças que influen
ciam a todos nós. Esta é a verdadeira razão para insistir em objetividade
de procedimento: levar a questão para fora de nós mesmos, sujeitá-la
a investigação crítica pública.
Não há verdades absolutas, cientificamente falando. Não podemos
“saber” nada completamente. Há apenas graus relativos de conhecimento
válido e fidedigno. Os procedimentos objetivos aumentam a probabili
dade de obter conhecimento mais fidedigno e mais válido através da
pesquisa. A objetividade em e de si própria, tem pouco valor. Ser objetivo
não significa ser científico. Afastar a objetividade da ciência, entretanto,
destrói o núcleo do empreendimento científico. •
Métodos quantitativos
300
Há diversas respostas à crítica feita à quantificação nas ciências
comportamentais, sendo que a mais importante é empírica e pragmática.
O uso da quantificação funciona! Embora as suposições que formam a
base do uso dos números e sua manipulação possam ser violadas, a
quantificação funciona muitíssimo bem. Quando a inteligência de criança
é medida com um teste fidedigno razoavelmente válido, pode-se correla
cionar os números obtidos com outros números obtidos em outro teste
aplicado às mesmas crianças, digamos, um teste de realização verbal, e
obter uma excelente aproximação da magnitude da relação. A evidência
para a “verdade” desta afirmativa é que — em geral e, naturalmente,
com as exceções de sempre — as crianças que obtêm notas altas em
testes de inteligência também recebem notas altas em testes de realização
verbal, assim como em testes de outros tipos de realização; e as crianças
que obtêm notas baixas em inteligência tendem também a receber notas
baixas em realização. (Veja a discussão sobre validade no capítulo 9.)
Embora o cientista não desdenhe arbitrariamente suposições impor
tantes na atribuição de números a objetos que estão sendo medidos, ele
sabe que, às vezes, não pode satisfazer todas elas. Além disso ele sabe,
por experiência e pela evidência, que com conhecimento, cuidado e habi
lidade em planejar e usar suas medidas, ele pode conseguir aproximações
razoáveis de suas variáveis e as relações entre elas no sentido de que seus
resultados, apropriadamente testados e verificados, concordam com a
“realidade”, como no exemplo acima de inteligência e realização verbal.
Conseguindo tudo isso, ele pode usar os métodos “fortes” da matemática
e da estatística para ajudá-lo a fazer inferências sobre o que está “lá
fora”.
Há uma resposta empírico-experimental fortemente relacionada com
isso para as acusações à quantificação. Os testes estatísticos de significân-
cia têm certas suposições por detrás. Por exemplo, um teste t, que já
discutimos anteriormente, entre outras coisas, avalia a significância esta
tística da diferença entre duas médias. Uma das suposições em que se
baseia o teste (Edwards, 1967, pp. 214-215; Hays, 1973, pp. 409-410) é
que as notas das duas populações das quais os dois grupos são amostras
são distribuídas normalmente.1 A teoria que apoia o teste t, da dife
rença entre duas médias, requer esta suposição. Se for violada, os resul
tados de um teste t podem não ser válidos. Igualmente, supõe-se que as
Valores e ciência
302
ópio do povo” são proposições de valores. Não há forma de testá-las
empiricamente. Elas estão além dos meios e capacidades da ciência.
Por isso, os cientistas excluem tais proposições de seu trabalho.
Isto não significa que os cientistas, como indivíduos, ou até em
grupos, não tenham valores. Tal afirmativa é absurda. Nem significa que
a pesquisa científica seja isenta de valores. As escolhas de tópicos de
pesquisa e até a metodologia da pesquisa são influenciadas pelos valores
que o cientista adota. Os valores podem também influenciar a interpre
tação dos resultados da pesquisa. O psicólogo ou o sociólogo informado
sabe disto, entretanto e usa salvaguardas para minimizar esta influência.
O fato de os cientistas evitarem proposições de valores como não
testáveis, não significa que os próprios valores não possam ser estudados
cientificamente. Sem dúvida eles foram assim estudados, mas por mais
estranho que pareça, nem uma fração do que sua importância justifica.
O estudo científico de valores é abordado o mais objetivamente possível;
o cientista que estiver estudando valores tem que ser especialmente
cuidadoso para que seus próprios valores não influenciem a coleta e
análise dos dados e a interpretação dos resultados. Exemplos possíveis
de pesquisa de valores são a influência de valores conservadores e liberais
no comportamento eleitoral; o efeito de valores religiosos em questões
como divórcio e aborto; as relações entre os valores de pais e filhos;
a ligação entre valores colocados em conceitos como liberdade e igual
dade, de um lado, e valores colocados em conceitos como propriedade
privada e capitalismo, de outro.
É perfeitamente possível, em outras palavras, estudar valores como
um fenômeno natural. Pode-se explorar a estrutura fatorial dos valores
que as pessoas dizem que adotam, para conhecer as relações entre conjun
tos gerais de valores e como os valores expressos podem se agrupar.
Pode-se estudar os diversos efeitos de valores declarados em tipos dife
rentes de comportamento social, ou as relações entre valores políticos e
valores religiosos, ou as maneira pelas quais as crianças aprendem os
valores. Mas não se pode testar empiricamente as próprias proposições de
valores, proposições que contenham as palavras “bom”, “mau”, “deve
ria”, “podería”, e assim por diante. Simplesmente não há maneira de
fazê-lo. Tais proposições e palavras implicam e refletem julgamento
humano. Não há nada a testar, nenhuma relação entre variáveis que
possa ser manipulada ou mensurada.
2 Uma “lei” em ciência é um enunciado de relações que tem uma base teórica
e considerável apoio empírico. Uma teoria, naturalmente, pode ou não ter apoio
empírico. Se uma teoria foi apoiada repetidamente pela evidência, pode então ser
chamada “uma lei”. Não há regras rígidas e seguras, entretanto, para dizer
quando uma teoria confirmada se torna uma lei.
304
zação (da informação a ser lembrada) e pelas imagens. Ele pode e natural-
mente descreverá a relação descoberta em palavras. Mas ele expressará a
relação mais sucinta, exata e frutiferamente com, digamos, uma equação
de regressão, que mostra mais claramente qual é a natureza da relação.
Muitos outros exemplos da necessidades e força da abstração pode
ríam ser dados. Mas isto não chega à raiz do motivo pelo qual o cientista,
como cientista, não. tem que se preocupar com o caso individual. Ao
propor a equação de regressão, como no caso acima, ele perde indivi
dualmente as pessoas que foram seus sujeitos. Sua equação de regressão
é uma expressão média, uma abstração dos dados originais. Naturalmen
te, ele poderá usar a equação de regressão para predizer a nota de
qualquer sujeito em uma variável dependente. Mas isto também é uma
abstração, uma expressão que diz, com efeito: “Aqui está a predição
para o sujeito Xü, mas é apenas uma predição da média”. Temos aqui
um dilema e uma pista para a natureza “grupai” da ciência. Para enten
der isto, vamos examinar um meio muito útil de encarar disciplinas e
proposições.
A distinção nomotética-ideográfica
305
são principalmente ideógrafos. Estão principalmente preocupados com o
indivíduo e seus problemas. Os pacientes devem ser tratados. As pessoas
têm que ser servidas. Por outro lado, o estudante nomotético da personali
dade não está nem pode estar preocupado com o indivíduo. Ele procura
leis que expliquem o comportamento. Ele quer, por exemplo, conhecer
a raiz das neuroses. Está interessado no cliente apenas como um exemplo
da expressão de uma teoria de personalidade. A neurose do paciente deve
ser explicada por meio de leis, nomoteticamente. O quadro que estou pin
tando é um bocado extremo; há cientistas-psicólogos que combinam abor
dagem nomotética e ideográfica, mas eu imagino que não lhes é fácil
fazer isto. Há muitos anos, Carl Rogers expressou eloqüentemente seu
próprio conflito ao tentar ser ao mesmo tempo nomotético e ideográfico
(Rogers ,1955).
Os cientistas, então, não estão nem podem estar preocupados com
o caso individual.3 Eles buscam leis, relações sistemáticas, explicações de
fenômenos. E seus resultados são sempre estatísticos. Eles precisam apren
der a viver e trabalhar com a incerteza. As leis que buscam são enuncia
dos do tipo se p, então q, mas tais enunciados são sempre compreendidos
como enunciados do tipo se p, então provavelmente q. Quaisquer predi-
ções que são feitas para casos individuais, não são “individuais” no
sentido clínico ideográfico, mas antes uma espécie de "indivíduo” ,
abstrato de uma equação estatística.
Para clínicos, professores e pessoas cujo trabalho esteja ligado ao
indivíduo, parece difícil compreender a ciência e o cientista nomotético.
Seu principal interesse na ciência, se existir, está em como ela pode
ajudá-los a curar ou ensinar indivíduos, e nem tanto em leis abstratas
que podem ou não ser aplicadas a indivíduos particulares ou que talvez
apliquem a eles apenas em média.
Predição
306
ção è perfil. (Vamos omitir todos os meios mais ou menos subjetivos,
como a especulação psicológica intuitiva e a astrologia.) Pela predição
podemos prever o desempenho de um indivíduo em uma variável depen
dente com base em uma ou mais notas em certas variáveis independentes.
Ou, intimamente relacionado com isto, predizemos a categoria ou a
inclusão do indivíduo em um grupo com base em seu desempenho ou
suas medidas em um ou mais testes ou medidas. Exemplos comuns são
a predição de realização no segundo grau ou na universidade, com base
em medidas de inteligência, classe social, motivação e realização anterior,
e a predição de sucesso ocupacional a partir de medidas de escolaridade,
classe social, escolaridade e ocupação dos pais.
Talvez o método para fazer predições mais freqiientemente usado
seja o da análise de regressão múltipla. (Se houver, naturalmente, apenas
uma variável dependente a ser predita.) O pesquisador aplica as medidas
das variáveis independentes a um número de pessoas e apura ou mede
W d 00 TV
a variável dependente. (“Apura” é usado aqui porque quando a variável
dependente é a inclusão em um grupo — “sucesso” ou “insucesso” em
terminar a universidade, por exemplo — , tudo o que se tem a fazer é
determinar a que grupo ou categoria o indivíduo pertence.) Ele faz então
análise de regressão múltipla e usa a equação de regressão para fazer
a predição, como ficou esboçada no capítulo 11.
Como exemplo, vamos tomar um fenômeno muito difícil, a criativi
dade. O conceito é difícil porque não é fácil saber o que é criatividade;
é de difícil definição, principalmente de modo operacional. Mas vamos
imaginar que um psicólogo tem duas medidas razoavelmente boas qi ie ' ’
predizem criatividade em crianças, sendo que o conceito global de criati-p ?
vidade propriamente dito seria julgado por especialistas. Vamos deno
minar as duas medidas Xi e X2 e criatividade, Y. Neste ponto aconselhai;'
mos que o leitor volte ao capítulo 11 e reveja o parágrafo sobre o estudo
de Holzman e Brown e a seção imediatamente seguinte. Lá aprendemos
o que é uma equação de regressão, para que é usada, e como se podem
fazer predições individuais usando a equação de regressão.
Uma equação de regressão abstrata com duas variáveis indepen
dentes é:
Y’ = a -f- biXi + 02X2
Y’ é a nota predita, a, a chamada constante de intersecção, vamos
ignorar de novo; não é importante para o que queremos. Xi e X2 são
as variáveis independentes, e bi e b2 são os pesos de regressão para
Xi e X2. São partes dos frutos da análise de regressão. Como seu nome
indica, eles “ponderam” ou “atribuem importância” diferenciada às
medidas das variáveis independentes.
Vamos supor que o psicólogo aplicou Xi e X2 e sua medida de
ííiatividade, Y, a um grande número de crianças, tenha feito a análise
307
de regressão e tenha obtido a seguinte equação de regressão — que é a
mesma usada para ilustrar regressão e predição no capítulo 11:
Y’ = 0 ,10 + 0 ,6 8 X i + 0,39X 2
308
e mensuração. Mas todo o conhecimento científico é conhecimento de
relações empíricas, cuja “existência” traz sempre junto um rótulo de
probabilidade. Em ciências naturais as probabilidades são mais altas do
que em ciências sociais. As generalizações e predições em todas as
ciências, entretanto, são predições de grupo e são probabilísticas. Um
físico não pode predizer o movimento de um átomo com mais exatidão
do que um psicólogo pode predizer a nota de criatividade de uma criança.
Perfis
309
Coordenação
x
Figura 15.1
mos dizer que a figura 15.1 retrata o (limitado) perfil do talento musical
de um indivíduo. Por ela, pode-se avaliar mais ou menos a capacidade
musical da pessoa. Supomos que os quatro atributos dados sejam impor
tantes para qualquer um que aspire à realização musical. As notas do
indivíduo estão representadas acima e abaixo das médias das quatro
medidas. (Vamos supor ainda que as notas brutas dos testes foram
transformadas convenientemente em medidas comparáveis. Do con
trário, o perfil não teria muito sentido.) 6
No caso presente podemos verificar que o indivíduo tem memória,
percepção melódica e coordenação acima da média. Mas sua acuidade’
auditiva está consideravelmente abaixo da média. Já que a acuidade é
decisiva (digamos) na maioria das atividades musicais, o prognóstico para
seu sucesso musical não é nada bom. Entretanto, ele poderá dar um
bom baterista! Mas jamais um timpanista, já que é preciso afinar os
tambores, mesmo durante um concerto!
Observe novamente que os perfis, como as equações de regressão,
estão amarrados a medidas de grupos. As médias, calculadas pelas notas
de um grupo, são os referenciais comparativos que possibilitam a inter
pretação. Em resumo, o psicólogo, o professor e o orientador que usam
perfis como este são ignorados aqui, já que não estão ligados diretamente ao
problema.
* U p uiodo comum, mas não o único, de fazer isto é converter todas as notas
do indivíduo ein notas-padrão. Uma nota-padrão é a diferença entre uma nota
1 e a, m®c^a SruP° naquele teste, M, convenientemente ajustada para
(dividida por) a variabilidade do grupo.
310
perfis ou notas preditas de regressão múltipla estão usando uma aborda
gem ideográfica; estão descrevendo indivíduos. Mas precisam fazer isto
sempre com base em medidas e estatísticas de grupos.7
A distinção nomotético-ideográfico é importante porque esclarece
parte da natureza fundamental da ciência e da pesquisa científica e
porque esclarece as limitações de ambas as abordagens. O bom novelista
é um ideógrafo. Ele descreve e sonda indivíduos e seus amores, temores,
motivações e comportamentos. O grande novelista faz isto e ainda mais:
ele dá um jeito de projetar também suas personagens na tela da humani
dade. Um Chaim Potok não apenas cria vividamente uma personagem
hassídica, no Brooklin, defrontada com o problema da ruptura com o
Hassidismo. Ele faz também o leitor sentir a dor de tal ruptura com
seu credo. Fazendo isto, ele, até certo ponto, escorrega para a nomotese.
O grande cientista jamais poderá passar de uma abordagem nomotética
para uma abordagem ideográfica. As regras do jogo não permitem.
Deve-se agarrar a elas e deixar a ideografia para os Potoks, porque a
própria definição da ciência como fazedora de leis, com sua restrição à
generalidade, não permite tratar com o indivíduo.
Um parodoxo perturbador
312
e estabelecer as relações que estavam estudando usando grupos de indi
víduos. Entretanto, ambos os autores vão da unidade de discurso do
grupo para a unidade de discurso do indivíduo. Eles têm que fazer isto
mais ou menos porque suas teorias “explicam” o que há, presumivel
mente, dentro da cabeça do indivíduo. No segundo estudo, uma vez que
as relações enunciadas nas hipóteses foram confirmadas pela evidência
empírica grupai, a autora supõe que necessariamente existam esquemas
do eu nos cérebros de seus sujeitos individuais. 8 O paradoxo é, então,
que os cientistas, principalmente os psicólogos, devem formular hipóteses
e testar relações no nível do conjunto ou do grupo, quando eles freqüente-
mente desejam de fato falar em nível de indivíduo — e podem fazê-lo.
Adendo
8 Não se pretende fazer críticas negativas aos dois relatos citados. Só estou ten
tando mostrar como é difícil em psicologia escapar do nível individual de discurso
e do indivíduo com seus motivos idiossincráticos, percepções, motivos, atitudes
e assim por diante. Para atingir meu objetivo, selecionei deliberadamente o que
na minha opinião são bons exemplos de pesquisa psicológica. Outros exemplos
em que a orientação individual é mais pronunciada poderíam facilmente ser
citados. Sem dúvida., é virtualmente imnossível escapar à conversa de nível
individual na redação de pesquisas psicológicas.
313
pode selecionar alguns de vários casos — as notas mais altas e mais
baixas em uma variável dependente, digamos — para ajudar a compre
ender as relações sob estudo. Esta não é a abordagem científica básica
dos dados, naturalmente.
Outra possível exceção à regra coletiva é mais difícil e controvertida.
É uma abordagem na qual o pesquisador — talvez o caso mais famoso
seja o de B. F. Skinner, o psicólogo behaviorista— estuda um fenômeno
com um animal ou uma pessoa. Digamos que o problema seja o efeito
do reforçamento (recompensa) na aprendizagem. O pesquisador pode
reforçar uma ou mais vezes uma certa resposta ou classe de respostas em
um único pombo, como fez Skinner. Ele descobre que a aprendizagem
melhora com o reforçamento. Aqui há uma relação: temos um conjunto
de pares ordenados consistindo em pontos no tempo, ou reforçamento
em pontos no tempo, havendo um conjunto dado e as respostas a este
conjunto no outro. Isto pode ser considerado uma verdadeira exceção
à regra coletiva?
O alvo da ciência nomotética é estabelecer leis, explicações siste
máticas ou relações que se apliquem em geral. O pesquisador, neste caso,
quer poder afirmar que o reforçamento produz certas respostas e, a partir
disto, quer afirmar que o reforçamento produz aprendizagem. Se todo
indivíduo — rato, pombo, pessoa — fosse igual a todos os outros indi
víduos, estudando então um indivíduo isolado poderiamos produzir resul
tados generalizados aplicáveis a todos os indivíduos de uma certa espécie.
Como sempre, o problema são as grandes diferenças entre os indivíduos.
Mesmo isópodes, pequenos crustáceos marinhos, apresentam diferenças
individuais! (Morrow & Smithson, 1969.) Portanto, é necessário ter muito
cuidado com as conclusões obtidas pela pesquisa que usa um indivíduo
apenas. Os princípios de amostragem e generalização a partir de amostras
se aplicam a todas as situações, embora as exigências possam ser bem
menores em pesquisa com animais e no laboratório. O exemplo acima,
então, não é realmente uma exceção para o requisito coletivo.
Stephenson (1953), cujas idéias já foram mencionadas anterior
mente, afirma enfaticamente que uma teoria psicológica pode ser testada
com um único indivíduo, usando o que ele denominou metodologia Q.
Pede-se a um sujeito único que classifique um maço de cartas ou itens
de acordo com algum critério, digamos graus de aprovação ou graus de
importância na área que as cartas representarem. As cartas são colocadas
nas pilhas designadas com números variáveis de cartas em cada pilha.
As seis ou mais pilhas representam uma ordem de postos e atribuem-se
valores às cartas nas pilhas, valores diferentes para cada pilha e o mesmo
valor dentro de cada pilha.
O método é muitíssimo eficiente. Pode-se conseguir uma espécie de
"estatística do indivíduo.” Isto é feito construindo categorias dentro de
314
um Q-sort e seus itens. Por exemplo, ao se medir atitudes sociais, pode-se
ter metade dos itens conservadores e metade liberais. Então, depois que
uma pessoa escolheu as cartas de acordo com suas crenças e números
apropriados que foram atribuídos às cartas de cada pilha, é feito um teste
estatístico apropriado da significância da diferença entre a média dos
itens conservadores e a média dos itens liberais. Obviamente pode-se
construir duas e até três categorias dentro dos itens. A categoria “ abstrato-
específico” pode ser usada, por exemplo. Então, pode-se aplicar ao
arranjo feito por um indivíduo a análise de variancia fatorial, como
ficou descrita em capítulo anterior (e cujos detalhes não são pertinen
tes aqui).
O método é realmente um meio sofisticado de ordenar em postos
um conjunto de itens. É difícil e tedioso ordenar 60 ou 80 itens. Colocar
cartões em pilhas é muito mais fácil e ainda eficiente. Além da análise
estatística dos valores Q de um indivíduo, pode-se correlacionar os
valores de um indivíduo com os de outro. Na verdade, as correlações
entre os arranjos Q de diversos indivíduos podem ser intercorrelaciona-
das e analisadas fatorialmente, freqüentemente com resultados provei
tosíssimos.
Stephenson afirma que uma teoria incorporada aos itens Q pode
ser testada usando o arranjo Q de um indivíduo cujas características
sejam conhecidas. Um conservador que tivesse classificado o Q-sort de
atitudes sociais descrito acima deveria ter uma média maior nos itens
conservadores do que nos itens liberais. Embora esta descrição seja por
demais simplificada, é suficiente para o que nos interessa no momento.
A idéia é importante e interessante. (Estranho não ter sido mais
usada do que foi.) Infelizmente, está sujeita a mesma avaliação feita
para o exemplo anterior do estudo do reforçamento com um animal.
Em resumo, não se pode estabelecer as relações de uma teoria com dados
de um único indivíduo. Exige-se generalidade maior do que podem
fornecer os dados de um indivíduo apenas. Sem dúvida, uma das fraque
zas da metodologia Q é que a natureza do método — exigindo aplicação
quase personalizada dos arranjos Q, investindo-se muito tempo com
um indivíduo apenas, por exemplo — virtualmente impede o uso de
grandes grupos de sujeitos.
Acredito que a distinção nomotético-ideográfico, e a colocação feita
peste capítulo, de que a ciência não está nem pode se preocupar com
indivíduos, seja geralmente válida. Entretanto, quero deixar um pouco
aberta a porta do entendimento do leitor. É possível que exceções legíti
mas — em psicologia fisiológica, por exemplo — possam ser desenvolvi
das no futuro. Embora eu próprio não possa imaginar como a ciência
possa ser outra coisa que não nomotética, pode ser que no futuro seja
possível à ciência trabalhar com o indivíduo isolado. Em todo caso,
pode-se compreender consideravelmente melhor a ciência comportamen
tal moderna, conhecendo-se a distinção nomotetico-ideográfico e o para
doxo indivíduo-grupo do psicólogo.9
316
16. C o n c e p ç õ e s e r r ô n e a s e c o n t r o v é r s ia s :
p e s q u is a e p r á t ic a 1
Ciência e engenharia
Grande parte dos mal -entendidos na cabeça das pessoas com relação
à pesquisa e seu suposto propósito melhorativo surgiu provavelmente do
fato de se confundir ciência com engenharia e tecnologia. Vamos aqui
nos afastar um pouco do assunto para explicar a diferença.
A engenharia é um conjunto de disciplinas aplicadas que dependem
principalmente da ciência, mas que em si próprias não são ciência. O tra
balho do engenheiro é descobrir soluções técnicas para problemas práti
cos. Ao fazer isto, ele usa a tecnologia, que da mesma forma, surge às
vezes da ciência, mas que em si não é ciência. A tecnologia abrange
métodos técnicos e materiais criados para atingir objetivos práticos.
O técnico em ensino mencionado acima criou um método de ensinar
conceitos. Os .técnicos de computadores criam máquinas e linguagem de
máquinas, como vimos no capítulo 14, para descobrir soluções para
problemas analíticos. O técnico de ensino e o técnico de computador
são elementos muitíssimo importantes dentro da comunidade intelectual.
Mas não são cientistas; basicamente são engenheiros, embora às vezes
seja difícil traçar uma linha clara entre a engenharia e a ciência. A pista
essencial para compreender a diferença é o objetivo básico de cada uma.
O objetivo da engenharia e tecnologia é resolver problemas práticos
relativamente específicos. O objetivo da ciência é compreender fenôme
nos naturais. O certo e apropriado é esperar e pedir soluções de proble
mas práticos aos engenheiros. Não é certo nem apropriado esperar e
pedir soluções de problemas práticos aos cientistas, como veremos.
320
que não é possível uma definição adequada ou operacional da pesquisa
básica (Kidd, 1959). Entretanto, os cientistas, pensadores e escritores da
ciência sabem, às vezes vagamente, o que significa o termo, especialmente
em contraste com a pesquisa aplicada. Em todo caso, pesquisa básica é
pesquisa feita para testar teoria, estudar relações entre fenômenos com
o fim de entender os fenômenos, com pouca ou nenhuma preocupação
quanto à aplicação dos resultados da pesquisa a problemas práticos.
Apesar das prováveis impropriedades desta definição, ela é suficiente
para nos ajudar a falar sobre pesquisa básica. Diz o que vimos dizendo
desde o primeiro capítulo deste livro: que a pesquisa científica é a inves
tigação disciplinada das relações entre fenômenos naturais e acrescenta
que ela não foi criada para atingir metas práticas.
Pesquisa aplicada é pesquisa dirigida para a solução de problemas
práticos especificados em áreas delineadas e da qual se espera melhoria
ou progresso de algum processo ou atividade, ou o alcance de metas
práticas. As pesquisas denominadas programáticas e dirigidas são pes
quisa aplicada. Tais pesquisas são dirigidas para determinados objetivos
que prometem solução de problemas geralmente aflitivos. É o tipo citado
freqüentemente pelos jornais quando se discute pesquisa, porque é fácil
compreender as razões e a motivação de pesquisadores aplicados e suas
fontes de recursos financeiros. Como sempre os exemplos podem nos
ajudar a entender as diferenças importantes entre pesquisa básica e
aplicada.
O estudo de Aronson e Mills (1959), já citado, é um bom exemplo
de pesquisa básica em psicologia. Os pesquisadores estavam interessados
nas influência da privação e dificuldade de entrada em grupos, no valor
que os membros do grupo colocavam na participação no grupo. Eles
procuravam também lançar mais luz sobre a teoria sócio-psicológica para
ajudar a explicar certos fenômenos ligados à participação em grupos.
Os estudos sobre obediência à autoridade de Milgram (1974), também
citados anteriormente, são igualmente bons exemplos de pesquisa básica.
Lembre-se que foi pedido aos sujeitos que aplicassem choques suposta
mente dolorosos a outra pessoa num suposto experimento sobre aprendi
zagem. A questão era: Até onde irão os sujeitos experimentais? Até onde
inflingiriam dor a outra pessoa sob o comando de um “investigador
científico”? A relação estudada foi entre as variáveis autoridade e obe
diência.
Nenhuma dessas pesquisas parece ter, sido feita com o pesquisador
pensando em conseqüências práticas. Eles estavam à procura de explica
ções explícitas ou implícitas para fenômenos naturais: o valor presumi
velmente mais alto colocado na participação em um grupo quando a
pessoa experimentou privação ou dificuldade em fazer parte do grupo
e obediência à autoridade.
321
Memória e planarias
2 Podem ser encontrados relatos claros e muito bem escritos destes fenômenos,
assim como outros fenômenos psicológicos, em: Hilgard, Atkinson e Atkinson
(1975) Introduction to Psychology, O próprio início do livro (p. 4) é um bom
exemplo de parte do principal argumento deste capítulo. Os autores dão dez
problemas de pesquisa psicológica como exemplos do trabalho dos psicólogos.
Dos dez, oito são problemas de pesquisa aplicada, um é problema de pesquisa
básica e um é problema metodológico. Entretanto grande parte, ou talvez a
maior parte do texto do livro, está preocupada com pesquisa básica.
322
luz, sem necessidade do choque. Um grupo de controle de cinco animais
não recebeu este treinamento.
Depois do treinamento, os experimentadores cortaram os animais de
ambos os grupos, experimental e de controle, em dois. Será que as
seções da cauda dos animais do grupo experimental, que originalmente
tinha tido cérebro — naturalmente as seções da cabeça tinham os cére
bros originais, e portanto acreditava-se terem “ aprendido” a resposta
condicionada à luz — mostrariam evidências de terem “aprendido” a
resposta à luz? Depois de aproximadamente quatro semanas, tempo
suficiente para a regeneração, os animais do grupo experimental e do
grupo de controle foram testados. Foram testadas tanto a seção da
cabeça quanto a da cauda. A situação está representada na figura 16.1.
A figura é auto-explanatória.
A seção da cauda dos animais regenerados do grupo experimental
exibiram a resposta condicionada à luz? Já que a seção da cabeça do
grupo experimental continuava com o cérebro original que aprendera
a resposta, supôs-se que reteria.a aprendizagem. Como os animais do
grupo de controle não tiveram treinamento, esperava-se que ambas as
seções, cabeça e cauda, depois da regeneração, não apresentariam nenhu
ma aprendizagem. A medida da variável dependente foi o número de
tentativas necessárias para alcançar um critério de 23 respostas condicio
nadas em 25 tentativas consecutivas.
Os resultados mostraram que as caudas dos sujeitos, do grup< expe
rimental, possuíam a aprendizagem, da mesma_ forma que as cabeças!
O número médio de tentativas do treinamento original foi de 134.
A média das seções de cabeça, depois do corte e regeneração, foi 41),
Corte Cérebro
Seção da Seção da
cauda . cabeça
Figura 16.1
e a média das seções de cauda foi de 43,2. As diferenças entre a média
do treinamento original e ambas as médias de reteste, após a regeneração,
foram estatisticamente significantes. A média das seções de cabeça dos
animais do grupo de controle foi de 248,6, e a média das seções de cauda
foi de 207,8. Estas médias não diferiam significantemente entre si.
Mas as seções de cauda e cabeça diferiam significantemente das médias
do grupo experimental após a regeneração.
Estes resultados são notáveis. Não há dúvida de que o experimento
e sua concepção têm uma espécie de estranha beleza. Teria a aprendi
zagem, de alguma forma, chegado às caudas regeneradas do grupo experi
mental de planarias? Nossa preocupação, entretanto, não é com os resul
tados e a fascinação da pesquisa, mas com pesquisa básica. Ê claro que
os pesquisadores provavelmente estivessem interessados ria aprendizagem
humana, mas parece claro que eles pouco ou nada estavam ligando para
sua aplicação prática. Todavia, se resultados tão impressionantes são
confirmados em pesquisas posteriores, a teoria e pesquisa da memória,
tanto.com animais quanto com seres humanos, poderíam ser fortemente
afetadas. A questão seguinte, naturalmente, é por que e como as seções
de cauda regeneradas do grupo experimental haviam “aprendido” .
Não é difícil encontrar-se exemplos de pesquisa aplicada. O estudo
de Clark e Walberg, tantas vezes citado neste livro, é um estudo aplicado,
embora sem dúvida tenha aspectos de pesquisa básica. Foi dirigido para
a obtenção de uma resposta parcial a uma questão bastante difícil:
Qual a melhor maneira de ensinar grupos minoritários de crianças caren
tes (underachieving) a ler? Grande parte da pesquisa em educação é por
natureza aplicada: seu objetivo é ajudar a melhorar a prática educacio
nal. Por exemplo, a maioria dos estudos de métodos de ensino, instrução
programada, crianças excepcionais, etc., são pesquisa aplicada. Por estar
focalizada em problemas práticos específicos e por sua falta de foco na
compreensão básica de fenômenos, o campo da pesquisa aplicada é mais
estreito e seu impacto potencial mais limitado. Os estudos aplicados em
educação não são feitos tanto para aumentar os conhecimentos, alargar
e aprofundar a compreensão dos processos de educação, quanto o são
para ajudar as crianças a aprenderem melhor. Em outras palavras, são
essencialmente pragmáticos: procuram descobrir o que funciona ou deter
minar as relações, não pelas relações e pela possível teoria, mas para o
planejamento e decisões da ação educacional.
324
igualdade na educação norte-americana, feita por ordem do Congresso,
Equality of Educational Opportunity (Coleman e outros, 1966). Sua
grande influência mostra claramente que não faltam significância e
importância à pesquisa aplicada. Na procura de respostas para as
questões sobre a igualdade feitas pelo Congresso, Coleman e seus colegas
estudaram os efeitos de um grande número de variáveis na realização
escolar. Os resultados do estudo, assim como sua metodologia, ainda têm
muito impacto hoje. Foram feitos estudos semelhantes em outros países
sob o título geral de International Studies of Educational Achievement
(por exemplo, Husén, 1967; Thorndike, 1973), e sua importância e
influência são também grandes.
Outro estudo em pesquisa aplicada de grande importância prática
para o bem-estar dos Estados Unidos é um conjunto de levantamentos
feitos pelo Survey Research Center da Universidade de Michigan, para
determinar as atitudes dos brancos em relação aos pretos (Campbell,
1971). Na verdade foram estudadas também as atitudes dos pretos em
relação aos brancos, no conjunto completo de estudos, mas o livro de
Campbell limitou-se às atitudes de'brancos em relação a negros. Levanta
mentos geralmente são pesquisa aplicada: são feitos para objetivos práti
cos específicos, comumente para obter informação na qual basear decisões
ou ações. O estudo sob consideração não é exceção. Parte dele foi autori
zado pelo Comissão Consultora Nacional sobre Desordens Civis (veja
Report of the National Advisory Commission on Civil Disorders, 1968)
para obter informações sobre distúrbios raciais e assuntos relacionados.
Presumivelmente a informação obtida ajudaria a. Comissão e outras orga
nizações a melhor lidarem com os problemas raciais. Em todo o conjunto
de estudos, cerca de 9.000 americanos foram incluídos nas amostras e
entrevistados em 1964, 1968 e 1970.
As descobertas desses estudos são surpreendentes e importantes.
Mas Campbell nos avisa logo no início do livro (p. 1) que não há maneira
simples de descrever as atitudes dos brancos em relação aos pretos.
Contudo, ele chega a três ou quatro conclusões importantes. Uma,
embora não haja dúvidas de que o branco americano tenha atitudes
francamente racistas, a população branca das cidades não é universal
mente racista. Além disso, tem havido um movimento maciço em direção
a atitudes raciais mais favoráveis. Apesar de longe de serem igualitários,
os brancos americanos são muito mais igualitários do que já o foram.
E apenas uma pequena porção da população expressou atitudes aberta
mente hostis em relação aos pretos.
Duas, a resistência à mudança nas relações raciais é muito difun
dida, embora de forma alguma, universal. Algumas formas de mudança,
por exemplo a aceitação de pretos em situações de trabalho, são aceitas.
Outros tipos de mudanças mais de ordem privada sofrem maior resis
tência. Três, a idéia de superioridade racial não caracteriza as atitudes
dos brancos. Este signo convencional de doutrina racial parece ter
mudado para melhor.
Quatro, os americanos que freqüentaram universidades depois da
Segunda Guerra Mundial são claramente mais positivos em suas atitudes
em relação aos pretos dos que os que não freqüentaram universidades
ou que as freqüentaram antes da guerra. Esta foi a relação mais forte
encontrada no estudo. Em outras palavras, houve uma importante
mudança no clima intelectual do campus nos Estados Unidos: os pretos
são aceitos pelos diplomados brancos mais jovens. Talvez o ensino supe
rior recente tenha tido um impacto importante e benéfico. Há várias
outras descobertas, claro, mas estas são as principais. Aceitando-as como
indicadores válidos da atitude dos brancos norte-americanos em relação
aos pretos — e os resultados de pesquisas de organizações de grande
categoria como o Survey Research Center são geralmente aceitos pelos
cientistas por causa da excelente qualidade conceituai e técnica de seu
trabalho —, podemos ter uma boa idéia de como a pesquisa aplicada
pode ser importante.
Pode restar pouca dúvida, então, de que a pesquisa aplicada tenha
freqüentemente grande importância prática, social e humana. Seria difícil
superestimar a importância dos dois estudos ora sumariados. Tais estudos,
assim como outros semelhantes, levam, entretanto, muito gente a acreditar
que a pesquisa aplicada é mais importante e significante do que a pes
quisa básica. A importância e significância da pesquisa básica são fáceis
de serem negligenciadas porque geralmente a pesquisa básica não se
dirige a questões de importância e urgência humanas. É muito mais
fácil entender, por exemplo, a relevância social dos dois estudos acima
do que entender a importância dos estudos de teoria das atribuições ou
estudos da memória humana.
A pesquisa aplicada é indispensável e quase sempre muito signifi
cativa de duas ou três formas. Primeira, pode, como aliás é sua finali
dade, fornecer informações que levarão à solução de problemas. Segunda,
pode sugerir, às vezes, linhas novas ou diferentes de pesquisa básica.
Pode ser descoberta, por exemplo, uma relação inesperada entre duas
variáveis em um levantamento de opiniões. Esta relação pode sugerir a
alteração de uma teoria que estiver sendo testada na pesquisa básica.
As necessidades da pesquisa aplicada podem estimular também a pesquisa
básica metodológica. A necessidade de formas mais apropriadas de
análise para estudo de fenômenos como realização escolar, status ocupa-
cional, sucesso na vida adulta e variáveis semelhantes ajudaram, aparen
temente, a reforçar o desenvolvimento da análise multivariada, especial
mente análise de regressão múltipla e análise de trajetória. Terceira, e
talvez mais importante, a pesquisa aplicada tem, às vezes, uma qualidade
326
heurística. Pode levar ao desenvolvimento da teoria e da pesquisa básica.
É freqüentemente rica em hipóteses potenciais que exigem testagem e
fundamentação teórica.
Vantagens
327
ensinar essas crianças. Infelizmente as coisas não são tão simples assim.
O reforçamento maciço funciona com crianças de outras idades? Que
diferença faz o reforçamento maciço quando usado por tipos diferentes
de professores? Mais sutil ainda, é possível que o uso prolongado do.
reforçamento maciço tenha efeito deletério sobre algumas ou mesmo todas
as crianças? Poderia ter, por exemplo, o efeito de sufocar a iniciativa
e a motivação interna das crianças?
Então, mesmo os resultados aparentemente mais óbvios e simples
de uma pesquisa que é mais aplicada que básica acabam tendo impli
cações incertas para a prática. Se tomarmos o resultado de muitos
trabalhos de pesquisa básica que parecem ter implicações para a prática
educacional, descobrimos um hiato maior ainda. Na maioria de tais
estudos, a lacuna entre tais descobertas e a prática é larga e profunda.
Estudar relações e entrar em ação estão em dois níveis diferentes
de discurso que não se podem unir facilmente.3 A pesquisa científica
jamais teve como propósito resolver problemas humanos e sociais, tomar
decisões e entrar em ação. O pesquisador está e deve estar preocupado
com variáveis e suas relações. Jamais deve se exigir dele que pense ou
explique ou fale das implicações do que ele está fazendo ou fez. Exigir
isto é exigir um salto de um nível relacionai abstrato de discurso para
outro nível muito mais concreto e específico. Isto não pode ser feito
diretamente; não é possível fazer uma pesquisa e então ter os profissio
nais usando imediatamente seus resultados.
A expectativa de que a pesquisa deveria levar rapidamente à
mudança na prática vem em boa parte, como já mencionamos, da orienta
ção prática e pragmática das pessoas. Elas imaginam que o objetivo da
ciência seja o progresso humano, ambiental e técnico. A pesquisa, sob
este aspecto tem que ter vantagens; deve haver um retomo no investi
mento feito em pesquisa. São exigidas, da ciência e dos cientistas, respos
tas práticas e solução de problemas.
3 É importante saber o que se quer dizer com “nível de discurso”. Sempre que
falamos sobre algo, falamos em um contexto ou quadro de referência. Vamos
denominar este quadro de referência U, significando “ universo” . Um particular
U é um nível de discurso e deve incluir todos os objetos em discussão. Se saltar
mos de um nível de discurso para outro, digamos de Ui para U2, o novo nível
não conterá todos os objetos. Pode, aliás, não conter nenhum deles. Quando se
discute segregação e suas implicações, não devemos saltar para problemas religiosos
— “ Ê desejo de Deus que haja raças; e as foram feitas, obviamente, para estarem
separadas” . Estes são dois níveis ou universos de discurso: segregação e religião.
Mudar de níveis de discurso, sem uma transição conveniente, é uma maneira
consciente e inconsciente de distorcer a comunicação. No problema discutido
acima, o nível de discurso dos problemas de ação é inteiramente diferente do nível
de discurso da pesquisa científica. Veja Kerlinger (1973, pp. 57-58) para mais
discussão.
328
Uma atitude fortemente pragmática, então, virtualmente dirige o
foco para resultados e realização de coisas. O que é bom é o que fun
ciona! Por que funciona é menos importante; o mais importante é que
funcione. Isto, em ciência, é uma atitude derrotista, porque como
Thomson (1960) observou: “A melhor maneira de fazer progressos na
tecnologia. .. vem a ser a compreensão do princípio” (p. 997). Ele
observou também que esta idéia é uma descoberta recente e só recente
mente tornou-se verdadeira.
Os profissionais têm geralmente pouca paciência com o que julgam
como pesquisa “não-prática”, “torre de marfim”. Eles querem que a
pesquisa seja colocada em trabalho prático. Uma das manifestações infeli
zes desta orientação geral para a pesquisa é o desejo urgente e a exigência
que a pesquisa dê lucros, que traga vantagens rápidas. Falar sobre
pesquisa com finalidade de compreensão, parece para a grande .maioria,
tolo e até patético. Tem que haver uma vantagem! É uma expectativa
fútil. A pesquisa científica não tem vantagens de maneira simples porque
não está nem pode ser dirigida para problemas práticos (Brain, 1965;
Brooks, 1971; Dubos, 1961; Townes, 1968; Waterman, 1966).
E a pesquisa aplicada? O mesmo argumento se lhe aplica? Afinal,
por definição a pesquisa aplicada é dirigida para a aplicação. Não deve
mos então exigir vantagens da pesquisa aplicada? A resposta parece ser
um Sim com muitas ressalvas. Pode-se esperar vantagens, mas é ilusório
, exigí-las. Já foi dado um exemplo aqui. A aplicação direta das desco
bertas do estudo de reforçamento maciço de Clark e Walberg, obtidos
de pesquisa aplicada de grande qualidade, foi Considerada questionável.
Uma possível vantagem proporcionada por este estudo é a sugestão de
que reforçamento maciço podería ajudar certos tipos de crianças.
Como já dissemos, o amplo estudo Equality of Educational Opportu-
nity foi pesquisa aplicada. Que vantagens proporcionou? Por estranho
que pareça, suas descobertas pouco oferecem ao profissional. Elas docu
mentaram a desigualdade de recursos e realização. Mas não ofereceram
soluções. Mostraram também que uma porção consideravelmente maior
da variância de realização, foi devida presumivelmente ao ambiente fami
liar e às características que a criança traz para a escola, do que às dife
renças entre escolas (ou recursos da escola). O que significa isto para
a prática educacional? Não se preocupar gastando dinheiro com escolas?
Se apenas uma porção relativamente pequena da variância de realização
é devida a escolas, por que então fazer, tanto esforço para ter escolas
excelentes? Não há dúvida de que a extrapolação direta dos estudos
de pesquisa pode levar, às vezes, a conclusões absurdas! Curiosamente,
a única vantagem real do estudo Equality foi enfatizar que situações
educacionais e realização são complexas demais e exigem pesquisa muito
mais complexa do que a feita geralmente. Mostrou também maneiras de
estudar tais situações. Em resumo, mostrou uma grande necessidade de
compreender os fenômenos educacionais.
Naturalmente a pesquisa aplicada pode ser usada para resolver pro
blemas mas esta solução não leva ordinariamente à compreensão do
complexo fenômeno da pesquisa comportamental. Como no estudo
Equality, ela freqüentemente esclarece problemas de pesquisa, problemas
teóricos e metodológicos, mas é duvidoso que aplicações diretas sejam
possíveis para os fenômenos de interesse na pesquisa comportamental.
Seus resultados, entretanto, podem sugerir o que fazer. Mas, como
sempre, os profissionais têm que. fazer as coisas. Os resultados das
pesquisas fornecem apenas possível apoio às decisões.
Leitura é um bom exemplo. As respostas aos problemas de leitura
não estão em muitas pesquisas voltadas para dizer aos professores como
ensinarem a ler. Elas estão em pesquisas dirigidas à compreensão dos
vários aspectos da aprendizagem humana e do ensino ligado à leitura.
Tal compreensão é conseguida, se realmente o for, invocando teorias
psicológicas e outras ligadas à leitura e durante longo tempo fazendo
pesquisa dirigida à compreensão dos fenômenos ligados à leitura. A
pesquisa sobre leitura é em si quase que invariavelmente improdutiva.
Devemos estudar leitura no contexto de percepção, motivação, atitudes,
valores, inteligência e assim por diante. Em outras palavras, o alvo não
deveria ser o aperfeiçoamento da leitura! Deveria ser a compreensão
das relações entre os vários fenômenos complexos ligados à leitura. Para
melhorar coisa tão complexa quanto a leitura é necessário compreendê-la
e os vários fenômenos a ela ligados, tarefa sem dúvida muito difícil.
E, naturalmente, não há garantia de melhoramento na leitura das crian
ças, mesmo que sejam feitas pesquisas básicas dos fenômenos relaciona
dos com a leitura.
A exigência de que a pesquisa proporcione vantagens, é então uma
exigência impossível, pois é baseada em mal-entendidos do que é ou
não pesquisa científica. Sua persistência é testemunha de sua força.
Infelizmente sua influência pode ser bastante perturbadora para indi
víduos que procuram compreender a ciência e a pesquisa científica
porque inculca-lhes idéias erradas a respeito do objetivo e do que a
pesquisa pode realizar. 4
330
Dada a importância da questão, poder-se-ia pensar que os pesquisa
dores já teriam estudado os efeitos relativos das pesquisas básica e
aplicada na prática. Mas parece que o problema não foi estudado empiri-
camente. Assim, de um ponto de vista empírico sabemos pouco a respeito
dos efeitos relativos de, digamos, pesquisas básica e aplicada na prática.
A maioria das discussões e asserções são opiniões mais ou menos infor
madas e especulação. Recentemente, entretanto, foi publicado um impor
tante estudo empírico em medicina (Comroe& Dripps, 1976). Este estudo
tem as virtudes da perenidade, importância e competência, e o que é
mais importante, traz excelente evidência empírica para o difícil problema
da relação da pesquisa com a prática. Vamos nos voltar para ele agora.
332
teórico e séries de pesquisas voltadas para responder questões gerais
teóricas, psicológicas e sociológicas têm a maior probabilidade de terem
um impacto. Mas o impacto é geralmente não específico. Unia pesquisa
apenas ou mesmo um conjunto de pesquisas, por exemplo, jamais informa
ao profissional o que fazer. Em vez disso, se tem alguma influencia,
influencia maneiras de pensar, de perceber, de reagir. E particularmente
assim com a pesquisa básica. Estudos em pesquisa^ aplicada, virtualmente
por definição, têm menos oportunidade de terem impacto profundo e de
longo alcance porque estão apontados para metas específicas e relativa-
mente estreitas. Estudos teoricamente orientados, dirigidos para a com
preensão de fenômenos, são gerais, abstratos e em principio aplicáveis
a muitos problemas e situações diferentes — se é que são realmente
aplicáveis. .
Vamos tomar a teoria de inteligência fluida e cristalizada de
Cattell, já mencionada. Se pesquisas posteriores confirmarem as idéias
de Cattell, é possível, no final das contas, que o pensamento psicoló
gico e educacional possa ser mudado. Se se tornar aceito que ha dois
tipos de inteligência geral, cristalizada e fluida, isto não poderá influen
ciar no fim o ensino? Muito do ensino contemporâneo tem sido influen
ciado pela idéia de que há uma forma geral de inteligência^ que passa
por muitos testes de capacidade e muito do^ desempenho^ humano (o
famoso “g”). Levar em conta diferenças individuais no ensino significa,
em grande parte, fornecer instruções diversificadas para diferentes níveis
de uma inteligência geral. Mas Cattell diz que há duas formas de inte
ligência geral! Se isto for verdadeiro e se tornar geralmente conhecido
e aceito, ficará óbvio então que levar em conta diferenças individuais
torna-se mais complexo.
A teoria das atribuições é outro exemplo interessante. Na ultima
década, apareceu uma bibliografia muito grande em psicologia social
sobre o fenômeno da atribuição.5 Atribuição é o processo que as pes
soas usam para compreender e explicar as causas do comportamento -
especialmente o comportamento de outras pessoas. Se vemos^ alguém
resolvendo problemas rápida e eficientemente, podemos atribuir isto à
sua capacidade. Ou podemos atribuir à facilidade dos problemas. Por
outro lado, se vemos alguém com grande dificuldade com os problemas,
podemos atribuir a falta de sucesso à preguiça, falta de concentração
e até mesmo a raça e sexo! O que causa estas e outras atribuições? Como
s Por exemplo, Harvey, Ickes e Kidd (1976), lones, Kanouse, Kelley. Nisbett,
Valins e Weiner (1971) e Shaver (1975). Infelizmente a maioria das referencias
é enfadonha. Talvez a melhor introdução seja a de Shaver (1975). Pode ser encon
trada uma exposição breve mas muito clara no capítulo 18 do texto de psicologia
geral de Hilgard, Atkinson e Atkinson (1975). (O capítulo, de fato, foi escrito
por Daryl J. Bem.)
estão relacionadas às características dos indivíduos que as fazem? Obvia
mente, a atribuição é um fenômeno altamente geral. É também heurís
tico: estimula grande parte da teoria e da pesquisa. Vamos examinar
dois estudos ligeiramente.
Harvey e Kelley (1974) fizeram a pergunta geral: Que condições
afetam o sentido do indivíduo de sua própria competência em fazer
julgamentos? Em um experimento fizeram sujeitos realizarem compara
ções dos tamanhos relativos de figuras, mas as figuras foram-lhes apre
sentadas de maneiras diferentes. Foram-lhes apresentados 20 vezes
pares de figuras de tamanhos diferentes, e perguntava-se aos sujeitos
qual das duas era maior. A manipulação experimental foi a estabilidade
da apresentação. As primeiras 10 das 20 apresentações de uma condição,
por exemplo, foram instáveis; isto é, as figuras foram apresentadas em
maneiras casuais: às vezes, a figura maior à esquerda, às vezes, à direita.
As segundas dez apresentações foram todas estáveis: a figura maior
aparecia sempre ou à direita ou à esquerda. Esta foi a condição instável-
estável. As outras três condições foram estável-estável, estável-instável
e instável-instável.
Num segundo experimento foram igualmente manipulados estabili
dade e instabilidade (desta vez com três condições), A modalidade,
entretanto, foi audição. Pediu-se aos sujeitos que julgassem a localização
relativa de sons. Harvey e Kelley descobriram, entre outras coisas, que
a estabilidade e instabilidade da apresentação afetava os julgamentos
de autocompetência. A seqüência instável-estável levou aos julgamentos
mais altos de autocompetência, enquanto que as outras seqüências em
geral levaram a julgamentos mais baixos.
Em outro estudo estimulado pela teoria da atribuição, Jones e seus
colegas (Jones, Rock, Shaver, Goethals & Ward, 1968) estavam interes
sados nos efeitos do sucesso e fracasso iniciais nos julgamentos dos
observadores. Fizeram seus sujeitos tentarem resolver uma série de pro
blemas apresentados de tal forma que os observadores viram alguns
sujeitos resolverem primeiro e depois fracassarem e outros sujeitos fra
cassarem primeiro e depois resolverem. Os observadores julgaram os que
resolveram primeiro mais capazes dos que os que fracassaram primeiro,
independentemente do desempenho posterior. Ou seja, os observadores
atribuíram graus diferentes de habilidade dependendo de se os sujeitos
primeiro resolvessem ou primeiro fracassassem.
Séries de estudos iguais a este deviam aumentar nossa compreensão
da atribuição. Esta compreensão, por sua vez, deveria aumentar nossa
compreensão da autopercepção, percepção social e julgamento. Muitos
problemas interpessoais e de julgamento em situações práticas, como em
negócios e educação, podem ser afetados por esta crescente compreensão.
Podemos, por exemplo, compreender melhor o julgamento dos alunos
334
pelo professor, as condições da escola, os traços do professor; e os com
portamentos que afetam tais julgamentos. Pode-se colher dividendos no
caminho. O inesperado da exploração teórica e da pesquisa e frequente
mente surpreendente e recompensador. Será possível, por exemplo, que
o estudo de Harvey e Kelley seja uma abertura para um aspecto muito
importante mas pouco explorado da motivaçao: sentido de competência.
Em si, nenhum desses estudos tem muito significado para a prática
— embora’todos os três sejam sugestivos. Por outro lado, um corpo de
tais estudos pode ajudar a mudar o pensamento de psicologos, sociolo-
eos e educadores em importantes áreas do comportamento humano, neste
caso inteligência, e fazer julgamentos e outras atribuições. A compreensão
assim ganha poderá ter um impacto sobre a prática — embora nunca
se possa garantir se haverá impacto significante e benefico.
Outro exemplo de pesquisa de longo alcance que já está mudando
a educação na América e na Europa é a série de estudos epistemológico-
desenvolvimentais de Piaget e seus colegas. Durante muitos anos Piaget
observou cuidadosamente crianças de todas as idades, entrevistando-as
e falando com elas, e criando “problemas” pam que elas resolvessem.
Ele está evidentemente interessado em responder a antiga questão episte-
mológica e psicológica: Como conhecemos? Ele acha que a pergunta
pode ser respondida, pelo menos em parte, entendendo o desenvolvi
mento dos processos de pensamento da criança. 6 Uma das descobertas
gerais de Piaget — congruente com o que dissera John Dewey muitos
anos antes — é que a criança tem uma vida intelectual propna, uma
maneira de olhar a realidade diferente do adultó. Em outras palavras,
em seu pensamento, a criança não é apenas um adulto pequeno. A
compreensão da concepção de realidade da criança, pelo educador e pelo
psicólogo provavelmente afetará profundamente a interação dos adultos
com as crianças, principalmente em educação. Por conseguinte^ series
de estudos como estes terão -provavelmente um impacto na pratica.
A influência da metodologia
6 O leitor interessado poderá ler um ou dois dos vários livros de Piaget, mas
um melhor conselho — infelizmente os escritos de Piaget não sao modelos de
clareza — é tentar uma das várias explanações em forma de livro. Uma das mais
antigas, mas talvez ainda a melhor, é o livro de Flavell (1963).
335
livro; veja Apêndice), a mensuração de variáveis e técnicas de análise
de dados. A metodologia inclui também aspectos da filosofia da ciência
urna abordagem critica geral a pesquisa. Apesar de sua grande impor
tância, raramente pensamos na possível influência da metodologia na
prática. Isto é estranho porque a metodologia já teve uma profunda
influencia no conhecimento científico comportamental.
Se podemos dizer que a pesquisa tem influência na prática, segue-se
então que qualquer coisa que influencie fortemente a pesquisa pode,
por sua vez, influenciar a pratica. A metodologia influencia fortemente
a pesquisa. Tal influência, naturalmente, será bem indireta. Afinal, a
influência da própria pesquisa é indireta. A influência da metodologia
é mais indireta ainda. Vamos tomar um exemplo bem óbvio. Antes de
1930; os experimentos eram. principalmente uma questão de duas va
riáveis.^ Era manipulada uma variável independente e observado seu
presumível efeito sobre uma variável dependente. Depois da invenção
da análise de variância, contudo, puderam ser feitos experimentos mais
realistas e teoricamente mais interessantes usando duas ou mais variá
veis independentes. Alguns deles foram descritos em capítulos anteriores.
O efeito do progresso na metodologia é ajudar a produzir pesquisa
cujos resultados sejam mais generalizáveis e ampliar as abordagens e
problemas de pesquisa tanto experimentais quanto não-experimentais.
Mas é possível que a metodologia tenha efeitos mais profundos?
Vamos especular, por exemplo, sobre os possíveis efeitos da regressão
múltipla sobre os hábitos de pensamento daqui a 10 ou 20 anos A
essência da regressão múltipla é o efeito simultâneo de muitas variáveis
sobre uma variável dependente. Geralmente a maioria das pessoas pensa
no efeito de uma variável sobre outra. É possível que depois de repetida
exposição e do uso de regressão múltipla — e não há dúvidas de que
as próximas duas décadas verão muito tal exposição e uso — possamos
não mais pensar em influências isoladas? Será possível que influências
múltiplas se tornarão parte de nossa maneira habitual de pensar? Para
mim parece que sim.
A influência da teoria
336
experimental foi influenciada pela teoria comportamental e pela teoria
cognitiva. Tais teorias provavelmente influenciam a prática, porque
influenciam decisões sobre quais são os problemas de pesquisa impor
tantes — a pesquisa de atribuição surgiu principalmente da teoria ges-
táltica (ou de campo) e da teoria cognitiva — e porque as idéias esti
muladas pela teoria entram em livros e, às vezes, até se tornam parte
de dogmas. Assim, muito indiretamente, a prática pode por fim ser
afetada. O difundido uso da dinâmica de grupo por professores e assis
tentes sociais nas décadas de 50 e 60 foi resultante em parte da teoria
de campo, um ramo da teoria gestáltica, que éstimulou tanto a pesquisa
em processos de grupos quanto a introdução e uso de técnicas de grupo
em situações práticas.
O outro tipo de influência teórica é a teoria mais específica, como
a teoria das atribuições, a teoria do reforçamento e as teorias de inteli
gências. As teorias de inteligência podem mudar o pensamento e a prá
tica educacional e previdenciária. Teorias de inteligência ambiental e
hereditária, por exemplo, podem levar a práticas previdenciárias e edu
cacionais muito diferentes. A influência da teoria do reforçamento já foi
sentida por causa de sua forte enfatização do reforçamento positivo.
Pais e professores preferem usar recompensa à punição, porque sua edu
cação e treinamento não podem evitar de ser influenciados pela teoria e
pesquisa do reforçamento. Eles “sabem”, freqüentemente sem conheci
mento específico e explícito, que o efeito da recompensa é muito melhor
que o efeito da punição. (Se o leitor estiver inclinado a achar que isto
é óbvio, lembre-se de que no século XIX a punição era a maneira mais
comum de lidar com crianças, pelo menos nas escolas.)
337
Foi feita, repetindo talvez tediosamente, para aumentar a compreensão
dos fenômenos que se relacionavam aos problemas sociais.
Vamos considerar um problema da maior magnitude: a igualdade
dos negros norte-americanos. Rotulo o problema desta forma porque
os problemas concernentes às relações de raça, preconceito, discrimina
ção e segregação podem ser agrupados em igualdade com os brancos,
então a maioria dos problemas provavelmente desaparecería com o
tempo. Sem dúvida houve um progresso considerável, grande até, em
melhorar as condições dos negros norte-americanos. É desnecessário cata
logar as leis aprovadas, e as estatísticas de empregos, habitação e aceita
ção, em transformação. Poucos americanos negarão que homens, mulhe
res e crianças pretos devem ter direitos e oportunidades iguais perante
a lei. (Veja a discussão anterior da pesquisa de Campbell.) Outro sinal
de importante mudança social é o abandono de linguagem ofensiva e
estereotipada. No início do século, expressões e palavras aviltantes eram
comumente usadas para descreverem o negro — e ninguém pensava que
isso fosse errado. Embora tal linguagem ainda seja usada hoje, seu uso
diminuiu enormemente. São grandes mudanças. O que a pesquisa tem a
ver com estas e outras mudanças salutares de pensamento e prática?
Ninguém sabe ao certo. Não há nenhum estudo de Comroe e Dripps.
Então o que se segue é necessariamente especulação, embora, espera-se,
especulação bem informada.
O pensamènto e os escritos sociológicos e psicológicos sobre raça e
preconceito fizeram progressos no início do século. A pesquisa, no sen
tido de investigação controlada, começou realmente a florescer na ter
ceira, quarta e quinta décadas do século. Investigações clássicas sobre
um dos fundamentos do preconceito, os estereótipos, tiveram grande
impacto sobre os psicólogos e sociólogos (por exemplo, Katz e Braly,
1935). 7 Foram feitos muitos outros estudos sobre estereótipos e outros
aspectos do preconceito e o assunto foi analisado teoricamente (por
exemplo, Krech & Crutchfield, 1948). Cientistas comportamentais dese
javam compreender o fenômeno, assim como contribuir para sua solução.
Escolhi deliberadamente um fenômeno cuja investigação teve moti
vos mistos. Por ter sido dito repetidamente que o propósito da ciência
é a teoria, ou a compreensão, não quer dizer que os teóricos e os pesqui
sadores desejem pura e simplesmente obter conhecimentos. De fato,
muitos pesquisadores trabalhando na área geral do preconceito pareciam
ter fortes motivos sociais, baseados em uma ideologia igualitária. Entre
tanto, o progresso na compreensão do preconceito — hoje preconceito é
338
bastante bem compreendido, embora, como sempre, muita coisa não seja
ainda entendida — veio da pesquisa científica sobre o fenômeno e sobre
fenômenos relacionados. Vamos nos voltar agora para um conjunto de
investigações muitíssimo interessante, importante e influente, cujo alvo
inicial foi estudar e compreender o preconceito, mas cuja execução foi
consideravelmente além do preconceito. Embora já tenhamos examinado
aspectos dessas investigações, sua importância e especial adequação para
o problema da pesquisa e prática justifica uma repetição.
A influência de um livro notável publicado em 1950, The Autho-
ritarian Personality (Adorno e outros, 1950), é sentida ainda hoje. A
meta ambiciosa da pesquisa nele contida era estudar, compreender e
explicar o preconceito. Os pesquisadores eram homens e mulheres que
se dedicavam também ao combate do preconceito na moderna sociedade.
De fato, duvidamos que tal estudo pudesse ter sido feito sem que os
pesquisadores tivessem esta motivação. Logo na primeira página do livro,
Horkheimer e Flowerman, diretores do Departámento de Pesquisa
Científica do Comitê Judeu Norte-Americano, que patrocinou o estudo,
propuseram diversas questões perturbadoras, estimulados pela persegui
ção e extermínio de milhões de seres humanos por outros seres humanos:
Como é possível que . . . em uma cultura de lei, ordem e razão
possam ter sobrevivido os remanescentes irracionais de antigos
ódios raciais e religiosos? Como . . . explicar a disposição de gran
des massas de pessoas para tolerar o extermínio em massa de seus
semelhantes e concidadãos? Que tecidos continuam cancerosos na
vida da nossa moderna sociedade, e que, a despeito de seu propalado
progresso, mostram o incongruente atavismo de povos primi
tivos? (p.v)
São questões profundas. O fato de serem feitas como perguntas
para serem respondidas pela investigação empírica, pelo menos em
parte, é um dos aspectos mais notáveis desta pesquisa. Horkheimer e
Flowerman dizem:
Mas uma consciência desperta não é suficiente se não estimular
uma busca sistemática de uma resposta. A humanidade pagou um
preço muito alto por sua ingênua fé nos efeitos automáticos da
simples passagem do tempo; a magia jamais conseguiu dissipar tem
pestades, catástrofes, peste, doença ou outros males. .. (p.v)
Não estamos agora tão preocupados com a substância, metodologia
e descobertas do estudo, mas com sua motivação mista e de que maneira
pode ter afetado a prática. Os pesquisadores, profundamente preocupa
dos com o preconceito e seus efeitos secundários perniciosos, desejavam
contribuir com a busca de respostas práticas para erradicarem o pre
conceito. Afinal, o estudo fora iniciado e financiado pelo Comitê Judeu
Norte-Americano, entre cujas principais tarefas estava combater o anti-
semitismo. Todos sabiam, entretanto, que teriam que compreendê-lo
para combate-lo. “Nosso objetivo não é merámente descrever o precon
ceito, mas explicá-lo a fim de ajudarmos em sua erradicação” (p. vii).
Através de uma combinação de abordagens de pesquisa, os pesqui
sadores chegaram a várias conclusões importantes. Uma delas foi que o
preconceito é um fenômeno muito geral que faz parte das personalidades
dos indivíduos. A esta personalidade eles denominaram “personalidade
autoritária” porque descobriram, entre outras coisas, que uma “perso
nalidade autoritária” possuía uma síndrome de características que pre
dispunham o indivíduo que a possuía a ser hostil em relação a grupos
que não fossem o seu.
Uma segunda conclusão foi que o preconceito tende a ser gene
ralizado. A pessoa que tem preconceito contra um grupo torna-se incli
nada a ter preconceito contra outros grupos. Esta conclusão, como outras
de Adorno e seus colegas, foi confirmada por outras pesquisas. O indi
víduo que não gosta de judeus provavelmente não gosta de negros,
estrangeiros e assim por diante. Observe que isto explica muito do com
portamento social humano, mas especialmente o que envolve o contato
entre grupos. Significa também que, para compreender o anti-semitismo,
é preciso compreender também o preconceito em relação a outros grupos
minoritários.
Uma terceira conclusão — a última que vamos considerar — está
relacionada à primeira resumida acima: atitudes políticas, religiosas e
outras, estão relacionadas ao autoritarismo. Isto é, a personalidade auto
ritária^ não tende apenas a ter preconceito em relação a outros grupos
que não o seu; ela tem também atitudes identificáveis e predizíveis em
relação a questões sociais. O termo geral que engloba estas atitudes é
“conservadorismo”, mas os autores mostram cuidadosamente que eles
querem dizer “pseudoconservadorismo”, pelo que parecem querer dizer
conservadorismo reacionário. Não há dúvida, entretanto, da correlação
positiva entre o autoritarismo e o conservadorismo medidos. 8
Evidentemente o preconceito é muito complexo e não é fácil com
preendê-lo. Adorno e outros descobriram que o anti-semitismo faz real-
340
mente parte de uma síndrome mais ampla que pode ser chamada de
etnocentrismo: caracterizada pela centralização dos membros no seu
próprio grupo, crença em seu valores e retidão e por atitudes negativas
em relação a outros grupos. Descobriram ainda que o etnocentrismo por
sua vez faz parte de outro fenômeno chamado autoritarismo, e que o
autoritarismo descreve um certo conjunto de traços de personalidade.
Sua ênfase foi fortemente psicológica no sentido de terem localizado o
etnocentrismo e o autoritarismo no indivíduo. Eles provavelmente acer
taram, mas é provável que ambos sejam afetados por forças sociais e
variáveis fora do indivíduo. Entretanto, The Authoritarian Personality é
uma grande realização da pesquisa e da ciência comportamental, uma
contribuição distinta e importante para a compreensão do preconceito,
do autoritarismo e da ideologia, das relações entre personalidade e
ideologia.
Praticamente toda essa pesquisa foi pesquisa básica. Sua meta era
compreender e explicar o preconceito, ainda que os pesquisadores e seus
patrocinadores tivessem convicções profundas sobre os males do precon
ceito e forte desejo de erradicá-lo. Ninguém pode dizer com certeza,
claro, se o estudo teve algum efeito real sobre o preconceito em si.
Eu creio que provavelmente tenha tido influência porque, com a maior
compreensão do preconceito, líderes intelectuais e uma geração de estu
dantes ganharam uma base para entenderem como lidar com o precon
ceito. Provavelmente tenha também ajudado a criar uma noção mais forte
da necessidade de igualdade em muito mais pessoas. Do ponto de vista
deste capítulo, os autores de The Authoritarian Personality mostraram
não somente capacidade de pesquisa, discernimento e argúcia; mostraram
sabedoria quando escolheram fazer pesquisa básica. Um conjunto de
estudos aplicados poderia ter dado em nada porque provavelmente teria
fracassado em encontrar relações mais profundas que os autores encon
traram. 9
342
Não há concessões, interferências, como em negócios ou em política.
A ética da ciência é absoluta. O fato de que a maioria dos cientistas
observa a ética que é mostrado pelo choque com que é recebido algum
caso de trapaça. É mostrado ainda pelo destino do cientista trapaceiro:
ele perde seu status de cientista. O caso de Sir Cyril Burt, que foi um
dos psicólogos mais famosos e respeitados da Inglaterra, pode ser um
exemplo. Alegou-se que o exame cuidadoso das evidências que ele apre
sentara para apoiar conceitos de hereditariedade de inteligência indica
vam que ele falsificara ou inventara os dados. Não vamos discutir o
caso. A questão foi o choque causado no mundo científico comporta-
mental do Ocidente. Qualquer cientista que falsifique dados, por qual
quer motivo, causa um tremendo choque. Ainda mais Burt, por causa
de sua posição e do respeito que seus colegas tinham por ele. A questão
ainda não foi resolvida. Há os que estão convencidos que Burt fez q,;
que o acusaram e que foi, portanto, desonesto. Mas ha os que não
acreditam nisso. Provavelmente a questão jamais seja resolvida completa
mente, porque Burt já não está mais aqui para ser questionado e porque
a evidência parece ser equívoca.
Outro problema importante, relacionado aos valores da ciência e
que contribuiu para a má interpretação da ciência e da pesquisa, é ò
suposto conflito entre a ciência e o estudo das humanidades. Acredita-se
que a ciência não toca na maioria dos aspectos da experiencia humana,;
Acredita-se, por exemplo, que a essencia da musica e da poesia está
além da ciência e que, na verdade, a ciência não toca nas experiências
humanas mais importantes. Assuntos estéticos e espirituais, entre outras
coisas, escapam à ciência e aos cientistas.
Seria agradável dar uma resposta eloqüente e romântica a tais argu
mentos. Mas não é possível uma resposta real. Primeiro, os fatos
estão corretos: a ciência nada tem a ver com musica e poesia e não a
toca muitos aspectos da experiência humana. Mas isto é verdadeiro para
qualquer atividade humana. A música abraça toda a humanidade? E a
literatura? A pintura? Se existe uma resposta satisfatória é que a ciência,
por um lado, e a música, arte, literatura, experiências místicas, etc., por
outro, são simplesmente diferentes. Não podem ser comparadas no
sentido comum da palavra. Alguém diz que flor e melhor do que cafe?
— a não ser naturalmente, que se esteja atras do exotico ou comparando
alguma qualidade comum aos dois, como o cheiro ou a cor.
Segundo, imaginar um conflito entre ciência e humanidade é coisa
sem significado e sentido. As duas simplesmente são diferentes^ têm
objetivos diferentes. É absurdo esperar que a ciência tenha como objetivo
a satisfação estética (a não ser, talvez, para o cientista), assim como^ e
absurdo esperar que a ciência e a pesquisa resolvam problemas sociais.
A ciência procura compreensão. Não se destina a melhorar nível de vida,
experiência estética, ou o ser existencial do indivíduo. O conflito ou
polaridade entre a ciência e as humanidades, então, é um conflito psico
lógico: está na cabeça de homens e mulheres e não pertence à natureza
“oposta” da ciência e das humanidades. Duas coisas serem opostas
implica que existe alguma coisa em comum entre elas. Ciência e humani
dades são, ambas, atividades intelectuais humanas. Termina aí. Não há
virtualmente, mais nada em comum entre elas. Então como pedem ser
opostas? A compreensão da ciência exige a compreensão de que sua
natureza e objetivos são muito diferentes de outras atividades .humanas.
Isto quer dizer que não está oposta a nada embora seu efeito' seja abrir
áreas de atividade humana, geralmente fechadas, ao exame crítico e
cético.
Duas perguntas difíceis, as últimas: A influência da ciência tem
sido boa ou má? Se se entender “boa” por conforto e conveniência física
e se se admitir que grande parte da tecnologia moderna foi criada pela
ciência, então deve-se responder: Sim, a influência da ciência tem sido
boa, as pessoas se sentem fisicamente melhor do que no século XIX.
Se se fizer perguntas sobre a qualidade de vida que a ciência possa ou
não ter acentuado, a resposta é muito mais complexa e ambígua. Vamos
então nos limitar aqui à ciência e à pesquisa comportamentais.
Ao contrário do que muita gente acredita, a ciência e a pesquisa
comportamental contribuíram muitíssimo em uma área em que deveríam
ser julgadas: conhecimento e compreensão do comportamento humano.
Antes de irmos mais adiante, entretanto, vamos reconhecer que qualquer
contribuição é sempre parcial e, talvez até, apenas uma pequena parte
de todas as contribuições possíveis. É até bastante duvidoso que surgirá
completa compreensão científica do comportamento humano. Provavel
mente sempre haverá áreas nebulosas e desconhecidas em aspectos da
economia, sociologia, psicologia, antropologia e assim por diante. As
depressões econômicas provavelmente jamais serão totalmente compre
endidas, se não por outras razões, pelo menos porque as situações socais
mudam constantemente, e o mesmo acontece, portanto, com as situações
econômicas. Surgem até novos fenômenos e variáveis. O conhecimento
completo da motivação e habilidades humanas continuará a nos escapar.
As complexidades das instituições e dos movimentos sociais provavel
mente jamais serão também entendidos completamente.
Uma das coisas que as pessoas esperam da ciência é que, depois
de algum tempo, maturidade e trabalho, a pesquisa resultará em conhe
cimento e compreensão total dos fenômenos; esta esperança é errônea e
inadequada. A ciência e a pesquisa jamais produzirão conhecimento e
respostas completas às questões. Manter essa esperança é compreender
mal a pesquisa e a ciência. Isto, entretanto, não é motivo de desespero.
344
Não quer dizer que, por não poder dar respostas completas, a empresa
científica perde seu valor. Longe disto.
Um modo mais exato e realista de encarar a ciência e concebê-la
como um meio poderoso de reduzir a ignorância. Vamos tomar a inteli
gência novamente. Em, digamos, 1850, não havia evidência científica
sobre a natureza da inteligência. O que era “ conhecido” foi resultado de
observação e dedução, aguçadas ou não, sábias ou não. Não se fazia
uma investigação controlada sistemática da inteligência. Em resumo, o
estado de ignorância, se não era completo, era quase. Na década de 70,
entretanto, sabe-se muita coisa sobre a inteligência humana. Natural
mente muita coisa continua desconhecida, mas isto não quer dizer que
não saibamos quase nada a seu respeito. Sabemos, por exemplo, que a
inteligência humana é produto tanto da hereditariedade quanto do meio
ambiente. Sabemos que não se trata de uma coisa isolada, unitaria,
querendo dizer, por exemplo, que uma pessoa aUamente inteligente e
inteligente em todas as áreas. Aliás, é um função multifacetada que
evidentemente tem tantas manifestações quanto pessoas. Certos fatores,
ou tipos de inteligência, estão agora bem estabelecidos e bem conhecidos:
verbal numérico, espacial e assim por diante. Há até evidência, embora
não ainda sólida, de que não há só 6 ou 7 fatores de inteligência, mas
mais de 20 ou 30.
Uma das grandes realizações científicas e técnicas do século é, então,
a mensuração da inteligência. Ela pode ser medida com alta fidedigm-
dade e elogiável validade. Há os que duvidam, naturalmente. Uma das
principais causas de dúvida é a desconfiança de que o que esta sendo
medido não é a verdadeira essência a inteligência. Talves não. Mas então,
a “verdadeira essência” da inteligência jamais será medida. Isso de forma
alguma diminui a magnitude teórica e prática da realização. A ignorância
completa foi reduzida para o que pode ser chamado ignorância parcial.
Graças ao trabalho de cientistas sociais, sabemos que classe social
tem muita influência sobre a inteligência, realização e ocupação. Sabe-
mos muita coisa a respeito do papel que desempenha a raça em casa, na
escola e no trabalho. Sabemos muita coisa a respeito do funcionamento
dos sistemas econômicos — não o suficiente para evitarmos depressões
e acabar com a inflação, mas muita coisa, apesar de tudo. Os sociologos
e os economistas reduziram bastante a ignorância social e econômica.
Ajudaram também a destruir falsas crenças e mitologias enganosas sobre
a sociedade e seu funcionamento.
Alguns anos atrás, Deutsch, Platt e Senghaas (1971), publicaram
um estudo do progresso das ciências sociais e de onde veio este progresso.
Fizeram uma lista de 62 melhoramentos feitos durante o período de
1900-1965 que influenciaram a pesquisa e a prática. Omitindo as contri
buições não científicas, resta-nos ainda uma lista formidável de melhora-
mentosr a sociologia da burocracia, cultura e valores, teoria e pesquisa
de aprendizagem, testes de inteligência, estudos sobre autoritarismo,
pesquisa de atitudes e opiniões, e vários avanços metodológicos, como
analise fatorial, análise de conteúdo, definições operacionais, análise
estatística, computadores, análise multivariada e assim por diante. Dizem
os autores:
Juntos, estes melhoramentos acrescentam-se à inconfundível evidên
cia de crescimento cumulativo do conhecimento nas ciências sociais
no decorrer do século. Hoje, afirmativas como “não sabemos mais
do que Aristóteles sobre psicologia humana e política”, expressam
principalmente a ignorância daqueles que as proferem (p. 455). 10
Em suma, as contribuições da ciência e da pesquisa comportamental
foram impressionantes na redução da ignorância. O progresso não foi tão
impressionante quanto em física, química e biologia, mas considerando
sua relativa juventude e grande complexidade, são sem dúvida impressio
nantes. A compreensão do mundo físico e de nossos corpos progrediu
enormemente graças à ciência. A compreensão de nós mesmos e de nosso
ambiente, embora não sendo enorme, tem sido e é uma realização
excepcional, reduzindo nossa ignorância praticamente completa cem anos
atras.
É verdade jjue podemos não saber muito bem como lidar com
depressão, inflação, desemprego, terrorismo, preconceito religioso e racial
e privação intelectual extrema. Conhecemos, entretanto, algumas das
causas destes fenômenos e relações entre eles. Estamos começando a com
preende-los cientificamente. Embora isto não signifique solução definitiva
dos problemas — repetimos, não é este o objetivo da ciência —, signi-
íca, no mínimo, redução considerável da grande ignorância que permeia
estes e outros problemas psicológicos e sociais semelhantes. Significa
uma certa medida de compreensão, compreensão que pode nos fornecer
as razoes, senão os remédios, da nossa infelicidade e nossa felicidade
• de nossos fracassos e nossos sucessos.
a, „!0de-Se- dif Utlr a. is.ta de 62 avanços na ciência social. Por exemplo, diversos
avanços nao forarn absolutamente científicos: a teoria da organização unipartidária
L f ? revolu?a°. de Lenm psicanálise e psicologia profunda, contabilidade da
foram E f / ™ por diante- £ lém diss0’ certos melhoramentos significantes
evidência de realiSSo0 “ * ^ é impressionante e incontestável como
346
A p ê n d ic e
T ip o s d e p e s q u is a , m é t o d o s d e o b s e r v a ç ã o
e t e s t e s d e s ig n if i c â n c ia e s t a t í s t i c a
Tipos de pesquisa
Um tipo mais importante de pesquisa dominou o texto: pesquisa
em que foram estudadas as relações entre variáveis dependentes e inde
pendentes. Este é, naturalmente, o tipo de pesquisa mais importante e a
meta última de quase toda a pesquisa científica: pesquisa para testar
relações hipotéticas entre variáveis. Há, contudo, vários outros tipos de
pesquisa que são importantes. Vamos examinar dois deles rapidamente.
Investigação histórica
Pesquisa histórica, ou investigação histórica, é uma investigação
crítica dos acontecimentos, desenvolvimentos e experiências do passado,
pesagem cuidadosa da evidência da validade de fontes de informação
347
ção, alguns deles já foram mencionados. Vamos agora caracterizar rapi
damente três dos métodos mais usados.
Observação é um termo geral que significa qualquer tipo de dado
obtido através de notar eventos, contá-los, medi-los, registrá-los. Métodos
de observação são procedimentos sistemáticos e padronizados para se
obter dados. Quase todos os métodos têm o objetivo técnico de ajudar
o observador ou pesquisador a obter medidas de variáveis. O principal
objetivo de “fazer observações”, então, é medir variáveis. Em ciência,,
fazer observações significa mais do que olhar as coisas simplesmente.
Significa também qualquer aparato usado para medir variáveis.
Entrevistas
350
grande parte da pesquisa comportamental, os estímulos estruturados sao
escalas e testes objetivos, que são mais usados do que qualquer ra
coisa para fazer observações. Em capítulos anteriores mencionamos exem
plos de tais testes e escalas, e no capítulo 2 eles foram definidos. Vamos
repetir as definições. Um teste é um procedimento sistemático em que se
apresenta aos indivíduos a serem testados um conjunto de estímulos
construídos, chamados itens, aos quais eles respondem de uma forma
ou de outra. Estas respostas possibilitam o pesquisador atribuir notas
individuais, que presumivelmente indicam o grau em que os indivíduos
possuem o atributo que está sendo medido, ou o grau em que eles
“conhecem” a coisa sendo testada.
Uma escala é semelhante a um teste, enquanto possui itens, e cada
um deles deve medir o que. quer que esteja sendo medido. As escalasv
contudo, não têm o sabor competitivo dos testes. São construídas de
forma que números diferentes possam ser atribuídos a sujeitos diferentes
para indicarem quantidades diferentes da propriedade ou atributo em
mensuracão. Foram dados exemplos no texto. Lembre-se, por exemplo,
de que a conhecida escala F mede autoritarismo. Lembre-se também das
escalas referentes destinadas a medirem conservadorismo e liberalismo.
Foram construídas, literalmente, centenas de escalas e usadas em pesquisa
comportamental para medirem atitudes, valores, rigidez, preconceito, inte
resses, introversão-extroversão e assim por diante. O L;
pC BC.!
LaJ
Observação de comportamento
Estatística e análise
352
tística. Entretanto, a natureza onipresente da estatística e sua importância
vital na análise de dados exige mais do que um “fora” cavalheiresco.
Estamos longe de ter negligenciado o assunto. Nos capítulos 4, 5 e 6,
além de em outros pontos, foram dadas as bases conceituais da análise,
do estudo de relações e da testagem de hipóteses. . . No capítulo 10,
discutimos análise de freqüências. Vimos correlação, regressão e abor
dagens multivariadas nos capítulos 11, 12 e 13. Mas uma análise descri
tiva e uma vista geral da estatística não foram discutidas, sistematica
mente. Vamos fazê-lo agora, mas de forma limitada. O objetivo não é
ensinar estatística; é aprofundar a compreensão da pesquisa comporta-
mental em geral. Vamos anteceder a discussão de estatística com uma
consideração da natureza da análise.
Análise é a categorização, ordenação, manipulação e sumarização
de dados. Seu objetivo é reduzir grandes quantidades de dados brutos
passando-os para uma forma interpretável e manuseável de maneira que
características de situações, acontecimentos e de pessoas possam ser des
critas sucintamente e as relações entre as variáveis estudadas e interpre
tadas. A estatística, naturalmente, faz parte da análise. Já foi definida
mas, para maior clareza, vamos caracterizá-la novamente. Estatística é a
teoria e método de analisar dados obtidos de amostras de observações
com o fim de descrever populações, estudar e comparar fontes de variân-
cia, para ajudar a tomar decisões sobre aceitar ou rejeitar relações entre
fenômenos e para ajudar a fazer inferências fidedignas de observações
empíricas (Kerlinger, 1973, p. 185). Vamos considerar apenas como
avaliar a significância estatística em três situações de pesquisa variadas
e comumente usadas.
Tabela A .l V a lo re s selecionados d e u m a ta b e la f.
p* 0,05 0,01
g .l.b
10 1,81 2,76
15 1,75 2,60
25 1,71 2,49
30 1,70 2,46
354
Média 1 — Média 2
t = ------------------------------------------
Variabilidade de médias casuais
Tais fórmulas foram nitidamente caracterizadas como informação versus
erro (Diamond, 1959). A informação, neste caso a diferença entre duas
médias, está no numerador. O erro, no denominador. O resultado então é
conferido com uma chamada tabela t (dada em qualquer texto de esta
tística). As entradas de uma tabela t são razões t, como acima, e essas
razões t são dadas para amostras de grupos de diferentes números de
casos nas amostras e para níveis diferentes de significância (probabili
dades). Uma pequena parte de uma tabela t é dada na tabela A. 1.
p na tabela significa “probabilidade”, e g.l. significa graus de liber
dade, que não é necessário explicar. Neste caso g.l. é igual ao número
total de casos menos 2, ou N — 2. No estudo de Clark e Walberg,
havia 110 crianças; assim, g.l. = N — 2 = 110 — 2 = 108. Dois p ou
níveis de probabilidade são dados, 0,05 e 0,01. Estes são dois “níveis
de significância” usados comumente. A entrada para g.l. = 108, 1,66,
significa que se um t produzido pela fórmula t é 1,66 ou maior, então
a diferença entre as duas médias é estatisticamente significante: a dife
rença afasta-se significantemente da expectativa casual ao nível de 0,05;
não é um resultado que pudesse ter sido provavelmente produzido apenas
por acaso.
O í do estudo de Clark e Walberg foi 3,09.1 Suponhamos que
aceitemos o nível de 0,05 como nosso critério. Isto quer dizer que
estamos dispostos a aceitar um risco de 5 por cento de estarmos errados.
Já que o t obtido, calculado dos dados dos dois grupos de crianças, foi
3,09, e este é maior do que .1,66 da tabela, a diferença de 4,76 é estatisti
camente significante, o que significa que este resultado provavelmente
não é casual. Lembre-se que as entradas ria tabela são resultados casuais,
por assim dizer. Se o í obtido fosse, digamos, 1,54, então seríamos
forçados a dizer que a diferença de 4,76 entre as médias foi uma das
lnuitas diferenças que poderiam ter acontecido somente pelo acaso.
Portanto, não seria um resultado estatisticamente significante. Isto signi
fica, por sua vez, que realmente não houve diferença alguma de reali
zação em leitura entre os grupos experimental e de controle que pudesse
g p atribuída a outros fatores além do acaso, implicando assim que o
fêçforçamento maciço não teve qualquer efeito apreciável na realização
do grupo experimental de crianças.
555
Se quiséssem os ter consideravelmente mais segurança dá significân-
cia estatística da diferença de 4 ,7 6 , poderiamos ter escolhido o valor de
2 ,3 6 , correspondente ao nível de 0,0 1 . Então a diferença de 4,7 6 é esta
tisticam ente significante ao nível de 0,01, significando que há apenas
uma chance em 100 de obter diferença tão grande apenas pelo acaso.
A mesma conclusão do parágrafo antecedente se seguiría, só que esta
ríamos consideravelm ente mais seguros de que o resultado era estatis
ticamente significante. 2
356
tabela A .2. As entradas na tabela representam números de sociedades.
Por exemplo, 17 num total de 39 sociedades tinham alta ansiedade oral
e usavam também explicações orais para doença.
S ociedades altas em 17 3 20
a n sie d a d e o ral (11,79) (8,21)
S ociedades b aix as em 6 13 19
a n sie d a d e oral (11,21) (7,79)
23 16 39
357
Tabela A .3 Cruzamento da tabela A .2, com freqüências "obtidas” fictícias, pró
ximas da expectativa de acaso*.
14 6 20
(11,79) (8.21)
9 10 19
(11,21) (7,79)
23 16 39
A® entrai^as üas células são freqüências. As entradas entre parênteses são fre
quências esperadas, calculadas dos totais marginais, por exemplo, (20)(23)/39
= 11,79. x2 = 2,06, significante ao nível de 0,01; C = 0,22. (Veia o texto para
uma explanação de x1 e C.) ^
358
gêttcia, ou C. C para a tabela A . 2 é 0 ,4 8 e para a tabela A .3 é 0,22.
Estes coeficientes C são apenas medidas aproximadas das relações. Eles
subestimam a magnitude das relações, por exem plo. Entretanto, dão uma
idéia da magnitude relativa das relações nas duas tabelas.
Xt-Xt
359
onde Xi e X2 são as médias dos grupos 1 e 2 e EP . , _ é o chamado
Xj —X2
erro padrão das diferenças entre as duas médias. Um erro padrão é
uma medida de flutuação ao acaso. Neste caso é o erro padrão da
diferença entre duas médias. É um cálculo da variabilidade das diferen
ças entres as médias, tendo as médias sido calculadas de conjunto de dois
grupos de números aleatórios. Por exemplo, supondo que tiramos núme
ros aleatórios em conjuntos de dois, digamos, 20 números em cada grupo,
calculamos então as médias de cada conjunto e as diferenças entre estas
médias. Fazemos isto diversas vezes e calculamos então a variabilidade
(os erros padrões) das diferenças. Este erro padrão, então, é usado para
avaliar a magnitude da diferença obtida. Se a diferença obtida for “sufi
cientemente maior do que” o erro padrão, então a razão t é “grande”
e considerada estatisticamente significante.
Esta abordagem geral é muito usada nas ciências comportamentais.
Vamos agora ilustrá-la com a avaliação da significância estatística de
coeficientes de correlação. O raciocínio e o método são semelhantes.
A fórmula para o erro padrão, naturalmente, é diferente. A fórmula para
avaliar a significância estatística de um coeficiente de correlação.é:
r
t = ---------
EPr
Como calcular EPr, o erro padrão de r, não irá nos ocupar. O que
devemos notar é que temos novamente um teste t, e a forma da fórmula
é a mesma que foi usada para a significância da diferença entre duas
médias: informação (no numerador) contra erro (no denominador).
Vamos supor que estejamos interessados em compreender as atitu
des em relação às mulheres e, em consonância com um exemplo dado em
um capítulo anterior, acreditamos que as crenças sociais são sistematica
mente relacionadas, e que a crença na igualdade para as mulheres está
positivamente ligada à crença na liberdade sexual e legalização do aborto.
Ou seja, indivíduos que acreditam que deva haver considerável liberdade
sexual para ambos os sexos e que o aborto deveria ser legalizado e feito
quando a mulher o desejasse, também acreditam na igualdade para as
mulheres. Suponhamos ainda que tenham sido construídas escalas para
medir, por um lado, atitudes em relação à liberdade sexual e legalização
do aborto e, por outro, igualdade para as mulheres, que ambas as escalas
tenham sido aplicadas a 20 homens e que 0 coeficiente de correlação
entre as duas escalas seja 0,30.
Este r de 0,30 apóia nossa crença de que há uma correlação posi
tiva entre os dois conjuntos de crenças? Assim como com todas as
estatísticas, devemos perguntar se este r é estatisticamente significante.
360
Ou é um dos muitos r que poderíam ter sido calculados entre conjuntos
de números aleatórios? Se calculamos t para este r, obtemos t = 1,33.
O t da tabela, ao nível de 0,05 para 18 graus de liberdade (N — 2 —
20 — 2 = 18), que, digamos, aceitamos anteriormente como nosso
critério de significância, é 1,73. Nosso t obtido, entretanto, é de apenas
1,33. Já que é menor que 1,73, percebemos que nosso coeficiente de
correlação de 0,30 não é estatisticamente significante. Concluímos, por
tanto, que há pouca ou “nenhuma” relação entre nossos conjuntos de
crenças.
Suponhamos que o r obtido tenha sido de 0,62 com 20 sujeitos que
responderam ambas as escalas. Será estatisticamente significante? Sim, é.
O t então é 3,35, que é maior do que ambas as entradas ao nível de
0,05 e 0,01 da tabela t (o t para 0,05 é 1,73, como acima e o t para 0,01
é 2,55). O r de 0,62 é, portanto, estatisticamente significante e podemos
então pensar na magnitude de r e seu significado. Quer dizer que há
uma relação bastante substancial entre os dois conjuntos de atitudes:
indivíduos que acreditam em liberdade sexual e legalização do aborto
tendem também a acreditar na igualdade para as mulheres. Em resumo,
a significância estatística de um coeficiente de correlação é estabelecida
primeiramente, e depois sua magnitude é avaliada.
Observe que o tamanho de N, o tamanho da amostra, afeta a signi
ficância estatística das estatísticas. Suponhamos, por exemplo, que tivésse
mos obtido um r de 0,30, mas que houvesse 30 sujeitos que responde
ram aos instrumentos de atitude (em vez de 20 sujeitos). Então
t = 1,664. Embora isto não seja significante de acordo com a tabela
t — a entrada t ao nível de 0,05 para g.l. = 28 é 1,701 — é quase
significante. Se calcularmos a probabilidade com um computador, como
fizemos antes, encontraremos p = 0,054, apenas um pouco maior do
que 0,05. Assim, isto seria, embora marginal, sugestivo. Não o caracte
rizaríamos como claramente não significante. Se tivéssemos 35 sujeitos e
um r de 0,30, t = 1,807, que é significante ao nível de 0,05. (A proba
bilidade calculada pela máquina é p = 0,04.)
Há, naturalmente, muitos tipos diferentes de tèstes de significância
estatística. A maioria deles, por mais complicadas que sejam suas fórmu
las, são baseados no mesmo princípio relativamente simples: a compa
ração de resultados obtidos com resultados esperados por acaso. O leitor
deveria perceber, entretanto, que a significância estatística diz pouco
ou nada a respeito da magnitude de uma diferença ou de uma relação.
Com um número grande de sujeitos, digamos, mais de 200, a maioria
dos testes de significância mostra significância estatística, mesmo
quando uma diferença entre médias seja bastante pequena, talvez trivial,
ou um coeficiente de correlação seja muito pequeno e trivial. Com 1.000
sMieitos, por exemplo, um r obtido de 0,06 apenas é significante ao nível
361
de 0,05! Como sempre, não há substituto para o bom julgamento e para
a experiência. Para se usar a estatística adequadamente, é preciso com
preender os princípios e ser capaz de julgar se os resultados obtidos
são estatisticamente significantes e se são significativos no contexto par
ticular da pesquisa. Um coeficiente de correlação de 0,30 pode ser
baixo, até trivial, com um problema de pesquisa e ao mesmo tempo
ser substancial com outro problema.
362
Bibliografia
364
Goldfarb, W. The effects of early institutional care on adolescent personality.
Journal o f E xperim ental Educatioh, 12: 106-129, 1943.
Green, B. F. D igital com ptiters in research. N ew York: McGraw-Hill, 1963.
Guilford, J. P. Psychom etric m ethods { 2 ‘ ed.). N ew York: McGraw-Hill, 1954.
Guilford, J. P. The structure of intellect. Psychological Bulletin, 53:267-293, 1956.
Guilford, J. P. Three faces of intellect. A m erican Psychologist, 14:46 9-479, 1959.
Guilford, J. P. T h e nature o f h um an intelligence. New York: McGraw-Hill, 1967.
Guthrie, E. R. T h e psychology o f learning. New York: Harper e Brothers, 1935.
Hartz, L. T h e liberal tradition in Am erica. New York: Harcourt, 1955.
Harvey, J. H., Ickes, W. J. e Kidd, R. F. N e w directions in a ttribution research
(Vol. 1). Hillsdale, N.J.: Lawrence Erlbaum Associates, 1976.
Harvey, J. H. e Kelley, H. H. Sense of own judgmental competence as a function
of temporal pattem of stability-instability in judgment. Journal o f Personality
a n d Social Psychology, 29:526-538, 1974.
Hays, W. L. Statistics fo r the social Sciences (2.* ed.). New York: Holt, Rinehart
and Winston, 1973,
Hilgard, E. R., Atkinson, R. C. e Atkinson, R. L. Intro d u ctio n to psychology
(6.* ed.). New York: Harcourt, 1975.
Holtzman ,W. H. e Brown, W. F. Evaluating the study habits and attitudes of
high school students. Journal o f E ducational Psychology, 59:404-409, 1968.
Howells, W. W. The importance of being human. In: J. M. Tanur <org .), Statistics:
A guide to th e un kn o w n . San Francisco: Holden-Day, 1972.
Hurlock, E. An evaluation of certain incentives used in schoolwork. Journal o f
Educational Psychology, 16:145-159, 1925.
Husén, T. (org.). International stu d y o f achievem ent in m athem atics: A com parison
o f tw elve countries (Vols. I e II). New York: Wiley, 1967.
Hyman. H. H., Wright, C. R. e Reed, J. S. T h e enduring effects o f education.
Chicago: University of Chicago Press, 1975.
Jones, E. E., Kanouse, D. E., Kelley, H. H., Nisbett, R. E., Valins, .S. e Weiner, B.
A ttribution: Perceiving th e causes o f behavior. Morristown, N.J.: General
Learning Press, 1971.
Jones, E. E., Rock, L., Shaver, £ . G., Goethals, G. R. e Ward, L. M. Pattem of
performance and ability attribution: An unexpected primacy effect. Journal o f
Personality and Social Psychology, 10:317-340, 1968.
Jõreskog, K. G. Analyzing psychological data by structural analysis of çovariance
matrices. In: D. H. Krantz. R. C. Atkinson, R. D. Luce e P. Suppes (orgs.),
Contem porary developm ents in mathematiccd psychology (Vol. II): Measure-
m eni, psychophysics, a n d inform ation processing. San Francisco: Freeman,
1974.
Jõreskog, K. G. Structural equation models in the social Sciences: Specification,
estimation and testing. Research report 76-9. Uppsala, Sweden: Uppsala Uni
versity, 1976.
Katz, D. e Braly. K. W. Racial prejudice and racial stereotypes. Journal o f
A bnorm al and Social Psychology, 3 0: 175-193, 1935.
Kemeny, J. G. A phitosopher tooks at Science. Princeton, N.J.: Van Nostrand, 1959.
Kemeny, J. G., Snell, J. L. e Thompson, G. L. In tro d u ctio n to fin ite m athem atics
(2.* ed.). Englewood CUffs, N.J.: Prentice-Hall, 1966.
Kerlinger, F. N. Social attitudes and their criterial referents: A structural theory.
Psychological R ev iew , 74:110-122, 1967.
Kerlinger, F. N. The structure and content of social attitude referents: A prelimi-
nary study. Educational and Psychological. Measurement, 32:613-630, 1972.
Kerlinger, F. N. The influence of research on educational practice. Educational
Researcher, 6:5-12, 1977.
Kerlinger, F. N. Foundations of behavioral research (2.a ed.). New York: Holt,
Rinehart and Winston, 1973.
Kerlinger, F. N. e Pedhazur, E. J. Multiple regression in behavioral research. New
York: Holt, Rinehart and Winston, 1973.
Kerlinger, F. N., Middendorp, C. P. e Amón, J. The structure of social attitudes
in three countries: Tests of a criterial referent theory. International Journal of
Psychology, 11:265-279, 1976.
Kidd, C. V. Basic research — Description versus definition. Science, 129:368-371,
1959.
Kirk, R. The conservative mind (ed. revista). Chicago: Henry Regnery, 1960.
Kirscht, J. P. e Dillehay, R. C. Dimensions of authoritarianism: A review of
research and ikeory. Lexington, Ky.: University of Kentucky Press, 1967.
Krech, D. e Crutchfield, R. S. Theory and problems of social psychology. New
York: McGraw-Hill, 1948.
Lee, R. S. Social attitudes and the Computer revolution. Public Opinion Quarterly,
34:53-59, 1970.
Likert, R. e Hayes, S. P. (orgs.). Some applications of behavioral research. Paris:
UNESCO, 1957.
Lindsay, P. H. e Norman, D. A. Human information processing: An introduction
to psychology (2.a ed.). New York: Academic Press, 1977.
Lindzey, G. e Aronson, E. (orgs.). The handbook of social psychology (Vol. 2).
Reading, Mass.: Addison-Wesley, 1968.
Marjoribanks, K. Ethnic and environmental influences on meiítal abilities. Ameri
can Journal of Sociology, 78:323-337, 1972.
Markus H. Self-schemata and processing information about the self. Journal of
Personality and Social Psychology, 35:63-78, 1977.
McClelland, D. C. The achieving society. Princeton, N.J.: Van Nostrand, 1961.
McClelland, D. C., Atkinson, J. W., Clark, R. A. e Lowell, E. L. The achievement
motive. New York: Appleton, 1953.
McConnell, J. V., Jacobson, A. L. e Kimble, D. P. The effects of regeneration
upon retention of conditioned response in the planarian. Journal of Compara
tivo and Physiological Psychology, 52:1-5, 1959.
Milgram, S. Obedience to authority. New York: Harper & Row, 1974.
Miller, N. E. Neal E. Miller: Selected papers. Chicago: Aldine, 1971.
Miller, D. R. e Swanson, G. E. Inner conflict and defense. New York: Holt,
Rinehart and Winston, 1960.
Morrow, J. e Smithson, B. Learning sets in an invertebrate. Science, 159:850-851,
1969.
Murdock, G. et al. Outlines of cultural materiais (3.‘ ed.). New Haven, Conn.:
Human Relations Area Files, 1950.
Nagel, E. The structure of Science. New York: Harcourt, 1961.
Nunnally, J. Psychometric theory. New York: McGraw-Hill, 1967.
Page, E. B. Teacher comments and student performance: A seventy-four classroom
experiment in school motivation. Journal of Educational Psychology,
49:173-181, 1958.
366
Parkinson, C. N. Parkinson’s law. London: John Murray, 1957,
Platt, J. R. Strong inference. Science, 146:347-353, 1964.
Report of the National Advisory Commission on Civil Disorders. Bantam Books,
1968.
Robinson, J. P., Rusk. J. G. e Head, K. B. Measures of political attitudes. Ann
Arbor: Institute for Social Research, University of Michigan, 1968.
Robinson, J. P. e Shaver, P. R. Measures of social psychological attitudes. Ann
Arbor: Institute for Social Research, University of Michigan, 1969.
Roe, A. e Siegelman, M. The origin of interests. Washington, D.C.: American
Personnel and Guidance Association, 1964.
Rogers, C. R. Persons or Science? A philosophical question. American Psychologist,
10:267-278, 1955.
Rokeach, M. The nature and meaning of dogmatism. Psychological Review,
67:194-204, 1954.
Rokeach, M. The open and closed mind. New York: Basic Books, 1960.
Rokeach, M. Beliefs, attitudes, and values. San Francisco: Jossey-Bass, 1968.
Rokeach, M. The nature of human values. New York: Free Press, 1973.
Rokeach, M. e Mezei, L. Race and belief as factors in social choice. Science,
757:167-172, 1966.
Rosch, E. H. Natural categories. Cognitive Psychology, 4:328-350, 1973.
Rosenberg, M. Factors influencing change in occupational choice. In: P. Lazarsfeld
e M. Rosenberg (orgs.), The language of social research. New York: Free
Press, 1955.
Rossiter, C. Conservatism in America (2.a ed.). New York: Vintage, 1962.
Rozeboom, W. W. Poundations of the theory of prediction. Homewood, 111.: Dorsey
Press, 1966.
Schachter, S., Elertson, N., McBride, D. e Gregory, D. An experimental study of
cohesiveness and productivity. Human Relations, 4:229-238, 1951.
Shaver, K. G. An introduction to attribution processes. Cambridge, Mass.:
Winthrop Publishers, 1975.
Shaw, M. E. e Wright, J. M. Scales for the measurement of attitudes. New York:
McGraw-Hill, 1967.
Simpson, G. E. e Yinger, J. M. Racial and cultural minorities (3.a ed.). New York:
Harper & Row, 1965.
Snedecor, G. W., & Cochran, W. C. Statistical methods (6.a ed.). Ames, lowa:
Iowa State University Press, 1967.
Social Science Research Council. Theory and practice in histórical study: A report
of the committee on historiography. New York: Social Science Research
Council, 1946.
Sontag, H. Attitudes toward education and perception of teacher behaviors. Ameri
can Educational Research Journal, 5:385-402, 1969.
Stephenson, W. The study of behavior. Chicago: University of Chicago Press, 1953.
Stevens, S. S. Mathematics, measurement and psychophysics. In: S. S. Stevens
(org.), Handbook of experimental psychology. New York: Willey, 1951.
Stouffer, S. A. Communism, conformity, and civil liberties. Garden City, New
York: Doubleday, 1955.
Sullins, W. L. Matrix algebra for statistical applications. Danville, 111.: Interstate
Printers and Publishers, 1973.
Tatsuoka, M. M. Discriminant analysis: The study of group differences. Champaign,
111.: Institute for Personality and Ability Testing, 1970.
Tatsuoka, M. M. Mulíivariate analysis: Techniques for educational and psycholo-
gical research. New York: Wiley, 1971.
Thomson, G. The two aspects of Science. Science, 132:996-1000, 1960.
Thorndike, R. L. Reading comprehension education ín jifteen countries: Interna
tional studies in evaluation (Vol. III). New York: Wiley, 1973.
Thurstone, L. L. e Thurstone, T. G. Factorial studies of intelligence. Chicago:
University of Chicago Press, 1941.
Townes, C. H. Quantum electronics, and surprise in development of technology.
Science, 159:699-703, 1968.
Turing, A. M. Can a machine think? In: J. R. Newman (org.), The world of
mathematics (Vol. 4). New York: Simon & Schuster, 1956.
Walster, E., Cleary, T. A. e Clifford, M. M. The effect of race and sex on college
admission. Journal of Educational Sociology, 44:237-244, 1971.
Walster, E., Walster, G. W., Piliavin, J. e Schmidt, L. “Playing hard to get”:
Understanding an elusive phenomenon. Journal of Personality and Social
Phychology, 26:113-121, 1973.
Waterhian, A. T. Federal support of Science. Science, 153:1359-1361, 1961.
Weizenbaum, J. Computer power and human reason. San Francisco: Freeman, 1976.
Whiting, J. W. M., e Child, I. L. Child training and personality: A cross-cultural
study. New Haven, Conn.: Yale University Press, 1953.
Wiley, D. E., Schmidt, W. H. e Bramble, W. J. Studies of a class of covariance
structure models. Journal of the American Statistical Association, 68:317-323,
1973.
Woodmansée, J. J. e Cook, S. W. Dimensions of verbal racial attitudes: Their
identification and measurement. Journal of Personality and Social Psychology,
7:240-250, 1967.
Worell, L. Levei of aspiration and academic success. Journal of Educational
Psychology, 50:47-54, 1959.
368
ín d ic e o n o m á s tic o
369
Harding, J. 106» Markus, H. 312
Hartz, L. 232 Meehl, P. E. 159»
Harvey, J. H. 333», 334 Mezei, L. 43
Hayes, S. P. 172» Middendrop, C. P. 228-232, 256, 274
Hays, W. L. 301 Milgram, S. 120-130, 131», 143, 321
Head, K. B. 232 Miller, D. R. 6-9, 28, 36, 91, 110, 164,
Üilgard, E. R. 322», 333» 170, 356
Hobson, C. J. 134-135 Miller, N. E. 16, 40
Holtzman, W. H. 48, 187,189, 192, 244 Mills, I. 27, 81», 95-96, 102-104, 119,
Horkheimer, M. 339 131, 141, 321
Howells, W. W. 247-248, 251-252n Mischel, W. 312
Hurlock, E. 36, 47 Mood, A. M. 134-135
Husén, T. 325 Morrow, J. 314
Hyman, H. H. 166-170» Mowrer, O. H. 40
Murdock, G. 356
Ickes, W. J. 333»
Nagel, E. 316»
Jacobson, A. L, 322 Nisbett, R. E. 333»
Jahoda, M. 341» Norman, D. A. 38, 294»
Jensen, O. 36 Nunnally, ). 155»
fohnson, L. B. 175
Jones, E. E. 333», 334
Joeskog, K. 254-263 Page, E. B. 3
Parkinson, C. N. 113
Kanouse, D. E. 333» Pedhazur, E. J. 264»
Katz, D. 127», 338, 352 Piaget, J. 335
Kaya, E. 272» Pilivian, J. 42
Kelley, H. H. 333», 334 Platt, I. R. 124, 129, 332, 345
Kemeny, J. G. 53, 79 Potok, C. 311
Kerlinger, F. N. 30», 69,115», 165» 174»,
228-232, 255, 264», 272», 274, 317», Reed, J. S. 166-170
328», 331», 352, 353 Robinson, I. 284»
Kidd, C. V. 333» Robinson, I- P. 232
Kidd, R. F. 321 Rock, L. 334
Kimble, D. P. 322 Roe, A. 237-238
Kirk, R. 232 Rogers, C. R. 306
Kirscht, J. P. 341» Rokeach, M. 43, 136-137, 158, 302, 340»
Krech, D. 38, 138-139, 338 Rosch, E. H. 36
Rosenzweig, M. R. 38, 138-139
Lee, R. S. 295 Rossiter, C. 232
Lenin, V. I. 346» Rusk, J. C. 232
Levinson, D. J. 63»
Lewin, K. 47 Sanford, R. N. 63»
Likert, R. 172» Schachter, S. 38
Lindsay, P. M. 38, 294»
Schmidt, L. 42
Lindzey, G. 352
Lohnes, P. R. 238», 252, 253, 260 Schmidt, W. H. 225»
Lorge, I. 272n Sears, R. R. 40
Lowell, E. L. 264 Senghaas, D. 129, 332, 345
Shaver, K. G. 333», 334
McBride, D. 38 Shaver, P. R. 232
McClelland, D. C. 8, 264 Shaw, M. E. 232
McConnell, J. V. 322 Síegelman, M. 237-238
McPartland, J. 134-135 Simpson, G. E. 338»
Marjoribanks, K. 194-199 Skinner, B. F. 314
370
Smithson, B. 314 Valins, S. 333n
Snedecor, G. W. 99n Van Heerden, J. 316n
Snell, J. L. 53
Sontag, M. 227-228 Walberg, H. J. 4-5, 8, 9, 11, 27, 35, 36,
Stanley, J. C. 113, 141 47, 75, 86, 91, 96, 141, 236, 324,
Steiner, G. A. 137 327-328, 329, 354-355
Stephenson, W. 226, 3 lln , 314-315 Walster, E. 42, 49, 115-117, 131n
Stevens, S. S. 145 Walster, G. W. 42
Stouffer, S. A. 163-164, 170, 171, 172 Ward, L. M. 334
Sullins, W. L. 260 Waterman, A. T. 329
Swanson, G. E. 6-9, 28, 36, 91, 110, 164, Weiner, B. 333n
170, 356 Weinfeld, F. D. 134-135
Weizenbaum, J. 274, 276
Tatsuoka, M. M. 249, 250n, 260 Whiting, J. W. 356-357
Taylor, G. 42, 43 Wiley, D. E. 255n
372
—- e engenharia 320 — n a an álise dos d ad o s 170
~ — e o indivíduo 303-313 co rre la ç ã o 60, 183-184, 207-209
— e pragmatismo 327-329 — a lta e a n á lise de reg ressão 199-201
— e valor 302-303, 341-346 — c a n ô n ic a 239-242
— naturais e objetividade 12-13 — e n tre ind iv íd u o s 226-228
— natureza geral da 3-9 — fo rç a d a 260-262
— neutralidade da 37-38 — m o m e n to -p ro d u to 184
— objetivo da 17-21 — sig n ificân cia e statística d a s 359-362
— social (ver pesquisa comportamental) — zero 2 1 l n
— versus humanidades 344 “ c o rre la to s” 163w
— unidade de discurso 311-316 c o v a riâ n c ia 30,183-184
classificação, fidedignidade 153 — an álise de e stru tu ra s d e 254-269
coeficiente c ria tiv id a d e
— de consistência interna 153 — o b serv açõ es d a 10
— de contingência 358-359 — p re d iç ã o d a 307-308
— de correlação 60, 61, 64, 183-184, 270 c ru z a m e n to 174
múltipla 192-194 — e an á lise d e fre q ü ê n c ia 177
— de fidedignidade 153 c u rio sid a d e c ien tífica 202
de teste-reteste 153
— de regressão 190 D a d o s 28-29
— de trajetória 265 — c o le ta d e 349-352
Comitê Judeu Norte-Americano 339-340 d e fin ição
comportamento — c o n stitu tiv a 46
— do professor 226-228 — o p e ra c io n a l 46-50
—■inteligente 233 -------- c rític a d a 49-50
— observação do 351-352 -------- e x p e rim e n ta l 47
computador 271-295 -------- fu n ç ã o d a 47-48
— calculadoras programáveis 282-283 -------- m e d id a 47
— características dos 273-277 -------- m e d in d o a in te lig ê n c ia 147-148
— caráter internacional 291-292 — p o r re g ra 53
— desvantagens de 292-295 — te ó ric a 77
— e tabela t 356n d elin eam en to (s)
— iteração 287-288 — c a su alização 97-104
— raiz quadrada 286-289 — “ clássico ” 105
— efeitos na pesquisa comportamental — d e p e sq u isa 94, 119
271-273, 289-295 — d e u m a só v ariá v e l in d e p e n d e n te
— limitações 275 94-107
— usos e operações 284-289 -------- g en eralização 97
— viciados 276 ---------lim ita ç ã o 104
conceito — fa to ria is 105-119
— definição 23 -------- dois-por-dois 107
— variável 45-46 -------- 2x2x3 115-117
concepção bipolar 229, 256 -------- exem plo fictício 106-113
conhecimento, bases do 1-2 -------- exem plos d e p e sq u isa 113-118
conjuntos 52 -------- fo rm a s 112
conservadorismo 228-232, 340 -------- v an tag e n s 106
constante 45n desig n ação a le a tó ria 27, 94-95
constructo — e casu alização 99-102
— na hipótese 41-42 d e so rd e n s civis 175-176
— variável 25, 45-46 (ver também con d ia g ra m a d e tra je tó ria 264
ceito) d ife re n ç a s casuais 87-89
contaminação 125 d ire ç ã o d e in flu ê n c ia 263, 264
contar, como mensuração 178n d isc ip lin a
controle 123-130 — id io g ráfica 305-306
— definição de 123-124 — n o m o té tic a 305-306
distorção e propósito da ciência 20 — reco m p en sa m a c iç a e ap ro v e ita m e n to
distribuição n a le itu ra 4-5
— de freqüência 174 — testagem d a te o ria 125-126
— normal 301n — “ v e rd a d e iro ” 141-142
divergência geométrica 249-251 explicação(ões) 8, 15, 118-119
dogmatismo 158-159. — com o p ro p ó sito 17-20
— e m e lh o r p re d iç ã o 196
ductilidade 275
— e o b je tiv id a d e 13-14
— n a tu ra is 70
Efeito(s)
— teo ria e relaçõ es 69-73
— da privação 137, 141
— heurístico 334
F a to r
— principais 110 — d efinição 203-204, 221-225
entrevista 163, 350 — de pessoa 227
equação de regressão 190, 246 — ro ta ç ã o d e 216 n, 294
erro padrão 360 fid e d ig n id a d e 91, 148-155, 159
escala(s) 29 — com o e sta b ilid a d e 153
— D (dogmatismo) 158-159 — d efin ição d e 149-150, 152
— definição 351 — exem plos 150-154
— F 154, 158 — im p o rtâ n c ia d a 154-155
— objetiva 11, 350-351 fo n te
escolarização, efeitos duráveis da 166-170 — p rim á ria 348
escolha ao acaso 4n — se c u n d á ria 348
estado agêntico 126 F o rtra n 277-281
estatística 348-349 freq ü ên cia(s)
— concepção errônea da 92-93 — com o m e n su ra ç ã o 178n
— definição 89-90, 353 — d efin ição 173-174
— descritiva 90 — relativ as 173n
— e análise 352-362 fu m o e p e sq u isa d o c â n c e r 132-133
— e realidade 92-93
— influência 91 G en erá liz a ç ã o 129-130
— propósito da 93 gráficos de relaçõ es 62-63
graus d e c erteza 74-75
estereótipo
— racial 225-226, 339-340 gru p o
— d e c o n tro le 5
— sexual 115-117
— e x p e rim e n ta l 5
estudo (s)
— da tolerância e intolerância 163-164
H ip ó tese(s) 38-44
— de caso 313 — de dois fa to re s 257
— definição 26-27 — d e . in te ra ç ã o 110, 117
— de igualdade e liberdade 136-137 — e te s ta b ilid a d e 41-42
— longitudinal 166, 168 — exem plos d e 42-44
— sobre predição 187-189 — te ste d a 82-84
estrutura fatorial 204 — v a lo r das 39-41
etnia 194-199 h isto rio g ra fia 348
etnocentrismo 341
evento 77, 84 Ig u a ld a d e d e o p o rtu n id a d e edu cacio n al
experimento(s) [veja re la tó rio C o lem an)
— artificialidade do 128 in d e p e n d ê n c ia 84-86, 109, 184-185
— características 26-27, 125-127 ín d ice 6 2 n
— definição 3, 94-95, 125, 143 in d iv íd u o
— e estudo não-experimental ( veja pes — e a n álise d e c o n te ú d o 312-314
quisa não-experimental) — e ciência 303-313
— generalização do 129-130 — e p e rfis 309-311
— no campo 95, 127« — e p re d iç ã o 306n
374
— estatística do 31 ln, 314-315 — crítica da 160
inferência(s) 91 — d e fin iç ã o 145
— causais 13 ln, 181n, 199 — d isc rim in a ç ã o 146-147
inteligência — do d ogm atism o 158-159
— análise fatorial da 204-207 — em p e rsp e c tiv a 159-161
— conhecimento acerca da 344-346 — fid e d ig n id a d e d a 148-155
— e efeitos na educação 168-170 — in telig ên cia 147-148
— e realização 181-182 — n o m in a l 178n, 243
— estudos de Guilford 218-221 — v a lid a d e d a 160
— fatores da 209-212 m é to d o (s)
— geral 218 — d o s g ru p o s co n h ecid o s 158
— medindo 147-148, 299-303 — q u a n tita tiv o s 209-302
— teoria de Thurstone 205-207 m eto d o lo g ia 296-316, 335-336
— verdadeira e funcional 148 — Q 226-227, 314-315
interação de variáveis 108, 112 m odelo
— sexo e capacidade 116-117 — c asu al 265
International Studies of Educational — lin e a r 238«-239n
Achievement 325
inversão de matriz 275 National Advisory Commission on Civil
investigação Disorders 325
— história 347-348 nível
— sociológica 162-170 — do discu rso 328n
------- classe social e tempo de desmame — d e significância 354, 355
164 n o ta (s)
------- conclusão 178 — d isc rim in a n te s 251-252
------- efeitos duráveis da escolarização — p a d rã o 310n
166-170 — p re d ita s 245-246
------- estudo de tolerância e intolerân — v e rd a d e ira 150 ( veja p o n to )
cia de Stouffer 164-165 n ú m e ro s 146n
------- valores orientados para pessoas — ale a tó rio s 69, 80
e escolha ocupacional 165-166 p o r c o m p u ta d o r 284
itens 29, 254n
iteração 287-288 O b e d iê n c ia e a u to rid a d e 120-123
o b je tiv id a d e 8, 296-299, 342
Lei(s) — com o p ro c e d im e n to 14-15
— científicas 304n — c rític a d a 297-298
— de Parkinson 113-114 — d efin ição 10-11, 298-299
levantamento(s) 170-173, 325-326 — e exp licação 13-14
- descritivos 171 — e h ip ó te se 39-41
liberalismo 228-232 — e p e sq u isa c ien tífica 9-15
linha de regressão 58, 62 — p e rd a d a 20
o b se rv a ç ã o 144-145
Manipulação 3, 27, 95 — d e co m p o rta m e n to 351-352
máquina, definição de 273-274 — d e fin iç ã o 350
matriz 204 — d isto rção n a 10
— alvo ou hipótese 211, 258-259 — m éto d o s d e 349-352
— de carga fatorial 204 o rie n ta ç ã o p a ra pessoas e o c u p a ç ã o 238
— de correlação 204, 259
— de covariância 260 P a re s o rd e n a d o s 55
medidas p e n sa m e n to
— contínuas 356 — c o n v erg en te 220
— definidas 29 — d iv erg en te 32
média 61n — p ro b a b ilístic o 32
memória, estudo da. 322-324 p e q u e n a te o ria 18, 73, 264
mensuração 145-148 p e rfis 309-311
pesos — conversão 174-177
— b e ta 191-192 pragmatismo
— d e regressão 189-192 — comparado com o empirismo 15-16
p esq u isa — de apelo e preconceito 106-113
— a p lic a d a 115-117 — e ciência 327-331
d e fin ição 321 prática, influência da pesquisa na 332-341
-------- dois im p o rta n te s estu d o s 324-327 preconceito
-------- e an álise d isc rim in a n te 252-253 — análise fatorial do 220-226
-------- e p e sq u isa b á sic a 320-327 — e admissão a faculdade 115-117
— b á sic a 320-321 — e apelos pragmáticos e morais 106-113
-------- e a p lic a d a 320-327, 331-332 — e autoritarismo 63-64, 65
— co m p o rta m e n ta l — e explicação 70-71
-------- co n ceito s e d efinições 22-32 — e medição 146-147
-------- co n cepções e rrô n e a s e c o n tro v é r — hostilidade e agressão 117-118
sias 296-316, 317-346 predição 306-309
-------- d e fin ição 2 n — e explicação 196
-------- o b je tiv id a d e n a 12-13 — grupo 308
-------- p ro b a b ilid a d e e acaso 81-84 — participação no grupo 243
-------- relaçõ es n a 58-66 princípio da parcimônia 202-203, 265
— ■— traço s c a ra c te rístic o s d a 8 probabilidade(s) 31-32, 75-89
— d e le itu ra 330 — concepção errônea 84-86
— efeitos possíveis d a 332-335 — condicionais 175
— e p rá tic a 317-346 — definição 76-79
— e questões éticas 122 — e acaso e pesquisa 81-84
— e re le v â n c ia 330w-331n — nas ciências naturais versus compor-
— ex p e rim e n ta l 120-130 tamentais 74-76
-------- co n tro le 123-130 problemas 35-38
-------- fo rç a d a 127-128 critérios de 36-37
-------- fra q u e z a d a 128-130 — definição 35
— ex post facto (veja p e sq u isa não-ope- — exemplos 42-44
racio n al) — valor e engenharia 33-34
— m eto d o ló g ica 348 procedimento de Monte Cario 89
— m u ltiv a ria d a 179-201, 235-270 programas de computadores 277-281
-------- an álise d isc rim in a n te 242-254 — ACOVS e LISREL 255n
-------- an álise fa to ria l 202-234 — de tradução (compilador) 283n-284n
-------- con clu são 269-270 — linguagem para 277-281
-------- c o rrelação ca n ô n ic a 239-242 — pacote 294
-------- d e fin ição 180n — sub-rotina 285n
-------- exem plos e x p erim en tais 236-247 proposições testáveis 34-35, 36-37, 41-42
-------- p a rtiç ã o d a v a riâ n c ia 179-186 psicometria 349
— n ão -ex p erim en tal 130-134
-------- classes sociais e tip o s d e Criação Q-sort 227, 314
5-9 questão
-------- c o n fia n ç a 124 — de engenharia 33-34
-------- d e fin ição 3-4 — de valor 33-34, 37
------— e p e sq u isa e x p e rim e n ta l 139-141 quociente de inteligência (QI) 148
-------- ex em plos d e 134-141
-------- in v estig ação sociológica 162-170 Raiz quadrada por computador 286-289
-------- v ariáv eis n á 133 realidade dos fatores 203
— objetiv o d a 318-320 realização 8-9
— tip o s d e 347-349 — definida operacionalmente 48
“ p ic o ta d o re s” d e co m p u ta d o re s 276 — e inteligência 181-182
p o n to , d efin iç ã o 25 ( veja n o ta) — explicação da 72
p o p u la ç ã o , d efin iç ã o 80 — necessidade de 264-269
p o rcen tag en s, u sa d a s n a s tab elas 164/t referentes criteriais 229
376
re fo rç a m e n to 9n — e hipótese 41
— p o sitiv o e neg ativ o 4 n .— e lei 304b
reg ressão m ú ltip la 187-194 — e pesquisa da eqüidade 131
— e c o m p u ta d o r 273 — explicação e relações 69-73
— e q u aç ão 189-192 — influência da 336-337
— ex em plos d e p e sq u isa 194-201 — objetivo 17-19, 318-320
re la ç ã o “ se-então” 39 — pequena 18, 73, 264
relaçõ es 26, 51-52, 53-57, 183 — testagem no experimento 126
— com o u m c o n ju n to d e p a re s o rd e testagem empírica 37
n a d o s 55-56 teste(s)
— d efin iç ã o 5-6 — definição 29, 351
— d ire ç ã o e m a g n itu d e 58-62, 63-64, — de inteligência 148, 210
66-69 — fidedignidade 153-154
— e ex p licação e te o ria 69-73 — objetividade 10-11, 350-351
— e h ip ó te se 38-39 — redações 11
— e m en su ra ç ã o 145-146 — "robustos” 302
— ex p ressão d a 39 — t 284, 301-302, 353-356
— g ráfico s d e 62-63 The Achieving Society 8
—; n a p e sq u isa c o m p o rta m e n ta l 57-64 The Authoritarian Personality 339-341
— n eg ativ as 67-68
— p o sitiv a s 58 Unidade de discurso na ciência 311-316
— ra c ia is 325-326, 337-341 universo do discurso 328b
— tip o s d e 65-69
— z e ro 61, 62, 69 Validade 155-159
re la tó rio C o lem an 134-135, 178, 254, — de constructo 157-159
325, 329 — de conteúdo 157
re le v â n c ia 330n-331n — definição e natureza da 156-157
re p lic a ç ã o 5, 12, 127, 128, 140 — empírica 75
Report of the National Advisory Com- — e o método dos grupos conhecidos
mittee on Civil Disorders (1969) 158
175-176
— e validação de constructo 159
re p re ssã o , c o n stru c to d e 41
— preditiva 157
ro ta ç ã o em análise fa to ria l 216 b
— tipos de 157
S ig n ificân cia, te s ta r a 284
valor(es)
— esta tístic a 88, 89 — científicos 341-346
-------- d e co rrelaçõ es 359-362
— de população 90-91
---------o teste d e q u iq u a d ra d o 356-359 — e ciência 302-303
-------- o teste t 353-356 — instrumental e terminal 136
su b sc rito s 56 b variação 29-30
Survey Research Center (d a U niversi — concomitante 65
d a d e d e M ichigan) 172 variância 29-31
— análise de (veja análise de variância)
T a b e la s t 284-285 — compartilhada 183-184, 189-192
ta x io n o m ia 57, 233 — partição da 179-186
te c n o lo g ia 320 — quando as variáveis independentes
te o ria são correlacionadas 184-186
— " c o rre ta ” e m o d elo 267-268 — residual 193
— d a a trib u iç ã o 333-334 — significado da 179-180
— d a d isso n ân cia co g n itiv a 103, 114 verdadeiras notas 150
— d a fru stração -ag ressão 117-118 variável(is) 22-25, 44-50
— d efin iç ã o 73 — categóricas 23
— d e F re u d , te s ta b ilid a d e d e 41 — definição 5, 44-46
— d o reforçam ento- 4-5, 41 — de participação em um grupo 242-244
— dos c o n ju n to s 108 b -109 b exemplo de pesquisa 247-249
377
—i — quantificação 245-246 — medida 23
— dependentes e independentes 24 — mensuração de 144-161
— de status 153-154 — na pesquisa não-experimental 133-134
— experimentais e manipuladas 24 — ortogonais 109
— independentes 24, 182, 184 — sociais 162-164
versus naturais 128 — tipos por campo ou disciplina 25
— interação de 108 — valor da 45
— latentes 262-264
— manipulada e medida 134« Zero, relação 61, 62, 69
378
S o uto , C lá u d io