Você está na página 1de 419

Livros Grtis

http://www.livrosgratis.com.br
Milhares de livros grtis para download.
TEORIA E MTODOS DE MEDIDA
EM CINCIAS DO COMPORTAMENTO
SECRETARIA DE AVALIAO E INFORMAO EDUCACIONAL

Secretria
Maria Helena Guimares de Castro

INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS

Diretor-Geral
Og Roberto Dria

Coordenadora-Geral de Divulgao de Informaes Educacionais


Christina Helena Micheli Velho

Coordenadora de Difuso e Promoo


Sueli Macedo Silveira

Pasquali, Luiz.
Teoria e mtodos de medida em cincias do comportamento /
organizado por Luiz Pasquali. Braslia: Laboratrio de Pesquisa em
Avaliao e Medida / Instituto de Psicologia / UnB: INEP, 1996.
432p.

1. Psicometria 2. Psicofisica. 3. Psicologia do comportamento. 4.


Testes psicolgicos. I. Ttulo

CDU : 159.9.019.43
TEORIA E MTODOS DE MEDIDA
EM CINCIAS DO COMPORTAMENTO

LUIZ PASQUALI
(Organizador)
TEORIA E MTODOS DE MEDIDA EM CINCIAS DO COMPORTAMENTO
Edio financiada pelo Instituto Nacional de Estudos e Pesquisas Educacionais

Editorao eletrnica
Antonio Bezerra Filho
Francisco Edilson de Carvalho Silva

Reviso de texto
Antonio Bezerra Filho Jos
Adelmo Guimares

Capa
Accio Valerio da Silva Reis

Nenhum captulo deste livro poder ser reproduzido, por qualquer processo,
sem autorizao expressa do autor respectivo.

1996 by Luiz Pasquali

INEP Coordenadoria-Geral de Divulgao de Informaes Educacionais


Coordenadoria de Difuso e Promoo
SGAS 607 Lote 50 Asa Sul
70200-670 Braslia-DF
Fone: (061) 244-2612; 244-0001 Ramais: 396/308
Fax:(061)244-4712

Impresso no Brasil
AGRADECIMENTOS

Muitas pessoas so responsveis pelo final exitoso deste trabalho.


Contudo, devo especiais agradecimentos colaborao substancial dada
pela equipe do Laboratrio de Pesquisa em Avaliao e Medida do
Instituto de Psicologia da Universidade de Braslia, sem cujo apoio este
trabalho teria sido vrias vezes mais dificultado. Notadamente, devo
agradecer a Alexandre Damanico da Cunha, Cludia Cristina Fukuda,
Edilson Marcolino dos Santos, Heila Magali da Silva Veiga, Ina de
Figueiredo Cerqueira, Ivnia Ghesti e, em especial, a Maria Mazzarello
Azevedo, vice-coordenadora do LBPAM.

O Organizador
SUMRIO

PREFCIO .................................................................................... 11
APRESENTAO ........................................................................ 13
OS AUTORES: PERFIL ACADMICO PROFISSIONAL ................ 15

Ia PARTE FUNDAMENTOS DA MEDIDA


EM CINCIAS DO COMPORTAMENTO
Cap. 1 Teoria da Medida............................................................. 21
Cincia e Matemtica ................................................. 21
A natureza da medida ................................................. 22
A base axiomtica da medida ..................................... 23
Formas e unidades de medida.................................... 27
A medida em cincias sociais e do comportamento .. 30
Nveis da medida (escalas de medida) ...................... 34
O problema do erro...................................................... 36
Importncia da medida ............................................... 39
Concluso .................................................................... 40
Referncias bibliogrficas............................................ 40
Cap. 2 Teoria e Mtodos em Psicofisica..................................... 43
Questes centrais em psicofisica................................ 44
Psicofisica clssica...................................................... 50
Psicofisica moderna .................................................. 53
Deteco de sinal ..................................................... 56
Psicofisica animal ...................................................... 60
Psicofisica da criana.................................................. 63
Concluses .................................................................. 70
Referncias bibliogrficas............................................ 71
Cap. 3 Medida Psicomtrica ....................................................... 73
Teoria da medida psicomtrica ................................... 74
Parmetros psicomtricos da medida ......................... 81
Concluso geral........................................................... 111
Referncias bibliogrficas............................................ 112
Cap. 4 Medidas Escalares .......................................................... 117
Escalas psicofsicas ................................................. 118
O enfoque de Thurstone.............................................. 119
O enfoque de Likert ..................................................... 123
O enfoque de Guttman ............................................... 124
O enfoque do diferencial semntico............................ 126
O enfoque de Fishbein e Ajzen ................................ 129
Escala multidimensional ............................................. 129
Princpios de elaborao de escalas ........................... 132
Concluso.................................................................... 136
Referncias bibliogrficas............................................ 137
Cap. 5 Escalagem Psicolgica Unidimensional .......................... 141
O modelo dos julgamentos comparativos.................... 142
O modelo dos julgamentos categricos....................... 147
O modelo de Luce ....................................................... 151
O modelo de Bradley-Terry ........................................ 153
Algumas consideraes adicionais ........................... 157
Referncias bibliogrficas............................................ 158
Cap. 6 Em torno do Ensino de Estatstica nos Cursos de Base
Psicossocial .................................................................... 159
O ensino da psicometria e da estatstica .................... 163
O que se deve ensinar .............................................. 167
Cap. 7 Teoria da Resposta ao Item IRT: uma Introduo ... 173
Caractersticas da IRT................................................. 175
Modelos da IRT ........................................................... 177
Determinao dos parmetros de tens e aptides .. 179
Ajuste do modelo (model-data goodness-of-fif) ....... 183
Invarincia dos parmetros ......................................... 185
Funes de informao e eficincia............................ 188
Transformaes do 0................................................... 190
Aplicaes da IRT ....................................................... 192
Concluso.................................................................... 194
Referncias bibliogrficas............................................ 194

2a PARTE MTODOS E TCNICAS DE MEDIDA


EM CINCIAS DO COMPORTAMENTO
Cap. 8 Consideraes em torno da Medida da Inteligncia ___ 199
Por que falar ainda em medida da inteligncia?.......... 200
Formas de avaliao da inteligncia .......................... 203
Especificidades dos testes coletivos ........................... 205
Especificidades dos testes individuais......................... 206
Controvrsias em torno da avaliao da inteligncia . 209
Alteraes previsveis na avaliao da inteligncia .. 215
Concluso.................................................................... 217
Referncias bibliogrficas............................................ 220
Cap. 9 La Medicin de la Organizacin Lgica del Pensamiento 225
Relaciones entre lgica, pensamiento e Psicologia . . 226
El problema de la lgica del pensamiento desde el
punto de vista de la Psicologia Cognitiva ........................... 232
Mtodo ................................................................................. 238
Conclusiones ...................................................................... 254
Referencias bibliogrficas .................................................... 258
Cap. 10 Observao do Comportamento.............................................. 263
Estudos observacionais no Brasil anos 70 ...................... 263
Estudos observacionais no Brasil anos 80 e 90 ... 279
Referncias bibliogrficas .................................................... 296
Cap. 11 A Medida da Criatividade ...................................................... 305
As diferentes modalidades de medidas de criatividade 306
Questes relativas fidedignidade, validade e con
dies de aplicao dos instrumentos de medida de
criatividade........................................................................... 311
Referncias bibliogrficas .................................................... 317
Cap. 12 Estratgias e Medidas em Anlise de Contedo .................... 319
Concepes e mtodos em A.C .......................................... 322
Diferentes etapas de A.C ..................................................... 328
Concluses e perspectivas .................................................. 337
Referncias bibliogrficas .................................................... 338
Cap. 13 Medida Projetiva ................................................................... 341
Conceito de projeo e tcnicas projetivas.......................... 342
Foras e fraquezas das tcnicas projetivas ...................... 354
Referncias bibliogrficas .................................................... 360
Cap. 14 A Medida na Teoria da Ao Racional..................................... 367
Afirmaes bsicas da Teoria da Ao Racional .... 370
A medida na Teoria da Ao Racional .............................. 373
Concluso ............................................................................ 384
Referncias bibliogrficas .................................................... 385
Cap. 15 Desenvolvimento de Instrumento para Levantamento de
Dados (Survey) .................................................................... 387
Consideraes gerais sobre um instrumento ..................... 389
Desenvolvimento de itens .................................................... 393
Referncias bibliogrficas .................................................... 402
Cap. 16 Evaluacin Conductual: una Experiencia de Integracin 405
Que es la evaluacin conductual?..................................... 405
Perspectivas de la evaluacin conductual ........................... 414
Referencias bibliogrficas .................................................... 416

NDICE ONOMSTICO ............................................................................ 419


NDICE DE ASSUNTOS ......................................................................... 427
PREFCIO

A importncia da avaliao na rea educacional um consenso


contemporneo. O tema, at pouco tempo restrito aprendizagem e de-
sempenho dos alunos, vem ganhando a necessria amplitude. Estende-
se objetivamente a projetos, programas, professores, currculos, instituies
e sistemas, numa abordagem que destaca a interdependncia de todos
esses fatores.

Esta viso ampla e integrada fundamental para responder com-


plexidade e totalidade do ato educativo e traduz o processo de consolida-
o da democracia brasileira. Ela expressa, sobretudo, a presso social
de cidados mais conscientes e mais exigentes quanto ao padro dos
servios pblicos que lhes so devidos.

Desde o incio dos anos 90, o INEP tem sido um dos principais atores
da implementao do Sistema de Avaliao de Ensino Bsico (SAEB).
Responsvel pela avaliao do desempenho do sistema educacional, o
SAEB atua em trs eixos: rendimento do aluno, perfil e prtica docente e
gesto do ensino. A disseminao dos resultados obtidos com os trs ciclos
de aplicao do SAEB indica que o sistema vem se constituindo um marco
importante na construo de uma cultura de avaliao j presente nas
redes de ensino estaduais e municipais. Indica tambm que o SAEB vem
cumprindo seu papel enquanto instrumento de suporte a formulao de
estratgias e polticas educacionais que buscam elevar a qualidade e
eqidade da educao brasileira.

Um olhar crtico nessas experincias confirma a avaliao como um


pressuposto tico e uma poltica pblica necessria. Esse mesmo olhar
crtico mostra, porm, que, para explorar todo o seu potencial e alcanar
suas finalidades, ainda h muito a ser construdo nas dimenses poltica,
social e tcnica da avaliao.
Este livro, que o INEP apresenta aos educadores atuais e em
formao e sociedade em geral, traz a contribuio de importantes
especialistas em trabalhos que abordam os fundamentos, mtodos e tcni-
cas de medidas em cincias do comportamento. As questes aqui tratadas
certamente agregaro novos elementos aos debates e prticas de avalia-
o que crescem em todo o Pas, sinalizando o compromisso com os alu-
nos, com a escola, com a educao transformadora e com a construo de
um pas justo e igualitrio.

Maria Helena Guimares de Castro


APRESENTAO

A rea da medida e da avaliao em cincias humanas e sociais, no


Brasil, est quase totalmente carente de publicaes nacionais. Os poucos
textos existentes no mercado representam, em sua maioria, tradues de
obras estrangeiras de anos h muito tempo idos. Como esta rea vem
mostrando um grande desenvolvimento nos ltimos anos, essas tradues
se ressentem de atualidade, deixando o pesquisador e profissional
nacionais numa situao extremamente difcil de se aprofundar e atualizar
nos fundamentos e tcnicas da medida nas reas de estudo do comporta-
mento. O presente livro pretende ser o primeiro de uma srie de obras
nesta rea, visando superar a lacuna mencionada. Este primeiro trabalho
teve como inteno fundamental apresentar o status e os avanos da
tecnologia da medida nos vrios ramos da Psicologia, bem como cobrir a
mais variada gama de enfoques que neles existem. O intento, creio, foi
conseguido em sua grande parte. Apesar de especialistas em algumas
reas desta temtica, aps contatados, terem declinado de participar desta
aventura, grande parte da temtica da medida em Psicologia foi abordada.
As reas no abordadas neste livro dizem respeito, sobretudo, medida
piagetiana, avaliao dita qualitativa e anlise experimental do
comportamento. Evidentemente, outras muitas temticas poderiam ser
consideradas para entrar num livro deste teor, sobretudo no contexto da
29 Parte, onde se trata mais de tcnicas diferenciadas de avaliao do que
dos fundamentos da medida, situao que poder ser sanada em futuras
edies, se for o caso.
O livro se divide em duas partes. A 1 Parte Fundamentos da
Medida em Cincias do Comportamento trata, obviamente, de aspectos
epistemolgicos e da fundamentao do enfoque quantitativista em
cincias do comportamento, mais especificamente em Psicologia. Ques-
tes epistemolgicas e estatsticas so, conseqentemente, o tema desta
parte. A teoria da medida discutida no captulo 1. Em seguida so
tratados tipos diferentes de enfoques epistemolgicos da medida em
Psicologia, a saber, a medida psicofisica e a medida psicomtrica. A
medida psicofisica tratada no captulo 2, enquanto os captulos 3, 4, 5 e
7 tratam da medida psicomtrica clssica e moderna e das escalas de
atitude. O captulo 6, enfim, anota problemas com o uso da Estatstica em
cincias do comportamento.
A 2a Parte Mtodos e Tcnicas de Medida em Cincias do
Comportamento trata do problema e das tcnicas de mensurao ou de
avaliao em reas especficas da Psicologia. Assim, a medida na rea da
inteligncia tratada nos captulos 8, 9 e 11 ; a observao do comporta-
mento, no captulo 10; a anlise de contedo, no captulo 12; as tcnicas
projetivas, no captulo 13; a medida das atitudes, no captulo 14; o captulo
15 trata da tcnica de survey, e o captulo 16, da avaliao cognitivo-
comportamental.

Alm de visar instrumentar pesquisadores e profissionais das


cincias do comportamento, este livro tem por objetivo iniciar uma
discusso mais tcnica, menos emocional, sobre a medida nestas cincias
no Pas.

Braslia, setembro de 1996

Luiz Pasquali
OS AUTORES: PERFIL ACADMICO-PROFISSIONAL

Alfredo Oscar Lpez Alonso


Licenciado em Psicologia e doutor em Filosofia e Letras, com orien-
tao psicolgica, pela Universidade de Buenos Aires. Professor titular, em
nvel de graduao e ps-graduaco, da Universidade de Buenos Aires,
da Universidade de Belgrano, da Universidade de Salvador e da Universi-
dade Nacional do Prata, na Repblica Argentina. Sua especializao
principal, tanto em docncia como na pesquisa, tem sido em temas de
medio em Psicologia, Psicometria, Metodologia da Pesquisa Psicolgica
e em Psicologia Cognitiva, inteligncia humana, processos inferenciais e
organizao lgica do pensamento. pesquisador principal do Conselho
Nacional de Investigaes Cientficas e Tcnicas da Repblica Argentina
(CONICET) e diretor do Instituto de Investigaciones Psicolgicas da
Universidad del Salvador, em Buenos Aires, Argentina, onde leva a termo
seus trabalhos de pesquisa, como o que aqui se publica. autor de mais
de 60 trabalhos e publicaes nas temticas acima evocadas.

Ceclia Guarnieri Batista


Psicloga pela Pontifcia Universidade Catlica de Campinas (PUC-
CAMP) em 1972, concluiu o mestrado (1978) e o doutorado (1989) em
Psicologia pelo Departamento de Psicologia Experimental do Instituto de
Psicologia da Universidade de Sao Paulo (USP). Lecionou na UNIP (So
Paulo) e na PUC-CAMP, notadamente Psicologia do Desenvolvimento.
Participou na elaborao de projetos relacionados preveno de defi-
cincias e implantao do Programa de Integrao e Desenvolvimento
da Criana e do Adolescente (Prodecad), atualmente subordinado Pr-
Reitoria de Extenso e Assuntos Comunitrios da UNICAMP. Atuou como
psicloga escolar do Prodecad, especialmente com os filhos de funcion-
rios de baixa renda de universidade que cursavam da 1 4a srie do
primeiro grau (Programa de Apoio Escolaridade). Presentemente, como
docente de Educao Especial e Reabilitao no Centro de Estudos e
Pesquisas Prof. Dr. Gabriel Porto (CEPRE), da Faculdade de Cincias
Mdicas da UNICAMP, trabalha na rea de deficincia visual, auditiva e
mltipla. Seu trabalho de pesquisa tem envolvido o emprego e a reflexo
terica sobre a Metodologia Observacional, o estudo da interao me-
filho e o desenvolvimento cognitivo e moral infantil.

Edson A. de Souza Filho


Doutor em Psicologia Social pela cole des Hautes tudes en
Sciences Sociales, em Paris, foi professor adjunto do Instituto de Psicolo-
gia da Universidade de Braslia (UnB) at bem pouco tempo. Tem
ensinado e pesquisado em representaes sociais, anlise de contedo e
do discurso, grupos e influncia social. Atualmente professor da
Universidade Estadual do Norte Fluminense, em Campos, RJ.

Eleonora Vivas
Mestre e doutora (M.Phil. e Ph.D.) em Psicologia pela Universidade
de Londres. Professora de ps-graduaco em Psicologia da Universidad
Simon Bolvar, em Caracas, Venezuela. Trabalha nas reas de avaliao
comportamental, teoria e fundamentos do enfoque cognitivo-comporta-
mental. Pesquisadora na rea da motivao e preveno de problemas de
linguagem e leitura psicologia da sade.

Eunice Maria Lima Sorlano de Alencar


Licenciada em Psicologia pela Universidade Federal de Minas
Gerais (UFMG), com mestrado e doutorado em Psicologia pela Purdue
University e post-doctoral scholar no Gifted Education Resource Institute
(Lafayette, Indiana, EUA). professora titular da Universidade de Braslia
(UnB), onde se dedica principalmente ao estudo da Criatividade, e,
tambm, membro do Conselho Regional de Psicologia e do Conselho
Tcnico da Associao Brasileira para o Superdotado, tendo j presidido
essa Associao. Alm de autora de diversos livros, , ainda, redatora da
revista Psicologia: Teoria e Pesquisa, editada pelo Instituto de Psicologia
da UnB.

Hartmut Gnther
Nascido na Alemanha, estudou na Universitt Hamburg e na
Universitt Marburg. Graduou-se em Psicologia pelo Albion College, em
Michigan, EUA. Tendo realizado o mestrado em Psicologia Experimental
na Western Michigan University e o doutorado em Psicologia Social na
University of California at Davis, atualmente pesquisador e professor
titular da Universidade de Braslia (UnB). Tem vrios artigos publicados,
tanto no Brasil como no exterior.
Jorge de Souza
Bacharel em Cincias Estatsticas pela Escola Nacional de Cincias
Estatsticas, mestre em Cincias da Engenharia de Produo e doutor em
Estatstica pela Universidade Federal do Rio de Janeiro (UFRJ).
professor titular da Universidade de Braslia (UnB), com vrios trabalhos
publicados na rea de Estatstica, estando atualmente, como professor
visitante, no Departamento de Economia da Universidade Federal de
Pernambuco (UFPE). [Fax (081) 271-8360]

Jurema Alcides Cunha


Livre-docente em Psicologia Clnica e doutora em Filosofia, com
experincia de ensino e pesquisa no Brasil e nos Estados Unidos.
professora dos cursos de Ps-Graduao em Psicologia da Pontifcia
Universidade Catlica do Rio Grande do Sui (PUC-RS) e j conhecida
por suas publicaes, em especial pelo livro Psicodiagnstico-R, adotado
em muitas universidades brasileiras, e pelo Teste das Fbulas Forma
Verbal e Pictrica.

Leandro da Silva Almeida


Nascido em Portugal, licenciado em Psicologia (1975-1980) e
doutor em Psicologia (1987), na especialidade de Psicologia da Educao,
pela Faculdade de Psicologia e de Cincias da Educao da Universidade
do Porto. Atualmente professor da Universidade de Braga e, ainda,
membro da Comisso Cientfica da Unidade de Cincias da Educao, do
Conselho Cientfico do CEFOPE, do Projeto de Investigao PIDACS
(Universidade de Aveiro), do National Council on Measurement in
Education (NCME), da International School Psychology Association (ISPA),
entre outras. So de sua autoria os livros Teoria da Inteligncia e O
Raciocnio Diferencial dos Jovens: Avaliao, Desenvolvimento e
Diferenciao, alm de vrios artigos sobre testes e educao.

Luiz Pasquali
Licenciado em Filosofia, Teologia, Pedagogia e Psicologia. Mestre
e doutor em Psicologia pela Universit Catholique de Louvain, Blgica
(1970). professor titular da Universidade de Braslia (UnB), onde
responsvel pelas disciplinas de Psicometria (Uso dos Testes), Mtodos
e Medidas em Psicologia e Anlise Fatorial em Psicologia (Ps-Gradua-
o), coordenando tambm o Curso de Especializao em Avaliao e
Medida da UnB. coordenador do Laboratrio de Pesquisa em Avaliao
e Medida do Instituto de Psicologia da Universidade de Braslia. Tem cerca
de 40 trabalhos sobre instrumental psicolgico.
Maria Alice Magalhes D'Amorim
Licenciada em Filosofia e em Psicologia pela Pontifcia Universidade
Catlica do Rio de Janeiro (PUC-RJ), tendo completado sua formao em
Psicologia Aplicada na Universidade de Louvain, Blgica. Mestre pela State
University of lowa, EUA, fez o doutorado em Psicologia na Universidade de
Louvain, ps-doutorado em Administrao de Programas de Sade Mental
na University of North Carolina, EUA, e na Unidade de Psicologia do
Trabalho e das Organizaes da Universidade de Louvain Louvain-la-
Neuve, Blgica. Lecionou na Pontifcia Universidade Catlica do Rio de
Janeiro (PUC-RJ), na Universidade de Qubec em Trois Rivires, Canad,
na Universidade Federal da Paraba (UFPB), na Universidade de Braslia
(UnB) e na Universidade Federal do Rio Grande so Sul (UFRGS);
encontra-se atualmente na Universidade Gama Filho, na cidade do Rio de
Janeiro.

Maria ngela Guimares Feitosa


Formou-se em Psicologia pela Pontifcia Universidade Catlica de
So Paulo (PUC-SP), em 1971. Fez o mestrado em 1977 e o doutorado em
Psicobiologia em 1983 na University of Michigan, USA. Foi diretora do
Instituto de Psicologia da Universidade de Braslia (UnB) de 1987 a 1989 e
atualmente editora da revista Psicologia: Teoria e Pesquisa. Orientou trs
teses de mestrado em Psicobiologia e possui seis publicaes na rea nos
ltimos cinco anos. Ensina e pesquisa na rea de Psicobiologia, especiali-
zando-se em processos sensoriais, particularmente audio.

Maria Lcia Tiellet Nunes


Doutora pela Universidade Livre de Berlim, onde realizou tambm
formao teraputica. professora nos cursos de graduao e ps-
graduaco em Psicologia da Pontifcia Universidade Catlica do Rio
Grande do Sul (PUC-RS) e no curso de graduao em Psicologia da
Universidade Federal do Rio Grande so Sul (UFRGS). Colaborou no livro
Psicodiagnstico-R e co-autora de Tesfe das Fbulas Forma Verbal
e Pictrica.
1a PARTE

FUNDAMENTOSDAMEDIDAEM CIENCIASDO COMPORTAMENTO

Cap. 1 Teoria da Medida 21


Luiz Pasquali

Cap. 2 Teoria e Mtodos em Psicofisica 43


Mara ngela Guimares Feitosa

Cap. 3 Medida Psicomtrica 73


Luiz Pasquali

Cap. 4 Medidas Escalares 117


Luiz Pasquali

Cap. 5 Escalagem Psicolgica Unidimensional 141


Jorge de Souza

Cap. 6 Em torno do Ensino de Estatstica nos Cursos


de Base Psicossocial 159
Jorge de Souza

Cap. 7 Teoria da Resposta ao ItemIRT: uma Introduo 173


Luiz Pasquali
CAPTULO 1

A TEORIA DA MEDIDA

Luiz Pasquali
Instituto de Psicologia
Universidade de Brasilia

A
medida em cincias do comportamento, notadamente na Psicolo-
gia, deveria ser chamada puramente de psicometria, similarmente
ao que ocorre em cincias afins a ela, onde se fala de sociometria,
econometria, politicometria, etc. Psicometria, contudo, tem sido abusiva-
mente utilizada dentro de um contexto muito restrito, referindo-se atestes
psicolgicos e escalas psicomtricas. De qualquer forma, a psicometria
ou medida em Psicologia se insere dentro da teoria da medida em geral
que, por sua vez, desenvolve uma discusso epistemolgica em torno da
utilizao do smbolo matemtico (o nmero) no estudo cientfico dos
fenmenos naturais. Trata-se, portanto, de uma sobreposio, ou melhor,
de uma interface entre sistemas tericos de saber diferentes, tendo a
teoria da medida a funo de justificar e explicar o sentido que tal
interface possui.

CINCIA E MATEMTICA

A Matemtica e a Cincia emprica so sistemas tericos (ou de


conhecimento) muito distintos e, em termos estruturais, no so comen-
surveis. Na verdade, os dois sistemas tm objetos e metodologias
prprios, distintos e irreversveis entre si. Pode-se discernir esta distino
atentando para a Tabela 1-1. Observa-se que em nenhum momento ou
sob nenhum critrio os dois sistemas se assemelham estruturalmente. A
Cincia tem como referente ou objeto os fenmenos da realidade, ao
passo que a Matemtica estuda como seu objeto o smbolo numrico
(que um conceito e no uma realidade emprica e nem uma proprieda-
de desta realidade - Frege, 1884); a metodologia da Cincia a obser-
vao sistemtica e a da Matemtica a deduo; o critrio de verdade
para a Cincia o teste emprico, ao passo que para a Matemtica a
consistncia interna do argumento.
Assim, a primeira afirmao, no contexto da teoria da medida, con-
siste em dizer que o sistema cientfico do conhecimento no tem nada a
ver com a Matemtica e vice-versa, falando-se em termos das estruturas
epistemolgicas dos dois saberes. O mesmo tipo de argumentao pode
ser feito da Ciencia com relao aos outros sistemas de saber (Filosofia,
Teologia, etc.).

Tabela 1-1 Enfoque epistemolgico de Cincia e Matemtica


SISTEMA TERICO OBJETO ATITUDE METODOLOGIA VERDADE CERTEZA CRITRIO DE VERDADE

Cincia Fenmeno Emprica Observao e Fato Relativa Teste Emprico


(emprica) s naturais Controle

Matemtica Smbolo Transcen Deduo Teorema Absoluta Consistncia interna


numrico dental do argumento

A NATUREZA DA MEDIDA

Apesar dessa distncia epistemolgica entre Cincia e Matemtica,


a Cincia emprica se apercebeu das vantagens considerveis que ela
pode obter ao se utilizar da linguagem da Matemtica para descrever o seu
objeto prprio de estudo. Na verdade, se o modelo matemtico no dita e
nem fundamenta o conhecimento cientfico, parece que o uso deste
modelo que vem possibilitando distinguir nveis de progresso no conheci-
mento cientfico. Esta afirmao, pelo menos, aparece claramente
demonstrada na cincia da Fsica que, com o uso do modelo matemtico,
pde passar de um estgio pr-histrico Fsica moderna. Alm disso,
"Os instrumentos e tcnicas de medida propiciam a ponte mais til entre
os mundos do dia-a-dia do leigo e dos especialistas em cincia" (Klein,
1974, p.24).
O uso do nmero na descrio dos fenmenos naturais constitui o
objeto da teoria da medida. Esta teoria est razoavelmente axiomatizada
somente nas cincias fsicas, aparecendo ainda lacunar nas cincias
sociais e do comportamento, onde, alis, ainda se discute a viabilidade
epistemolgica da prpria medida.
A natureza da medida implica alguns problemas bsicos, dentre os
quais trs devem ser mencionados (Luce, Suppes, 1986; Suppes, Zinnes,
1963; Campbell, 1928, 1938): a representao, a unicidade e o erro.

O problema da representao ou o isomorfismo


O problema central da medida consiste em justificar a legitimidade
de se passar de procedimentos e operaes empricos (a observao)
para uma representao numrica destes procedimentos. justificvel
designar ou expressar objetos ou fenmenos naturais atravs de
nmeros? Sim, se nesta designao se salvarem tanto as propriedades
estruturais do nmero quanto as caractersticas prprias dos atributos dos
fenmenos empricos. Trata-se do teorema da representao.

O problema da unicidade da representao


Este problema diz respeito ao fato de que uma representao 'x'
de um atributo natural seria a nica vivel e possvel ou que a tal
representao a mais adequada que se possa imaginar para descrever
o atributo em questo. Assim, por exemplo, a massa das coisas no pode
ser descrita melhor ou pode ser descrita somente em termos de peso,
este expresso em termos de quilogramas: no haveria outra maneira
possvel de se descrever massa. O teorema da unicidade define o nvel
de escala de medida; em outras palavras, ele define se a escala obtida
ser ordinal, intervalar, etc.

O problema do erro
A observao dos fenmenos empricos sempre sujeita a erros
devidos tanto ao instrumental de observao (os sentidos e suas
extenses atravs de instrumentos tecnolgicos) quanto a diferenas
individuais do observador, alm de erros aleatrios, sem causas
identificveis. Assim, tipicamente toda e qualquer medida vem acompa-
nhada de erros e, por conseqncia, o nmero que descreve um
fenmeno emprico deve vir acompanhado de algum indicador do erro
provvel, o qual ser analisado dentro de teorias estatsticas para
determinar se o valor encontrado e que descreve o atributo emprico est
dentro dos limites de aceitabilidade de medida.

A BASE AXIOMTICA DA MEDIDA

H legitimidade no uso do nmero na descrio dos fenmenos


naturais se e somente se as propriedades estruturais do mesmo forem
salvaguardadas neste procedimento. Isto , dever haver isomorfismo
estrito (relao de 1 para 1) entre propriedades do nmero e aspectos
dos atributos da realidade emprica.
So propriedades bsicas do sistema numrico a identidade, a
ordem e a aditividade. A medida deve salvar, pelo menos, as duas
primeiras destas propriedades de preferncia, as trs.
Para melhor enquadrar a psicometria ou a medida em geral em
cincias do comportamento neste contexto, a base axiomtica da medida
ser melhor feita dentro das cincias fsicas, fazendo em seguida as
ressalvas e correes necessrias para o caso da medida em cincias
sociais e do comportamento e, em especial, da Psicologia.
Axiomas do sistema numrico
Stevens (1951) sumariza o sistema numrico na Figura 1-1:

Estes vrios tipos de nmeros surgiram em pocas histricas di-


ferentes, segundo as necessidades dos estudiosos e as necessidades da
vida prtica. Inicialmente s havia os nmeros inteiros, que eram
suficientes para contar objetos discretos, razo pela qual eles tambm so
chamados de nmeros naturais. Com eles se podia fazer as operaes de
adio e de multiplicao. Eles no davam sempre certo, porm, quando
da subtrao, especialmente quando se queria subtrair um nmero maior
de um nmero menor. Esta limitao do sistema de inteiros fez com que
o sistema fosse estendido para incluir nmeros negativos e o zero. Com a
diviso, o sistema de inteiros se mostrava ainda mais limitado, o que forou
a adoo de nmeros fracionrios. Este conjunto de nmeros (inteiros
positivos, negativos, zero e fraes) constitui o sistema de nmeros
racionais, dado que qualquer nmero deste sistema pode ser expresso em
termos de razo entre dois nmeros inteiros. Excetuada a diviso por zero,
todas as operaes so possveis dentro deste sistema numrico.
Contudo, certas operaes matemticas no eram viveis dentro do
sistema, como, por exemplo, a raiz quadrada de 2. Inventaram-se, ento,
os nmeros irracionais, e assim se fechou o crculo dos nmeros reais,
suficientes para permitir qualquer sorte de medida da realidade, at o
presente.
A Matemtica um saber baseado em puras convenes; assim,
tanto o seu objeto (o nmero) quanto suas regras sao convencionadas. As
regras do jogo dos nmeros se caracterizam por trs grandes proprieda-
des: identidade, ordem e aditividade.
Identidade (=)
Esta propriedade define o conceito de igualdade, isto , que um
nmero idntico a si mesmo e somente a si mesmo. Ela apresenta trs
axiomas (postulados aceitos e nao provados) que expressam a relao de
IGUALAW:
reflexividade: a = a ou a b. Nmeros so idnticos ou so dife-
rentes;
simetria: se a = b, ento b = a;
transitividade: se a = b e b = c, ento a = c. Duas coisas iguais a uma
terceira so iguais entre si.
Ordem (>)
Esta propriedade se baseia na desigualdade dos nmeros. Todo
nmero diferente de outro. Assim, excetuado o caso de igualdade, os
nmeros podem ser colocados numa seqncia invarivel ao longo de
uma escala linear: seqncia monotnica crescente. Tambm tem trs
axiomas, que expressam NAO IGUAL A (>):
assimetria: se a > b, ento b > a. A ordem dos termos no pode ser
invertida;
transitividade: se a > b e b > c, ento a > c;
conectividade: ou a > b ou b > a;
Um quarto axioma seria o de ordem-denso: nmeros racionais so
tais que entre dois nmeros inteiros quaisquer h sempre um nmero
racional; o intervalo entre dois inteiros no vazio.
Aditividade (+)
Os nmeros podem ser somados. Isto , as quatro operaes
adio, subtrao, multiplicao e diviso (as trs ltimas sao redutveis
primeira) podem ser aplicadas aos nmeros. Dois axiomas:
comutatividade: a + b = b + a. A ordem dos termos no altera o re-
sultado da adio;
associatividade: (a + b) + c = a + (b + c). A ordem de associao ou
de combinao dos termos no afeta o resultado.

Axiomas da medida
Como a medida consiste na atribuio de nmeros s propriedades
das coisas segundo certas regras, ela deve garantir que as operaes
empricas salvem os axiomas dos nmeros. A medida que salva todos
esses axiomas a mais sofisticada possvel e, por isso, rara (escala de
razo). A maioria das medidas, ao menos em cincias do comportamento,
se do por satisfeitas se puderem salvar, pelo menos, os axiomas de
ordem. Se somente os axiomas de identidade forem salvos (escala
nominal), a operao propriamente no chega a ser medida, mas trata-se
apenas de classificao, pois a nica caracterstica do nmero salva a
sua identidade; isto , o nmero utilizado para uma operao emprica
deve ser diferente do de uma outra operao. Para tanto, alis, o nmero
utilizado to-smente como numeral, a saber, um rabisco diferente de
outro, que poderia ser substitudo por qualquer outro sinal ou rabisco
(desde que diferentes entre si) sem a menor conseqncia para a medida.
O nmero, neste caso, serve apenas de etiqueta de uma classe de coisas.
A medida realmente acontece quando se salvam, pelo menos, os axiomas
de ordem dos nmeros. Ento, fica a pergunta: possvel se demonstrar
a existncia de ordem de magnitude nos atributos das coisas? Isto , as
coisas tm dimenses, entendidas estas como atributos mensurveis,
propriedades empricas possuidoras de magnitude? Como resposta a esta
questo poder-se-ia simplesmente assumir que sim: os atributos
empricos tm magnitude, como o senso comum nos parece dizer quoti-
dianamente quando fala de 'mais do que', 'maior que' e expresses
similares. Contudo, esta no parece ser uma base muito segura para
fundamentar uma teoria da medida. preciso, ento, demonstrar empi-
ricamente que tal ocorrncia existe na realidade das coisas. Nas cincias
fsicas esta questo parece resolvida, mas nas cincias sociais e do com-
portamento ela ainda suscita acirradas controvrsias. Segue uma tentativa
de demonstrao experimental de axiomas da medida.

Demonstrao emprica dos axiomas de ordem (Guilford, 1954)

Estes afirmam que, na medida, a ordem dada pelos nmeros


atribudos aos objetos (transitividade e conectividade) deve ser a mesma
obtida pela ordenao emprica destes mesmos objetos. Existe ordem
('maior que') nas propriedades das coisas. Exemplos: 1) de um metal que
arranha um outro e no pode ser arranhado por este, diz-se que mais
duro assim, uma ordem emprica de dureza pode ser estabelecida a
partir da operao emprica de arranhar; 2) igualmente, o alinhamento de
linhas mostra que uma maior que outra, donde uma ordenao de
objetos em termos de comprimento poder ser montada; 3) se um tom dito
mais alto que outro por uma amostra de sujeitos, diz-se que ele mais
agudo assim, uma ordem de altura de tons (pitch) pode ser estabeleci-
da; 4) se um sujeito resolve corretamente maior nmero de uma srie de
problemas do que outro, diz-se que ele mais inteligente assim, pode-
se estabelecer uma escala de inteligncia. As inverses que ocorrem so
consideradas 'erros de medida' ou de observao, que devem ser tratados
dentro da teoria da consistncia, a qual visa mostrar que, apesar desses
erros, h consistncia na medida.
Demonstrao emprica dos axiomas de aditividade
Esta demonstrao parece ser possvel somente no caso dos
atributos extensivos, como massa, comprimento e durao temporal, bem
como no caso da probabilidade. A aditividade se baseia na idia de
concatenao: a combinao (concatenao) de dois objetos ou eventos
produz um terceiro objeto ou evento com as mesmas propriedades dos
dois, mas em grau maior. Assim, tomando-se um objeto de comprimento
'x' (medido por uma unidade de comprimento qualquer, o metro, por
exemplo), encontra-se um outro objeto com o mesmo comprimento 'x'
que, junto (concatenado) ao primeiro, resulta num objeto maior 'z' com
comprimento duas vezes o comprimento dos objetos individuais. O con-
ceito de concatenao implica que A con B (A concatenando B) = A + B.

FORMAS E UNIDADES DE MEDIDA

Se cada atributo da realidade emprica apresentasse uma unidade-


base natural especfica de magnitude, a medida dele seria uma tarefa
relativamente fcil. Seria suficiente verificar quantas unidades-base ele
possui, e o nmero de unidades seria a medida do atributo em questo.
Acontece, porm, que nem no mundo da Fsica todos os atributos
permitem uma definio de unidade-base natural especfica, como, por
exemplo, no caso da velocidade. Disto resulta que deve haver mais de uma
forma de se proceder medida dos atributos da realidade que no seja a
simples enumerao do nmero de unidades que o objeto apresenta.

Formas de medida
H diferentes maneiras (formas) de se atribuir nmeros s proprie-
dades dos objetos. Uma das taxonomas mais teis consiste em distinguir
trs formas diferentes de mensurao: medida fundamental, medida
derivada e medida por teoria (esta chamada de medida by fiat por
Campbell, 1928, 1938). Pode-se igualmente falar em medida direta e
medida indireta; e h outras ainda. A primeira, contudo, parece mais
esclarecedora.
Medida fundamental
a medida de atributos para os quais, alm de se poder estabelecer
uma unidade-base natural especfica, existe uma representao extensiva.
So dimenses (atributos mensurveis) que permitem a concatenao, isto
, dois objetos podem ser associados, concatenados, formando um terceiro
objeto de mesma natureza. Tal situao ocorre com os atributos de massa,
comprimento e durao temporal. Estes atributos permitem uma medida
direta e fundamental, dado que o instrumento utilizado para medi-los
possui a mesma qualidade que se quer medir neles. Assim, ao se medir o
comprimento de um objeto, utiliza-se um instrumento composto de
unidades de comprimento. A medida dele ser dada pela coincidncia de pontos
entre o comprimento do objeto e a unidade de comprimento marcada no
instrumento, por exemplo o metro.
Mesmo podendo ser possvel conceitualmente se proceder a uma
medida fundamental nos casos mencionados, nem sempre isto empiricamente
factvel. Por exemplo, como se faria uma medida fundamental de distncias
astronmicas ou subatmicas? Ou como se poderia medir fundamentalmente a
massa de uma galxia? Nestes casos e semelhantes preciso recorrer a outras
estratgias de medida, como a medida derivada.

Medida derivada

Muitos atributos da realidade nao permitem urna medida extensiva e,


portanto, nenhuma medida fundamental deles possvel. Eles podem, contudo,
ser medidos indiretamente atravs do estabelecimento de uma relao com
medidas extensivas. Este procedimento depende da prova emprica de que
estes atributos so afetados independentemente por dois ou mais componentes.
Se estes componentes permitem medida fundamental, ento pode-se obter uma
medida derivada para aqueles atributos no-extensivos atravs de uma funo
de potncia entre os componentes da qual o atributo em questo afetado. De
qualquer forma, uma tal medida derivada se finalmente ela pode ser expressa
em termos de medidas fundamentais. Por exemplo, sabe-se que a massa varia
em funo de volume e de densidade: massa = volume x densidade. Como a
massa permite medida fundamental (peso, expresso em quilos) e o volume
tambm (o cubo do comprimento = m3), ento a densidade, que no possui
medida fundamental, pode ser medida indiretamente em funo de massa e
volume (quilos dividido por metros cbicos = kg/m3).
Deve-se notar que o fundamento da funo existente entre os
componentes constitui uma lei, isto , deve ser um dado empiricamente
demonstrado e no somente baseado em alguma teoria. Assim, a massa sendo
determinada pelo volume e pela densidade uma descoberta cientfica, uma lei,
no uma hiptese. Entende-se, portanto, por medida derivada de um atributo
aquela cujos componentes do atributo, estabelecidos por uma lei emprica,
tenham finalmente dimenses extensivas.
Esta uma parte da histria. Fala-se tambm de medida derivada
quando, embora os componentes da funo no forem redutveis, em ltima
anlise, a medidas fundamentais, eles apresentam, contudo, uma unidade-base
natural e especfica. Assim, pode-se medir de modo derivado um atributo no-
extensivo se ele for passvel de ser expresso em termos de outros atributos que
possuem uma unidade-base, ainda que estes no tenham propriedade
extensiva. Exemplo: luminncia pode ser medida atravs da unidade-base de
intensidade luminosa (a candela) e
pela distncia (medida em metros); de fato, ela lum = cd/m2. O mesmo
vale para resistncia eltrica, fora do campo eltrico e do campo
magntico.
Medida por teoria
H outros atributos da realidade e o caso de quase todos em
cincias sociais e do comportamento que, alm de no se apresentarem
como dimenses extensivas, portanto incapazes de medida fundamental,
tambm no podem ser expressos em termos de componentes extensivos
e no possuem uma unidade-base natural, no permitindo, portanto,
medida derivada. Estes so mensurareis somente com base em leis e
teorias cientficas.
1) Medida por lei: quando uma lei for estabelecida empiricamente
entre duas ou mais variveis, a(s) constante(s) tpica(s) do sistema
pode(m) ser medida(s) indiretamente atravs da relao estabelecida entre
estas variveis, como o caso da viscosidade em Fsica e a lei do reforo
em Psicologia.
2) Medida por teoria: quando nem leis existem relacionando
variveis, pode-se recorrer a teorias que hipotetizam relaes entre os
atributos da realidade, permitindo assim a medida indireta de um atributo
atravs de fenmenos a ele relacionados via teoria. O importante neste
caso garantir que haja instrumentos calibrados para medir (fundamental
mente ou de outra forma vlida) os fenmenos com os quais o atributo em
questo esteja relacionado pela teoria. Mesmo em Fsica isto ocorre, como
o caso da medio das distncias galcticas. Assim, medindo o
movimento das linhas espectrais para o vermelho estar-se-ia medindo as
distncias astronmicas, dada a teoria de que existe uma relao siste
mtica entre a distncia de uma galxia e a velocidade do seu afastamen
to. O mesmo vale para o efeito Doppler, que afirma (teoria) que uma luz
que se afasta tende a espalhar as ondas, reduzindo sua freqncia.

Unidades de medida
Normalmente existe interdependncia entre os fenmenos, de sorte
que, ao se variar um deles, o outro covaria com ele. Esta covariancia pode
ser expressa por alguma constante. Estas constantes podem ser univer-
sais, como o caso da gravitao universal que covaria com as gravitaes
locais de um sistema menor, por exemplo, a da massa, chamada inclusive
de constante universal de gravitao. Outras constantes pertencem a
algum sistema especfico (constantes do sistema ou locais), como a
constante entre massa e volume em Fsica ou as constantes da lei do
reforo em Psicologia. Evidentemente, a descrio de tais constantes pode
constituir uma medida indireta.
Alm de constantes que relacionam dois ou mais atributos, os
prprios atributos variam por conta prpria, assumindo diferentes
magnitudes, isto , eles so dimenses, entendendo por isso que eles
podem variar de magnitude e, portanto, podem ser mensurveis. Neste
caso, seria extremamente til se houvesse, para cada atributo diferente,
uma unidade bsica com a qual se pudesse determinar a magnitude do
mesmo. De fato, qualquer unidade que se queira definir serve aos pro-
psitos da medida, bastando haver consenso sobre a mesma. Mas fcil
ver as vantagens de se estabelecerem unidades-base aceitveis para
todos. Nas cincias fsicas, este esforo tem sido constante. O critrio que
tem guiado os fsicos na procura destas unidades-base foi a busca de um
fenmeno natural de estabilidade mxima que pudesse servir como padro
fsico da unidade-base para o sistema. A histria da procura destas uni-
dades tem lances de Babel, pois cada regio do mundo tinha seus sis-
temas de medida, incomensurveis com os de outras regies. H cerca de
200 anos, contudo, uma procura mais sistemtica e mais entrosada em
nvel mundial tem sido desenvolvida at que culminasse no Systme
International des Units (abreviado SI), definido na 11th General Conferen-
ce on Weights and Measures (Paris, 1960), onde foram estabelecidas seis
unidades-base ou primrias para os fenmenos fsicos, sendo todas as
restantes medidas derivadas destas seis primrias (Klein, 1974; Luce,
Suppes, 1986). A Tabela 1-2, na pgina seguinte, sintetiza estas unidades-
base consensuais, inclusive o mol, unidade posteriormente acrescida.
A grande maioria das outras unidades em Fsica so unidades
derivadas destas seis unidades-base. Por exemplo, densidade igual a
peso por volume (kg/m3), velocidade a metros por segundos (m/s), lumi-
nncia a intensidade da luz por rea que expressa em termos de
distncia (cd/m2), volt watts por ampre (V=W/A), watt joule por
segundo (W=J/s), joule newton vezes comprimento (J = N.m), newton
peso vezes distncia por tempo (N=kg'm/s2), etc.
A procura de unidades similares em cincias sociais e do comporta-
mento algo ainda precrio, exceto onde medidas fundamentais forem
possveis, como talvez em psicofisica (medida dos estmulos) e na anlise
experimental do comportamento (medidas de estmulos e freqncia de
respostas).

A MEDIDA EM CINCIAS SOCIAIS E DO COMPORTAMENTO

Medidas fundamentais nestas cincias parece difcil de serem


concebidas. Mesmo em Economia, que se apresenta como a mais
desenvolvida nesta rea, parece ter cado em descrdito a concepo de
que a escolha dos sujeitos se reduziria avaliao da quantidade e preo
dos bens. De fato, h ali fatores subjetivos que co-determinam a escolha
dos sujeitos, fatores agrupados sob o construto de utilidade. Tambm no
parece aceitvel que a utilidade de um conjunto de bens possa ser
reduzida soma das utilidades individuais destes bens. Deste problema
Tabela 1-2 Unidades-base da Fsica
ATRIBUTO UNIDADE SIGLA PADRO FSICO (Definio do SI)

Comprimento metro m "O metro e o comprimento igual a 1.650.763.63


comprimentos de onda no vcuo da radiao
correspondente transio entre os nveis 2 p10 e
5 d5 do tomo do Criptnio-86."

Massa quilograma kg "O quilograma (unidade de massa) a massa de


um cilindro especial feito de liga de platina e de
iridio, que considerado como o prottipo
internacional do quilograma. e conservado sob os
cuidados do Bureau International des Poids et
Mesures num cofre forte em Svres, Frana."

Tempo segundo s "O segundo a durao de 9.192.631.770 perodos


(ou ciclos) da radiao correspondente transio
entre dois nveis hiperfinos do tomo de Csio-
133."

Corrente ampre A "O ampre, unidade de corrente eltrica, a


eltrica corrente constante que, se mantida em dois
condutores paralelos de comprimento infinito. de
uma grossura negligvel, e colocados a 1 metro de
distncia num vcuo, produzir, entre estes
condutores, uma fora igual a 2 X 10 7N por metro
de comprimento (cerca de 0,1kg)."

Temperatura kelvin K "O kelvin, a unidade de temperatura ter-


modinmica. atrao 1/273,16 da temperatura
termodinmica do triplo ponto da gua (no qual
gelo. gua e vapor esto em equilbrio igual a-
273,16C)."

Intensidade candela cd "Luminosidade de 1/600.000 de um metro qua-


da luz drado de pura platina fundida no ponto de se
solidificar. Isto corresponde a uma temperatura de
2.045K."

Massa atmica mole mol Montante de substncia que corresponde


somados pesos atmicos de todos os tomos que
compem uma molcula.

surgiu a teoria moderna da utilidade baseada na teoria dos jogos. Em


psicofisica tambm se tenta enquadrar a medida como sendo fundamental.
Entretanto, para tanto dever-se-ia modificar a definio de medida
fundamental como sendo a medida de atributos extensivos. Em psicofisica
o atributo de interesse a resposta do sujeito a estmulos fsicos. Estes
certamente podem permitir medida fundamental, mas no so eles o
interesse especfico direto da medida psicofisica, mas sim a resposta a
eles. E desta nao h como visualizar uma medida fundamental, dado que
no um atributo extensivo. A medida da resposta se faz em funo da
sua relao com o estmulo, relao estabelecida por uma lei empirica-
mente demonstrada. A medida, portanto, se baseia numa funo entre
"componentes". Componentes est entre aspas porque o estmulo
realmente no componente da resposta no sentido dado nas medidas
derivadas, nas quais os componentes relacionados so propriedades
constituintes do atributo medido derivadamente, como massa em funo
de volume e densidade.

Se medida fundamental no defensvel em cincias sociais e do


comportamento, nem a derivada o . Resta, ento, a possibilidade de se
medir nestas cincias por uma terceira forma, que vimos apresentando sob
a gide de medida por teoria, que congrega aquelas formas de medida no
redutveis finalmente a medidas fundamentais. Duas formas de medida so
aqui destacveis: medida por lei e medida por teoria propriamente. As duas
podem ser enquadradas sob medida por teoria, dado que a lei constitui
uma hiptese derivvel de alguma teoria e empiricamente demonstrvel.

Medida por lei

A medida por lei comum nas cincias sociais e do comportamento.


Em Psicologia, em particular, ela a histria na psicofisica e na anlise
experimental do comportamento. Em psicofisica, a histria que vai de
Weber a Stevens a medida por lei: lei da constante (Weber), lei
logaritmica (Fechner) e lei da potncia (Stevens). Na anlise experimental
do comportamento temos as vrias leis do reforo, por exemplo.

Em que consiste uma medida por lei? Mede-se por lei quando se
quer demonstrar empiricamente que dois ou mais atributos estruturalmente
diferentes mantm entre si relaes sistemticas. Duas condies so
expressas nesta concepo: 1) os atributos sao de natureza diferente, um
no redutvel ao outro por exemplo, a cor e a distncia so dois
atributos distintos dos fenmenos fsicos no caso do desvio para o
vermelho das linhas espectrais dos objetos na medida de distncias, do
mesmo modo que a resposta e o estmulo so dois atributos diferentes no
caso da medida psicofisica e da anlise experimental do comportamento;
2) uma relao sistemtica foi demonstrada cientificamente (empiricamen-
te) existir entre estes atributos. Assim, as manipulaes efetuadas num
atributo repercutem sistematicamente no outro, donde possvel estabele-
cer uma funo de covariancia entre os dois, uma lei.
Medida por teoria
Uma teoria no uma lei, dado que ela composta de axiomas ou
postulados e nao de fatos empricos. Ademais, ela cientfica se de seus
axiomas possvel deduzir hipteses empiricamente testveis. O caso da
medida por teoria ocorre tambm em Fsica, como ficou dito acima. No
caso das cincias sociais e do comportamento, ela mais facilmente dis-
cernvel quando se trabalha com variveis hipotticas, isto , nas teorias
da estrutura latente ou da modelagem latente (latent modeling).
Nesta concepo, a teoria versa sobre processos mentais (estrutu-
ras psicolgicas hipotticas), conceitualizando sua estrutura e sua din-
mica, e define o conjunto de comportamentos que os expressa. Assim,
uma teoria da inteligncia trata dos processos cognitivos, sua estrutura,
sua gnese, seu desenvolvimento, seus processos operativos, etc, bem
como dos comportamentos tpicos em que ela se expressa, tais como
resolver problemas numricos, problemas espaciais, problemas com
palavras, etc. E no nvel dos comportamentos que se faz a medida. De
sorte que, ao se medir por teoria neste caso, consiste em dizer que ao se
proceder a medida de um atributo emprico (o comportamento) est-se de
fato medindo a estrutura psicolgica latente, isto , um outro atributo e de
outra natureza (um atributo hipottico). A funo da teoria fundamental-
mente garantir a legitimidade de tal operao; trata-se, portanto, de um
problema de representao: a operao emprica de medir o comporta-
mento representa a medida da estrutura latente. Legitimar tal represen-
tao a funo da teoria psicomtrica (a questo da validade psicomtri-
ca da medida).
Na verdade, pode-se ver trs grandes linhas da teoria da medida
por teoria: a teoria da deteco do sinal em psicofisica, a teoria dos jogos
em Psicologia Social e a teoria das escalas e testes (a psicometria, num
sentido mais restrito). O fato de trabalharem com construios hipotticos
(processos cognitivos, preferncias, utilidade, etc.) seria o elo entre estes
tipos de teorias, bem como a procura de formas de medida desses mes-
mos construios.
A teoria da deteco do sinal trabalha com dois parmetros: relao
sinal-rudo ('d') e a disposio do sujeito ('beta'). O primeiro parmetro
define o grau de detectabilidade do sinal contra um fundo de rudo, e o
'beta' define o nvel de vontade ou disposio que o sujeito tem de ver o
sinal quando ele est presente.
A teoria dos jogos trabalha com o conceito de utilidade, introduzido
pela cincia econmica. Esta varivel representa a preferncia do sujeito
na escolha de uma alternativa de ao dentre duas ou vrias. A teoria dos
jogos determina as probabilidades de ganhos e perdas associadas com a
escolha de cada alternativa, bem corno permite verificar o nvel de prefe-
rncia do sujeito com relao a cada alternativa, possibilitando, assim, uma
ordenao destas alternativas em termos de preferncia.

A psicometria, em sentido estrito, trata da medida de construtos


psicolgicos ou de traos latentes, atravs de comportamentos verbais ou
motores que seriam a representao daqueles traos. Os parmetros com
que lida a psicometria so a legitimidade de tal representao (validade)
e a anlise dos itens comportamentais em termos de dificuldade e discri-
minao (Item Characteristic Curve ICC, Lord, 1980).

NVEIS DA MEDIDA (ESCALAS DE MEDIDA)

Dependendo da quantidade de axiomas do nmero que a medida


salva, resultam vrios nveis de medida, as chamadas escalas de medida.
Como vimos, so trs os axiomas bsicos do nmero: identidade, ordem
e aditividade. O ltimo apresenta dois aspectos teis para o presente
problema: origem e intervalo ou distncia. Quanto mais axiomas do
nmero a medida salvaguardar, maior ser o seu nvel, isto , mais ela se
aproxima da escala numrica ou mtrica e maior ser o isomorfismo entre
o nmero e as operaes empricas. Assim, podemos considerar cinco
elementos numricos para definir o nvel da medida: identidade, ordem,
intervalo, origem e unidade de medida. Destes cinco elementos, os mais
discriminativos dos nveis so a origem e o intervalo, dado que a ordem
uma condio necessria para que realmente haja medida. Se a medida
somente salva a identidade do nmero, na verdade no se trata de
medida, mas sim de classificao e contagem. Neste caso (escala
nominal), os nmeros no so atribudos a atributos dos objetos, mas o
prprio objeto identificado por rtulo numrico. Este rtulo nem precisaria
ser numrico, dado que no importa que smbolo ou rabisco pode ser
utilizado com a mesma funo de distinguir objetos um do outro ou classe
de objetos de outra classe. A nica condio necessria que se
salvaguarde a identidade do smbolo, isto , um mesmo smbolo no pode
ser duplicado para identificar objetos diferentes, como tambm diferentes
smbolos no podem ser usados para identificar objetos idnticos. Embora
no estejamos neste caso medindo, a escala numrica que resulta desta
rotulao adquire direito ao nome escala, dado que ela corresponde em
parte definio de medida que reza "medir atribuir nmeros s coisas
empricas".

O esquema a seguir ilustra como se originam as vrias escalas de


medida, enquanto que a Tabela 1-3, por outro lado, sintetiza as caracters-
ticas de cada escala.
ORIGEM

NAO-NATURAL NATURAL
NAO-IGUAL ORDINAL ORDINAL

IGUAL INTERVALAR RAZO

Uma escala numrica pode ser transformada numa outra equivalen-


te, se forem respeitados os elementos da invarincia nesta transformao.
Uma escala de maior nvel pode utilizar as operaes estatsticas de uma
escala inferior, mas perde informao dado que as estatsticas prprias de
uma escala inferior so menos eficientes, isto , so menos robustas. No
permitido ( erro) utilizar estatsticas de uma escala de nvel superior
numa inferior, dado que esta no satisfaz os requisitos necessrios para
se utilizar de procedimentos estatsticos superiores. So chamados de
paramtricos os procedimentos estatsticos da escala intervalar, porque
nela os nmeros possuem carter mtrico, isto , so adicionveis,
enquanto os no-paramtricos no so mtricos, visto que representam
somente postos e no quantidades somveis.

Tabela 1-3 Caractersticas das escalas numricas de medida.


ESCALA AXIOMAS INVARI- LIBER- TRANSFORMAES ESTATSTICAS
SALVOS NCIAS DADES PERMITIDAS APROPRIADAS

Nominal identidade ordem Permutao Freqncias:


2
intervalo (troca 1 por 1) f,%,p,Mo,X ,C
origem
unidade

Ordinal identidade ordem intervalo Monotnica No-paramtri-


ordem origem crescente cas: Md, rs U, etc.
unidade (isotonia)

Intervalar identidade ordem origem Linear de tipo y Paramtricas:


ordem intervalo unidade = a + bx M,DP,r,t,f,etc.
actividade

Razo identidade ordem unidade Linear de tipo Mdia geomtrica,


ordem intervalo y= bx Coef. variao,
aditividade origem (similaridade) Logaritmos
O PROBLEMA DO ERRO

Conceito de erro

A medida um procedimento emprico, e no existe procedimento


emprico isento de erro. Esta no uma afirmao lgica, mas pode ser
considerada um postulado e empiricamente verificada atravs de
operaes de mensurao. Mesmo na medida fundamental, impossvel
evitar-se o erro. Argumentando com Popper (1972), podemos dizer que
medir consiste na determinao da coincidncia de pontos: um sinal no
objeto a ser medido e um sinal no instrumento de medida (metro, por
exemplo). Agora, no existe tal coincidncia no sentido de que os dois
pontos se fundem num ponto nico; h apenas uma justaposio dos dois
pontos. A preciso perfeita da justaposio s seria finalmente efetuada se
pudesse ser verificada num aumento ao infinito desses dois pontos, pois
que, com o aumento deles, se verifica que os pontos realmente (de fato)
no esto perfeitamente alinhados, mas apenas aparecem mais ou menos
prximos. Assim, a coincidncia se faz dentro de um intervalo: o ponto do
corpo medido cai dentro de um intervalo de pontos no instrumento
(extremos de condensao). Quanto menor este intervalo, maior a preciso
da medida. Por esta razo, costumeiro entre os cientistas apresentar,
alm do valor da medida, o seu equivalente erro provvel, o qual define
precisamente estes extremos de condensao.

Tipos de erro

Os erros podem ser debitados ou prpria observao ou


amostragem de objetos ou eventos na qual a medida foi realizada.

Erros de observao

H quatro fontes principais de erros de observao: erros instru-


mentais, devidos a inadequaes do instrumento de observao; erros
pessoais, devidos s diferentes maneiras de cada pessoa reagir; erros
sistemticos, devidos a algum fator sistemtico no controlado, como, por
exemplo, medir a temperatura a um nvel diferente do nvel do mar; e erros
aleatrios, sem causa conhecida ou conhecvel. H, inclusive, curiosos
acontecimentos neste particular, como a demisso do seu assistente pelo
astrnomo real Nevil Maskelyne (Inglaterra) porter observado a passagem
de estrelas e planetas meio segundo depois do que tinha ele mesmo
observado. O problema no tanto a existncia desses erros, que so
inevitveis, mas sim identificar as suas fontes e propor meios de reduzi-
los. A Tabela 1-4 d uma sntese desta problemtica.
Tabela 1-4 Erros de medida: fontes e controle
TIPO CAUSA CONTROLE

instrumental instrumento calibrao


pessoal (observador) diferenas individuais ateno, treinamento
sistemtico fator especfico experimental ou estatstico
aleatrio no conhecida teorias do erro (probabilidade)
amostragem coleta da amostra representatividade da amostra
(teoria estatstica)

Erros de amostragem
Como a pesquisa emprica normalmente no pode ser feita sobre
todos os membros de uma populao de eventos ou objetos, tipicamente
se seleciona uma amostra destes eventos ou objetos. Esta escolha de
indivduos no meio de uma populao sujeita a desvios, vieses, isto ,
erros. O problema no so os erros em si, se o interesse fosse tirar con-
cluses sobre a amostra selecionada. Acontece, porm, que o interesse do
pesquisador tirar concluses ou fazer inferncias sobre toda a populao
da qual a amostra foi retirada. Neste caso, o erro de amostragem desas-
troso, uma vez que poderia ocasionar inferncias errneas, dada a
presena de vieses da amostra com respeito a esta populao (falta de
representatividade). Para solucionaros problemas advindos da seleo da
amostra, foi desenvolvida a teoria estatstica da amostragem.

A teoria do erro
Dado que o erro est sempre presente em qualquer medida e que
sua presena constitui uma ameaa sria tomada de decises cientficas,
de capital importncia que haja meios de neutralizar ou diminuir os seus
efeitos ou, pelo menos, de conhecer sua grandeza, o mais aproximado
possvel, para saber o tamanho do risco em que se est incorrendo ao
tomar decises baseadas na medida. Todos os esforos para controlar o
erro atravs de procedimentos experimentais so necessrios, mas nem por
isso o erro vai desaparecer, visto que a sua ocorrncia imprevisvel, isto
, no nunca possvel se determinar as causas de todos os erros pos-
sveis numa medida. Para enfrentar esta situao foi desenvolvida a teoria
do erro, baseada na teoria da probabilidade e dos eventos casualides.
Um evento casualide ou aleatrio definido por Popper (1974,
p. 190): "Uma seqncia-evento ou seqncia-propriedade, especialmente
uma alternativa, se diz 'casualide' ou 'aleatria' se e somente se os
limites das freqncias de suas propriedades primrias forem 'absoluta-
mente livres', isto , indiferentes a qualquer seleo que se apoie nas
propriedades de qualquer nupla de predecessores". Em palavras mais
simples, um evento emprico aleatrio se sua ocorrncia no pode ser
predita a partir dos eventos que ocorreram antes dele, isto , ele
totalmente independente (livre) com relao ao que aconteceu antes.
Imagine o jogo de lanar uma moeda para obter cara ou coroa ou o de um
dado: qualquer que tenha sido o resultado nos lanamentos anteriores do
dado, o resultado (um entre os seis possveis) do prximo lanamento
totalmente imprevisvel isto liberdade absoluta.
O erro na medida considerado um evento aleatrio, pela teoria do
erro. Feita esta suposio, ento possvel tratar o erro dentro da teoria
da probabilidade, do teorema de Bernoulli, que baseia a lei dos grandes
nmeros e da curva normal, que determina a probabilidade de ocorrncia
dos vrios elementos da srie, no nosso caso, da srie aleatria composta
dos vrios tamanhos de erros cometidos na medida.
A curva normal define que uma seqncia aleatria de eventos
empricos se distribui normalmente em tomo de um ponto modal (mdia)
igual a 0 e uma varincia igual a 1. Este valor modal, no caso de uma
distribuio de erros, significa que estes se cancelam no final, dado que
este valor (0) o que possui a maior probabilidade na distribuio.
Contudo, isto absolutamente verdadeiro somente na distribuio de uma
srie aleatria de um nmero infinito de eventos, segundo o teorema de
Bernoulli. Este teorema, na verdade, afirma que um segmento 'x' de
elementos de uma srie aleatria infinita 'A' (isto , com liberdade
absoluta) que se aproxima da srie total (x->A) possui os mesmos
parmetros desta srie. Isto significa que, quanto maior o segmento, mais
prximo est dos parmetros da srie ou, em outras palavras, quanto
maior o segmento, menor o desvio dos parmetros dele dos da srie. Diz
Popper (1974, p.198): "Assim, o teorema de Bernoulli assevera que os
segmentos mais curtos de seqncias casualides mostram, muitas vezes,
grandes flutuaes, enquanto que os segmentos longos sempre se
comportam de modo que sugerem constncia ou convergncia; diz o
teorema, em suma, que encontramos desordem e aleatoriedade no
pequeno, ordem e constncia no grande. a este comportamento que se
refere a expresso 'lei dos grandes nmeros".
Na prtica da pesquisa, contudo, o erro da medida expresso pelo
erro padro da medida, que o valor mdio da varincia, isto ,

A informao dada pelo erro padro da medida esclarece que a


medida verdadeira de um atributo se situa entre o valor mdio das medidas
efetuadas e um erro padro em torno dele (isto , mais um erro padro e
menos um erro padro).

IMPORTNCIA DA MEDIDA

Poder-se-ia perguntar, diante de tantas dificuldades que a medida


apresenta, se h vantagem em se utilizar mtodos de medies em lugar
de mtodos puramente qualitativos ou descritivos. Parece que a resposta
deva ser positiva, porque aqueles mtodos se apresentam superiores a
estes em, pelo menos, duas reas: preciso e simulao.

Preciso

Apesar de a medida nunca ser destituda de erro, ela capaz de


definir limites dentro dos quais os reais valores dos atributos medidos se
encontram. O conceito de pontos de condensao ou de extremos
imprecisos (Popper, 1974) nos indica a soluo da questo da preciso da
medida. Fazer pontos coincidirem (ponto extremo do atributo do objeto a
ser medido e ponto de referncia do instrumento de medida) significa
determinar que o ponto do atributo cai dentro de um intervalo de pontos
extremos do instrumento. A questo, ento, se reduziria a determinar estes
pontos extremos do intervalo, que, por sua vez, tambm caem dentro de
um intervalo cujos pontos extremos precisariam ser determinados, e assim
indefinidamente; isto , nunca daria para decidir nenhum intervalo de
pontos de condensao. Entretanto, os pontos extremos do intervalo de
condensao seriam definidos por intervalos cada vez menores, de sorte
que se pode finalmente definir um intervalo, o menor possvel, com pontos
extremos imprecisos, dentro do qual o valor real do atributo se encontra.
Assim, fica definido um intervalo mnimo mais provvel dentro de seus
pontos extremos e, igualmente, a margem de erro tolerada ou provvel, de
sorte que no se contentaria em simplesmente afirmar que o atributo
mais ou menos de tal magnitude, mas que ele tem uma magnitude definida
dentro de limites (intervalo) assim definidos. A reduo ao mnimo do
intervalo dos pontos de condensao, evidentemente, depende de avanos
tecnolgicos no instrumental de medio.
Sendo isso possvel, ficam mais precisas tanto a descrio do
fenmeno natural quanto a comunicao sobre o mesmo. Fica tambm
mais exata a definio das operaes e procedimentos utilizados na
observao dos mesmos fenmenos. A medio no torna a observao
possvel, mas a torna mais unvoca, isto , menos ambgua, mais precisa.
Esta vantagem da medio se torna ainda mais crucial na observao do
muito grande (macroscpico) e do muito pequeno (microscpico).
A simulao

A manipulao da realidade geralmente complexa, difcil e cus-


tosa. Alm disso, s vezes ela impossvel ou eticamente condenvel. Por
exemplo, no parece aceitvel querer estudar os efeitos da bomba atmica
sobre uma cidade explodindo uma. Mas, conhecendo com preciso as
relaes entre os componentes em jogo e suas magnitudes, pode-se
utilizar modelos matemticos para simular os efeitos que queremos estudar
e que, de outro modo, seria impossvel ou impraticvel pesquisar.

CONCLUSO

A medida em cincias empricas no pode ser considerada uma


panacia para decidir todos os problemas do conhecimento da realidade,
inclusive porque no ela que define o objeto e nem o mtodo da Cincia.
Mas, diante das vantagens apresentadas, seria qui at irracional no se
aproveitar da medida como instrumental de trabalho no estudo da
realidade. A histria da Cincia parece demonstrar, inclusive, que o avano
do conhecimento cientfico est ligado ao maior ou menor uso da medida,
sobretudo quando ela est baseada numa teoria axiomatizada, isto ,
quando h a explicitao clara do maior nmero possvel dos axiomas
necessrios. Infelizmente, na medida em cincias sociais e do comporta-
mento, esta axiomatizao est longe de ser uma realidade. Mesmo assim,
a discusso sobre a viabilidade da medida nestas cincias parece uma
disputa mais incua que produtiva; uma discusso de como se proceder
medida parece mais substantiva, produtiva e til para o desenvolvimento
destas cincias.

REFERNCIAS BIBLIOGRFICAS

CAMPBELL, N.R. An account of the principles of measurement and calculations. London:


Longmans Green, 1928.
--------------. Symposium: Measurement and its importance for philosophy.Proceedings Aristot.
Society Suppl., London, v.17, p.121-142, 1938.
FREGE, J.G. Os fundamentos da aritmtica: uma investigao lgico-matemtica sobre o
conceito de nmero. In: OS PENSADORES: Peirce e Frege. Sao Paulo: Victor Civita,
1984. p. 195-276.
GUILFORD, J.P. Psychometric methods. New York: McGraw-Hill, 1954.
KLEIN, H.A. The world of measurements, masterpieces, mysteries and muddles of metrology.
New York: Simon and Schuster, 1974.
LORD, F.M. Applications of item response theory to practical testing problems. Hillsdale (NJ):
Erlbaum, 1980.
LUCE, R.D., SUPPES, P. Measurement theory.ln: THE NEW ENCYCLOPAEDIA BRITANNICA.
London: Britannica, 1986. v.23, p.792-798.
POPPER, K.R. A lgica da pesquisa cientfica. Sao Paulo: Cultrix, 1972.
--------------. Conjeturas e refutaes. Braslia: Ed. UnB, 1974.

STEVENS, S.S. Mathematics, measurement and psychophysics. In: STEVENS, S.S. (Ed.).
Handbook of experimental psychology. New York: Wiley, 1951. p.1-49.
SUPPES, P., ZINNES, J.L. Basic measurement theory. In: LUCE, R.D., BUSH, R.R.,GALANTER,
E.G. (Eds.). Handbook of mathematical psychology. New York: Wiley, 1963. v.l, p.1-76.
CAPTULO 2

TEORIA E MTODOS EM PSICOFSICA*

Maria Angela Guimares Feitosa


Instituto de Psicologia
Universidade de Brasilia

I
nformalmente, a psicofisica nasceu em aproximadamente 130 A.C., na
Astronomia, nas mos de Hiparco, com o desenvolvimento de uma
escala para quantificao de magnitude estelar; formalmente, com a
publicao do Elemente der Psychophysik, por Gustav Theodor Fechner,
em 1860, como uma proposta metodolgica para o estudo experimental
da alma. Este evento foi precedido por alguns outros eventos relevantes
que merecem meno. Daniel Bernoulli props, em 1738, que as pessoas
no agem com base no valor real do dinheiro, mas em uma transformao
psicolgica do seu valor real. Bernoulli props que a utilidade do dinheiro
aumenta como uma funo logartmica da quantidade do dinheiro. Em
1824, o matemtico Herbart props o conceito de limiar, ao afirmar que
eventos mentais precisam ter uma certa fora para serem conscientemente
experimentados. Herbart props ainda o uso de pressupostos e conceitos
matemticos para lidar com conceitos psicolgicos. Weber (1834-1846),
pesquisando sobre somatossentidos, observou que pesos grandes levan-
tados precisam diferir mais do que pesos pequenos para serem percebidos
como diferentes, levando formulao de que a diferena apenas per-
ceptvel (DAP) uma razo do peso levantado, criando as condies para
que Fechner enunciasse a lei que mais tarde veio a ter o nome de Weber.
Em torno de 1850, os astrnomos J. Herschel, W.R. Dawes e N.R. Pogson
formularam, independentemente de Fechner, a lei psicofisica bsica de
Fechner, no contexto de desenvolver a escala de magnitude estelar
originalmente concebida por Hiparco. Na dcada de 1850, o fsico J.A.F.
Plateau inventou o mtodo de bisseco, no qual o observador, dados dois
valores de estmulo, tinha que produzir um terceiro que parecesse ocupar
a metade do intervalo entre os estmulos padro. Especificamente, Plateau

* A preparao deste capitulo foi parcialmente financiada pelo CNPq, atravs do Auxlio
Integrado 50.0493/91-0. A autora agradece a Luiz Pasquali, Miosotis Lcio e Rosana Maria
Tristo Taveira, pela leitura crtica de verso preliminar e pelas vrias sugestes
oferecidas. Miosotis Lcio tambm colaborou no levantamento da bibliografia.
solicitou a artistas que, a partir de tintas branca e preta, produzissem um
cinza que parecesse estar equidistante do branco e do preto.
A publicao do Elemente der Psychophysik teve impacto na
comunidade cientfica europia e foi decisiva para o estabelecimento da
prpria Psicologia como disciplina cientfica. O estabelecimento e o pro-
gresso da psicofisica no foi, entretanto, ausente de percalos. A Univer-
sidade de Cambridge, na Inglaterra, recusou permisso para o estabe-
lecimento de um laboratrio de psicofisica porque isto "seria insultar a
religio por colocar a alma humana em um par de escalas", uma reao
que lembra a que sofreu Charles Darwin com o enunciado da teoria da
evoluo das espcies. Nos Estados Unidos, William James deixou publi-
camente claro seu desprezo pelo trabalho de Fechner, o que contribuiu
para a pouca participao dos laboratrios americanos de Psicologia
Experimental na consolidao da psicofisica (Adler, 1980; Boring, 1957).
A psicofisica criada por Fechner e os desdobramentos sob sua
influncia terica e metodolgica so referidos na literatura como psico-
fisica fechneriana ou clssica. Fechner tinha um interesse especial pela
questo mente-corpo, e sua proposta psicofisica bsica, R=f(S), tem
embutidos o pressuposto de identidade psicofisica e o de que as pessoas
no tm acesso direto s sensaes, as quais deveriam ser medidas indi-
retamente atravs de sucessivos limiares diferenciais. Mais especifica-
mente, ele pressupunha que a diferena apenas perceptvel (DAP) a
unidade de sensao, que diferentes DAPs correspondem a uma mesma
sensao e que as DAPs podem se somar para constituir uma escala. O
investimento de Fechner no estudo das sensaes no deve ser interpre-
tado como refletindo sua posio sobre o objeto principal do desenvolvi-
mento da psicofisica, mas como refletindo o fato de que Fechner viveu em
uma poca em que eram influentes filsofos associacionistas empiricistas
que defendiam que todo o conhecimento e as idias se devem, em ltima
instncia, a experincias sensoriais com o mundo externo. No surpreende,
portanto, que tendo Fechner um profundo interesse pela Filosofia, esco-
lhesse as sensaes como o ponto de partida de seu extenso "programa"
psicofisico, o qual inclua o estudo da memria e do pensamento.

QUESTES CENTRAIS EM PSICOFSICA

Embora o objetivo principal deste livro seja metodologia de pes-


quisa em Psicologia, impossvel discorrer sobre mtodos psicofsicos
sem fazer uma incurso, ainda que breve, na teoria pertinente. Caso
contrrio, corre-se o risco de propiciar uso indevido do texto e de se
passar ao leitor pouco mais do que um cookbook, porque mtodos no
costumam ser desenvolvidos dissociados de um referencial terico ou de
um problema cuja soluo exija o desenvolvimento de uma estratgia
apropriada. Alm disso, os mtodos psicofsicos tm sido utilizados em
campos to distintos que a anlise crtica da aplicabilidade do mtodo
especfico no pode ser feita fora do contexto de pesquisa em que o
mtodo usado. A organizao das partes subseqentes deste captulo
bem como os diversos exemplos escolhidos procuram destacar algumas
destas questes. Associada descrio de cada mtodo, tambm ser
feita uma descrio bsica do tratamento de dados proposto e consistente
com os pressupostos tericos subjacentes ao mtodo. Tratamento sofisti-
cado das teorias, dos mtodos psicofsicos e da anlise quantitativa dos
dados pode ser encontrado em Falmagne (1985) e em Luce e Krumhansl
(1987).

O objeto de estudo da psicofisica


Independentemente dos pressupostos e objetivos originais de
Fechner, contemporaneamente a psicofisica se prope a descrever as
relaes entre propriedades do mundo fsico e a forma como as pessoas
respondem a elas. O objeto central da psicofisica so as sensaes,
entendendo-se que sensao um construto acerca dessas relaes
primitivas dos organismos com o meio. Esta leitura contempornea da
psicofisica pode ser melhor apreendida a partir de algumas colocaes
explcitas de S.S. Stevens. Stevens (1975, p.51-52) props que a sensao
com a qual a cincia lida o tipo de reao que se presta ao escrutnio
pblico; que as reaes que interessam so aquelas produzidas por
organismos em circunstncias que fazem com que respondam a estmulos;
e que a adeso a este princpio nos permite extrair a ordem quantitativa de
nossos sistemas sensoriais quando eles respondem a configuraes de
estmulo do ambiente. Vale a pena ressaltar a acepo proposta por
Stevens acerca da noo de subjetividade em psicofisica. Eie afirma que
a diferena principal entre os construtos da Fsica e os da psicofisica que
os construtos psicofsicos dizem respeito a pessoas, chamados observa-
dores ou sujeitos, e so portanto ditos subjetivos. Se lembrarmos que
"subjetivo" pertence a "sujeito", em particular resposta de observadores
humanos, podemos evitar as questes metafsicas que costumam surgir
quando o discurso centrado na, assim chamada, experincia subjetiva.
Embora as afirmaes imediatamente anteriores privilegiem o ser humano
como objeto de interesse, no h nada nelas que impea sua ampliao
para incluir outros organismos animais.

As principais perguntas psicofsicas


As principais perguntas que a psicofisica procura responder podem
ser agrupadas em quatro tipos (Coren, Porac e Ward, 1979). Uma pergunta
: qual a energia mnima que um estmulo deve ter para provocar uma
sensao? Por exemplo, podemos querer saber qual o nvel de presso
que um som de 500Hz precisa ter para ser minimamente audvel quando
apresentado atravs de fones de ouvido. Dizemos que esta uma questo
de deteco, para cuja resposta procuramos definir o limiar absoluto.
Uma segunda pergunta : em quanto dois estmulos precisam diferir para
provocarem sensaes diferentes? Por exemplo, que distncia mnima
duas pontas cegas apresentadas pele do dedo indicador precisam ter
para serem percebidas como duas, ao invs de uma? Dizemos que esta
uma questo de discriminao, para cuja resposta procuramos definir o
limiar diferencial. Uma terceira pergunta : o que o estmulo?. Um
exemplo a correta leitura de letras da carteia de Snellen, solicitada pelo
oftalmologista na avaliao clnica de acuidade visual. Dizemos que esta
uma questo de reconhecimento, para cuja resposta procuramos definir
o limiar de reconhecimento ou a funo de identificao. Uma quarta
pergunta : como cresce a magnitude da sensao com a magnitude do
estmulo? Por exemplo, como cresce a sensao de frio ou desconforto
com a queda na temperatura irradiada em uma determinada rea da pele?
Dizemos que esta uma questo de escalonamento, para cuja resposta
procuramos definir uma funo de magnitude psicofisica. Uma das
proposies da psicofisica encontrar os princpios ou leis gerais
subjacentes ao comportamento dos organismos nos tipos de situaes
acima descritos e, obviamente, as formas metodologicamente apropriadas
de se chegar a estes enunciados. O presente captulo no faz jus
complexidade terica e metodolgica da psicofisica. O tratamento mais
aprofundado de vrios aspectos da psicofisica pode ser encontrado nas
obras relacionadas no final do captulo.

Leis psicofsicas bsicas


Lei de Weber
Voltemos ao experimento precursor sobre discriminao de pesos
levantados. Weber observou que pesos pequenos precisam diferir em
pouco para serem percebidos como diferentes e que pesos grandes
precisam diferir em muito para serem percebidos como diferentes. Dito de
outra forma, isto quer dizer que o valor do limiar diferencial para um
determinado estmulo varia em funo do valor do estmulo padro com o
qual est sendo comparado. Assim sendo, o limiar diferencial no uma
forma econmica de expressar a capacidade discriminativa de um
observador em uma dada tarefa sensorial. conveniente recorrer
expresso da proporcionalidade entre o valor do estmulo padro e o limiar
diferencial. Esta proporcionalidade pode ser matematicamente expressa
da forma abaixo, como a lei de Weber:

onde c a frao ou constante de Weber, S, o estmulo padro e S2


um estmulo a ser discriminado de S1.

46
A lei de Weber tem sido testada para vrios tipos de estmulos,
mostrando-se aplicvel em um conjunto grande de situaes. Com seu
uso podemos fazer afirmaes gerais importantes, como, por exemplo,
acerca da comparao entre espcies quanto discriminabilidade de
estmulos em uma dada modalidade sensorial, discriminabilidade relativa
dos vrios sistemas sensoriais para um mesmo tipo de estmulo em uma
dada espcie. A lei tem uma limitao igualmente bem documentada, que
a sua no aplicabilidade para estmulos de magnitude muito pequena. Os
dados tipicamente mostram que quando os estmulos tm magnitude muito
pequena, c relativamente grande e tende a diminuir com o aumento na
magnitude do estmulo at atingir um valor a partir do qual passa-se a
verificar a constncia expressa na lei. Em algumas condies especficas,
a constncia tambm no se verifica para valores muito elevados de
estmulo.
Lei de Fechner
Baseado nos pressupostos de que a diferena apenas perceptvel
(DAP) a unidade de sensao e que diferentes DAPs correspondem a
um mesmo incremento psicolgico em magnitude sensorial, Fechner
props constituir uma escala de magnitude sensorial somando DAPs a
partir do limiar absoluto. Fechner pressups tambm a validade da lei de
Weber e, a partir dela, derivou a frmula que ficou conhecida como a lei de
Fechner, abaixo representada:

onde P a magnitude da sensao, k uma constante de multiplicao


cujo valor depende da modalidade e da dimenso sensorial e S a
magnitude (intensidade) do estmulo acima do limiar. Como mencionado
anteriormente, os dados empricos de discriminao mostram limitaes
nas condies em que se verifica a lei de Weber. Assim sendo, a lei de
Fechner vlida apenas nas condies em que se sustentam os pressu-
postos nos quais est ancorada, um deles sendo a prpria lei de Weber.
Lei de Ekman
Um problema de interpretao de dados sobre magnitude de
sensao que as escalas produzidas por escalonamento de razo e as
produzidas por escalonamento de discriminao diferem sistematicamente
em expoente. Gosta Ekman, trabalhando na Universidade de Estocolmo,
procurou uma explicao para esta diferena e props, no final da dcada
de 50, que o tamanho psicolgico do DAP uma funo linear de magni-
tude sensorial. A lei de Ekman afirma que:

onde DY uma mudana em magnitude apenas detectvel, Y o valor de


incio da magnitude de sensao e kY e a so constantes. Em essncia, a
lei de Ekman uma afirmao de que a variabilidade em magnitude
sensorial proporcional ao valor mdio de magnitude sensorial. Um
aspecto relevante da lei de Ekman que ela permite unificar dados de
experimentos usando mtodos de deteco de sinal, discriminao,
estimativa de magnitude e julgamento de comparao de pares, cujas
caractersticas de variabilidade so compatveis com as descritas na lei.
Como digresso, interessante notar a observao de Gescheider de que,
j em 1874, Brentano havia proposto que a relatividade da variabilidade
aplica-se no s ao domnio fsico como psicolgico, mas essa idia s foi
retomada e avanada 80 anos depois. Este um exemplo especfico de
um fato corriqueiro na construo da Cincia de que a evoluo do
pensamento cientfico e a acumulao do conhecimento s vezes seguem
caminhos bastante tortuosos.

Lei de Stevens
Stevens, em contraposio direta a Fechner, props na dcada de
50 que a razes iguais de estmulo correspondem razes iguais de sen-
saes. Descrita matematicamente, esta relao pode ser reproduzida por:

onde P a magnitude da sensao, k uma constante de proporciona-


lidade, S a magnitude do estmulo e n a varivel potncia.
O parmetro mais importante e que tem sido o foco de muitos
experimentos psicofsicos o expoente n. Quando n = 1, a representao
grfica da funo uma reta. Isto corresponde a uma situao psicofisica
em que a magnitude da sensao cresce de forma proporcionalmente
equivalente, linearmente, com a magnitude do estmulo (vide Figura 2-1).
Este fenmeno ocorre, por exemplo, com julgamento de comprimento de
linha. Quando n < 1, a representao grfica da funo uma curva com
crescimento em acelerao negativa, cuja assntota tende a uma paralela
ao eixo da abcissa. Isto corresponde a uma situao psicofisica em que a
magnitude da sensao cresce de forma gradativamente menor conforme
aumenta a magnitude do estmulo. Este comportamento da funo o
mais freqentemente encontrado. Dois bons exemplos so o crescimento
de brilho em funo de intensidade de flashes rpidos e o crescimento de
sonoridade em funo de presso acstica. Quando n > 1, a representao
da funo uma curva de acelerao positiva, com assntota tendendo a
uma paralela ao eixo da ordenada. Isto corresponde a uma situao
psicofisica em que a magnitude da sensao cresce de forma gradativa-
mente maior com o aumento na magnitude do estmulo. Este fenmeno
ocorre, por exemplo, com choque eltrico em funo de corrente aplicada
aos dedos.
Magnitude de estmulo (unidades arbitrarias)

Fig. 2-1 Representao estilizada dos dados tpicos de experimentos


relacionando magnitude aparente a magnitude de estmulo para trs
condies diferentes de estmulo. A magnitude aparente est expressa em
unidades arbitrrias como funo de magnitude de estmulo, em unidades
arbitrrias para choque eltrico, comprimento de linha e brilho. (Adaptado
de Stevens, 1975, p.16)

Independentemente da propriedade terica desta funo e de sua


eventual superioridade em relao lei de Fechner, a equao anterior-
mente descrita apresenta a convenincia de, ao ser logaritmicamente
tratada, se transformar na equao da reta:

onde log k o intercepto no eixo log P e n a inclinao da reta (vide


Figura 2-2).
Nesta forma, a funo psicofisica sempre pode ser descrita por uma
reta, quando se piota log P em funo de log S. Quando n = 1 obter-se-
uma reta de inclinao 1; quando n > 1 obter-se- uma reta com inclina-
o superior a 1; e quando n < 1, obter-se- uma reta com inclinao
inferior a 1. Os valores de n e de k podem ser obtidos atravs do mtodo
dos quadrados mnimos.

Rumo a uma lei psicofisica unificada


A comparao entre as leis de Fechner e de Stevens tem ocupado
os tericos mesmo dcadas depois do incio da controvrsia originalmente
1 2 3 10 20 3'0 90 100 200 380 1000
Magnitude de estmulo (unidades arbitrrias)

Fig. 2-2 Representao estilizada dos mesmos dados da Fig. 2-1, loga-
ritmicamente transformados. Observe-se que as trs funes so retas,
que a curva de acelerao positiva se transformou em uma reta de inclina-
o maior que 1 e que a curva de acelerao negativa se transformou em
uma reta de inclinao menor que 1. (Adaptado de Stevens, 1975, p.17)

colocada por Stevens. O leitor interessado numa viso panormica e


contempornea da controvrsia, bem como de uma possvel sada para a
controvrsia, pode consultar uma publicao no volume 12 do Behavioral
and Brain Sciences (Krueger, 1989), que rene um artigo central de Lester
E. Krueger com comentrios de 36 outros autores. Neste trabalho, Krueger
prope que a descrio de uma lei psicofisica geral exigiria que os
fechnerianos abandonassem os pressupostos da validade da lei de Weber
e de que o DAP tem a mesma magnitude subjetiva independentemente de
modalidade sensorial; e que os stevensonianos abandonassem o pressu-
posto de que a escala no ajustada de magnitude uma medida direta de
magnitude sensorial. ainda cedo para avaliar o impacto desta proposta
sobre a consolidao da teoria psicofisica.

PSICOFISICA CLASSICA

Fechner criou trs mtodos psicofsicos, os chamados mtodos


psicofsicos clssicos, que, com pequenas modificaes, continuam sendo
considerados mtodos centrais na psicofisica.
Mtodo dos estmulos constantes
Neste mtodo, apresenta-se o observador um conjunto de est-
mulos cujos valores so adequadamente espaados, para se obter uma
funo psicofisica em que a probabilidade de resposta ao longo do
contnuo de valores de estmulo varie de 0 a 1. Para a dimenso de
estmulo escolhida, cada valor de estmulo apresentado um mesmo
nmero de vezes, mas em ordem aleatria. Na verso mais simples de sua
utilizao, o observador solicitado a julgar se um estmulo est presente
ou no; os resultados so plotados em termos de p(SIM) como funo de
intensidade de estmulo. A funo resultante aproxima-se de uma
sigmide e descreve como cresce a sensao acerca do estmulo em
funo de sua magnitude. Desta funo possvel obter-se, como limiar
absoluto para a dimenso de estmulo em estudo, aquele valor de estmulo
que corresponde probabilidade 0,5 de respostas SIM. Este valor de
probabilidade visto como aquele em que existe incerteza mxima acerca
da ocorrncia ou no do estmulo em estudo. costumeira uma variao
de regra de apresentao de estmulo em que a seqncia de estmulos
pseudo-aleatria, para impedir a ocorrncia de sries longas de
apresentaes de um mesmo valor de estmulo.
Quando o mtodo dos estmulos constantes usado para a obten-
o de limiares diferenciais, o julgamento solicitado ao observador passa
a ser, na verso mais simples do mtodo, se um estmulo S1 maior ou
menor que um segundo estmulo S2 variado o tamanho da diferena
entre S1 e S2, e os valores do par de estmulo ao qual se associa a pro-
babilidade 0,75 de respostas MAIOR QUE ou MENOR QUE so ento
usados para calcular o limiar diferencial para incremento ou decremento,
respectivamente, a partir do valor padro de S. O estudo de limiares
diferenciais exige que o mtodo contenha proviso para lidar com a
comparao entre dois estmulos. Assim, por exemplo, em audio, a
apresentao simultnea de dois tons produz efeitos de interao que no
so triviais; em viso e tato, a apresentao simultnea de dois estmulos
pode resultar em estimulao de reas receptoras da retina ou da pele
funcionalmente no comparveis. A apresentao sucessiva de estmulos
sensoriais tambm tende a produzir efeitos de ordem outras variveis
permanecendo constantes, o estmulo apresentado em segundo lugar
percebido como de maior magnitude. O conhecimento detalhado do
sistema sensorial especfico com o qual se est trabalhando necessrio
para que sejam incorporados os controles apropriados.

Mtodo dos limites


Neste mtodo o pesquisador predefine urna amplitude de variao
de estmulos a serem investigados, bem como os valores especficos de
estmulo a serem apresentados ao observador, da mesma forma como o
faria no mtodo dos estmulos constantes. Os estmulos so apresen-
tados em sries nas quais os valores de estmulo so de magnitude
crescente, tentativa a tentativa (srie ascendente), ou de magnitude
decrescente, tentativa a tentativa (srie descendente). Em cada srie, o
valor de estmulo com o qual a srie se inicia claramente subliminar
(srie ascendente) ou supraliminar (srie descendente). A srie
encerrada quando o observador muda a sua resposta ao estmulo, por
exemplo: de NO (a tentativa no contm estmulo) para SIM (a tentativa
contm estmulo) em uma srie ascendente; ou de SIM para NAO em uma
srie descendente. No jargo psicofisico, estes pontos de mudana so
chamados transies. Tipicamente o procedimento contm controles para
assegurar que sries de um mesmo tipo no sejam iniciadas com o mesmo
valor inicial e que uma mesma sesso de coleta de dados contenha tanto
sries ascendentes como descendentes, para impedir ou contrabalanar
estratgias de resposta que estejam sob o controle de variveis outras que
magnitude de estmulo. Limiares locais so definidos a partir dos pontos de
transio de resposta nas sries individuais, e um limiar mdio calculado
a partir da mdia dos limiares locais.
O mtodo tambm se aplica ao estudo de limiares diferenciais,
circunstncia em que se entende como srie ascendente aquela em que
a diferena entre os estmulos crescente e srie descendente como
aquela em que a diferena entre os estmulos tende a zero. As preocu-
paes anteriormente colocadas com as conseqncias da opo por
apresentao simultnea ou sucessiva de estmulos tambm se aplicam
a este mtodo. O mtodo dos limites deu origem a trs variaes: o
mtodo da escada, o mtodo do rastreamento (do original ingls tracking)
e o mtodo de escolha forada. Apenas o primeiro ser aqui descrito; o
segundo ser omitido porque partilha algumas caractersticas com o
mtodo dos ajustes, o qual est descrito nesta mesma seo; o terceiro,
pelo seu amplo uso associado teoria de deteco de sinal, ser descrito
na prxima seo.
Mtodo da escada
Este mtodo avana em relao ao mtodo dos limites a caracte-
rstica de economia no nmero de tentativas para a obteno de medidas
de limiar. Difere do mtodo dos limites no seguinte aspecto: encerrada a
primeira srie de estmulos, o valor de estmulo com que se iniciar a srie
complementar seguinte ser o valor com que se encerrou a srie anterior.
A conseqncia disto que os valores de estmulo efetivamente apresen-
tados esto sempre muito prximos do limiar. Obtm-se um grande
nmero de estimativas de limiar em curto perodo de tempo. Da mesma
forma como no mtodo dos limites, limiares locais so definidos a partir
dos valores de estmulo correspondentes a transies de resposta, e um
limiar mdio obtido a partir da mdia dos limiares locais. Procura-se
obter um nmero de transies que seja um compromisso entre o neces-
srio para o uso confortvel de estatstica descritiva e a possibilidade de
vrias aferies de limiar para a construo de uma funo. Este mtodo,
da mesma forma que o mtodo dos limites, encontrado numa srie de
variaes no que diz respeito a quatro caractersticas: (a) os critrios
usados para determinar mudanas no nvel do estmulo; (b) o valor, ou o
tamanho do intervalo de valor, em que o estmulo aumentado ou dimi-
nudo de tentativa a tentativa; (c) o critrio usado para encerrar a escada;
e (d) o algoritmo usado para calcular o limiar a partir dos dados.

Mtodo dos ajustes


Este o terceiro mtodo psicofisico concebido por Fechner. Foi
originalmente concebido para a mensurao de limiares diferenciais, mas
pode ser usado tambm para o estabelecimento de limiares absolutos. Na
verso para limiares absolutos, o estmulo inicialmente apresentado em
um valor bem acima do limiar e pede-se ao sujeito para ajustar o nvel do
estmulo at que ele desaparea. Em seguida, o estmulo pode ser apre-
sentado bem abaixo do limiar e pede-se ao sujeito para ajustar o nvel do
estmulo at ele ser apenas perceptvel. Tipicamente, o estmulo varia
continuamente. Uma srie de tentativas em que o estmulo cresce ou
decresce apresentada. O limiar calculado como a mdia dos diversos
valores de ajuste.
A verso para limiares diferenciais tem tambm o nome de mtodo
do erro mdio. Nele, apresenta-se ao observador um estmulo padro e
um segundo estmulo, o qual ele instrudo a ajustar para que parea igual
ao padro. Como o uso tpico do mtodo poder descrever a discrepncia
entre o valor de estmulo padro e o valor de ajuste, o tratamento de dados
voltado para este aspecto. A mdia da distribuio dos ajustes consi-
derada o valor de igualdade subjetiva; o erro constante a diferena
entre os valores do estmulo padro e os da igualdade subjetiva; o desvio
padro (ou outra medida de disperso) o limiar diferencial.
Uma limitao do mtodo dos ajustes que a variao contnua do
estmulo torna o resultado pouco preciso no caso de aferio de limiar.
Uma outra limitao que tempo de exposio e taxa de mudana por si
ss podem ser variveis relevantes na sensao que um estmulo produz,
e o experimentador perde controle sobre estas variveis se o procedimento
permite que o observador manipule estes aspectos do estmulo.

PSICOFSICA MODERNA

Stevens, em um trabalho volumoso que se iniciou na dcada de 30,


questionou a formulao bsica da lei de Fechner, de que a razes iguais
de estmulo correspondem diferenas iguais de sensaes, e contestou
diretamente o pressuposto fechneriano de que as sensaes no podem
ser medidas diretamente. Props uma nova lei de acordo com a qual a
razes iguais de estmulos correspondem iguais razes de sensao, a lei
da potncia, posteriormente tambm chamada de lei de Stevens, e
demonstrou que possvel obter escalas confiveis relacionando atri-
butos fsicos a atributos psicolgicos, perguntando-se diretamente ao
observador acerca de propriedades dos estmulos. Criou os chamados
mtodos de escalonamento direto, dos quais destacaremos quatro neste
captulo.
Os mtodos de escalonamento e as estatsticas a eles associadas
para produzir diferentes escalas sensoriais tm por trs a caracterizao
do grau de correspondncia entre o sistema de nmeros e as propriedades
dos objetos ou eventos em estudo. De acordo com estas propriedades, as
escalas de medida so agrupadas em quatro tipos: escalas nominais,
ordinais, de intervalo e de razo. Os mtodos de escalonamento podem
ser agrupados em duas grandes categorias, situando-se na primeira os
mtodos para construo de escalas de intervalos. Esta primeira categoria
se subdivide em duas famlias de mtodos para a construo de escalas
de confuso e de escalas de partio. Na segunda categoria esto os
mtodos para construo de escalas de razo, sendo apenas estas aqui
descritas, dada a preponderncia de seu uso na psicofisica contempor-
nea. O leitor pode consultar Stevens ( 1975) ou Gescheider (1976) para uma
boa descrio de outras escalas.
Iniciativas precursoras de uso de escalas de razo remontam a
Merkel em 1888 e a Fullerton e Cattell em 1892, mas foi s na dcada de
30, quando os engenheiros acsticos comearam a se preocupar com uma
descrio numrica de sonoridade (loudness), que os psiclogos passaram
a investir esforos neste tipo de escala. Os quatro principais mtodos para
produo de escalas de razo sero descritos a seguir.

Mtodo de produo de razo


Neste mtodo, tambm chamado de fracionamento, solicita-se ao
observador que observe um estmulo padro e ajuste um segundo est-
mulo, varivel, at que este parea um certo valor de razo do primeiro.
Por exemplo, fornece-se um tom puro de uma certa freqncia a uma
certa intensidade e solicita-se ao sujeito que ajuste a intensidade de um
segundo tom de mesma freqncia, at que este parea ter a metade da
sonoridade do primeiro tom. A tarefa repetida para vrios valores de
intensidade de estmulo. A tarefa pode tambm ser de razes que se
expressem por mltiplos, como, por exemplo, achar o valor que reflita o
dobro, o triplo de sonoridade. Recomenda-se que a descrio de uma
funo de magnitude seja baseada num experimento que inclua os dois
tipos de tarefa. A forma como os estmulos so apresentados costuma ser
especificada de acordo com um dos mtodos da psicofisica clssica
anteriormente descritos. Uma variao do mtodo fazer com que o
estmulo varivel assuma valores discretos, espaados a pequenos inter-
valos de intensidade, em vez da variao contnua, cuja desvantagem de
quantificao j foi anteriormente exposta. O mtodo de produo de razo
j foi utilizado para a obteno de funes de magnitude para vrias
modalidades e dimenses de estmulo.

Mtodo de estimativa de razo


Neste mtodo, pede-se ao sujeito para, dados dois estmulos que
se diferenciam em intensidade por um valor definido pelo experimentador,
estimar a razo entre eles. Aplicam-se as mesmas consideraes feitas
na descrio imediatamente acima para a obteno de uma funo de
magnitude. Os mtodos de produo e de estimativa de razo podem ser
usados para validao recproca. Gescheider (1976) alerta para o fato de
que estes dois mtodos no so muito poderosos, porque so muito
influenciveis por variveis de contexto, como, por exemplo, a prpria
amplitude dos valores de estmulo usados no experimento.

Mtodo de estimativa de magnitude


A genialidade deste mtodo est na sua surpreendente simplicidade.
Pede-se ao observador para atribuir nmeros a variaes quantitativas em
um atributo de um estmulo. Em uma das variantes do mtodo, d-se ao
observador um estmulo padro ao qual se atribui um valor de medida, do
tipo: se o peso deste cilindro tem o valor de 100, em quanto voc estima o
peso de uma srie de cilindros que lhe sero apresentados? Stevens reco-
menda que o estmulo padro corresponda a um valor intermedirio, dentre
aqueles que sero julgados. Em outra variante, o sujeito livre para atribuir
valores, e a instruo se limita a orientar o sujeito no sentido de que os
valores atribudos reflitam seu julgamento da magnitude relativa dos est-
mulos. Nesta segunda variante, a comparao de dados entre diferentes
observadores exige que se trabalhe com mdia geomtrica ou que se use
um procedimento preliminar de normatizao dos valores de resposta para
os diferentes observadores. Como a tarefa tipicamente considerada
muito fcil pelo observador, a coleta de dados muito eficiente, oque torna
o mtodo recomendado em experimentos que exigem a obteno de mui-
tos dados. O leitor pode consultar Gescheider (1988) para uma anlise de
modelos explicativos das caractersticas dos dados obtidos por estimativa
de magnitude.

Mtodo de produo de magnitude


Este mtodo a recproca do anterior. D-se ao observador um
estmulo padro num dado valor especificado pelo experimentador e pede-
se ao observador para ajustar um segundo estmulo at que o valor deste
seja um determinado mltiplo ou frao do padro. Novamente, a validade
da escala de magnitude julgada pela boa aproximao entre as escalas
obtidas por produo e por estimativa de magnitude.
Comparando-se os resultados obtidos com os mtodos de estima-
tiva e de produo de magnitude, observa-se um vis tpico na inclinao
de uma funo em relao a outra, descrito como efeito de regresso
mdia, com a seguinte caracterstica: na tarefa de estimativa, o observador
evita fazer estimativas muito baixas ou muito altas, resultando em uma
inclinao menor da funo; j na tarefa de produo, o observador evita
ajustar o estmulo em valores muito baixos ou muito altos, resultando em
uma maior inclinao da funo. O balanceamento destes dois vieses
complementares pode ser feito atravs do mtodo de balanceamento
numrico de magnitude, que consiste na extrao da mdia geomtrica
das duas funes.

Mtodo de equiparao intermodal


Diferentemente dos mtodos psicofsicos acima apresentados, nos
quais se busca descrever algum tipo de funo R = f (S), este mtodo
voltado para a obteno de funes do tipo S = f (S). Rigorosamente
falando, no um dos mtodos bsicos, mas suas peculiaridades mere-
cem uma ateno especial. Neste mtodo, o observador solicitado a
fazer comparaes diretas entre dois contnuos sensoriais. Uma tarefa
tpica seria solicitar ao observador apertar um dinammetro com fora
equiparvel intensidade aparente de um som. Este mtodo foi desenvol-
vido com uma preocupao terica acerca da lei potncia. Stevens
argumenta que, se a estimativa numrica que um observador faz quando
solicitado a julgar a magnitude de sua sensao reflete uma propriedade
fundamental do sistema sensorial, ento esta mesma propriedade deveria
nortear seu comportamento quando ele equipara uma sensao a outra.
Assim, conhecendo-se a funo potncia para cada sensao, a equipa-
rao deveria ser uma outra funo potncia cujo expoente a razo dos
dois expoentes originais. A aproximao entre o expoente predito e o
empiricamente obtido na tarefa de equiparao pode, ento, ser usada
como indicador de validade da escala psicofisica. As implicaes tericas
da equiparao intermodal continuam sendo objeto de pesquisa. O leitor
pode recorrer a Luce (1990) para um tratamento avanado contemporneo
do assunto.

DETECO DE SINAL

Tanner e Swets propuseram em 1954 que a teoria de deciso


estatstica e certos conceitos sobre dispositivos eletrnicos de deteco de
sinal poderiam ser usados para construir um modelo que se aproximasse
de como as pessoas se comportam em situaes de deteco nas quais
existem expectativas e conseqncias. O modelo ficou conhecido como a
teoria de deteco de sinal e est descrito no livro A Signal Detection
Theory and Psychophysics, de D.M. Green e J.A. Swets, publicado em
1966 e considerado a referncia bsica principal para a teoria. A descrio
que se segue baseada em Gescheider (1976).
A teoria de deteco de sinal se contrape psicofisica clssica ao
rejeitar a relevncia do conceito de limiar e ao propor que o observador
no recebe passivamente o estmulo, mas, muito ao contrrio, est ati-
vamente engajado no processo de decidir acerca da presena de um
estmulo na situao de observao. Assim, a teoria e o mtodo esto
voltados para a anlise do comportamento de tomada de deciso do
observador. A teoria contm algumas proposies centrais: a) existe ati-
vidade sensorial, mesmo na ausncia de estmulo especfico; b) um sinal
sempre ocorre na presena de rudo; c) o nvel de rudo varia de momento
a momento; d) o observador define (conscientemente ou no) acerca de
um critrio ou ponto de corte para um nvel de sensao acima do qual
responde SIM (existe um estmulo, ou sinal, como preferem os usurios da
teoria) e abaixo do qual, NO; e) sensibilidade (detectabilidade ou
discriminabilidade, dependendo de detalhes da tarefa psicofisica especfi-
ca) a quantidade mdia de sensao gerada por um sinal quando
comparado com a quantidade mdia de sensao gerada por rudo
apenas. Duas medidas centrais inerentes teoria so, portanto, critrio de
resposta (P) e sensibilidade ao estmulo (d'). Alm disto, a legitimidade da
utilizao da teoria pressupe a verificao dos pressupostos estatsticos
de que as distribuies de rudo e de sinal-rudo sejam normais e que as
varincias das respectivas distribuies sejam iguais.
Dentro do arcabouo acima descrito, um experimento psicofisico
simples pode ser representado por uma matriz estmulo x resposta 2x2, na
qual, para duas possibilidades de sinal (presente ou ausente) contempla-
se duas possibilidades de resposta (sim ou no). Uma matriz assim
delineada permite verificarem-se quatro possibilidades de resultado de
tentativas individuais, sendo dois tipos de acerto e dois tipos de erro. Mais
especificamente, se um sinal est presente e a resposta sim, obtm-se
uma deteco correta; se um sinal est presente e a resposta no, uma
omisso; se um sinal est ausente e a resposta sim, um alarme falso;
e se o sinal est ausente e a resposta no, uma rejeio correta do
sinal. Como, necessariamente, so complementares as propores de
resposta sim e no para cada uma das possibilidades de sinal, por
conveno selecionam-se para estudo as categorias deteco correta e
alarme falso, cujas probabilidades so independentes; este delineamento
bsico repetido para probabilidades diferentes de apresentao de sinal.
Todo o conjunto pode ainda ser repetido para valores diferentes de sinal
(vide Figura 2-3).
Os dados de um experimento assim planejado e executado podem
ser graficamente apresentados como curvas de isossensibilidade quando
Fig. 2-3 Representao estilizada de uma curva de isossensibilidade a
partir de um experimento de deteco de sinal, em que cada ponto repre-
senta os dados sob uma condio de probabilidade de ocorrncia do sinal.
A probabilidade de correta deteco est expressa na ordenada e a pro-
babilidade associada de alarme falso est expressa na abcissa. (Adaptado
de Stevens, 1976, p.74)

a proporo de deteces corretas plotada na ordenada, a proporo de


alarmes falsos plotada na abcissa e cada curva representa o comporta-
mento de deteco para um nico valor de estmulo associado a vrias
probabilidades de apresentao de sinal. Curvas diferentes descrevem a
sensibilidade do observador a valores diferentes de estmulo. Com este
tipo de apresentao de dados, a curvatura da funo, ou o grau de seu
afastamento de uma reta de inclinao 1, indica a sensibilidade do
observador ao estmulo. Para testar os pressupostos de normalidade de
distribuies e de igualdade de varincia, a curva de isossensibilidade
deve ser transformada em uma reta, o que se faz transformando as
propores em escores Z. Feita esta transformao, se a distribuio for
normal, a funo ser uma reta; se as varincias forem iguais, a inclinao
ser 1 e os valores de d' sero os valores de intercepto. A reta costu-
meiramente descrita a partir do mtodo dos quadrados mnimos.
A soluo grfica no , porm, necessria para descrever os resul-
tados do experimento. O valor de d' pode ser diretamente calculado a partir
da proporo de deteces corretas e de alarmes falsos atravs da
frmula:

O procedimento tpico comporta a manipulao explcita de variveis


motivacionais, pois possvel substituir a manipulao de freqncia
relativa do sinal por manipulao de tipo e magnitude de conseqncia
para cada uma das quatro possibilidades de resposta. Desta forma pode-
se verificar a influncia de variveis no estritamente sensoriais sobre o
padro de respostas do observador.
Como anteriormente mencionado, a teoria tem um referencial esta-
tstico. Embutidos em um mtodo geral acima descrito, pode-se descrever
trs procedimentos associados teoria de deteco de sinal: o procedi-
mento sim-no, o procedimento de escolha forada e o procedimento de
julgamento (rating) de confiana. importante apreciar que estes
procedimentos so delineados para permitir a obteno de dados que
possam, por sua vez, ser convertidos nos construtos tericos de sensibili-
dade, de critrio, de distribuio de varincia e de forma de distribuio, e
permitir o teste da teoria comparando-se os valores dos construtos predi-
tos na teoria com aqueles derivados dos dados empricos de proporo de
respostas.

Procedimento sim-no
O experimento organizado em tentativas de dois tipos. Em algu-
mas tentativas o sinal apresentado (mais rigorosamente, tentativas
contendo sinal e rudo) e em outras tentativas o sinal no apresentado
(mais rigorosamente, tentativas contendo apenas rudo). O observador
informado da matriz de pagamento (ou, em linguagem coloquial, do que tem
a ganhar e perder com acertos e erros, respectivamente). Sua tarefa sim-
plesmente julgar, atravs de uma resposta simples do tipo sim/no, se um
sinal est ou no presente na tentativa Em cada sesso experimental vigora
uma condio de matriz de pagamento e de probabilidade sinal/rudo.
Poder traar uma curva de isossensibilidade exige que o experimento
inclua vrias condies de probabilidade sinal/rudo, o que muitas vezes
no feito, pois isto exige vrias sesses experimentais e um nmero
muito grande de tentativas. Nestas circunstncias no existem condies
de se testar os pressupostos de distribuio normal e varincias iguais,
tendo-se que usar um tratamento estatstico que dispense a verificao
destes pressupostos.

Procedimento de escolha forada


Neste procedimento, o observador exposto a tentativas que con-
tm dois ou mais intervalos de observao e deve indicar qual deles
contm o sinal. Pressupe-se que, na ausncia de vis de resposta em
relao a um ou outro intervalo de observao, o observador escolha o
intervalo que contm o estmulo de maior magnitude. Na prtica, o planeja-
mento das tentativas deve incluir controles para impedir o desenvolvimento
de vieses de resposta, como, por exemplo, vis de posio ou de ordem.
A prpria proporo de respostas corretas considerada medida direta de
sensibilidade.

Procedimento de julgamento de confiana


Em cada tentativa o observador deve indicar quo seguro est da
presena do sinal, em uma escala de grau de confiana apresentada pelo
experimentador. Pressupe-se que o dado de estimativa medida de
critrio, o que representa uma economia em coleta de dados. Para fins de
anlise de dados, as respostas so desdobradas por valor de grau de
confiana, e com os dados de uma sesso experimental consegue-se
obter uma funo de isossensibilidade. Este procedimento considerado
vantajoso em relao aos dois anteriormente descritos, no s pela rapidez
como pela convenincia para testes de normalidade de distribuio e
igualdade de varincia.

PSICOFSICA ANIMAL

Estudos precursores em psicofisica animal apareceram em 1935,


quando a equipe de Culler e Brodgen desenvolveu um mtodo cuidadoso
e sensvel para obteno de limiares auditivos no cachorro, usando
esquiva. Ao se apontar um marco para o surgimento formal da psicofisica
animal, seria justo destacar um outro trabalho, pelo seu impacto na
comunidade cientfica uma publicao de Donald Blough, em 1958, na
qual ele prope um procedimento para a obteno de uma funo
psicofisica de adaptao visual no pombo. Na dcada de sessenta, vrios
laboratrios se dedicaram ao desenvolvimento de metodologias de
pesquisa apropriadas ao estudo das sensaes em vrias modalidades e
em vrias espcies animais. Estas mltiplas iniciativas foram consolidadas
no livro Animal Psychophysics, organizado por William C. Stebbins e
publicado em 1970. Outro trabalho importante de consolidao dos mto-
dos da psicofisica animal um texto de autoria do casal Donald e Patrcia
Blough, publicado em 1977.
No se pode dizer que a psicofisica animal tenha um referencial
terico prprio, embora ela possa causar um certo desconforto aos puristas
tericos, que vem a psicofisica como um empreendimento para destrin-
char questes referentes relao mente-corpo. Porm ela, clara e expli-
citamente, faz uso do conhecimento cientfico sobre o comportamento
animal desenvolvido tanto na perspectiva etologica quanto de anlise
experimental do comportamento. A psicofisica animal se prope a desen-
volver procedimentos especficos que permitam a utilizao de metodolo-
gias bsicas independentemente desenvolvidas, como as j descritas
neste captulo, quer para assegurar o estudo de determinadas espcies,
quer para permitir estudos comparativos entre espcies. As questes que
lhe interessam so as mesmas leis e princpios gerais anteriormente
descritos, as teorias, leis e princpios prprios dos diversos sistemas
sensoriais e a verificao do seu grau de generalidade no reino animal. A
seguir sero descritos, por categoria de problema, os procedimentos
recomendados para adaptar os mais variados mtodos psicofsicos ao
sujeito animal.

Aspectos motivacionais
A impossibilidade de usar instrues verbais, muito ao gosto dos
estudiosos da psicofisica humana, leva ao uso de regras de contingncia.
O estabelecimento destas regras no trivial. Tomemos, por exemplo, o
caso de especificao de limiar absoluto. Se razovel que uma resposta
de deteco na ausncia de estmulo seja considerada uma resposta
errada e, portanto, deva no ser reforada ou at mesmo punida, no
razovel planejar que a ausncia de resposta na presena de um estmulo
fraco seja considerada erro, pois uma incgnita a magnitude de estmulo
necessria para que ele seja estmulo efetivo. O uso de reforamento
positivo, ao mesmo tempo que eficaz em manter o animal engajado na
tarefa, impe limites ao nmero de tentativas contidas em uma sesso
experimental, em virtude de saciao do reforador, o que leva ao cuidado
de que o procedimento otimize a razo tentativas teis/tentativas totais.

Resposta de observao
A baixa varincia dos dados psicofsicos depende de que o animal
esteja atento ao estmulo sensorial e adequadamente posicionado, de
modo que o estmulo entre em contato com o rgo receptor de forma
especificvel e constante. Tipicamente uma tentativa iniciada com a
apresentao de um estmulo que sinaliza a ocasio para a emisso de
uma resposta de observao. Isto significa, por exemplo, no caso de
estmulos visuais, que o procedimento seja tal que o estmulo sensorial s
ser apresentado se o animal estiver com a cabea posicionada de uma
maneira determinada, para assegurar que os olhos estejam a uma
distncia e orientao especificadas em relao ao estmulo. Em um
procedimento tpico, a emisso de uma resposta de orientao condio
para que se inicie o intervalo que pode ou no conter o estmulo sensorial.
A correta emisso da resposta de observao reforada com um
estmulo arbitrrio que tambm exerce a funo de sinalizar o incio de um
intervalo de apresentao de estmulo. A topografia desta resposta
depende de variveis prprias do experimento, como a espcie animal, a
modalidade e a dimenso de estmulo em estudo.
Controle de estmulo da resposta de deteco
O procedimento precisa incluir salvaguardas para que no existam
outras variveis, alm do prprio estmulo sensorial em estudo, exercendo
o papel de sinalizadores para a ocorrncia da resposta de deteco. A
prpria existncia de uma sinalizao para a ocorrncia do estmulo sen-
sorial pode propiciar a ocorrncia de respostas indevidas de deteco. Um
animal pode estimar o intervalo de tempo entre eventos relevantes e con-
venientemente espaar suas respostas de forma a maximizar a obteno
de reforos. Embora esta afirmao costume soar como um exagero para
aqueles no familiarizados com o estudo de aprendizagem animal, ela est
fartamente documentada na literatura especializada. Salvaguardas tpicas
para impedir esta possvel estratgia de resposta so: tornar variveis o
tempo entre a emisso da resposta de observao e a apresentao do
estmulo sensorial e o tempo entre a resposta de deteco e o incio da
tentativa seguinte; punir respostas de observao e respostas de deteco
na ausncia de seus respectivos estmulos sinalizadores com um timeout,
punir respostas de deteco com tempo de reao inferior ao mnimo
necessrio, considerando o que se conhece sobre tempo mnimo de
resposta.
Os controles acima so necessrios, mas ainda no suficientes. Por
exemplo, um switch que aciona um tom pode conter transientes audveis,
fazendo com que a ocorrncia do estmulo seja detectvel independente-
mente de sua intensidade e, em conseqncia, o animal seja reforado
pela deteco desses transientes, o que pode levar o pesquisador a
concluir pela sua supersensibilidade. Uma forma de controlar isto
introduzir pseudotentativas nas quais tudo ocorre como em uma tentativa
regular, exceto que o estmulo apresentado em uma magnitude aberran-
temente distanciada da faixa de sensibilidade conhecida para a espcie.
O uso de pseudotentativas propicia uma forma de monitorar a qualidade
do desempenho do animal. A porcentagem de respostas a estas tentativas
pode ser usada para decidir sobre a confiabilidade dos dados. As res-
postas a pseudotentativas, dentro de um referencial de teoria de deteco
de sinal, podem ser um indicador de critrio de resposta. Assim, um animal
conservador ter uma baixa proporo de respostas a estas tentativas e
um limiar mais alto; um animal menos conservador ter uma proporo
mais alta de respostas a estas tentativas e um limiar mais baixo. Um
controle sobre este critrio de resposta pode ser tentado via manipulao
da especificao do timeout.

Tempo de reao e escalas psicofsicas


Embora na maioria das tarefas psicofsicas de deteco se solicite
ao observador uma resposta simples e arbitrria que registrada como
ocorrendo ou no dentro de um intervalo de tempo no qual a resposta
pode ser dada, possvel medir-se o intervalo entre o incio da apresen-
tao do estmulo e a ocorrncia da resposta de deteco do estmulo.
Este tempo de reao guarda uma relao inversa natural e ordenada com
magnitude de estmulo para todas as modalidades testadas, de forma tal
que pode ser usado para escalonar estmulos. Se o manipulandum e a
topografia da resposta reforada so cuidadosamente adaptados s
caractersticas da espcie em estudo, possvel obterem-se dados de
excelente qualidade. Tempo de reao um mtodo que nasceu fora da
psicofisica; sua inveno creditada a Franciscus Donders, em torno de
1865, interessado em calcular a velocidade de operaes mentais. O
mtodo foi incorporado ao laboratrio de Wundt e posteriormente aplicado
psicofisica, no com os objetivos originais, mas em funo desta sua
propriedade de relao natural com magnitude de estmulo. A proposio
deste uso para tempo de reao remonta a Cattell, em 1902, mas s a
partir da dcada de 60 tempo de reao comeou a ser usado de forma
sistemtica na psicofisica animal. Vide, por exemplo, a demonstrao de
seu uso para pesquisar tanto audio quanto viso em macacos, feita por
Stebbins e Miller (1964). Este mtodo vem sendo usado para descrever a
sensao de brilho e de sonoridade em vrias espcies, e os dados se
comportam de forma equivalente aos obtidos para observadores humanos,
no s em tarefas semelhantes de tempo de reao, mas comparando
dados humanos obtidos usando tempo de reao e estimativa de magni-
tude (Marshall, Brandt, 1980; Pfingst, Hienz, Kimm e Miller, 1975; Reason,
1968). O mtodo tem uma srie de variaes que no nos possvel deta-
lhar neste captulo. possivelmente o mtodo mais usado em psicofisica
animal para a pesquisa sobre escalas de sensao.
importante a apreciao de que as vrias adaptaes anterior-
mente descritas, alm de permitirem a transposio da barreira da
linguagem, asseguram a efetiva observncia das regras esperadas de
comportamento do observador humano explicitadas atravs de instruo
verbal. Com freqncia, os procedimentos de psicofisica animal podem,
com pequenas adaptaes, ser usados com seres humanos, permitindo a
validao do uso do comportamento animal como modelo do comporta-
mento humano. A combinao da psicofisica animal com eletrofisiologia
sensorial, belamente representada pelos trabalhos pioneiros de DeValois
e DeValois em viso, permitiram um avano significativo na psicobiologia
dos sistemas sensoriais. Fica aqui apenas o registro, pois este um outro
assunto que mereceria espao prprio para apresentao.

PSICOFSICA DA CRIANA

Sea dcada de 60 foi decisiva para o desenvolvimento de condies


para uma psicofisica animal, a dcada de 80 poderia ser apontada como
aquela em que se concentraram esforos para o desenvolvimento de uma
psicofisica da criana. Esta psicofisica tem que dar conta de algumas
caractersticas bsicas do comportamento do organismo em desenvolvi-
mento, como as limitaes no repertrio com portam ental disponvel e
alteraes neste repertrio em funo de maturao. Como exemplo da
primeira categoria temos a impossibilidade de utilizao de instrues e de
respostas verbais no infante, um problema que, na sua essncia, no
diferente daquele encontrado na psicofisica animal. Como exemplo da
segunda categoria temos o fato de que respostas que se mostram
adequadas numa faixa de idade deixam de ser utilizveis numa faixa
posterior, criando obstculos realizao de estudos longitudinais. No se
dispe ainda de uma slida metodologia psicofisica da criana, mas h
progressos importantes que justificam uma sistematizao.
A ordem em que os principais mtodos disponveis sero apresenta-
dos segue aproximadamente a ordem de idade aos quais tm se mostrado
mais adequados. Como ficar claro, eles so, antes de mais nada, proce-
dimentos que viabilizam a utilizao de algum dos mtodos psicofsicos
propriamente ditos, apresentados mais no incio deste captulo, em conjun-
o com algum sistema de resposta que se identifique como apropriado
para a idade e para o sistema sensorial especfico em estudo. Observe-se
o recurso sistemtico a um sistema de resposta que pode ser caracteriza-
do genericamente como resposta de observao ou de ateno. Nas
idades mais tenras predomina o uso de respostas gerais indiferenciadas,
e nas idades mais elevadas, o uso de respostas especficas.

Psicofisica do feto
A pesquisa sobre a ontogense das sensaes tem, obviamente, um
interesse especial na descrio de quando se inicia o responder a est-
mulos nas diferentes modalidades sensoriais. H vrias evidncias bem
estabelecidas de que as crianas j nascem com competncia para detec-
tar uma srie de estmulos ambientais. Vide, por exemplo, reviso de
Cowart (1981), na rea de sentidos qumicos, e de Reisman (1987), na rea
de somatossentidos. Assim sendo, o surgimento dessa competncia
precisa ser buscado no feto, um empreendimento problemtico pela
inacessibilidade relativa do observador psicofisico.
Observao extra-uterina do feto
Uma abordagem encontrada na literatura mais antiga o estudo de
fetos no-viveis e com poucas horas de vida aps o aborto. Estes
estudos, necessariamente muito primitivos, se concentraram na obser-
vao da presena ou no de reflexos (vide reviso de Reisman, 1987) e
mostraram respostas bastante precoces a estmulos tteis aplicados
face. Dadas as circunstncias de coleta de dados, a disponibilidade e
interpretao de dados so muito problemticas.
Observao intra-uterina do feto
Birnholtz e Bernacerraf (1983) mostraram que a ultra-sonografiafetal
permite a observao de atividade muscular fetal em resposta a sons
apresentados extra-uterinamente. Esta tcnica contm uma srie de
limitaes relacionadas a especificao de estmulo sensorial e a repertrio
comportamental disponvel. No presente momento permite informaes
apenas de natureza qualitativa, embora o carter no-invasivo e a disso-
ciao de condies patolgicas imprimam, em princpio, maior garantia de
validade dos dados obtidos. A tcnica promissora especialmente para o
estudo da modalidade auditiva, mas ainda no se transformou em uma
rotina de pesquisa. Na rea dos sentidos qumicos, uma possibilidade
sugerida em Cowart (1981) a observao de movimentos de deglutio
em resposta a alterao na composio do lquido amniotico, produzida
pela introduo de substncias qumicas na cavidade intra-uterina, atravs
de sonda.

Psicofisica do Infante
Procedimentos baseados em atividade geral fisiolgica e comportamental
Alteraes em medidas como padro do ciclo de sono, taxa de bati-
mento cardaco, padro de respirao, nvel de vrias substncias na cor-
rente sangnea tm sido usados para o estudo das sensaes, embora
sejam mais encontrados em estudos mais antigos. Schneider, Trehub e
Bull (1979) fizeram uma anlise comparando os resultados de experimen-
tos sobre limiar auditivo em recm-nascidos usando uma variedade de
respostas e encontraram grandes discrepncias nos dados, argumentando
pela sua baixa confiabilidade. Reisman (1987), fazendo uma reviso de
pesquisas sobre dor em bebs circuncidados, tambm encontrou dificul-
dades na interpretao dos dados com essa categoria de medida. Estudos
sensoriais baseados em atividade fisiolgica e comportamental gerais,
rigorosamente falando, nem se classificam como estudos psicofsicos; sua
incluso aqui , muito mais, uma chamada de ateno para a precariedade
metodolgica no estudo da ontogense das sensaes.
Procedimentos baseados em respostas especficas de orientao
A criana recm-nascida e at aproximadamente de quatro meses
de idade tem sido pesquisada com procedimentos principalmente basea-
dos em seu repertrio de reflexos incondicionados. A observao da
ocorrncia de respostas incondicionadas apresentao de estmulos
especficos permite afirmar que a criana detecta o estmulo, mas no tem
permitido fazer afirmaes confiveis a respeito de valores mnimos de
estmulo necessrios para que ocorra uma sensao. Estes reflexos
tambm esto sujeitos a habituao, ou seja, sua apresentao repetida
leva ao enfraquecimento e eventual desaparecimento da resposta, fazendo
com que um experimento tenha que se limitar a um pequeno nmero de
observaes. Esta limitao no facilmente contornada pela repetio do
experimento a intervalos considerveis na mesma criana, no s porque
o repertrio de respostas vai se alterando como porque os prprios
sistemas sensoriais esto em desenvolvimento. O experimentador costuma
ento recorrer anlise de dados de grupo, o que contrrio tradio
psicofisica de privilegiar delineamentos intra-sujeito e anlise de dados
individuais. Algumas destas respostas especficas vm sendo estudadas
sistematicamente, razo pela qual so identificadas a seguir.
Mtodo do olhar preferencial
Este mtodo, creditado a Fantz e Berlyne, que o desenvolveram
simultnea e independentemente, baseado na tendncia observada em
crianas pequenas de fixar o olhar em um estmulo visual com padro e de
no fixar o olhar em um estmulo liso, em uma situao de escolha. Tipica-
mente, so registrados dados referentes direo da primeira fixao,
nmero de fixaes e tempo de fixao em cada estmulo. Interpreta-se
que a criana detecta um padro visual se a ele corresponder maior
freqncia e durao de fixao do olhar. Do mtodo do olhar preferencial
surgiu uma variante, o mtodo do olhar preferencial de escolha forada,
atribudo a Teller. Neste segundo mtodo, um observador adulto colo-
cado em uma posio na qual pode observar os olhos da criana, mas no
os estmulos sendo apresentados. A tarefa do observador julgar a loca-
lizao do padro com base na observao do olhar da criana, sendo-lhe
permitido escolher o(s) aspecto(s) do olhar da criana que julgar mais
nformativo(s). Se o julgamento de localizao do observador for estatisti-
camente diferente de desempenho aleatrio, interpreta-se que a criana
detecta o padro (Banks, Dannemiller, 1987).
Habituao
Habituao mais do que um mtodo; um paradigma a partir do
qual uma srie de mtodos especficos emergiram, adaptados para moda-
lidades diferentes de estmulo. Baseia-se no fato de que, quando um
estmulo novo apresentado, o organismo emite uma resposta de orien-
tao. Com a manuteno do estmulo ou sua apresentao repetida a
curtos intervalos de tempo h um decrscimo e eventual desaparecimento
da resposta. Sendo o estmulo alterado (novo estmulo apresentado), a
resposta de orientao reaparece. Assim, por exemplo, estmulos visuais
novos geram uma explorao visual que tende a desaparecer com a
manuteno do estmulo, mas reaparece com a troca do estmulo por um
novo; estmulos auditivos geram uma resposta de virada de cabea em
direo ao som, a qual tende a desaparecer com manuteno do estmulo.
Este paradigma inclui tambm fenmenos em que a resposta de orienta-
o envolve a inibio de uma atividade em andamento. Por exemplo, a
resposta de suco interrompida com a apresentao de um som; a ini-
bico da suco habitua-se reinstalando-se a suco com a manuteno
do estmulo auditivo, mas a apresentao de estmulo auditivo diferente
reinstala a inibio. A interpretao costumeira dos dados que se ocorrer
desabituao, ento os estmulos envolvidos so discriminveis. O leitor
pode consultar Dodwell, Humphrey e Muir (1987) para exemplos detalha-
dos do uso do paradigma ao estudo da percepo visual de padres.
Varredura visual
O mtodo baseado no fato de que, quando as pessoas exploram
visualmente imagens, a varredura da imagem segue padres caractersti-
cos (Dodwell, Humphrey e Muir, 1987), e a anlise destes padres de
varredura deveriam informar sobre aspectos do estmulo visual aos quais
a pessoa responde. Dodwell e colaboradores alertam que a implementao
deste mtodo em crianas bastante complexa, do ponto de vista tcnico.
Bergamasco (1992) observa que, devido imaturidade de fotorreceptores
em uma faixa precoce de idade, a melhor imagem visual pode no corres-
ponder viso foveal, o que dificulta a interpretao do dado tipicamente
analisado com o uso deste mtodo. Feitas estas ressalvas, o mtodo til
para o estudo de percepo de forma e de padro.
Expresses faciais
Uma abordagem adicional tem sido a de caracterizar a relao entre
tipos de estmulo e tipos de topografia de resposta. Nesta abordagem,
quando aplicada ao estudo da gustao, o experimentador pretende carac-
terizar a relao entre topografias especficas de movimentos da face,
incluindo lbios e lngua, a concentraes e qualidades de substncias
qumicas aplicadas boca. Uma anlise num nvel ainda mais molecular
na rea de gustao envolve dissecar as caractersticas do comportamento
de ingesto de lquidos, identificando separadamente aspectos como
nmero de jorros de ingesto, durao dos jorros de ingesto, pausas
entre jorros, volume ingerido, etc. Uma preocupao central nestas
microanlises a viabilidade de dissociar aspectos estritamente sensoriais
de aspectos hednicos da resposta ao estmulo qumico (Crook, 1987).
Sugar de alta amplitude
Diferencia-se o uso de um procedimento baseado na resposta de
sugar, originalmente proposto para o estudo da viso e posteriormente
adaptado por Eimas e colaboradores (1971) para o estudo da audio. O
que se segue uma descrio baseada em Patricia Kuhl (1987) represen-
tativa do uso contemporneo deste procedimento, chamado de sugar de
alta amplitude. D-se criana uma chupeta que contm, internamente,
um transdutor de presso. Desta forma monitora-se a ocorrncia e a
magnitude da resposta de sugar. Respostas de sugar de magnitude acima
de um critrio so reforadas com a apresentao de um som. O som
mantido at que ocorra habituao da resposta, de acordo com um certo
critrio de reduo. Ocorrida a habituao, o som mudado. A mudana
no som gera desabituao da resposta. A desabituao interpretada
como indicador da discriminabilidade dos dois sons.
Kuhl aponta algumas limitaes deste mtodo: a) no separa
convincentemente variveis sensoriais de variveis de ateno e moti-
vao pelo estmulo; b) exige tratamento grupai de dados; c) crianas
acima de 4 meses no demonstram interesse pela tarefa, o que limita seu
uso para estudos longitudinais. No obstante, parece ser o mtodo
disponvel mais confivel e com resultados mais consistentes para o
estudo da audio de crianas at os 4 meses.

Psicofisica da criana de 4 a 18 meses


Virar a cabea reforado
Este mtodo, atribudo a Moore, Thompson e Thompson (1975),
diferenciou-se a partir do comportamento reflexo de orientao da cabea
em direo fonte de um som. A resposta de orientao visualmente
reforada. Resumidamente, se a criana mantiver sua cabea virada para
afrente, algum tempo depois apresentado um som; se a criana respon-
der com uma virada de cabea na direo do som, dentro de um critrio de
ngulo mnimo, ela visualmente reforada com a apresentao de
imagens visuais projetadas (por exemplo, trechos de desenhos animados)
ou a iluminao de um objeto interessante colocado nas imediaes da
fonte sonora. Este procedimento bsico vem sofrendo refinamentos e
adaptaes para a investigao de aspectos especficos da audio da
criana (vide, por exemplo, Kuhl, 1987; Sinnot, Aslin, 1985). Os aspectos
interessantes deste mtodo, segundo seus usurios, resumem-se no fato
de que os dados so consistentes e por ser ele melhor que o mtodo de
sugar de alta amplitude, por permitir anlise de dados individuais. Oferece
tambm limitaes: Kuhl relata dificuldade em manter crianas engajadas
na tarefa a partir de 12 meses de idade.

Psicofisica da criana acima de dois anos


Procedimentos de condicionamento operante
Os procedimentos desenvolvidos para a psicofisica animal tm
inspirado alguns autores no desenvolvimento de procedimentos que se
prestem a crianas na faixa de 2 a 5 anos, idade a partir da qual procedi-
mentos planejados para adultos comeam a ser utilizveis. Dobson (1990)
examinou alguns procedimentos desenvolvidos dentro desta perspectiva
para o estudo da viso. Os principais problemas especficos com os quais
o pesquisador tem que lidar so a escolha de uma resposta e de um
reforador adequados idade da criana e a escolha de um mtodo
psicofisico que atenda simultaneamente a critrios mais estritamente
psicofsicos de adequao ao problema em investigao e de estabilidade
no desempenho da criana, o que s vezes pode significar uma densidade
relativamente alta de reforo.
Equiparao intermodal
Este mtodo foi originalmente desenvolvido para adultos, porm
Stevens se preocupou em verificar a viabilidade de sua utilizao com
crianas e demonstrou que crianas de 5 anos, executando uma tarefa de
equiparao entre intensidade luminosa e intensidade acstica, tm desem-
penho comparvel ao de adultos na mesma tarefa. Esta demonstrao
importante porque o procedimento adequado para escalonamento, e os
procedimentos para tal com adultos tm se valido do repertrio de
numerosidade para julgamento de magnitude sensorial, repertrio este
ainda no bem estabelecido nesta faixa de idade.

Avaliao da confiabilidade dos dados


A descrio acima deixa claro que h problemas na interpretao de
dados psicofsicos obtidos da criana e, sobretudo, do infante. Banks e
Dannemiller (1987) propem quatro estratgias, as quais eles chamam de
tcnicas de verificao, para que se possa aumentar o grau de confiana
de que estimativas de limiares reflitam o comportamento de mecanismos
sensoriais e no de fatores no-sensoriais. Embora elas sejam apresen-
tadas pelos autores no contexto especfico de desenvolvimento visual,
claramente podem ser adaptadas para o estudo de outros tipos de sen-
sao e at mesmo para a pesquisa psicolgica em outras reas.
O uso de limiares como informao relativa
Banks e Dannemiller consideram a separao de variveis senso-
riais de no-sensoriais uma questo que tem que ser enfrentada se o
problema em investigao envolver uma comparao absoluta entre
crianas e adultos. A separao destas categorias de varivel torna-se
irrelevante se o problema em investigao envolver uma comparao em
termos relativos entre crianas e adultos, como, por exemplo, a sensibili-
dade intra-idade para diferentes valores ao longo de alguma dimenso de
estmulo. Neste segundo tipo de questo, variveis no-sensoriais podem
estar presentes mas elas so uma constante e pode-se obter fun-
es com forma surpreendentemente equivalente para diferentes idades,
a despeito de grandes diferenas nos valores absolutos.
Convergncia de estmulo
Banks e Dannemiller definem convergncia de estmulo como a habi-
lidade de um modelo de mecanismo sensorial em predizer limiares obtidos
para um tipo de estmulo a partir de limiares obtidos para outros tipos de
estmulos, quando a mesma medida de resposta usada com os dois tipos
de estmulo. Se as predies do modelo sensorial so acuradas, aumenta
a confiana de que os dados reflitam variveis sensoriais. Os autores
consideram mais difcil interpretar a ausncia de convergncia de estmulo,
j que ela pode ocorrer tanto em virtude da participao diferenciada de
fatores no-sensoriais na interao com um dos estmulos como em
virtude da escolha no apropriada de um modelo de mecanismo sensorial.
Convergncia de resposta
Banks e Dannemiller definem convergncia de resposta como a
habilidade de se obter estimativas semelhantes de limiar usando medidas
diferentes de resposta, quando os mesmos tipos de estmulo so usados
para medidas diferentes de resposta. A observao de convergncia de
resposta permite afirmar que ela reflete os mesmos mecanismos sensoriais
e, portanto, aumenta a confiabilidade dos dados de limiar. Esta estratgia
amplamente usada na comparao entre medidas comportamentais e
eletrofisiolgicas de limiar para as vrias modalidades sensoriais.
Bom desempenho em relao a algum desempenho ideal conhecido
Banks e Dannemiller propem que se compare o desempenho em-
prico da criana com o desempenho ideal terico derivado a partir do
conhecimento sobre o papel desempenhado por variveis sensorialmente
relevantes. Usando o exemplo dos prprios autores, seria possvel com-
parar o desempenho emprico em uma tarefa de limiar para grades com o
esperado a partir do que se sabe sobre as qualidades pticas e a
densidade de fotorreceptores. Embora os autores no explicitem, fica claro
que a potncia desta estratgia depende da disponibilidade de um bom
modelo, para se poder interpretar adequadamente eventuais resultados
negativos.

CONCLUSES

A psicofisica tem mantido os cientistas ocupados, embora as preo-


cupaes contemporneas no sejam as de seu fundador. Ela ocupa um
status cientfico diferenciado na Psicologia, por ser uma das poucas reas
nas quais h condies estabelecidas para quantificao. Do ponto de
vista conceptual, importante destacar a preocupao em relao a uma
lei psicofisica geral e com poder preditivo. Do ponto de vista metodol-
gico, observa-se um crescimento quanto s alternativas de tipos de obser-
vadores, humanos e no-humanos, a respeito dos quais pode-se obter
dados fidedignos, graas ao contnuo desenvolvimento de estratgias de
pesquisa. Fenmenos de sensao, percepo e cognio tm sido os
principais objetos especficos de estudo da psicofisica. Nessas reas
observa-se uma trajetria no sentido de se estudar um nmero cada vez
maior de categorias de fenmenos e fenmenos cada vez mais complexos.
REFERNCIAS BIBLIOGRFICAS

ADLER, H.E. Vicissitudes of Fechnerian psychophysics in America. In: RIEBER, R.W.,


SALZINGER, K. (Eds.). Psychology, theoretical-historical perspectives. New York: Aca-
demic Press, 1980. p.11-23.
BANKS, M.S., DANNEMILLER.J.L Infant visual psychophysics. In: SALAPATEK, P., COHEN,
L (Eds.). Handbook of infant perception. From sensation to perception. Orlando (FL):
Academic Press, 1987. v.1, p.115-184.
BERGAMASCO, N.H.P. Desenvolvimento de funes visuais bsicas desde o nascimento.
In: REUNIO ANUAL DA SOCIEDADE BRASILEIRA DE PSICOLOGIA. 22. Resumos de
comunicaes cientficas. Ribeiro Preto: Sociedade Brasileira de Psicologia, 1992. p.397.
BIRNHOLTZ, J.C., BERNACERRAF, B.R. The development of human fetal hearing. Science,
Washington. D.C., v.222, n.4623, p.516-518,1983.
BLOUGH, D.S. A method for obtaining psychophysical thresholds from the pigeon. Journal of
the Experimental Analysis of Behavior, Bloomington (IN), v.1, p.31-43, 1958.
BLOUGH. D.S.. BLOUGH, P. Animal psychophysics. In: HONIG, W.K., STADDON, J.E. (Eds.).
Handbook of operant behavior. Englewood Cliffs (NJ): Prentice-Hall, 1977. p.514-539.
BORING, E.G. A history of experimental psychology. 2.ed. Englewood Cliffs (NJ): Prentice-
Hall. 1957.
COREN. S., PORAC. C, WARD. LM. Sensation and perception. New York: Academic Press, 1979.
COWART, B.J. Development of taste perception in humans: sensitivity and preference throughout
the life span. Psychological Bulletin, Washington, DC. v.90. n.1. p.43-73, 1981.
CROOK, C. Taste and olfaction. In: SALAPATEK, P., COHEN. L. (Eds.). Handbook of infant
perception. Orlando (FL): Academic Press, 1987. v.1: From sensation to perception, p.237-
264.
DOBSON, V. Behavioral assessment of visual acuity in human infants. In: BERKLEY, M.A.,
STEBBINS. W.C. (Eds.). Comparative perception. New York: Wiley. 1990. v.1: Basic
mechanisms, p.487-521.
DODWELL. P.C.. HUMPHREY, GK. MUIR, D.W. Shape and pattern perception. In: SALAPATEK,
P., COHEN, L (Eds.). Handbook of infant perception. Orlando (FL): Academic Press, 1987. v.2:
From perception to cognition, p. 1-77.
EIMAS, P.D.. SIQUELAND, E.R., JUSCZYK. P., VIGORITO, J. Speech perception in infants.
Science, Washington, D.C., v.171, p.303-306,1971.
FALMAGNE, J. C. Elements of psychophysical theory. New York: Oxford University Press, 1985.
GESCHEIDER, G.A. Psychophysics: method and theory. New York: Wiley, 1976.
------------- . Psychophysical scaling. Annual Review of Psychology, v.39, p.169-200, 1988.
GREEN, D.M., SWETS, J.A. Signal detection theory and psychophysics. New York: Wiley,
1966.
KRUEGER. L.E. Reconciling Fechner and Stevens: towards a unified psychophysical law.
Behavioral and Brain Sciences, Cambridge, v.12. p.251-320. 1989.
KUHL, P.K. Perception of speech and sound in early infancy. In: SALAPATEK, P., COHEN,
L. (Eds.). Handbook of infant perception. Orlando (FL): Academic Press, 1987. v.2: From
perception to cognition, p.275-382.
LUCE, R.D. "On the possible psychophysical laws" revisited: remarks on cross-modal
matching. Psychological Review, Washington, D.C., v.97, p.66-77, 1990.
LUCE, R.D., KRUMHANSL.C.L Measurement scaling, and psychophysics. In: ATKINSON,
R., HERRNSTEIN, R., LINDZEY, G., LUCE, R.D. (Eds.). Stevens'handbook of experimen-
tal psychology. 2.ed. New York: Wiley, 1987. v.1: Perception and motivation, p.3-74.
MARSHALL, L, BRANDT, J.F. The relation between loudness and reaction time in normal
hearing listeners. Acta Oto-Laryngologica, Stockholm, v.90, p.244-249, 1980.
MOORE, J.M., THOMPSON, G., THOMPSON, M. Auditory localization of infants as a function
of reinforcement conditions. Journal of Speech and Hearing Disorders, Rockville (MD).
v.40, p.29-34, 1975.
PFINGST, B.E., HIENZ, R., KIMM, J., MILLER, J. Reaction time procedure for measurement
of hearing: suprathreshold functions. Journal of the Acoustical Society of America, v.57,
p.421-431, 1975.
REASON, J.T. Individual differences in auditory reaction time and loudness estimation. Per-
ceptual and Motor Skills, Missoula (MT), v.26, p. 1089-1090. 1968.
REISMAN, J.E. Touch, motion, and proprioception. In: SALAPATEK, P., COHEN, L (Eds.).
Handbook of infant perception. Orlando (FL): Academic Press, 1987. v. 1 : From sensation
to perception, p.265-303.
SCHNEIDER, B.A., TREHUB, S.E., BULL, D. The development of basic auditory processes
in infants. Canadian Journal of Psychology, Ottawa, v.33, p.306-319, 1979.
SINNOT, J.M., ASLIN, R.N. Frequency and intensity discrimination in human infants and
adults. Journal of the Acoustical Society of America, v.78, n.6, p.1986-1992,1985.
STEBBINS, W.C. (Ed.). Animal psychophysics. The design and conduct of sensory experi-
ments. New York: Appleton-Century-Crofts, 1970.
STEBBINS, W.C. Perception in animal behavior. In: BERKLEY. M.A., STEBBINS, W.C. (Eds.).
Comparative perception. New York: Wiley, 1990. v.1 : Basic mechanisms.
STEBBINS, W.C, MILLER, J. Reaction time as a function of stimulus intensity for the monkey.
Journal of the Experimental Analysis of Behavior, Bloomington (IN), v.7, p.309-312,1964.
STEVENS, S.S. Psychophysics: introduction to its perceptual, neural and social prospects.
New York: Wiley, 1975.
THOMPSON, R.F., ROBINSON, D.N. Physiological psychology. In: HEARST, E. (Ed.). The first
century of experimental psychology. Hillsdale (NJ): Lawrence Erlbaum, 1979. p.407-454.
CAPTULO 3

MEDIDA PSICOMETRIA

Luiz Pasquali
Instituto de Psicologia
Universidade de Braslia

H
cerca de 20 anos, Guttman (1971) ainda se interrogava o que
exatamente significava "medida" em cincias sociais e do com-
portamento. Embora, nestas cincias, aparecessem correntes os
termos sociometra, antropometria, biometria, psicometria, econometria e
outras 'metrias', continuavam dvidas sobre sua significao no campo
da epistemologia e da metodologia. Os vrios prefixos das "...metrias"
evidentemente revelavam a rea de contedo em que a medida era
aplicada. Assim, psicometria seria o uso da medida em Psicologia.

Esta situao levantada por Guttman no est de todo resolvida


ainda hoje. De fato, a teoria da medida em cincias no constitui campo
pacfico entre os pesquisadores, sobretudo em cincias do comporta-
mento. Outro complicador, neste contexto, a tendncia de alguns em
reduzir, por exemplo, psicometria, cuja preocupao central a cons-
truo e verificao de hipteses cientficas, psicoestatstica, cuja
preocupao a inferncia a partir de amostras. Alis, este tipo de
divergncia foi o que provocou, em anlise fatorial, a diviso do grupo de
Thurstone dos anos 30 em vrias correntes, cada qual seguindo seus
interesses pessoais de psicometristas, de estatsticos ou de matemticos,
inclusive com a criao de revistas especializadas divergentes da
Psychometrika.

Este captulo pretende caracterizar a psicometria dentro de uma


orientao epistemolgica quantitativista, mas como ramo das cincias
empricas e no das matemticas. Estas duas no so conflituosas, mas
so epistemolgicamente independentes. A distino precisa ser
defendida e que seja tambm cobrado o nus da prova para a justi-
ficativa da viabilidade da associao das duas, isto , Cincia, de um
lado, e Matemtica, do outro (vide cap. 1). Este captulo se divide em
duas partes: a teoria psicomtrica e os parmetros psicomtricos da
medida.
TEORIA DA MEDIDA PSICOMETRIA

Em seu sentido etimolgico, psicometria seria, conforme insinuou


Guttman (1971), toda a classe de medida em Psicologia, similarmente a
sociometra ser na Sociologia, econometria na Economia, etc. Em seu
sentido mais restrito e neste que ela normalmente entendida ,
psicometria constitui uma das vrias formas de medio em Psicologia. Ela
uma das formas de medida por teoria (vide cap. 1), onde se situam
igualmente a teoria dos jogos e da deteco do sinal.
A teoria que fundamenta a psicometria neste sentido estrito, alm de
assumir os postulados da teoria da medida em geral, trabalha com o
modelo da estrutura latente (traos psicolgicos, latent modeling). Neste
contexto, alguns conceitos-chave precisam ser explicitados: trao latente,
sistema, propriedade, magnitude, bem como a representao comporta-
mental da estrutura latente.

Trao latente
O conceito de trao latente no isento de ambigidades e
controvrsias entre os autores que trabalham com tal construto. A
variedade de expresses utilizadas para represent-lo j indica tal
dificuldade. Trao latente vem referido sob denominaes como: varivel
hipottica, varivel fonte, fator, construto, conceito, estrutura psquica, trao
cognitivo, processo cognitivo, processo mental, estrutura mental, habilida-
de, aptido, trao de personalidade, processo elementar de informao,
componente cognitivo, tendncia e outros. A prpria natureza ontolgica
de trao latente deixa dvidas se ele concebido como um rtulo,
representando uma sntese hipottica de um conjunto de comportamentos
reais, ou como uma realidade mental. Para este autor, o conceito faz mais
sentido quando entendido como realidade na concepo popperiana de
que real aquilo que age sobre coisas consideradas reais, como as coisas
fsicas materiais: "Deve-se ento admitir que as entidades reais podem ser
concretas ou abstratas em vrios graus. Em Fsica, aceitamos foras e
campos de fora como reais, pois agem sobre coisas materiais. Mas essas
entidades so mais abstratas e, talvez, tambm mais conjeturis ou
hipotticas do que so as coisas materiais comuns. Foras e campos de
fora so ligados a coisas materiais, a tomos e a partculas. Tm um
carter dispositivo: so tendncias para interagir. Podem assim ser
descritas como entidades tericas altamente abstratas, ns as aceitamos
como reais, quer elas ajam de forma direta ou indireta sobre as coisas
materiais." (Popper, Eccles, 1977, p.27-28).
Alm desta controvrsia, existem diferentes maneiras de conceber
trao latente quando se trata de definir sua estrutura elementar. Na
verdade, h aqui duas tendncias distintas e em vrios nveis: concepo
elementarista (reducionista) e concepo estrutural, conforme detalhado
na Figura 3-1.
Fig. 3-1 Vises elementarista e estrutural de trao latente.

H os que entendem trao latente como uma estrutura global, seja


constituindo toda a psique do ser humano ou conjuntos dela. No caso das
aptides humanas, por exemplo, Spearman (1904) defende a teoria do fator
intelectual nico (fator G); Piaget (1952) fala do desenvolvimento das
estruturas cognitivas. Na rea da emoo e da motivao aparecem as
tipologias de tipo Jung (1921), Kretschmer (1925) e Sheldon (1940, 1942).
Estas concepes apresentam uma tendncia de considerar os traos
latentes como grandes estruturas que variam de sujeito para sujeito.
Dentro ainda de uma concepo estrutural, outros autores concebem os
traos latentes de uma forma mais diferenciada, quando falam de fatores.
a tradio na orientao da anlise fatorial em psicometria, onde os
fatores so concebidos como variveis-fonte responsveis pela qualidade
da execuo das tarefas comportamentais. Embora paream j elementa-
res, os fatores apresentam ainda um carter globalizante, dado que no
expressam processos cognitivos elementares, mas sim um possvel
conjunto destes que so necessrios para a execuo de uma tarefa
concreta. Pelo menos, esta a crtica que Sternberg (1977) faz desta
concepo fatorista do trao latente. Sternberg, na verdade, concebe trao
latente como algo elementar, isto , o ltimo elemento cognitivo a que se
pode reduzir uma atividade cognitiva, os processos cognitivos (o autor
trabalha na rea das aptides). A teoria do processamento da informao
(Newell, Simon, 1972) leva ainda mais longe este elementarismo, defen-
dendo o conceito de elementary information process (eip) como sendo o
processo mais elementar possvel no processamento da informao, o qual
no pode ser analisado em elementos menores.
Para ilustrar, talvez de forma grosseira, estas vrias concepes, no
caso dos processos cognitivos ou das habilidades e aptides, podemos
considerar a Tabela 3-1, na pgina seguinte.
Assim, as concepes de trao latente dependem do nvel de
especificidade que se quer dar a este construto ou parmetro. Os fatoristas
esto mais interessados em chamar de trao latente aquele conjunto de
processos cognitivos necessrios para a execuo de uma tarefa (de fato,
Tabela 3-1 Enfoques conceituais de processo cognitivo
ENFOQUE TRAO LATENTE ILUSTRATIVA
REFERNCIA
Processamento da elementary information elemento atmico da Newel & Simon, 1972
informao process eip Fsica Nuclear

Psicologia Cognitiva componente cognitivo elemento da tabela Sternberg. 1977


peridica de Qumica

Psicometria fator elemento natural Fatoristas (Thurstone


(Geologia. Geografia. Cattell. Guilford ...)

um barramento correlacionado de processos), falando de habilidades primrias,


que seriam combinaes de processos cognitivos elementares, isto , de
representaes mentais de objetos e smbolos. O fator seria um sistema de
processos cognitivos ou de componentes cognitivos. Ao contrrio, Sternberg
chama de processo cognitivo estas mesmas representaes mentais individuais,
que sero os componentes cognitivos. Agora, para representar mentalmente
objetos e smbolos, uma srie de processos mais elementares ainda so
necessrios e, ento, estes sim, seriam finalmente os processos elementares
bsicos do processamento da informao para Newell e Simon, elementos que
se combinam num sistema de processos da informao para a explicao de
uma tarefa comportamental. Onde parar nesta tendncia reducionista?
Sternberg (1977, p.65-66) afirma: "o componente no necessariamente, e
normalmente no o , a unidade mais elementar de comportamento que se
possa estudar. Operaes que so consideradas sem importncia dentro da
teoria so especificadas no modelo do processamento da informao do
desempenho de uma tarefa, mas no sero identificadas como componentes
separados. A razo para esta seletividade que tarefas complexas podem
requerer centenas ou at milhares de operaes, a maioria das quais se
apresentam desinteressantes do ponto de vista da teoria".
Alm da diferena no nvel de reducionismo, outra vertente importante de
diferenas entre estes vrios sistemas de conceber o trao latente consiste na
viso mais estruturalista das concepes holsticas, que tendem a considerar os
traos latentes como entidades; as concepes mais elementaristas tendem a
considerar trao latente como processos. Assim, Newell e Simon consideram
como "eips" a discriminao, a testagem e a comparao, a criao de
smbolos, a criao de estruturas de smbolos, produo de respostas externas
em funo de estruturas simblicas internas, designao de estruturas
simblicas e memorizao de estruturas simblicas. Por sua vez, Sternberg fala
de processos de codificar, inferir, mapear, aplicar, justificar e responder. As
diferenas
individuais que ocorrem nestes processos seriam devidas dificuldade e
durao que diferentes sujeitos encontram ou necessitam para eliciar estes
processos, enquanto para os fatoristas, por exemplo, as diferenas
surgiriam principalmente em funo da magnitude (tamanho, dimenso,
quantidade) do trao latente possudo por diferentes sujeitos. A psicometria
trabalha com o conceito fatorista de trao latente.

Sistema
O sistema representa o objeto de interesse, chamado tambm de
objeto psicolgico. A psicometria enfoca como seu objeto especfico as
estruturas latentes, os traos psicolgicos; ela teoriza a partir destas
estruturas hipotticas. Deste enfoque, evidentemente, surgem dificuldades,
dado que a cincia emprica, dentro da qual a Psicologia se define, tem
como objeto de conhecimento os fenmenos naturais abordados atravs
da observao, que, no caso da Psicologia, o comportamento. Este
problema ser abordado na seo da representao comportamental da
estrutura latente. Aqui relevante salientar que a psicometria trabalha com
a teoria dos traos latentes, sendo, portanto, as estruturas psicolgicas
latentes o seu objeto ou sistema direto de interesse. O sistema pode ser
considerado de vrios nveis, dependendo do interesse do pesquisador.
Poder-se-ia falar de um sistema universal e de sistemas locais. O
universal sendo a estrutura psicolgica total do ser humano, e os sistemas
locais, os vrios subsistemas de interesse. Assim, a inteligncia pode ser
considerada um subsistema dos processos cognitivos, e estes, da estrutura
latente geral; ou mesmo, a inteligncia, digamos, verbal, pode ser conside-
rada um sistema quando ela for o interesse imediato e na qual vrios
aspectos podem ser considerados, como a compreenso verbal e a
fluencia verbal. Sistema, portanto, constitui-se como tal quando representa
o objeto imediato de interesse dentro de um delineamento de estudo e no
uma entidade ontolgica, monoltica e unvoca.

Propriedade
Um sistema apresenta atributos que so os vrios aspectos ou as
propriedades que o caracterizam. Por exemplo, o sistema fsico se
apresenta com os atributos de massa, comprimento, etc. Similarmente, a
psicometria concebe os seus sistemas como possuidores de proprieda-
des/atributos que definem os mesmos, sendo estes atributos o foco
imediato de observao/medida. Assim, a estrutura psicolgica apresenta
atributos do tipo processos cognitivos, processos emotivos, processos
motores, etc. A inteligncia, como subsistema, pode apresentar atributos
de tipo raciocnio verbal, raciocnio numrico, etc. O sistema se constitui
como objeto hipottico que abordado (conhecido) atravs da pesquisa
de seus atributos.
Magnitude
A psicometria assume, ainda, que estes atributos psicolgicos
apresentam magnitude: os atributos so dimenses, isto , so mensur-
veis. Trata-se do conceito de quantidade: os atributos ocorrem com quan-
tidades definidas e diferentes de indivduo para indivduo. Quantidade um
conceito matemtico que se define em funo dos axiomas de ordem e de
aditividade dos nmeros: os nmeros no somente so diferentes, mas
uns so maiores que outros, de sorte que eles podem ser ordenados numa
srie monotnica crescente de magnitude. Ao se falar de magnitude dos
atributos empricos, quer se referir, pelo menos, a esta propriedade num-
rica de ordem crescente. Digo pelo menos, porque nem sempre possvel
salvar na medida o axioma da aditividade que implica a possibilidade de
concatenao, resultando em medida de nvel intervalar ou de razo. Alis,
esta suposio de magnitude das propriedades psicolgicas que torna
interessante a utilizao do modelo matemtico no estudo dos fenmenos
de que trata a Psicologia.

O problema da representao comportamental


Mesmo se admitindo que as estruturas latentes tenham atributos e
que estes possuam magnitude, fica o problema fundamental de que estes
atributos so impervios observao emprica, que o mtodo da Cincia.
Ento, como fica a utilidade de todo este teorizar? Estamos aqui nos
defrontando com o problema da representao: qual a maneira ade-
quada de se representar estes atributos latentes para que possam ser
cientificamente abordados? Embora o problema parea, e na verdade,
grave, ele no especfico da psicometria; eie ocorre na prpria Fsica,
com a teoria quntica, por exemplo.
Como o comportamento (verbal, motor) o nico nvel em que se
pode trabalhar cientificamente (empiricamente) em Psicologia, neste
nvel que se deve procurar a soluo para o problema da representao
e, portanto, do conhecimento dos processos latentes. Est ali tambm o
problema bsico da psicometria a legitimidade de suas operaes
depende da legitimidade desta representao. A teoria que fundamenta o
isomorfismo comportamento-processos latentes o fulcro epistemolgico
da psicometria, juntamente com a concepo de processos latentes como
dimenses, isto , atributos mensurveis. Postula-se que, ao se operar
sobre o sistema comportamento, est-se operando sobre os traos
latentes (isomorficamente). Assim, a medida que se faz em nvel compor-
tamental a medida dos traos latentes.
Como o comportamento representa estes traos latentes? o
problema das definies operacionais. A psicometria responde a esta
questo pela anlise de uma srie de parmetros que os comportamentos
(tipicamente chamados de itens) devem apresentar. Tais parmetros so
mencionados a seguir:
Modalidade
Em termos de seu contedo, os comportamentos (itens) podem ser
de tipo verbal ou motor. Dentro destes, podem-se distinguir outros. No
caso do verbal, por exemplo, o item pode ser verbal propriamente, nu-
mrico, espacial, abstrato, etc, dependendo do contedo semntico sobre
o qual o comportamento opera ser de palavras, nmeros, dimenses
espaciais, etc. Pode ser tambm mais ou menos abstrato, dependendo do
nvel de universalidade dos conceitos envolvidos: conceitos singulares,
universais de menor abstrao, universais de maior abstrao. Neste
particular, a psicometria deveria interagir com a psicolinguistica, j que
apresenta interface com a questo do significado.
Saturao
O comportamento humano tipicamente se apresenta como multimo-
tivado, dado que fatores mltiplos entram na sua apario, sendo, portanto,
difcil, seno impossvel, determinar causas ou fatores nicos para
qualquer comportamento, ao menos de adultos. Isto implica que seria
impossvel definir comportamentos (itens) crticos para qualquer trao
latente, no sentido de um comportamento 'x' ser especfico e nico de tal
trao e no tendo interface com qualquer outro trao. Podemos dizer,
ento, que somente parte do comportamento 'x' representa o trao, ele
covaria com o trao; mas esta covariao no constitui toda a varincia do
'x'. , por isso, importante descobrir o nvel desta covariancia 'x' e trao
latente em questo. Tipicamente tal covariancia se expressa estatistica-
mente atravs da sua carga ou saturao fatorial, que pode variar de zero
a um (positivo ou negativo), sendo que, no caso de ser zero, o comporta-
mento seria uma representao equivocada, inadequada, do trao. Este
parmetro se relaciona questo da unidimensionalidade das escalas de
medida.
Dificuldade (complexidade)
Um comportamento mais dificil ou mais complexo medida que
ele exige maior nvel de magnitude do trao em questo para ser eficaz ou
corretamente executado. A expresso 'dificuldade' se originou dentro da
medida das aptides e mantida, por exemplo, no parmetro 'b' da Item
Response Theory (IRT), mesmo quando se trata da medida de atitudes ou
traos de personalidade em geral. Talvez a denominao 'complexidade'
fosse mais adequada para representar este parmetro, de uma vez que ela
especifica que um comportamento mais complexo e, portanto, mais
difcil, porque a sua correta execuo (no caso de se tratar de aptido
cognitiva) ou a adeso a seu contedo semntico (no caso de traos de
personalidade e atitudes) depende de um maior nvel de magnitude no
trao latente. O que exatamente torna um item mais complexo ainda
tema de pesquisa, do qual a Psicologia Cognitiva vem se interessando
bastante como forma de estudar os processos cognitivos. A psicometria
avalia este parmetro atravs de tcnicas puramente estatsticas, mas
seria de enorme valor a descoberta dos elementos que constituem maior
complexidade no item, sobretudo para fins de construo do prprio elenco
de itens da medida dos traos latentes. Este parmetro afeta a questo da
amplitude de uma escala de medida: o elenco de itens cobre adequada-
mente toda a extenso de magnitudes possveis de um dado trao ou
somente um segmento delas e qual segmento?
Discriminao
O poder discriminativo de um item (comportamento) se define
como a capacidade que ele apresenta de separar (discriminar) sujeitos
com magnitudes prximas do mesmo trao. Quanto mais extremas
devam ser as magnitudes do atributo para que o item possa discrimin-
las, menos discriminativo ele e vice-versa. A IRT define como 'a' este
parmetro. Que caracterstica do item determinaria seu poder
discriminativo? Novamente a Psicologia Cognitiva poderia lanar luzes
nesta questo, definindo os elementos cognitivos que a reao a um
item utiliza. Seria a univocidade semntica do item, isto , um sentido
bem definido com nvel reduzido de rudo, a saber, conceitos despoja-
dos de conotaes? Uma informao desta natureza auxiliaria grande-
mente a construo de itens comportamentais mais tpicos e adequados
para a medida dos traos.
Vis de resposta
Mesmo apresentando bons ndices nos parmetros acima descritos,
h toda uma srie de dificuldades que aparecem afetando a qualidade da
resposta do sujeito aos itens, dificuldades estas que provm de fatores
subjetivos do respondente e que poderiam ser agrupadas dentro do
conceito de tendncias. Tendncia seria uma atitude, consciente ou no,
de o sujeito responder de maneiras sistemticas alheias ao contedo
semntico dos itens erros de resposta ao responder ao acaso,
respostas estereotipadas (sempre nos extremos de uma escala ou no
ponto neutro), respostas em funo de supostas expectativas dos outros
(desejabilidade social) ou em funo de uma idia preconcebida sobre o
objeto de avaliao (efeito de halo), etc. Vrios destes problemas podem
ser parcialmente evitados, se se puder desvendar os fatores sistemticos
responsveis pelas respostas estereotipadas. Assim, a IRT capaz de
contornar o problema das respostas dadas ao acaso (parmetro 'c'); o
formato das escalas de resposta pode reduzir a ocorrncia de erros do tipo
respostas extremadas ou neutras, etc.
PARMETROS PSICOMTRICAS DA MEDIDA

O parmetro fundamental da medida psicomtrica (escalas, testes...)


a demonstrao da conformidade da representao, isto , a demons-
trao do isomorfismo entre a ordenao nos procedimentos empricos e
a ordenao nos procedimentos tericos do trao latente. Significa de-
monstrar que a operacionalizao do atributo latente em comportamentos
(tens) de fato corresponde a este atributo. Esta demonstrao tipica-
mente tentada atravs de anlises estatsticas dos tens individualmente
e da escala em seu todo. Infelizmente a literatura, neste particular, no
mostra muita preocupao com a formulao de uma teoria clara, muito
menos axiomatizada, sobre o atributo que permitisse uma elaborao mais
bem delineada e planejada de uma escala de comportamentos pertinentes
ao atributo. Possivelmente esta situao se deve 1) predominncia de
um enfoque positivista baseado quase exclusivamente na anlise de um
elenco de tens, coletado mais ou menos ao acaso ou intuitivamente, em
vez de uma pesquisa dos elementos cognitivos envolvidos nos processos
do atributo psicolgico e, tambm, 2) ao fato de que o desenvolvimento da
psicometria tem sido preponderantemente viabilizado por pesquisadores
cuja formao e preocupaes eram mais de estatsticos do que de
psiclogos. O desenvolvimento da pesquisa da Psicologia Cognitiva,
particularmente do tipo Sternberg (1977, 1979,1980) e das pesquisas feitas
no centro de Pittsburgh (Mulholland, Pellegrino, Glaser, 1980; Pellegrino,
Mumaw, Shute, 1985; Carpenter, Just, Shell, 1990), dever auxiliar
substancialmente para remediar ou resolver este problema. Os trabalhos
de Guilford (1959) tambm devem ser mencionados neste particular. No
momento, em psicometria, se insiste ainda de maneira exclusiva numa
soluo estatstica. Por outro lado, as contribuies que a Psicologia
Cognitiva tem, no momento, a dar nesta rea da instrumentao psicom-
trica so ainda muito precrias para servir de base na elaborao e anlise
dos instrumentos psicolgicos.
De qualquer forma, a comunidade cientfica desenvolveu uma srie
de parmetros mnimos que a medida psicomtrica deve apresentar para
se constituir instrumento legtimo e vlido. Os parmetros mais bsicos se
referem anlise dos itens (dificuldade e discriminao) e validade e
confiabilidade do instrumento.

Anlise dos itens


H dois tipos de anlise de itens, que poderamos chamar de anlise
terica e anlise emprica ou estatstica.
Anlise terica dos itens
Esta anlise feita por juizes e visa estabelecer a compreenso dos
itens (anlise semntica) e a pertinncia dos mesmos ao atributo que
pretendem medir. Esta ltima , s vzes, chamada de anlise de con-
tedo, mas propriamente deve ser chamada de anlise de construto, dado
que precisamente procura verificar a adequao da representao
comportamental do(s) atributo(s) latente(s).
No caso da anlise semntica, duas preocupaes so relevantes:
primeiro, verificar se os itens so inteligveis para o estrato mais baixo (de
habilidade) da populao-meta e, por isso, a amostra para esta anlise
deve ser feita com este estrato; segundo, para evitar deselegncia na
formulao dos itens, a anlise semntica dever ser feita tambm com
uma amostra mais sofisticada (de maior habilidade) da populao-meta
(para garantir a chamada Validade aparente' do teste). De qualquer forma,
a dificuldade na compreenso dos itens no deve se constituir fator
complicador na resposta dos indivduos, dado que no se quer medir a
compreenso deles (a no ser, obviamente, que o teste queira medir
precisamente isto), mas sim a magnitude do atributo a que os itens se
referem.
Na anlise de contedo, os juizes devem ser peritos na rea do
construto, pois sua tarefa consiste em ajuizar se os itens esto se referindo
ou no ao trao em questo. Uma tabela de dupla entrada, com os itens
arrolados na margem esquerda e os traos no cabealho, serve para
coletar esta informao. Uma concordncia de, pelo menos, X0% entre os
juizes pode servir de critrio de deciso sobre a pertinncia do item ao
trao a que teoricamente se refere.
Anlise emprica dos itens
A anlise da dificuldade e da discriminao dos itens se faz em cima
dos dados coletados de uma amostra de sujeitos, utilizando-se de anlises
estatsticas.
1) Dificuldade dos itens
A dificuldade do item definida em termos da porcentagem
(proporo) de sujeitos que do respostas corretas (testes de aptido) ou
de acordo/preferncia (testes de personalidade) ao item. Assim, sobre um
item que respondido corretamente ou aceito por 70% dos sujeitos
afirmado ser ele mais fcil que um outro que recebeu 30% de respostas
corretas.
Qual a dificuldade ideal dos itens de uma escala ou teste? A
resposta depende da finalidade do teste. Se se deseja um teste para
selecionar os melhores ou para determinar se um patamar 'x' de conheci-
mento foi atingido (como nos testes de referncia a critrio), ento os itens
devem todos apresentar o nvel de dificuldade do patamar que se quer
como critrio de seleo. Assim, se se deseja selecionar somente os 30%
melhores candidatos, os ndices de dificuldade dos itens devem ser em
torno de 30%. Se, entretanto, o interesse consiste em avaliar a magnitude
diferencial dos traos nos sujeitos, como geralmente o caso, ento uma
distribuio mais equilibrada dos itens em termos de dificuldade requerida.
Neste caso, o interesse se centra sobre o poder de um teste discriminar
diferentes nveis de habilidades, atitudes, etc, nos sujeitos e, por conseguinte,
os itens devem poder avaliar tanto os que possuem pouca quanto muita
habilidade. Entretanto, bom saber que itens que todos os sujeitos acertam ou
igualmente aceitam e itens que ningum acerta ou aceita so tens inteis para
fins de diferenciar indivduos; de fato, tais itens no trazem nenhuma
informao. Os itens que trazem maior informao so aqueles cujo ndice de
dificuldade se situa em torno de 0%, pois, neste caso, 50% dos sujeitos
acertam e 50% erram, resultando 50 x 50 = 2.5(X) comparaes possveis, ao
passo que um item com dificuldade 30% teria 70% de erros e 30% de acertos,
resultando num nvel de 30 x 70 = 2.100 bits de informao. Obviamente, um
item com dificuldade 100% ou 0% produzir zero informao. Deve-se concluir
da que todos os itens de um teste devam ter dificuldade 50%? Embora a
maioria dos itens devam apresentar tal ndice de dificuldade, nem todos o
devero, pois que assim poder-se-ia discriminar apenas dois niveis da
magnitude do trao medido, dado que itens com o mesmo nvel de dificuldade
tero altas intercorrelaes, determinadas pela circunstncia de que sero os
mesmos sujeitos que sempre acertam ou sempre erram os itens todos. Haveria,
ento, uma distribuio mais adequada dos itens de um teste em termos de
dificuldade? Considerando que eles devem cobrir toda a extenso de magnitude
do trao e que os itens de dificuldade 50% so os que produzem maior
informao, pode-se sugerir que uma distribuio dos mesmos mais ou menos
dentro de uma curva normal seria o ideal. Assim, se considerarmos a amplitude
de um atributo ou trao numa escala de 100 pontos, podemos dividi-la em cinco
nveis de magnitudes: 0 a 20, 20 a 40, 40 a 60, 60 a80 e 80 a 100, distribuindo
os itens assim: 10% deles em cada uma das duas faixas extremas, 20% em
cada uma das duas faixas seguintes e 40% na faixa mdia (vide Figura 3-2).

% DE ACERTOS FAIXA NMERO DE ITENS

80 a 100 V 10%
60 a 80 IV 20%
40 a 60 III 40%
20 a 40 II 20%
0 a 20 I 10%

Fig. 3-2 Distribuio ideal dos itens por ndice de dificuldade.


2) Discriminao dos itens
Discriminao se refere ao poder de um item em diferenciar sujeitos com
magnitudes diferentes de trao do qual o item constitui a representao
comportamental. Quanto mais prximas forem as magnitudes do trao que o
item puder diferenciar, mais discriminativo eie . Assim, Poder-se-ia dizer que
discriminao se refere ao poder que o item possui de diferenciar sujeitos com
magnitudes prximas do trao a que se refere.
a) Grupos-critrio
A dificuldade envolvida na tarefa de avaliar o poder discriminativo dos
itens consiste na escolha dos sujeitos que serviro de base como grupos-critrio
que o item deve diferenciar. A escolha dos critrios para efetuar a anlise da
discriminao dos itens tem dependido, na prtica, dos objetivos do teste. Assim
existem critrios externos e critrios internos ao prprio teste cujos itens se quer
analisar. Critrios externos para estabelecer os grupos-critrio podem ser, por
exemplo, sujeitos psiquitricos e sujeitos no-psiquitricos para avaliar o poder
de discriminao dos itens em testes psiquitricos, ou sujeitos que tiveram xito
e sujeitos que fracassaram num curso de treinamento, ou, ainda, tipos de
ocupaes, etc. Enfim, trata-se de estabelecer grupos que se diferenciam em
algum comportamento definido como relevante com referncia aos objetivos do
teste e verificar se os itens do teste so capazes de, individualmente, diferenci-
los.
Utilizam-se tambm critrios internos ao prprio teste para definir estes
grupos-critrio. Tipicamente escolhido o escore total no prprio teste para
determinar os grupos extremos de sujeitos: grupo superior e grupo inferior. Em
amostras grandes, selecionam-se os 27% superiores e os 27% inferiores para
comporem os dois grupos (Kelley, 1939). Evidentemente, em amostras
menores, este percentual dever ser maior, visto que os grupos de comparao
devem apresentar um nmero suficiente de sujeitos para permitir anlises
estatsticas vlidas. De modo geral, algo em torno de 30% ser adequado;
contudo, em amostras normais e grandes costumeiro se utilizar a "regra 27%",
como ficou sendo conhecida.
b) ndices de discriminao
Existem dezenas de tcnicas estatsticas para estabelecer o ndice de
discriminao do item (Anastasi, 1988), os quais produzem basicamente
resultados similares (Oosterhof, 1976). Os mais utilizados so a anlise da
diferena de mdias ou de percentagens dos sujeitos que passaram (testes de
aptido, onde h respostas certas e erradas) ou aceitaram (testes de
personalidade, atitude) o item no grupo superior vis--vis o grupo inferior, bem
como coeficientes de correlao, especialmente o coeficiente phi(ty) e a
correlao bisserial.
O ndice D
um dos mais fceis para ser computado, porque consiste simples-
mente na diferena de porcentagens de acertos no grupo superior e no
grupo inferior, isto , S - I ou, em ingls, U - L (ULI ou ULD). Veja exemplo
na Tabela 3-2.

Tabela 3-2 Computao do ndice D


Item % dos que passaram ndice D
Grupo superior Grupo inferior
1 80 40 40
2 100 90 10
3 30 50 -20
4 55 55 0
5 75 40 35

O ndice D tem que ser positivo, e quanto maior for, mais discrimi-
nativo ser o item. Obviamente, um D nulo ou negativo demonstra ser o
item no-discriminativo.
O teste "t"
Um ndice de discriminao mais exato, embora mais laborioso de
se conseguir, consiste na anlise da diferena entre as mdias obtidas
pelos grupos superior e inferior. Neste caso, necessrio o clculo das
respectivas mdias e de suas varincias. O nvel de significancia do teste
't' pode ser verificado com exatido em tabelas estatsticas prprias.
Coeficientes de correlao
O coeficiente phi trabalha com dados dicotmicos, numa tabela de
quatro cselas, e produz um valor que vai de -1 a +1, como qualquer
coeficiente de correlao. O clculo deste coeficiente pode ser conseguido
atravs das tabelas de Jurgensen (1947), para o caso em que o nmero de
sujeitos for o mesmo nos dois grupos de sujeitos, ou das tabelas de
Edgerton (I960), para o caso deste nmero ser diferente.
O coeficiente bisserial de correlao (rb) utiliza as mdias dos
escores dos sujeitos que passaram ou que no passaram o item. Os livros
de estatstica apresentam vrias formas de clculo deste coeficiente
(Guilford, Fruchter, 1973).
O clculo do ndice de discriminao com base no escore total do
teste apresenta um problema terico. Na verdade, procura-se analisar a
adequao do item (em termos de discriminao) baseada nas infor-
maes obtidas de todo o elenco de tens (escore total). Tal procedimento
parece incongruente, dado que a adequao dos demais itens tambm est por
ser demonstrada, inclusive a esta altura das anlises do teste ainda no se sabe
se os itens do teste so homogneos, isto , se o teste unidimensional,
suposio necessria para se poder obter um escore total. Tenta-se resolver
este problema procedendo-se a uma anlise fatorial dos itens antes da prpria
anlise individual dos mesmos.
3) Item Response Theory (IRT ou ICC)
Esta teoria de anlise dos itens possui uma longa histria (desde os anos
50), mas s bem recentemente est sendo utilizada praticamente, dadas as
dificuldades das anlises estatsticas envolvidas que exigem o poder de
avanados softwares e micros de certo porte. AIRT uma teoria estatstica, mas
de utilizao direta na psicometria, inclusive com grandes vantagens sobre
outros mtodos tradicionais de anlise de itens.
Os modelos matemticos envolvidos nesta teoria so bastante
complexos e, embora seu conhecimento constitua uma grande vantagem, no
parece ser indispensvel seu domnio para uso inteligente por parte do usurio.
A compreenso da sua lgica, entretanto, indispensvel.
Primeiramente, h vrios modelos matemticos envolvidos na IRT. Na
verdade, h trs deles principais, dependendo do nmero de parmetros que
pretendem avaliar dos itens. Os parmetros em questo so a dificuldade, a
discriminao e a resposta aleatria (ou melhor, a resposta correta dada ao
acaso). Assim, temos o modelo logstico de 1, 2 ou 3 parmetros.
Todos os modelos trabalham com traos latentes, isto , teorizam sobre
as estruturas latentes, como faz a teoria psicomtrica. Entendem os sistemas
psicolgicos latentes como possuindo dimenses, isto , propriedades de
diferentes magnitudes ou mensurveis. Por isso, esta teoria tambm
conhecida como a teoria do trao latente ou a teoria da curva caracterstica do
item {tem characteristic curve - ICC). A teoria supe que o sujeito possui um
certo nvel de magnitude do trao latente, designado por theta (0), o qual
determinado atravs da anlise das respostas dos sujeitos por meio de diversas
funes matemticas. A funo do modelo completo de trs parmetros :

A probabilidade de resposta correta, que define a posio (0) do


indivduo no trao medido, funo de trs parmetros: a corresponde ao ndice
de discriminao do item e determinado pela curvatura da ogiva no ponto de
inflexo; b o parmetro da dificuldade/preferncia e
expresso pelo valor no eixo dos X no ponto de inflexo da curva; e o
parmetro que determina as respostas acertadas/preferidas por acaso,
sendo o D uma constante usualmente com valor 1,7.
Os trs modelos de IRT mais conhecidos so os seguintes: 1) o
modelo logstico de um parmetro ou o modelo Rasch (1966) Rasch faz
a suposio de que os itens possuem o mesmo nvel de discriminao e
que no h respostas dadas ao acaso, ficando como parmetro a ser
avaliado somente a dificuldade dos itens; 2) o modelo logstico de dois
parmetros (Birnbaum, 1968), que avalia a dificuldade e a discriminao
dos itens, assumindo que no hajam respostas dadas ao acaso; e 3) o
modelo de trs parmetros de Lord (1980), no qual os trs parmetros dos
itens so avaliados.
Exemplificando com o modelo de Lord: os valores so expressos
em coordenadas cartesianas, tendo na ordenada a probabilidade de res-
posta correta, isto , o P,(), e na abeissa o trao latente, o prprio .
Este procedimento produz, para cada item, uma ogiva, chamada de
curva caracterstica do item (item characteristic curve ou ICC), como na
Figura 3-3.

Fig. 3-3 ICC para trs itens.

Na ilustrao da Figura 3-3, os trs parmetros aparecem nas


seguintes posies: o a representado pela inclinao da curva na altura
do ponto de inflexo, isto , onde a curva corta a linha que representa a
probabilidade .50 de resposta correta (50%); quanto mais ngreme esta
curvatura, mais discriminativo o item. O b representado pela distncia na
linha dos X (abcissa) que corresponde ao ponto determinado pela perpendicular
que vem do ponto de inflexo da curva. O c definido pela assntota inferior da
curva; quando esta assntota no atinge a abcissa, h respostas dadas ao
acaso, e o tamanho destas respostas definido pela distncia que vai do ponto
0, na abcissa, at o ponto onde a curva corta a ordenada.
A adequao do uso da IRT depende de uma suposio que ela prpria
no pode verificar, a saber, a unidimensionalidade do teste, isto , a
homogeneidade do conjunto de itens que supostamente devem estar medindo
um mesmo trao. Este problema bastante grave, dado que ele atinge algo de
crucial na psicometria que a questo da representao comportamental do
trao latente e incide diretamente sobre a questo bsica da validade dos
testes. Tipicamente, a dimensionalidade do teste verificada atravs da anlise
fatorial, e somente aps ela seria justificado o uso de uma anlise de tipo IRT.
Isto, evidentemente, vale tambm para a anlise dos itens baseada no escore
total. A IRT tem uma vantagem sobre a ltima tcnica, porque, pelo menos,
analisa os parmetros do item independentemente um do outro. O que fica de
problemtico neste contexto que a anlise fatorial se fundamenta em
equaes lineares e, ao que parece, as correlaes entre os itens seriam
normalmente de carter curvilinear. Conseqentemente, a prova da
unidimensionalidade do teste, que mede um e um s trao, fica difcil de ser
cabalmente demonstrada.
4) Vieses de resposta
Independentemente da qualidade dos itens, a resposta aos mesmos
pode ser desvirtuada por fatores relativos ao sujeito que a eles reage. Estes
vieses na resposta falseiam os dados, introduzindo correlaes esprias,
mesmo em se tratando de bons instrumentos psicolgicos. Podemos classificar
estes erros em trs categorias, em termos de suas causas: cultura/nvel
socioeconmico, resposta aleatria e resposta estereotipada.
a) Erros associados cultura
A causa de erros de resposta associados cultura se relaciona ao
problema da transferncia de instrumentos psicolgicos para outras populaes
para as quais eles no foram especificamente construdos e validados. E o caso
da utilizao destes instrumentos para minorias e o da adaptao dos mesmos a
outras culturas (traduo de testes).
O problema do uso dos testes com minorias tem recebido grande ateno
nos Estados Unidos, sobretudo com a minoria negra. A IRT tambm vem se
preocupando com esta questo no contexto do uso de instrumentos para
estudos transculturais (Hambleton, 1991). O problema
que se observa ali sobretudo a dificuldade relativa de certos itens para grupos
de indivduos com tradies culturais e de experincia diferentes das dos
grupos para os quais os testes foram elaborados. Isto significa que pessoas de
habilidades similares num dado construto psicolgico, mas de culturas
diferentes, apresentam diferentes probabilidades de xito.
Vrios mtodos estatsticos foram apresentados para lidar com este
problema, chamado vis do teste {test bias), salientando-se o enfoque que
analisa a proporo dos sujeitos que respondem corretamente o item em cada
grupo (Angoff, 1982) e a IRT (Ironson, 1982; Hambleton, 1991; Ellis, 1991;
Jackson, 1991).
A tcnica de Angoff ( 1982) consiste em transformar as porcentagens de
acertos nas duas populaes em valores delta e plot-los em coordenadas
cartesianas. No caso de as populaes serem similares, esperam-se altas
correlaes entre as respostas dos sujeitos de ambas as amostras, isto , os
itens se apresentam com dificuldades similares, resultando em um agrupamento
dos itens em cima ou ao longo da linha de 45 que passa pelo ponto de origem
das coordenadas. Quando estas populaes, contudo, forem culturalmente
diferentes, o ndice geral de dificuldade dos itens pode aparecer mais forte
numa que na outra. Neste caso, os valores deltas no se agrupam junto linha
de 45, mas os pontos (que definem os itens) aparecem mais afastados desta
linha, isto , aparece uma srie de itens longe da linha, parecendo estranhos
aos demais (outsiders). Estes itens so mais difceis para a amostra de sujeitos
onde eles aparecem plotados (vide Figura 3-4).
O problema com esta anlise consiste no fato de que itens bem dis-
criminativos tendem a se mostrar outsiders e, com isso, correm o perigo de
serem eliminados como desviantes. Este problema evitado com o uso do
enfoque da IRT para analisar os itens em termos de desviantes quando apli-
cados a uma populao culturalmente diferente da original, dado que ela analisa
os parmetros de cada item independentemente uns dos outros.
Esta tcnica permite analisar a equivalncia dos itens quando aplicados
a populaes culturalmente distintas, identificando os itens que no apresentam
tal equivalncia, isto , tens que apresentam um funcionamento diferencial
differential item functioning - DIF (Ellis, 1991 ). AIRT produz os parmetros
de dificuldade (b) e de discriminao (a) dos tens para as duas amostras
culturalmente diferentes, e estes parmetros podem ser comparados para
verificar se so ou no estatisticamente equivalentes ou diferentes. Esta
hiptese testada atravs do qui-quadrado de Lord (1980; Hulin et al., I983).
Ao se piotar os ndices de dificuldade (b) assim calculados das duas
amostras em coordenadas cartesianas, os b se alinham ao longo de uma linha
paralela linha de 45, que no passa pela origem das coordenadas,
Fig. 3-4 Distribuio hipottica da dificuldade dos itens em amostras
de culturas diferentes.

mas corta, por exemplo, o eixo dos X, indicando que o teste como um todo
mais difcil para a amostra indicada neste eixo (vide Figura 3-5). Os itens
mais difceis para uma ou outra amostra aparecem indentados em direo
ao eixo da amostra para a qual tais itens so particularmente difceis.
Assim, por exemplo, o item # 1 mais difcil para a amostra A, sendo o item
#2 mais difcil para a amostra B.
Uma grande vantagem do enfoque da IRT neste particular consiste
em possibilitar a descoberta das causas de desvio de certos tens (o fato
de serem mais difceis para uma amostra do que para outra) e, assim, se
poder corrigir esta causa e tentar recuperar o item para o teste (Ellis, 1991).
b) A resposta ao acaso
Os fatores que determinam a resposta ao acaso no so determin-
veis, pois so, por definio, aleatrios. Tal ocorrncia pode ser devido a
Fig. 3-5 Distribuio dos b de duas amostras.

inmeros fatores no sistemticos, como a m disposio do sujeito em


responder ao teste, incompreenso das instrues, gozao e outros. A
IRT identifica este tipo de resposta atravs do parmetro c.
c) A resposta estereotipada
Trata-se realmente de erros ou de respostas tendenciosas devidos
a peculiaridades do sujeito que responde, sobretudo ocorrendo em testes
de personalidade e de atitude so devidos a uma estereotipia na
resposta. Dois tipos aparecem salientes: a desejabilidade social e as
respostas sistemticas.
A desejabilidade social na verdade corresponde a um trao de
personalidade, mas afeta negativamente a objetividade nas respostas de
auto-relato. Esta questo foi amplamente discutida por Edwards (1957,
1959), Edwards e Walker ( 1961 ), Edwards, Diers e Walker (1962) e Edwards
e Walsh (1963). Edwards, inclusive, construiu uma escala para avaliar esta
tendncia nos sujeitos (Heineman, 1952; Messick, Jackson, 1961); le
define a desejabilidade social como "a tendncia dos sujeitos em atribuir
a si mesmos, em caso de autodescrio, afirmaes de personalidade com
valores socialmente desejveis e em rejeitar aquelas com valores social-
mente indesejveis" (Edwards, 1957, p.vii). Essa atitude no representa
uma vontade de falsear os dados, mas um desejo (inconsciente) de se
apresentar bem diante dos outros. O sujeito no procura intencionalmente
mentir sobre si mesmo (neste caso, seria mentira), mas o faz sem dar-se
conta disso: quer simplesmente aparecer com bons olhos diante dos
outros. Esta tendncia to comum que parece um trao universal do ser
humano. Ela , igualmente, um problema praticamente sempre presente
em inventrios de personalidade. A maneira de controlar esta tendncia
tem sido a elaborao de uma escala de desejabilidade e inclu-la no
inventrio. Assim, um trao a mais mensurado pelo inventrio; mas fica
difcil saber o que fazer com tal dado que alerta sobre o fato de que o
sujeito pode bem ter utilizado a mesma ttica na resposta aos demais
traos medidos pelo inventrio. Pelo menos, fica o alerta para a interpre-
tao dos resultados do inventrio, quando ndices elevados de desejabili-
dade social esto presentes nos respondentes.
A resposta sistemtica, por outro lado, representa erros de jul-
gamento. H uma srie frustrante deste tipo de erros de resposta: efeito de
halo, lenincia, tendncia central, contraste, proximidade, e outras. O
controle destes erros tem se mostrado ainda bastante falho na utilizao
de escalas de avaliao.
O efeito de halo foi cunhado por Thorndike (1920) e ocorre quando
"um avaliador tende a avaliar um indivduo de modo semelhante sobre
todas as dimenses" (Guilford, 1959, p. 146). Este erro inversamente
proporcional varincia nas respostas (Borman, 1975), acarretando altas
correlaes entre diferentes fatores (Gillinsky, 1947; Taylor, Hastman, 1956)
e reduzidos desvios padres (Bernardin, Walter, 1977).
O erro de lenincia consiste em dizer "apenas coisas boas a respeito
de todo o mundo" (Dunnette, 1983). Estatisticamente, esta tendncia
definida como "uma mudana significativa na mdia das avaliaes na
direo favorvel, de uma condio de avaliao para outra" (Sharon,
Bartlett, 1969, p.252).
A tendncia central ocorre quando um avaliador tende a colocar
todos os sujeitos no centro da escala. uma tendncia na qual "avaliado-
res hesitam proferir julgamentos extremos... e talvez ocorre mais normal-
mente quando avaliadores no conhecem suficientemente bem os
avaliandos" (Guilford, 1954, p.278).
Erro de contraste consiste na tendncia das pessoas avaliarem os
outros ao oposto do que se avaliam a si mesmas. Os outros se tornam o
contraponto da auto-avaliao. Quem organizado acha todos os outros
desleixados (Murray, 1938).
O controle destes e outros erros da resposta se apresenta difcil,
dado que eles tm origem na prpria personalidade do sujeito que res-
ponde, tratando-se, portanto, de outros traos da prpria personalidade. Tem-se
inventado maneiras de contornar tais erros, eliminando, por exemplo, o ponto
central (neutro) da escala para inviabilizar a tendncia central ou eliminar a
parte inferior da escala para descaracterizar a leni-ncia, mas tais investidas
no tm surtido efeitos suficientes e claros e, assim, estas tendncias ainda
continuam sendo um problema substancial na medida da personalidade e das
atitudes.

Validade
Costuma-se definir a validade de um teste dizendo que ele vlido se de
fato mede o que supostamente deve medir. Embora esta definio parea uma
tautologia, na verdade ela no , considerada a teoria psicomtrica exposta
acima. O que se quer dizer com esta definio que, ao se medirem os
comportamentos (itens), que so a representao do trao latente, est-se
medindo o prprio trao latente. Tal suposio justificada se a representao
comportamental for legtima. Esta legitimao somente possvel se existir uma
teoria prvia do trao que fundamente que a tal representao comportamental
constitui uma hiptese dedutvel desta teoria. A validade do teste (este
constituindo a hiptese), ento, ser estabelecida pela testagem emprica da
verificao da hiptese pelo menos, esta a metodologia cientfica. Assim,
fica muito estranha a prtica corrente na psicometria de se agrupar intuitiva-
mente uma srie de itens e, a posteriori, verificar estatisticamente o que eles
esto medindo. A nfase na formulao da teoria sobre os traos tem sido muito
fraca no passado; com a influncia da Psicologia Cognitiva, esta nfase
felizmente est voltando ou dever voltar ao seu devido lugar na psicometria.
A validao da representao comportamental do trao, isto , do teste,
embora constitua o ponto nevrlgico da psicometria, apresenta dificuldades
importantes que se situam em trs nveis ou momentos do processo de
elaborao do instrumento: o nvel da teoria, a coleta emprica da informao e
a prpria anlise estatstica da informao.
No nvel da teoria se concentram talvez as maiores dificuldades. Na
verdade, a teoria psicolgica se encontra ainda em estado embrionrio,
destituda quase que totalmente de qualquer nvel de axiomatizao, resultando
disto uma pletora de teorias, muitas vezes at contraditrias. Basta lembrar de
teorias como behaviorismo, psicanlise, psicologia existencialista, psicologia
dialtica e outras, que postulam princpios irredutveis entre as vrias teorias e
pouco concatenados dentro de uma mesma teoria ou, ento, em nmero
insuficiente para se poder deduzir hipteses teis para o conhecimento
psicolgico. Havendo esta confuso no campo terico dos construtos, torna-se
extremamente difcil para o psicometrista operacionalizar estes mesmos
construtos, isto , formular
hipteses claras e precisas para testar ou, ento, formular hipteses
psicologicamente teis. Ainda quando a operacionalizao for um sucesso, a
coleta da informao emprica no senta de dificuldades, como, por exemplo,
a definio inequvoca de grupos critrios onde estes construios possam ser
idealmente estudados. Mesmo no nvel das anlises estatsticas encontramos
problemas. Pela lgica da elaborao do instrumento, a verificao da hiptese
da legitimidade da representao dos construtos se faz pela anlise fatorial
(confirmatoria), que procura identificar, nos dados empricos, os construtos
previamente operacionalizados no instrumento. Acontece que a anlise fatorial
faz algumas postulaes fortes que nem sempre se coadunam com a realidade
dos fatos. Por exemplo, a anlise fatorial assume que as respostas dos sujeitos
aos itens do instrumento so determinadas por uma relao linear destes com
os traos latentes. Todos os mtodos atuais de anlise fatorial postulam esta
relao linear. H, ainda, o grave problema da rotao dos eixos, a qual permite
a demonstrao de um nmero sem fim de fatores para o mesmo instrumento.
Diante destas dificuldades, os psicometristas recorrem a uma srie de
tcnicas para viabilizar a demonstrao da validade dos seus instrumentos.
Fundamentalmente, estas tcnicas podem ser reduzidas a trs grandes classes:
tcnicas que visam validade de construto, validade de contedo e validade de
critrio (APA, I954).
Validade de construto
A validade de construto ou de conceito considerada a forma mais
fundamental de validade dos instrumentos psicolgicos e com toda a razo,
dado que ela constitui a maneira direta de verificar a hiptese da legitimidade da
representao comportamental dos traos latentes e, portanto, se coaduna
exatamente com a teoria psicomtrica. Historicamente, o conceito de construto
entrou na psicometria atravs da APA Committee on Psychological Tests, que
trabalhou de 1950 a 1954 e cujos resultados se tornaram as recomendaes
tcnicas para os testes psicolgicos (APA, 1954).
O conceito de validade de construto foi elaborado com o j clssico
artigo de Cronbach e Meehl (1955) "Construct validity in psychological tests",
embora o conceito j tivesse uma histria sob outros nomes, tais como validade
intrnseca, validade fatorial e at validade aparente (face validity). Estas vrias
terminologias demonstram a confusa noo que construto possua. Embora
tenham tentado clarear o conceito de validade de construto, Cronbach e Meehl
ainda o definem como a caracterstica de um teste enquanto mensurao de um
atributo ou qualidade, o qual no tenha sido "definido operacionalmente".
Reconhecem, entretanto, que a validade de construto reclama por um novo
enfoque cientfico. De fato, definir esta validade do modo que eles definiram
parece um pouco estranho em cincia, dado que conceitos no definidos
operacionalmente
no so suscetveis de conhecimento cientfico. Conceitos ou construios so
cientificamente pesquisveis somente se forem, pelo menos, passveis de
representao comportamental adequada; do contrrio, sero conceitos
metafsicos e no cientficos. O problema que os autores, sintetizando, alis, a
atitude geral dos psicometristas da poca, para definir validade de construto,
partiram do teste, isto , da representao comportamental, em vez de partir da
teoria psicomtrica que se fundamenta na elaborao da teoria do construto
(dos traos latentes). O problema no descobrir o construto a partir de uma
representao existente (teste), mas sim descobrir se a representao (teste)
constitui uma representao legtima, adequada do construto. Este enfoque
exige uma colaborao, bem mais estreita do que existe, entre psicometristas e
Psicologia Cognitiva.
A validade de construto de um teste pode ser trabalhada sob dois
ngulos: a anlise da representao comportamental do construto e a anlise
por hiptese.
1) A anlise da representao
So utilizadas duas tcnicas como demonstrao da conformidade da
representao do construto: a anlise fatorial e a anlise da consistncia
interna.
A anlise da consistncia interna consiste essencialmente em verificar a
homogeneidade dos itens que compem o teste. Assim, o escore total no teste
se torna o critrio de deciso, e a correlao entre cada item e este escore total
decide a qualidade do item: sendo alta a correlao, o item retido. O ndice
alpha (a) de Cronbach tipicamente utilizado como indicador sumrio da
consistncia interna do teste e, conseqentemente, dos itens que o compem.
H alguns problemas com esta tcnica como demonstrao da
conformidade da representao do construto. Primeiramente, o escore total
constitui uma dificuldade, dado que ele somente faz sentido se o teste j , a
priori, homogneo. Assim, a correlao de cada item com o escore total j
pressupe que os itens so somveis, isto , homogneos; em outras palavras,
se pressupe que todos os itens sejam uma representao do mesmo trao
(unidimensionalidade). Por outro lado, a intercorre-lao entre os itens no
uma demonstrao de que estes estejam medindo um e mesmo construto.
Suponha a situao de trs itens saturados em trs fatores, como segue:

__________ F1_________ F2 _________ F3


1 .80 .30 .30
2 .30 .80 .30
3 .30 .30 .80
As correlaes entre os trs itens so todas de 0,57, altas e signifi-
cativas, mas nem por isso se pode dizer que os trs itens estejam medindo uma
e a mesma coisa. Na verdade, o item 1 mede especificamente o fator 1 e os
outros itens medem outros fatores. Conseqentemente, a anlise da
consistncia interna dos itens no parece garantir que eles sejam uma
representao unidimensional de um construto.
A anlise fatorial tem como lgica precisamente verificar quantos
construtos comuns so necessrios para explicar as covariancias (as
intercorrelaes) dos itens. As correlaes entre os itens so explicadas, pela
anlise fatorial, como resultantes de variveis-fonte que seriam as causas
destas covariancias. Estas variveis-fonte so os construtos ou traos latentes
de que fala a psicometria. A anlise fatorial tambm postula que um nmero
menor de traos latentes (variveis-fonte) suficiente para explicar um nmero
maior de variveis observadas (itens). Assim, se, a partir de uma teoria, foi
construdo um teste que mede um nico trao latente, a anlise fatorial poderia
verificar esta hiptese, demonstrando se o tal teste de fato mede um nico trao,
isto , que a matriz de intercorrelaes entre os itens pode ser reduzida ou
explicada adequadamente por um nicofator. Neste caso, temos uma
demonstrao emprica da hiptese de que o teste constitui uma representao
legtima e adequada do construto em questo, isto , o teste tem validade de
construto.
Infelizmente, as coisas no aparecem assim to ntidas. A razo principal
desta dvida se fundamenta na teoria matemtica da anlise fatorial que define
a relao entre as variveis observadas e as variveis-fonte somente em termos
de equaes lineares. Parece difcil se admitir que as intercorrelaes entre os
itens possam ser todas elas reduzidas a equaes lineares, particularmente
quando em, qui, nenhum campo da Psicologia e das cincias sociais e do
comportamento em geral se encontram tais equaes. Encontram-se, sim,
equaes logartmicas, exponenciais e outras, isto , equaes no-lineares,
como, por exemplo, nas leis da psicofisica e da anlise experimental do
comportamento.
2) Anlise por hiptese
Esta anlise se fundamenta no poder de um teste psicolgico ser capaz
de discriminar ou predizer um critrio externo a ele mesmo; por exemplo,
discriminar grupos-critrio que difiram especificamente no trao que o teste
mede. Este critrio procurado de vrias formas, havendo quatro entre as mais
salientes e normalmente utilizadas: validao convergente-discriminante, idade,
outros testes do mesmo construto e a experimentao.
A tcnica da validao convergente-discriminante (Campbell, Fiske,
1967) parte do princpio de que para demonstrar a validade de construto de um
teste preciso determinar duas coisas: 1) o teste deve
correlacionar significativamente com outras variveis com as quais o cons-truto
medido pelo teste deveria, pela teoria, estar relacionado (validade convergente);
e 2) no se correlacionar com variveis com as quais ele teoricamente deveria
diferir (validade discriminante).
Campbell e Fiske (1967, p. 125) apresentam o exemplo da Tabela3-3, a
seguir:

Tabela 3-3 Matriz sinttica de Multitrao- -Multimtodo

A ilustrao apresenta seis blocos de resultados: trs tringulos (com


linhas inteiras) e trs retngulos (com tringulos de linhas pontilha-das). As
diagonais dos blocos-retngulo representam as correlaes entre as variveis
medidas por diferentes mtodos e contm a diagonal da validade (convergente);
estes valores devem ser altos para mostrar validade de construto. Os valores
fora destas diagonais nestes mesmos blocos (os tringulos de linhas
pontilhadas) representam as correlaes entre diferentes variveis medidas por
diferentes mtodos; estes valores devem ser pequenos para mostrar validade de
construto (validade discriminante). O mesmo deve ocorrer com as correlaes
fora das diagonais nos blocos-tringulo (com linhas inteiras), que representam
os coeficientes entre variveis diferentes medidas pelo mesmo mtodo (nas
diagonais esto os
coeficientes de preciso). Este mtodo funciona se os mtodos e as vari-
veis diferem o suficiente (mximamente) entre si.
A idade utilizada como critrio para a validao de construto de
um teste quando este mede traos que so intrinsecamente dependentes
de mudanas no desenvolvimento cognitivo/afetivo dos indivduos, como
o caso, por exemplo, da teoria piagetiana do desenvolvimento dos pro-
cessos cognitivos e da teoria de Spearman sobre a inteligncia. A hiptese
a ser testada neste mtodo a de que o teste que mede o trao X, o qual
muda claramente com a idade, capaz de discriminar distintamente gru-
pos de idades diferentes. O problema com este mtodo consiste no fato de
que a maturao psicolgica pode assumir dimenses e conotaes muito
distintas em culturas diferentes, por um lado; por outro, outras variveis
que no o trao em questo podem estar dependentes desta maturao,
dificultando ou impossibilitando a definio dos grupos-critrio somente em
funo da idade. Assim, se outras variveis variam com a idade, pode bem
ser que estas sejam as responsveis pelas mudanas no trao e no a
idade especificamente. Isto no seria grave problema se estas outras
variveis variassem do mesmo modo em qualquer contexto cultural ou
socioeconmico, o que obviamente difcil de assumir. Dentro de uma
mesma cultura, o mtodo se apresenta como importante para a determi-
nao da validade de construto.
A correlao com outros testes que meam o mesmo trao
tambm utilizada como demonstrao da validade de construto. O argu-
mento de que, se um teste X mede validamente o trao Z e o novo teste
N se correlaciona altamente com o teste X, ento o novo teste mede o
mesmo trao medido por aquele teste. O problema com esta tcnica
consiste no fato de que normalmente um teste de um trao qualquer no
se apresenta com tal pureza a se poder afirmar que ele mede exclusiva-
mente o tal trao. De fato, ele mede o trao em termos de um certo nvel
de covariancia: por exemplo, existe uma correlao de 0,70 entre o teste
e o trao, o que eqivale a uma comunalidade de 49%. Agora, o novo teste
correlaciona, digamos, tambm 0,70 com aquele teste, havendo, portanto,
comunalidade de 49% entre os dois testes. Qual ser, neste caso, a comu-
nalidade do novo teste com o trao em si? Por azar, poderia acontecer que
a comunalidade de 49% entre os dois testes ocorra precisamente com os
51% do primeiro teste que no covariam com o trao; neste caso, a
comunalidade do novo teste com o trao seria 0%, isto , o novo teste seria
uma representao totalmente equivocada do trao.
O uso da interveno experimental aparece como logicamente
uma das melhores tcnicas para se decidir a validade de construto de um
teste. Esta tcnica consiste em verificar se o teste discrimina claramente
grupos-critrio 'produzidos' experimentalmente em termos do trao objeto
de medida do teste. Assim, um teste que mede ansiedade teria validade de
construto (ansiedade) se discriminasse grupo no-ansioso de grupo ansi-
oso, definidos estes grupos em termos de manipulaes experimentais
o ansioso, por exemplo, criado assim atravs de experiencias provocado-
ras de ansiedade. Uma vez que se possa garantir que as manipulaes
feitas nos grupos-criterio atingem exclusivamente o trao em questo, a
testagem da hiptese vlida; como, normalmente, estas manipulaes
supostamente de uma varivel de fato afeta uma srie de outras variveis,
sobretudo se as variveis interagirem, fica muito confusa a deciso sobre
em que especificamente os grupos-critrio diferem e, conseqentemente,
fica inconclusiva a deciso sobre a hiptese de que o teste discrimina os
grupos-critrio exclusivamente em termos do trao que ele pretende medir.
Em concluso, a tcnica da validao de construto via hiptese, que,
de um ponto de vista da metodologia cientfica, se apresenta como a mais
direta e bvia, esbarra na dificuldade que existe na definio inequvoca
do critrio a ser utilizado como representante da manifestao do trao.
Deve-se, na verdade, concluir que todas estas tcnicas de validao
apresentam dificuldades graves, mas nem por isso se justifica o simples
abandono das mesmas. Primeiramente, porque em cincia emprica nada
existe de perfeito e isento de erro e, em segundo lugar, a conscincia
destas dificuldades deve servir para melhorar e no abandonar as
tcnicas. Alis, recomendvel o uso de mais de uma das tcnicas acima
analisadas para demonstrar a validade de construto do teste, dado que a
convergncia de resultados das vrias tcnicas constitui garantia para a
validade do instrumento.

Validade de critrio
Concebe-se como validade de critrio de um teste o grau de eficcia
que ele tem em predizer um desempenho especfico de um sujeito. O
desempenho do sujeito torna-se, assim, o critrio contra o qual a medida
obtida pelo teste avaliada. Evidentemente, o desempenho do sujeito
deve ser medido/avaliado atravs de tcnicas que so independentes do
prprio teste que se quer validar.
Costuma-se distinguir dois tipos de validade de critrio: 1 ) validade
preditiva e 2) validade concorrente. A diferena fundamental entre os dois
tipos basicamente uma questo do tempo que ocorre entre a coleta da
informao pelo teste a ser validado e a coleta da informao sobre o
critrio. Se estas coletas forem simultneas (mais ou menos), a validao
ser de tipo concorrente; caso os dados sobre o critrio sejam coletados
aps a coleta da informao sobre o teste, fala-se em validade preditiva.
O fato de a informao ser obtida simultaneamente ou posteriormente do
prprio teste no um fator tecnicamente relevante validade do teste;
relevante, sim, a determinao de um critrio vlido. Aqui se situa
precisamente a natureza central deste tipo de validao dos testes: 1)
definir um critrio adequado e 2) medir, vlida e independentemente do
prprio teste, este critrio.
Quanto adequao dos critrios, pode-se afirmar que h uma
srie destes que so normalmente utilizados, quais sejam:
1) Desempenho acadmico
Talvez seja o critrio mais utilizado na validao de testes de
inteligncia. Consiste na obteno do nvel de desempenho escolar dos
alunos, seja atravs das notas dadas pelos professores, seja pela mdia
acadmica geral do aluno, seja pelas honraras acadmicas que o aluno
recebeu, ou seja mesmo pela avaliao puramente subjetiva dos alunos
em termos de "inteligente" por parte dos professores ou colegas. Embora
seja amplamente utilizado, este critrio tem igualmente sido amplamente
criticado, no em si mesmo, mas pela deficincia que ocorre na sua
avaliao. sobejamente sabida a tendenciosidade por parte dos profes-
sores em atribuir as notas aos alunos, tendenciosidade nem sempre
consciente, mas decorrente de suas atitudes e simpatias em relao a este
ou aquele aluno. Esta dificuldade poderia ser sanada at com certa
facilidade, se os professores tivessem o costume de aplicar testes de ren-
dimento que possussem validade de contedo, por exemplo. Como esta
tarefa dispendiosa, o professor tipicamente no se d ao trabalho de
validar (validade de contedo) suas provas acadmicas.
Neste contexto, tambm utilizado como critrio de desempenho
acadmico o nvel escolar do sujeito: sujeitos mais avanados, repetentes
e evadidos a suposio sendo de que quem continua regularmente ou
est avanado em termos de sua idade possui mais habilidade. Evidente-
mente, nesta histria no entra somente a questo da habilidade, mas
muitos outros fatores sociais, de personalidade, etc, tornando este critrio
bastante ambguo e esprio.
2) Desempenho em treinamento especializado
Trata-se do desempenho obtido em cursos de treinamento em
situaes especficas, como no caso de msicos, pilotos, atividades
mecnicas ou eletrnicas especializadas, etc. No final deste treinamento
h tipicamente uma avaliao, a qual produz dados teis para servirem de
critrio de desempenho do aluno.
3) Desempenho profissional
Trata-se, neste caso, de comparar os resultados do teste com o
sucesso/fracasso ou o nvel de qualidade do sucesso dos sujeitos na
prpria situao de trabalho. Assim, um teste de habilidade mecnica pode
ser testado contra a qualidade de desempenho mecnico dos sujeitos na
oficina de trabalho. Evidentemente continua a dificuldade de levantar ade-
quadamente a qualidade deste desempenho em servio dos sujeitos.
4) Diagnstico psiquitrico
Muito utilizado para validar testes de personalidade/psiquitricos. Os
grupos-critrio so aqui formados em termos da avaliao psiquitrica:
normais vs. neurticos, psicpatas vs. depressivos, etc. Novamente, a difi-
culdade continua sendo a adequao das avaliaes psiquitricas feitas
pelos psiquiatras.
5) Diagnstico subjetivo
Avaliaes feitas por colegas e amigos podem servir de base para
estabelecer grupos-critrio. utilizada esta tcnica sobretudo em testes
de personalidade, onde difcil encontrar avaliaes mais objetivas. Assim,
os sujeitos avaliam seus colegas em categorias ou do escores em traos
de personalidade (agressividade, cooperao, etc), baseados na convi-
vncia que eles tm com os colegas. Nem precisa mencionar as dificulda-
des enormes que tais avaliaes apresentam em termos de objetividade;
contudo, a utilizao de um grande nmero de juizes poder diminuir os
vieses subjetivos nestas avaliaes.
6) Outros testes disponveis
Os resultados obtidos atravs de outro teste vlido que mea o
mesmo construto que o teste a ser validado servem de critrio para deter-
minar a validade do novo teste. Aqui fica a pergunta bvia: para que criar
outro teste, se j existe um que mede validamente o que se quer medir? A
resposta se baseia numa questo de economia: utilizar um teste que
demanda muito tempo para ser respondido ou apurado como critrio para
validar um teste que gaste menos tempo.
Todos estes critrios podem ser considerados bons e teis para fins
de validao de critrio. A grande dificuldade em quase todos eles se situa
na demonstrao da adequao da medida deles: em geral, a medida dos
mesmos precria, deixando, por isso, muita dvida quanto ao processo
de validao do teste. Entretanto, h exemplos famosos de testes vali-
dados atravs deste mtodo, como o caso do MMPI.
Validade de contedo
Um teste tem validade de contedo se ele constitui uma amostra
representativa de um universo finito de comportamentos (domnio);
aplicvel quando se pode delimitar a priorie claramente um universo de
comportamentos, como o caso em testes de desempenho, que preten-
dem cobrir um contedo delimitado por um curso especfico.
Para viabilizar um teste com validade de contedo, preciso que se
faam as especificaes do teste antes da construo dos itens. Estas
especificaes comportam a definio de trs grandes temas: 1) definio do
contedo, 2) explicitao dos processos psicolgicos (os objetivos) a serem
avaliados e 3) determinao da proporo relativa de representao no teste de
cada tpico do contedo.
Quanto ao contedo, trata-se de detalh-lo em termos de tpicos e
subtpicos e de explicitar a importncia relativa de cada tpico dentro do teste.
Tais procedimentos evitam a super-representao indevida de alguns tpicos e
sub-representao de outros por vieses e pendores pessoais do avaliador. Claro
que ser sempre o avaliador ou equipe de avaliadores quem vai definir este
contedo e a relativa importncia de suas partes, mas esta definio deve ser
tomada antes da construo dos itens, garantindo certa objetividade, pelo
menos, nas decises.
Quanto aos objetivos, um teste no deve ser elaborado para avaliar
exclusivamente um processo. Como na aprendizagem entram em ao vrios
processos psicolgicos, h interesse que todos eles sejam avaliados por um
teste de contedo. Por exemplo, o teste dever conter itens que avaliam a
memria (reproduzir), a compreenso (conceituar, definir), a capacidade de
comparao (relacionar) e de aplicao dos princpios aprendidos (solucionar
problemas, transferncia da aprendizagem).
Para facilitar a especificao do teste, pode-se utilizar uma tabela de
dupla entrada, com o detalhamento dos objetivos (processos) no topo e o
detalhamento dos tpicos esquerda, explicitando, no corpo da tabela, o
nmero de itens, conforme Tabela 3-4.

Tabela 3-4 Especificao do contedo e processos para uma prova de


rendimento em estatstica descritiva
Contedo Processos (objetivos) Total
Conceituar Relacionar Aplicar
Freqncia 2 3 1 6
Tendncia Central 3 1 5 9
Variabilidade 3 2 4 9

Total 8 6 10 24

Preciso (fidedignidade)
O problema que se enquadra sob o conceito de fidedignidade vem
relatado sob uma srie de outras denominaes, como preciso, fidedignidade,
constncia, consistncia interna, confiabilidade, estabilidade, confiana,
homogeneidade. As mais genricas e, por isso, as mais utilizadas so preciso
e fidedignidade.
Estas diferentes designaes mostram a variabilidade de conceitos que
preciso assume, dependendo do aspecto que este parmetro quer salientar do
teste. Na verdade, fidedignidade cobre aspectos diferentes de um teste, mas
todos eles se referem a quanto os escores de um sujeito se mantm idnticos
em ocasies diferentes; por exemplo, os escores obtidos num tempo 1 e num
tempo 2 para os mesmos sujeitos. Esta ocorrncia (identidade dos escores)
evidentemente supe que o trao que o teste mede se mantenha constante sob
estas diferentes ocasies, como suposto ser o caso, por exemplo, na maioria
dos traos de personalidade e de aptido. No seria o caso num teste de humor,
porque este trao por natureza varia de momento para outro, e um teste vlido
de humor produziria escores necessariamente diferentes. Assim, o conceito de
fidedignidade, na verdade, se refere ao quanto o escore obtido no teste se
aproxima do escore verdadeiro do sujeito num trao qualquer; isto , a
fidedignidade de um teste est intimamente ligada ao conceito da varincia erro,
sendo este definido como a variabilidade nos escores produzida por fatores
estranhos ao construto. Aparece, assim, claro que a fidedignidade de um teste
depende da questo do erro da medida, especificamente do erro produzido pelo
prprio instrumento: quanto o escore produzido pelo teste se distancia do escore
verdadeiro do sujeito no trao em questo, isto , a valor theta individual na IRT.
Para melhor conceber esta problemtica, preciso se referir varincia
verdadeira e varincia erro. Um procedimento de medida qualquer, por exemplo,
os escores em um teste, produz uma variabilidade nos resultados que, em parte,
provocada pelas diferenas no prprio trao medido entre diferentes sujeitos,
parte pela impreciso do prprio instrumento e parte, ainda, por uma srie de
outros fatores aleatrios. A fidedignidade da medida depende do tamanho da
varincia erro, que precisamente a variabilidade nos resultados provocada por
estes fatores aleatrios e pela impreciso do instrumento. Expressa mais
positivamente, a fidedignidade de um instrumento diz respeito ao montante de
varincia verdadeira que ele produz vis--vis a varincia erro, isto , quanto
maior a varincia verdadeira e menor a varincia erro, mais fidedigno o instru-
mento: um escore preciso um escore que se aproxima do valor verdadeiro,
expresso estatisticamente pelo erro padro da medida (tratado mais adiante).
A definio estatstica da fidedignidade feita atravs da correlao entre
escores de duas situaes produzidos pelo mesmo teste. Se o teste preciso,
esta correlao deve no somente ser significativa, mas se aproximar da
unidade (cerca de 0,90). De fato, uma correlao de 0,70, por exemplo,
expressaria uma comunalidade de apenas 49% entre as duas situaes
provocadas pelo mesmo teste nos mesmos sujeitos. Neste caso, a varincia
comum, digamos a varincia verdadeira, seria menor que a varincia erro,
demonstrando que o teste no produz resultados fidedignos,
isto , o teste no possui preciso. Esta correlao, no caso do parametro de
fidedignidade ou preciso, referida como o coeficiente de preciso ou de
fidedignidade.
Dependendo da tcnica utilizada para demonstrao da preciso de um
teste, surgem vrios tipos de preciso: teste-reteste, formas paralelas,
consistncia interna.
Preciso teste-reteste
Este tipo de preciso consiste em calcular a correlao entre as dis-
tribuies de escores obtidos num mesmo teste pelos mesmos sujeitos em duas
ocasies diferentes de tempo. A correlao de 1,00 seria obtida se no
houvesse varincia erro provocada pelo teste ou outros fatores aleatrios, como
fatores no controlados nos sujeitos ou na situao de testagem. Quanto mais
longo o perodo de tempo entre a primeira e a segunda testagem, mais chances
haver de fatores aleatrios ocorrerem, diminuindo o coeficiente de preciso.
Este intervalo de tempo permite a ao dos fatores mencionados por Campbell e
Stanley ( 1%3) sob o tema de fontes de erro devido histria, maturao,
retestagem e s interaes entre estes fatores, bem como ao prprio
instrumento. Por isso, vem-se as graves dificuldades que apresenta este tipo
de anlise da fidedignidade de um teste; particularmente grave aparece aqui a
questo da maturao, isto , se o prprio trao matura (se desenvolve,
modifica), esta anlise da preciso torna-se errnea, dada sobretudo a
eventualidade de que a maturao do trao se processe diferencial mente para
os diversos sujeitos testados. Alm disso, e particularmente em testes de
aptido, a testagem constitui um treinamento, e provavelmente diferencial, para
os sujeitos, o que provocar diferenas na retestagem entre os mesmos,
reduzindo novamente o coeficiente de preciso do teste. Para contornar estas
dificuldades, outros tipos de anlises foram elaboradas, como a das formas
alternativas ou anlise da consistncia interna.
Preciso de formas alternativas
Neste caso, os sujeitos respondem a duas formas paralelas do mesmo
teste, e a correlao entre as duas distribuies de escores constitui o
coeficiente de preciso do teste. A condio necessria para que esta anlise
seja vlida se situa na demonstrao de que as amostras de contedo (de itens)
em ambas as formas sejam equivalentes, isto , que os itens possuam nveis
equivalentes de dificuldade e de discriminao em ambas. Estes parmetros
podem ser facilmente verificados atravs da IRT; h, contudo, algumas
dificuldades neste tipo de anlise: as duas formas so aplicadas em sucesso
imediata, no eliminando assim totalmente o efeito do intervalo de tempo,
resultando na possvel introduo de efeitos da histria e do treinamento
(prtica) obtido ao responder primeira das formas alternativas; aparece
facilmente um efeito repetitrio, dado que os
itens de ambas as formas so similares, produzindo efeitos motivacionais
negativos no responderte. Alm disso, no tarefa fcil construir formas
alternativas, quando a construo de um s teste j uma tarefa dispendiosa,
razo pela qual poucos testes aparecem no mercado com formas alternativas.
Preciso da consistncia interna
As vrias tcnicas de estabelecer este tipo de preciso visam
verificar a homogeneidade da amostra de itens do teste, ou seja, a
consistncia interna do teste. As tcnicas mais utilizadas so: duas
metades, Kuder-Richardson e alfa de Cronbach. Todas elas exigem
aplicao do teste em apenas uma nica ocasio, evitando totalmente a
questo da constncia temporal.
1) Preciso das duas metades
Os sujeitos respondem a um nico teste numa nica ocasio. O
teste dividido em duas partes equivalentes, e a correlao calculada
entre os escores obtidos nas duas metades. Nao importante como o
teste dividido em duas metades, conquanto que estas sejam equivalen-
tes. Na prtica, contudo, as duas formas mais normalmente utilizadas so
a diviso do teste em primeira metade e segunda metade ou em itens
pares e itens mpares. Para efetuar esta anlise, de fato o teste no
precisa ser homogneo, isto , no qual todos os itens medem o mesmo
trao (por exemplo, itens somente verbais ou numricos); o que
fundamental que as duas metades emparelhem itens homogneos:
verbal com verbal, numrico com numrico, etc.
Neste tipo de preciso, preciso notar que o clculo da correlao
se baseia somente na metade do teste. Assim, num teste de 100 itens, a
correlao se basearia somente em 50 itens. Como o nmero de itens
afeta o tamanho do coeficiente de correlao, preciso corrigir este
coeficiente para que leve em considerao a extenso total do teste e,
assim, produzir um coeficiente de preciso mais justo para o teste. Esta
correo feita atravs da frmula de Spearman-Brown:

onde, rtt o coeficiente de preciso calculado, r12 o coeficiente de corre-


lao entre as duas metades do teste e n o nmero de vezes em
que o teste foi dividido. Assim, um teste dividido em duas metades, o n
ser 2, porque ele deve ser aumentado 2 vezes para se obter a forma total
do teste.
2) Preciso de Kuder-Richardson
Esta tcnica, criada por Kuder e Richardson (1937), se baseia na
anlise de cada item individual do teste. Os autores desenvolveram vrias
frmulas sendo a mais utilizada a frmula 20, que segue:
onde, r o coeficiente de preciso do teste, n o nmero de itens do teste,
DP,' o desvio padro dos escores totais do teste e pq o somatrio do
produto da proporo de sujeitos que passaram (p) e dos que no
passaram (q) cada item.
Cronbach (1951) mostrou que esta tcnica produz um coeficiente de
preciso do teste que corresponde mdia dos coeficientes de todas as
metades em que o teste possa ser dividido, mas somente quando se utiliza
a frmula de Rulon (1939), que trabalha com as varincias das diferenas
entre as duas metades, e no a simples correlao com a correo de
Spearman-Brown, segundo observaram Novick e Lewis (1967). Esta equi-
valncia de coeficientes, contudo, ocorre em testes homogneos, porque
nos testes heterogneos os coeficientes de Kuder-Richardson so nor-
malmente menores, dado que esta tcnica no trabalha com diferenas
entre pares de itens e sim com a varincia de todos os itens.
3) Alfa de Cronbach
Esta tcnica de Cronbach (1951) constitui uma extenso da de
Kuder-Richardson. Esta ltima aplicvel somente quando a resposta ao
item dicotmica certo e errado, por exemplo. Entretanto, quando a
resposta ao item pode assumir mais de duas alternativas, o valor pq
substitudo por (DPt2), a soma dos desvios padres de cada item. Esta
frmula genrica a seguinte:
onde DPt2 a varincia de todo o teste e (DPt2) o somatrio das varin-
cias de cada item do teste.
Preciso na apurao dos escores
Existe toda uma srie de fatores que podem afetar negativamente
os resultados de um teste, tais como distrao, cansao, etc. Para a
maioria destes fatores pode-se encontrar alguma maneira de control-los
experimentalmente atravs, por exemplo, da padronizao das condies
de testagem. H, contudo, um fator importante na apurao dos resultados
de testes no-objetivos, onde a opinio do apurador entra como fator de
deciso. Neste caso, preciso que mais de um apurador seja utilizado
para se garantir um resultado preciso no teste. A concordncia, expressa
pela correlao entre as avaliaes de diferentes apuradores, produzir um
ndice de preciso entre apuradores. Obviamente este ndice deve ser
positivo e alto para garantir validade dos resultados.
O erro padro de medida
Para estabelecer a preciso de um teste, pode-se, em lugar de calcular
um coeficiente de fidedignidade, calcular o erro provvel da medida incorrido
pelo teste. Este erro expresso em termos padres e o
seguinte:
onde o erro padro da medida (EPM) se expressa em termos do desvio padro
do teste (DPt) e do coeficiente de preciso do mesmo teste (rtt) obtidos na
mesma amostra de sujeitos.
Este ndice se apresenta muito til na interpretao de escores
individuais, pois com ele se pode definir os limites do intervalo dentro do qual
mais provavelmente se situa o escore verdadeiro do sujeito. Estes limites so
expressos pelo desvio padro: 1 EPM em torno do escore obtido d os limites
dentro dos quais h uma probabilidade de 68,26% de se situar o escore
verdadeiro; se se optar por 2 EPM, esta probabilidade sobe para 07,72% (vide
curva normal). Assim, se um sujeito obteve um Ql de KM) num teste cujo DP
15 e o rtt = .91, seu escore verdadeiro se situa entre os
seguintes limites expressos pelo
EPM de:
Neste caso, os limites sero 100 4,5 ou seja, 104,5 e 95,5.
Existe na literatura uma louvvel tendncia de se apresentar os
resultados dos sujeitos num teste em termos de faixas definidas pelo DPM em
vez de escores isolados. Esta prtica permite, igualmente, comparar com maior
preciso a diferena entre dois escores, observando se as faixas dos dois
escores se sobrepem ou no.

Padronizao (normas)
Padronizao, em seu sentido mais geral, se refere necessidade de
existir uniformidade em todos os procedimentos no uso de um teste vlido e
preciso: desde as precaues a serem tomadas na aplicao do teste
(uniformidade das condies de testagem, controle do grupo, instrues
padronizadas e motivar os examinandos pela reduo da ansiedade) at o
desenvolvimento de parmetros ou critrios para a interpretao dos resultados
obtidos. Em seu sentido mais tcnico de parmetro psicomtrico, a
padronizao se refere a este ltimo aspecto, isto , como interpretar os
resultados.
Um escore bruto produzido por um teste necessita ser contextualizado
para poder ser interpretado. Obter, por exemplo, 50 pontos num teste de
raciocnio verbal e 40 num de personalidade no oferece nenhuma informao.
Mesmo se dissermos que o sujeito acertou 80% das questes
no diz muito, visto que o teste pode ser fcil (80% ento seria pouco) ou difcil
(80% ento seria muito). Na verdade, qualquer escore deve ser referido a algum
padro ou norma para adquirir sentido. Uma tal norma permite situar o escore de
um sujeito, permitindo 1) determinar a posio que o sujeito ocupa no trao
medido pelo teste que produziu o tal escore e 2) comparar o escore deste sujeito
com o escore de qualquer outro sujeito. O critrio de referncia ou a norma de
interpretao constitudo tipicamente por dois padres: 1) o nvel de
desenvolvimento do indivduo humano (normas de desenvolvimento) e 2) um
grupo padro constitudo pela populao tpica para a qual o teste construdo
(normas intragrupo).
Normas de desenvolvimento
As normas de interpretao dos escores de um teste baseadas no
desenvolvimento se fundamentam no fato do desenvolvimento progressivo (nos
vrios aspectos de maturao psicomotora, psquica, etc.) pelo qual o indivduo
humano passa ao longo de sua vida. Neste sentido, so utilizados, como critrio
de norma, trs fatores: idade mental, srie escolar e estgio de
desenvolvimento.
1) A idade mental
Este critrio foi criado por Binet e Simon (1905). Estes autores falavam
de nvel mental, depois popularizado como idade mental. Binet e Simon
separaram empiricamente uma srie de 54 questes/tarefas em 11 nveis de
idade cronolgica: 3 a 10 anos (oito nveis), 12, 15 anos e idade adulta. As
questes que eram respondidas corretamente pela mdia de crianas/sujeitos
de uma idade cronolgica X definiam o nvel/idade mental correspondente a esta
idade cronolgica. Assim, a um sujeito que respondia a todas as questes que
as crianas de 10 anos eram capazes de responder era atribuda a idade mental
de 10 anos.
Na adaptao norte-americana da escala de Binet-Simon, a Stanford-
Binet (Terman, Merrill, 1960), a idade mental (IM ) foi expressa em termos da
idade cronolgica (IC), resultando no quociente intelectual, o Ql, atravs da
frmula:
Assim, quem responde a todas as questes correspondentes sua idade
cronolgica possui um Ql de 100 (por exemplo, para uma criana de 10 anos: Ql
= 100 x (10/10) = 100). A interpretao dos resultados em termos de Ql se faz
atravs da Tabela 3-5.
2) Srie escolar
Este critrio utilizado para testes de desempenho acadmico e so-
mente faz sentido quando se trata de disciplinas que so oferecidas numa
Tabela 3-5 Interpretao dos escores de Ql

Ql Interpretao

140-160 .................................. Definitivamente superior


120-139 .................................. Superior
110-119 .................................. Mdio Superior
90-109 .................................. Normal ou mdio
80-89 .................................. Mdio inferior
70-79 .................................. Deficincia limtrofe
50-69 .................................. Cretino
30-49 .................................. Imbecil
29 .................................. Idiota

seqncia de vrias sries escolares. As normas so aqui estabelecidas


computando-se o escore bruto mdio obtido pelos alunos em cada srie,
resultando num escore tpico para cada srie. Desta forma, a criana que obtm
o escore bruto tpico da 49 srie obtm o escore padronizado de 4.
3) Estgio de desenvolvimento
Este critrio utilizado por pesquisadores na rea da psicologia da
criana que estudam o desenvolvimento mental e psicomotor em termos de
idades sucessivas de desenvolvimento, como Gesell e Piaget.
Gesell e colaboradores (Ames, 1937; Gesell, Amatruda, 1947; Halverson,
1933; Knoblock, Pasamanick, 1974) desenvolveram normas para oito idades
tpicas (de 4 semanas a 36 meses) de desenvolvimento das crianas nas reas
do comportamento motor, adaptativo, da linguagem e social.
Piaget e seus colaboradores estudaram o desenvolvimento cognitivo e
estabeleceram uma seqncia de estgios sucessivos deste desenvolvimento
(sensrio-motor, pr-operacional, operacional concreto, operacional formal).
Seguidores da escola piagetiana desenvolvem testes utilizando estes estgios
como critrio de interpretao dos escores (Laurendeau, Pinard, 1962, 1970;
Pinard, Laurendeau, 1964).
Normas intragrupo
O critrio de referncia dos escores o grupo ou a populao para a qual
o teste foi construdo. Aqui o escore do sujeito toma sentido em relao aos
escores de todos os sujeitos da populao. De fato, ele referenciado em
termos I) do posto percentlico ou 2) do desvio normal (z). Como tipicamente
no so conhecidos os escores da populao, sobre uma amostra
representativa desta que as normas so estabelecidas.
1) Posto percentlico
O escore do sujeito expresso em termos de percentil. Este posto indica
quanto por cento de todos os sujeitos da populao (amostra) esto abaixo dele.
Assim, se 40% dos sujeitos obtiveram um escore bruto menor do que 20, este
escore ser expresso como percentil 40, o que indica que 40% dos sujeitos tm
escore menor que 20 e 60% tm escore maior. Um percentil de 50 indica que o
sujeito se situa na mediana dos escores da amostra. Usa o intervalo semi-
interquartlico (Q) em torno desta mediana para definir o significado relativo dos
postos dos sujeitos. Q = (Q3-Ql)/2, onde Ql o percentil 25 e o Q3 o percentil
75.
Os escores percentlicos so fceis de calcular e so de compreenso
simples. A grande dificuldade da escala percentlica se situa no fato de que as
distncias entre escores sucessivos no so constantes, mas variam segundo a
posio do escore estar no incio/fim da escala ou no meio dela. De fato, os
intervalos entre os percentis medianos so menores do que os dos extremos da
escala, como aparece ilustrado na Figura 3-6.
2) Escore padro
As normas baseadas no escore padro (escore Z) se fundamentam no
clculo deste escore Z correspondente ao escore bruto do sujeito. Este clculo
feito de duas formas bastante distintas, que resultaro ou num escore padro ou
num escore padro normalizado. O primeiro feito atravs de uma
transformao linear e o segundo atravs de uma transformao no-linear.
O escore padro linear calculado pela frmula:

onde X = escore bruto, M - mdia do grupo e DP= desvio padro.


O escore padro normalizado calculado atravs das tabelas da curva
normal, e consiste essencialmente em transformar as porcentagens em escores
Z, como ilustrado na Figura 3-6.
As duas formas do resultados idnticos se as distribuies de
freqncia forem normais. Quanto mais as distribuies se afastam da
normalidade, menos recomendvel a utilizao da transformao no-linear
dos escores.
De qualquer forma que o Z seja obtido, as normas baseadas nele
normalmente utilizam algumas transformaes lineares ulteriores para evitar
duas dificuldades de uma escala de Z: 1) a presena de escores negativos, pois
o Z vai de menos infinito a mais infinito (mais praticamente, de -5 a +5), e 2) a
presena de decimais. Para eliminar estas duas dese-legncias, tipicamente o Z
multiplicado por um coeficiente e ao produto
Fig. 3-6 Distribuio normal e de postos percentlicos.

agregada uma constante. Tanto o coeficiente de multiplicao do Z


quanto a constante somada so arbitrrias, resultando em tantas formas
de normas quantas imaginveis. Contudo, alguns desses valores so
rotineiramente mais utilizados, produzindo normas j tradicionalmente
conhecidas, como: o escore T, os estaninos, o desvio Ql, o escore CEEB
e vrios outros. As frmulas de transformao para algumas destas
normas so:
T = 50 + 10z
Desvio Ql = 100 + 15z (Escalas de Wechsler) ou
Desvio Ql = 100 + 16z (Stanford-Binet) CEEB =
500 + 100z

CONCLUSO GERAL

A psicometria clssica j possui uma longa histria e tem consegui-


do sucessos importantes em nvel mundial. Contudo, devido sua origem
de longa data, ela sofre de alguns problemas ou limitaes que advem de
duas fontes: 1) ela surgiu dentro de um contexto histrico no qual a
Psicologia em geral era ditada pelo enfoque positivista e 2) se valeu dos
progressos da Estatstica na qual predominavam as estatsticas paramtri-
cas e univariadas.
Da primeira fonte surgem as dificuldades referentes ao precrio
embasamento psicolgico terico que a psicometria ainda sofre. Na
verdade, os psicometristas em geral no do a devida ateno funda-
mentao terica na hora da elaborao dos seus instrumentos psicologi-
cos, donde resultam instrumentos que muitas vzes no se sabe exata-
mente o que esto medindo ou, pelo menos, se esto medindo algo de
psicologicamente relevante. Este problema pode ser devidamente sanado
com o progresso da Psicologia Cognitiva, que d a devida importncia aos
componentes dos traos latentes, estudados em seus prprios mritos e
no, como vem fazendo a psicometria clssica, como interpretaes que
se do s resultantes de anlises estatsticas (anlise fatorial) feitas sobre
um agregado mais ou menos aleatoriamente agrupado de itens ou tarefas
respondidos por uma amostra de sujeitos. Da segunda fonte surge uma
srie de limitaes devido ao uso de estatsticas nem sempre adequadas
aos dados coletados, como, por exemplo, as anlises dos itens baseadas
no escore total e a anlise da fidedignidade do teste baseada na corre-
lao ou no erro de medida. Estas ltimas limitaes podem e esto sendo
superadas pelo desenvolvimento da nova teoria psicomtrica, a Item
Response Theory.

REFERNCIAS BIBLIOGRFICAS

AMERICAN PSYCHOLOGICAL ASSOCIATION. Committee on Psychological Tests. Technical


recommendations for psychological tests and diagnostic techniques. Psychological
Bulletin Supplement. Washington, D.C., v.51, n.2. part 2, p.1-38. 1954.
AMES, L.B. The sequential patterning of prone progression in the human infant. Genetic
Psychology Monographs, Provincetown (MA), v.19, p.409-460, 1937.
ANASTASI, A. Psychological testing. 6.ed. New York: Macmillan, 1988.
ANGOFF, W.H. Use of difficulty and discrimination indices for detecting item bias. In: BERK,
R.A. (Ed.). Handbook of methods for detecting test bias. Baltimore (MD): Johns Hopkins
University Press, 1982. p.96-116.
BERNARDIN, H.J., WALTER, C.S. Effects of rater training and diary keeping on psychometric
error in ratings. Journal of Applied Psychology. Washington. D.C., v.62, n.1, p.64-69,1977.
BINET, A., SIMON. T. Mthodes nouvelles pour le diagnostic du niveau intellectuel des anor-
maux. L'Anne Psychologique. Paris, v.1 1, p.191-244, 1905.
BIRNBAUM, A. Some latenttrait models and their use in inferring examinee's ability. In: LORD.
F.M.. NOVICK, M.R. (Eds.). Statistical theories of mental test scores. Reading (MA):
Addison-Wesley. 1968.
BORMAN, W.C. Effects of instructions to avoid halo error on reliability and validity of per-
formance evaluation ratings. Journal of Applied Psychology. Washington, D.C., v.60,
p.556-560. 1975.
CAMPBELL, D.T.. STANLEY, J. C. Experimental and quasi-experimental designs for research.
Chicago (IL): Rand McNally. 1963.
CAMPBELL. D.T.. FISKE. D.W. Convergent and discriminant validation by the multitrait-
multimethod matrix. In: JACKSON. D.N., MESSICK, S. (Eds.). Problems in human
assessment. New York: McGraw-Hill. 1967.
CARPENTER, PA. JUST. M.A., SHELL, P. What one intelligence test measures: a theoretical
account on the processing in the Raven Progressive Matrices Test. Psychological Review.
Washington, D.C., v.97, n.3. p.404-431. 1990.
CRONBACH, L.J. Coefficient alpha and the internal structure of tests. Psychometrika. v. 16, p.297-334,
1951.

CRONBACH, L. J., MEEHL, P.E. Construct validity in psychological tests. Psychological Bulletin,
Washington, D.C., v.52, p.281-302, 1955.

DUNNETTE, M.D. (Ed.). Handbook of industrial and organizational psychology. New York: Wiley, 1983.

EDGERTON, H.A. A table for computing the phi coefficient. Journal of Applied Psychology,
Washington, D.C., v.44, p.141-145, 1960.

EDWAR DS, A. L. The social desirability variable in personality assessment and research. New York:
Dryden, 1957.

--------------- . Social desirability and personality test construction. In: BASS. B.M., BERG, I .A.
(Eds.). Objective approaches to personality assessment. New York: Van Nostrand, 1959.

EDWARDS, AL, WALKER, J.N. Social desirability and agreement response set. Journal of Abnormal
and Social Psychology, n.62, p.180-183, 1961.

EDWARDS. AL, DIERS.C.J., WALKER, J.N. Response sets and factor loadings on 61 personality
scales. Journal of Applied Psychology. Washington, D.C., n.46, p.220-225. 1962.

EDWARDS. A.L., WALSH, J.A. The relationship between the intensity of the social desirability keying of
a scale and the correlation of the scale with Edwards' SD scale and the first factor loading of the
scale. Journal of Clinical Psychology. Brandon (VT), n. 19, p. 200-203, 1963.

ELLIS, B.B. Item response theory: a tool for assessing the equivalence of translated tests. Bulletin of
the International Test Commission, v.18, n.1-2, p.33-51, 1991.

GESELL. A., AMATRUDA, C.S. Developmental diagnosis. 2ed. New York: Hoeber-Harper. 1947.

GILLINSKY. A.S. The influence of the procedure of judging on the halo effect. American Psychologist.
Washington, D.C., v.2. p.309-310, 1947.

GUILFORD. J.P. Psychometric methods. New York: McGraw-Hill. 1954.

--------------- . Personality. New York: McGraw-Hill. 1959.

GUILFORD. J.P. FRUCHTER. B. Fundamental statistics in Psychology and Education. 5,ed. New York:
McGraw-Hill, 1973.

GUTTMAN. L. Measurement as structural theory. Psychometrika. v.36. n.4. p.329-347, 1971.

HALVERSON. H.M. The acquisition of skill in infancy. Journal of Genetic Psychology. Province-town
(MA), v.43, p.3-48, 1933.

HAMBLETON. R.K. Adapting tests for use in different cultures: technical issues and methods. Bulletin
of the International Test Commission, v.18, n.1-2, p.3-32.1991.

HEINEMAN. CE. A forced-choice form of the Taylor Anxiety Scale. Unpublished doctoral dissertation.
State University of Iowa. 1952.

HULIN. C.L.. DRASGOW. F.. PARSONS, C.K. Item response theory, applications to psychological
measurement. Homewood (IL): Dow Jones-Irwin, 1983.

IRONSON, G.H. Use of chi-square and latent trait approaches for detecting item bias. In: BERK, R.A.
(Ed.). Handbook of methods for detecting test bias. Baltimore (MD): Johns Hopkins University
Press. 1982. p.117-160.
JACKSON, D.N. Problems in preparing personality tests and interest inventories for use in multiple
cultures. Bulletin of the International Test Commissions.IH. n. 1-2. p.94-93, 1991.
JUNG. C.G. Psychologische Typen. Zurich: Rascher. 1921,
JURGENSEN, CE. Table for determining phi coefficients. Psychometrika, v. 12. p. 17-29, 1947.
KELLEY. T.L. The selection of upper and lower groups for the validation of test items Journal of
Educational Psychology. Washington, D.C., v.30, p.17-24. 1939.
KNOBLOCK. H., PASAMANICK. B. (Eds.). Gesell and Amatruda's developmental diagnosis. 3.ed. New
York: Harper and Row. 1974.
KRETSCHMER. E. Physique and character. New York: Hartcourt. 1925.
KUDER. G.F.. RICHARDSON. M.W. The theory of estimation of test reliability. Psychometrika. n.2. p.
151-160. 1937.
LAURENDEAU. M.. PINARD. A. Causal thinking in the child: a genetic and experimental approach.
New York: International Universities Press, 1962.
--------------- . The development of the concept of space in the child. New York: International
Universities Press, 1970.
LORD, F.M. Applications of item response theory to practical testing problems. Hillsdale (NJ): Erlbaum.
1980.
MESSICK. S., JACKSON. D.N. Acquiescence and the factorial interpretation of the MMPI.
Psychological Bulletin. Washington. D.C. v.58. p.299-304. 1961.
MULHOLLAND. T.M.. PELLEGRINO. J.W., GLASER, R. Components of geometric analogy solution.
Cognitive Psychology, v. 12..p.252-284. 1980.
MURRAY. H.A., et al. Explorations in personality. New York: Oxford University Press. 1938.
NEWELL. A.. SIMON. H.A. Human problem solving. Englewood Cliffs (NJ): Prentice-Hall. 1972.
NOVICK. M.R.. LEWIS. C. Coefficient alpha and the reliability of composite measurements.
Psychometrika. v.12. p. 1-13, 1967.
OOSTERHOF, A.O Similarity of various item discrimination indices. Journal of Educational
Measurement. Washington. D.C. v.13. p.145-150, 1976.
PELLEGRINO. J.W.. MUMAW. R.J.. SHUTE. V.J. Analysis of spatial aptitude and expertise. In:
EMBRETSON, SE. (Ed.). Test design: developments in psychology and psycho-metrics. 1985.
p.45-76.
PIAGET. J. The origins of intelligence in children. New York: International Universities Press. 1952.

PINARD. A.. LAURENDEAU, M. A scale of mental development based on the theory of Piaget:
description of a project. Journal of Research in Science Teaching. New York, v.2. p.253-260, 1964.
POPPER. K.R., ECCLES, J.C. O eu e seu crebro. Braslia: Ed. UnB, 1977.

RASCH. G. An individualistic approach to item analysis. In: LAZARSFELD, P.F., HENRY, N.W. (Eds).
Readings in mathematical social sciences. Cambridge (MA): MIT Press, p.89-107.

RULON. P.J. A simplified procedure for determining the reliability of a test of split-halves. Harvard
Educational Review. Cambridge (MA), v.9, p.99-103, 1939.

SHARON, A.T.. BARTLETT. C.J. Effect of instructional conditions in producing leniency on two types of
rating scales. Personnel Psychology. Durham (NC), v.22, p.251-263, 1969.
SHELDON. W.H. The varieties of human physique: an introduction to constitutional psychology. New
York: Harper, 1940.

------------------ . The varieties of temperament: a psychology of constitutional differences. New


York: Harper. 1942.
SPEARMAN. C. "General intelligence" objectively determined and measured. American Journal of
Psychology, Champaign (IL), v. 15, p.201-293. 1904.

STERNBERG, R.J. Intelligence, information processing, and analogical reasoning: the com-ponential
analysis of human abilities. Hillsdale (NJ): Erlbaum, 1977.

----------------. The nature of mental abilities. American Psychologist, Washington. D.C.. v.U.
p.214-230. 1979.

----------------. Representation and process in linear syllogistic reasoning. Journal of Experimental


Psychology: General. Washington. D.C. v.109. p.119-159, 1980.
TAYLOR. E.K.. HASTMAN. R. Relation of format and administration to the characteristics of graphic
rating scales. Personnel Psychology. Durham (NC), v.9, p.181-206, 1956.
TERMAN. L.M.. MERRILL, M.A. Stanford-Binet Intelligence Scale: manual for the third revision. Form L-
M. Boston (MA): Houghton Mifflin. I960.

THORNDIKE. E.L. A constant error in psychological ratings. Journal of Applied Psychology.


Washington. D.C.v.4. p.25-29. 1920.
CAPITULO 4

MEDIDAS ESCALARES

Luiz Pasquali
Instituto de Psicologia
Universidade de Braslia

s medidas escalares em Psicologia se situam dentro do enfoque


epistemologico defendido pela psicometria, trabalhando com o modelo da
estrutura latente. Elas fazem uso dos conceitos de trao latente, sistema,
propriedade e magnitude (vide cap. 3).
Os parmetros da medida (validade, fidedignidade) tambm continuam
sendo os parmetros fundamentais na medida escalar. Assim, o conhecimento
dos captulos sobre a teoria da medida e da medida psicomtrica se faz
necessrio para a compreenso do que ser dito sobre as medidas escalares.
A medida escalar constitui uma das vrias formas que a medida
psicomtrica pode assumir. Nesta se incluem os testes psicolgicos, os
inventrios, as escalas, etc. As medidas escalares so mais utilizadas na
Psicologia Social, especificamente no estudo das atitudes, e tambm no campo
da personalidade, com o intuito de medir traos de personalidade (como, por
exemplo, o inventrio de Comrey: Escalas de Personalidade de Comrey). Elas
se distinguem dos testes e inventrios, porque aqueles so de uso mais corrente
na avaliao das aptides (onde h respostas certas e erradas) e estes, no
campo da personalidade e da psicopatologia. Alm disso, os testes e os
inventrios, em confronto com as escalas, se apresentam como medidas para as
quais existem normas de interpretao, ao passo que para as escalas
comumente no so elaboradas tais normas. Na verdade, diferenas essenciais
entre estes vrios tipos de medidas psicomtricas no existem. H mesmo
dvidas quanto a existirem diferenas importantes entre escalas psicomtricas e
escalas psicofsicas. A distino, neste ltimo caso, talvez ainda faa sentido. A
escala psicofisica visa escalonar estmulos fsicos (atravs de medida
fundamental) que corresponderiam ou produziriam uma escala intervalar
psicolgica (escala de resposta), sendo as duas relacionadas por alguma lei
psicofisica. A escala psicomtrica visa escalonar estmulos que expressam um
construto psicolgico, e seria mais neste sentido restrito
que se usaria mais comumente o conceito de escala. Mas estas dis-
tines se tornam muito tnues, porque, afinal, sempre se escalonam
estmulos (itens) observveis.
Tambm, a expresso escala utilizada de mltiplas formas: para
designar o nvel mtrico da medida (escala ordinal, intervalar, etc); para
designar um contnuo de nmeros (escala numrica de 5 pontos, por
exemplo); para designar os prprios itens de um instrumento, como no
caso do diferencial semntico, onde cada item chamado de escala;
para designar diferentes tcnicas de construo e uso de instrumentos
psicolgicos de medida de atitudes (como escala tipo Thurstone, tipo
Likert, etc). Todos estes so usos legtimos da palavra escala e, mesmo,
no h contradies em tais usos. Embora eles possam trazer algumas
dificuldades, normalmente no produzem ambigidades no tipo de escala
que se est falando. O termo, na verdade, originalmente se refere ao fato
de que, ao se proceder a uma medida de um atributo emprico, surge
uma srie de nmeros ordenados qual dado o nome de escala num-
rica. Assim, qualquer medida resultaria numa escala. No caso presente,
entretanto, escala utilizada como uma forma ou tcnica de se fazer a
medida, especialmente na rea das atitudes, como se ver a seguir.

ESCALAS PSICOFSICAS

Estas escalas visam verificar e descrever a correlao que existe


entre estmulos fsicos (som, peso, tamanho, etc.) e a resposta do sujeito.
Mais especificamente, qual o mnimo valor do estmulo que capaz de
produzir uma resposta no organismo (limiar absoluto) e qual o mnimo de
acrscimo no estmulo necessrio para produzir no organismo uma
resposta diferente da anterior (limiar diferencial). A determinao do limiar
absoluto se faz em termos de 50% de percepo de um dado estmulo: o
nvel de estmulo que percebido em 50% das vezes considerado o
limiar absoluto ou nvel 0 (zero-inicial) da escala de resposta. Para a
determinao dos limiares diferenciais, vrias leis foram apresentadas na
histria da Psicologia. Weber (Stevens, 1951) concebeu alei da constante:
para produzir uma resposta diferente da anterior, o estmulo deve ser
aumentado por uma constante (k) que deve ser determinada empirica-
mente para cada modalidade de estmulo (peso, som, etc). Como logo se
percebeu que esta lei no correspondia muito observao dos fatos,
Fechner (Stevens, 1951 ) apresentou uma lei logartmica, na qual a resposta
depende de uma constante, diferente para cada modalidade de estmulo,
a qual multiplica o logaritmo do estmulo; isto , para produzir uma
resposta diferente da anterior, o estmulo tem que aumentar logaritmica-
mente: a resposta aumenta aritmeticamente e o estmulo, geometricamen-
te. Outras leis vieram substituir a de Fechner (Stevens, 1951; Guilford,
1951; Guilford, 1954). Stevens, de fato, demonstrou que alguns pressupostos
de Fechner no podiam ser mantidos e introduziu novos procedimentos que
vieram a se caracterizar como a lei da potncia (vide captulo 2).
Uma exposio detalhada das medidas psicofsicas vai alm da inteno
deste captulo. Para tal informao devem ser consultados os trabalhos de
Stevens (1951) e Guilford (1954), por exemplo.
Dar-se-o mais detalhes na exposio das escalas propriamente
psicomtricas, a seguir. Na apresentao dos vrios tipos de escalas, trs
niveis de preocupao devem ser levados em conta: os procedimentos tericos,
os procedimentos empricos (experimentais) e os procedimentos analticos, os
quais discriminariam diferentes tipos de escalas psicolgicas. Um manual
prtico para trabalhar com escalas psicomtricas o livro de A.L. Edwards
(1957), Techniques of Attitude Scale Construction.

O ENFOQUE DE THURSTONE

Caracterizando o plo terico de sua posio, Thurstone (1927)


introduziu o conceito de contnuo psicolgico em oposio ao contnuo fsico da
psicofisica. A diferena a seguinte: suponha 10 objetos de igual tamanho, mas
com pesos diferentes. Estes objetos podem ser ordenados pelo peso de duas
maneiras. Primeiro, pode-se usar uma balana e ordenar os objetos pelo seu
peso real, produzindo um contnuo fsico (atravs de medida fundamental); mas,
segundo, pode-se tambm pedir a indivduos, na falta de uma balana, para
ordenar os objetos do mais leve ao mais pesado, e esta ordenao constitui um
contnuo psicolgico de pesos. Esta ordenao psicolgica pode ser feita pelos
sujeitos comparando os 10 objetos dois a dois, at se chegar ordem final.
Com base neste raciocnio, Thurstone desenvolveu a lei do julgamento
comparativo, que poderia ser considerada como introduzindo o conceito de
mtodos de escalagem psicolgica (ou mtodos psicomtricos em sentido
estrito), em oposio aos mtodos psicofsicos.
A lei do julgamento comparativo se explicita assim: ao comparar dois
estmulos 'i' e 'j' para decidir qual deles maior (ou 'mais do que' em algum
atributo dado, como peso, por exemplo), o sujeito tem que fazer trs
julgamentos. Primeiro ele tem que avaliar o estmulo '', depois, o estmulo 'j' e,
finalmente, a diferena i > j. Ao avaliar os dois estmulos individualmente, o
sujeito produz um processo discriminante (discriminalprocess) e ao avaliar a
diferena entre os dois estmulos, ele produz uma diferena discriminante
(discriminal difference). Contudo, ao fazer esses julgamentos em ocasies
diferentes, o mesmo sujeito no produz o mesmo processo discriminante, de
sorte que, da, resulta uma variabilidade chamada disper-
so discriminante em torno de um processo discriminante modal que
corresponde mdia dos vrios processos discriminantes com referncia
ao estmulo. Assim, para cada estmulo, sobre o qual existe uma srie de
julgamentos (muitos sujeitos avaliando o mesmo estmulo ou o mesmo
sujeito avaliando o estmulo em muitas ocasies diferentes: procedi-
mentos experimentais), temos um processo discriminante modal e uma
disperso discriminante, isto , a mdia e o desvio padro, dado que os
processos discriminantes se distribuem normalmente (suposio razovel).
Ao se fazerem os julgamentos comparativos entre estmulos para
definir qual deles 'maior que' em algum atributo, produz-se uma tabela
de freqncias do tipo f, = i > j, conforme Tabela 4-1.

Tabela 4-1 Freqncia de vezes em que i considerado


maior que j por 100 sujeitos (Matriz Fi)
i
ITENS 1 2 3 4 5 6
1 50 60 45 70 80 95
2 40 50 30 60 50 80
j 3 55 70 50 70 80 90
4 30 40 30 50 65 85
5 20 50 20 35 50 60
6 05 20 10 15 40 50
Obs.: Na diagonal esto os N/2.

Esta matriz Fij pode ser transformada na matriz P,, onde pij = fij/N,
que pode ser transformada na matriz Zij atravs da tabela da curva normal,
a qual d as posies escalares dos itens no contnuo do construto,
conforme exemplificado nas Tabelas 4-2 e 4-3.

Tabela 4-2 Matriz P,


i
ITENS 1 2 3 4 5 (.
1 .500 .600 .450 .700 .800 .950
2 .400 .500 .300 .600 .500 .800
j 3 .550 .700 .500 .700 .800 .900
4 .300 .400 .300 .500 .650 .850
5 .200 .500 .200 .350 .500 .600
6 .050 .200 .100 .150 .400 .500
Soma 2.000 2.900 1.850 3.000 3.650 4.600
Tabela 4-3 Matriz Zij

i
ITENS 1 2 3 4 5 6
j 1 .00 - .25 -.12 - .52 .25 .84 1.65
2 .25 .00 .52 .00 .52 .00 .00 .84
3 .13 .52 -.52 - -.39 - .84 1.28
4 -.52 -.25 .84 - 1.04 .39 1.04
5 -.84 .00 1.28 .00 - .25
6 -1.65 -.84 .25 .00

Soma (S) -3.13 -.32 -3.28 0 -.14 1.82 5.06


S + 3.28 .15 2.96 0 3.14 5.10 8.34
Valor = 0 3 3 5 8

Assim, a separao entre os processos discriminantes modais de


dois estmulos em termos de desvios normais

Mas, como segue que

onde Zij = desvio normal, E = processo discriminante modal do estmulo i,


Ej= processo discriminante modal do estmulo j, DP = disperso dis-
criminante do estmulo i, DP = disperso discriminante do estmulo j e rij
= correlao entre Ei e Ej.
Esta a frmula que determina os procedimentos analticos e
permite estabelecer as posies escalares dos estmulos e suas distncias.
Entretanto, para tornar esta frmula solucionvel, Thurstone fez outras
suposies, dado que ela tem incgnitas demais; de fato, o nico valor
calculvel a partir dos dados empricos o zij. Das vrias suposies que
Thurstone fez, como a igualdade das disperses discriminantes e a
inexistncia de correlao entre as respostas aos dois estmulos, surgiram
os famosos cinco casos da lei de Thurstone. O Caso V, por exemplo,

que foi utilizado nos clculos das tabelas acima para a obteno dos
valores escalares (processos discriminantes modais) dos estmulos. Vale
ressaltar que Thurstone oferece testes estatsticos para a verificao da
consistncia interna da escala resultante, bem como a verificao da ade-
quao das suposies feitas em cada caso utilizado.
Tendo-se obtido os valores escalares, em termos de desvios padres, de
uma grande srie de estmulos, pode-se construir uma escala intervalar,
selecionando aqueles (cerca de 20) que se situam a distncias iguais entre si.
Estes estmulos assim escalonados constituem a escala para a medida
das atitudes. Os procedimentos experimentais para aferir as atitudes do
sujeito consistem em pedir ao mesmo que escolha o item (estmulo) com o qual
ele mais concorda, sendo o valor escalar deste item a medida da atitude do
sujeito. Ou pede-se para o sujeito escolher os trs tens com os quais mais
concorda, e a medida da sua atitude ser a mdia dos valores escalares destes
trs itens.
A construo de escalas a partir desta lei de Thurstone extremamente
laboriosa. Na verdade, ela se torna quase impossvel com um nmero elevado
de itens, dado que a comparao dos mesmos 2 a 2 aumenta geometricamente
o nmero de comparaes a serem feitas. Para 10 estmulos temos (10 x 9)/2 =
45 comparaes, e para 100 itens temos (100 x 99)/2 = 4.950. Por isso,
Thurstone desenvolveu outras tcnicas de construo de escalas de atitude.
Uma delas o mtodo dos intervalos aparentemente iguais (Thurstone, Chave,
1929).
No caso deste mtodo, as afirmaes (cerca de 100) sobre um objeto de
interesse so impressas em cartes que os sujeitos devem distribuir em 11
pilhas segundo o grau de favorabilidade que, na sua opinio, a afirmao
apresenta em relao ao objeto psicolgico. As 11 pilhas so erigidas sobre um
contnuo de cartes etiquetados de A a K, onde A est ancorado com a
expresso 'desfavorvel', o K com 'favorvel' e o F (o carto a meio caminho de
A e K) com 'neutro'.
O valor escalar dos itens se faz atravs do clculo da mediana, tendo
como coeficiente de variabilidade o intervalo semi-interquartlico, como na
Tabela 4-4.

Tabela 4-4 Clculo do valor escalar pelo mtodo dos intervalos


aparentemente iguais
CATEGORIAS ESCALA
AFIRMAES A B D E F G H 1 J K Q
c
1 2 3 4 5 6 7 8 9 10 11
1 f 2 2 6 2 6 62 64 26 18 8 4 6.8 1.7
P pa .01 .01 .03 .01 .03 .31 .32 .13 .09 .04 .02
.01 .02 .05 .06 .09 .40 .72 .85 .94 .98 1.00
2 f 0 0 0 10 40 28 50 26 28 24 4 6.9 2.8
P pa .00 .00 .00 .05 .20 .14 .25 .13 .14 .07 .02
.00 .00 .00 .05 .25 .39 .64 .77 .91 .98 1.00

f - freqncia; p - proporo; pa - proporo acumulada


Diversas variantes deste mtodo foram propostas (Ballin,
Farnsworth, 1941; Seashore, Hevner, 1933; Edwards, Kilpatrick, 1948;
Webb, 1951). O prprio Thurstone (Saffir, 1937) apresentou uma variante
que chamava de mtodo dos intervalos sucessivos.

O ENFOQUE DE LIKERT

A tcnica de Rensis Likert (1932) talvez seja a mais utilizada na


construo de escalas psicomtricas e conhecida, desde que Bird (1940)
assim a chamou, como mtodo dos pontos somados (methodof summated
ratings).
Em seu plo terico, Likert sustenta que uma atitude (propriedade
psicolgica) constitui uma disposio para a ao. Esta concepo apre-
sentava dificuldades para Likert na poca, dado o enfoque do behavioris-
mo positivista que defendia a atitude como sendo um simples substituto
verbal para a ao concreta. Ele defendeu a atitude como um elemento da
personalidade, talvez concebido como um construto hipottico, ao afirmar
"se de fato tais elementos existem" if, in fact, any such elements exist
(Likert, 1932, p.8). Defendeu igualmente que h uma srie de tais constru-
ios de personalidade e no um nico; novamente uma diatribe espelhando
as disputas da poca entre unifatoristas e multifatoristas. Likert nem se ps
a questo da magnitude das propriedades psicolgicas (atitude, mais
especificamente), pois era para ele uma questo j decidida, isto , as
propriedades psicolgicas tm magnitudes, por isso que podem ser
medidas.
A preocupao da escala Likert no consiste em procurar determi-
nar o valor escalar dos itens, como pretendia Thurstone, mas verificar o
nvel de concordncia do sujeito com uma srie de afirmaes que
expressem algo de favorvel ou desfavorvel em relao a um objeto
psicolgico. As afirmaes so respondidas numa escala de 3 ou mais
pontos, isto , o sujeito tem que dizer se concorda, est em dvida ou
discorda com o que a frase afirma sobre o objeto psicolgico. O nmero de
pontos na escala de resposta varia de 3 a mais de 10, sendo as mais
utilizadas as escalas de 5 e 7 pontos. Alis, o nmero de pontos utilizados
nas escalas Likert parece ser algo irrelevante. Na pesquisa de Matell e
Jacoby (1972), foram utilizadas escalas com 2 at 19 pontos; com exceo
das escalas de 2 e 3 pontos (por oferecerem poucos graus de liberdade),
em todas as outras a porcentagem de uso dos pontos e o tempo de
resposta no foram afetados de modo significativo. Outros estudos j
haviam descoberto que o nmero de pontos da escala, bem como a
existncia ou no de um ponto neutro, no afeta a consistncia interna da
escala Likert (Bendig, 1954; Komorita, 1963; Matell, Jacoby, 1971), nem a
estabilidade teste-reteste (Jones, 1968; Van der Veer, Howard e Austria,
1970; Goldsamt, 1971; Matell, Jacoby, 1971) e nem a validade concorrente
e preditiva (Matell, Jacoby, 1971, 1972).
Os procedimentos empricos consistem em 1) criar um nmero n
de itens sobre um construto psicolgico e 2) ter estes itens respondidos por
N sujeitos numa escala de n pontos. Para a construo dos itens, vide
critrios descritos na parte final deste captulo.
Os procedimentos analticos visam determinar a seleo final dos
itens e a avaliao dos parmetros psicomtricos da escala.
Likert sugere selecionar os itens em termos do seu poder de
discriminao de grupos-critrio, formados estes base do escore total
que os sujeitos obtm na escala. Assim, um teste entre as mdias de
cada item, obtidas pelos grupos superior e inferior (os 30% escores
superiores e 30% inferiores na escala) definem a discriminabilidade dos
itens. Entretanto, as anlises mais modernas da IRT parecem mais
promissoras neste particular, pois elas oferecem at trs parmetros para
os itens: discriminao, dificuldade e resposta ao acaso.
Na anlise da prpria escala, importa verificar a validade e a
preciso. Uma anlise importante da escala consiste em verificar a
unidimensional idade supostada mesma. Tipicamente se utiliza, para tanto,
a anlise fatorial. A anlise da fidedignidade comumente feita atravs da
anlise da consistncia interna dos itens atravs do coeficiente alfa de
Cronbach. Mas qualquer das tcnicas de validade e preciso podem ser
aqui utilizadas.
Fica ainda em dvida se a escala de Likert produz medidas somente
ordinais ou se chegam a ser de intervalo. Na verdade, com os dados
empricos coletados com a escala, pode-se avaliar o valor escalar das
categorias utilizadas (os pontos) na escala de resposta (Edwards, 1957) e,
a partir da, utilizar estes valores escalares para as categorias. Tal
procedimento, contudo, tira a leveza e a facilidade de trabalhar com as
escalas tipo Likert. Edwards e Kenny (1946), alis, verificaram que escalas
construdas no estilo Likert (considerando as categorias 1, 2, 3, etc, como
intervalos iguais) correlacionam em torno de 0,90 com escalas de intervalos
aparentemente iguais de Thurstone. Concluem ainda que, dada a
facilidade de construo e utilizao, as escalas tipo Likert se apresentam
com grande vantagem sobre as de tipo Thurstone.

OENFOQUEDEGUTTMAN

Guttman apresentou seu escalograma, para avaliar atitudes, numa


srie de trabalhos (1944, 1945, 1947, 1950).
A parte terica da tcnica supe que a propriedade psicolgica
possua magnitude e seja unidimensional. Cada item (indicador comporta-
mental) expressa um nvel diferente de magnitude, seguindo uma srie
monotnica crescente (pelo menos de ordem). De sorte que o conjunto de
itens da escala expressa o contnuo da propriedade e que, sendo cumu-
lativos, a aceitao de um item de maior nvel implica a aceitao de todos
os itens inferiores, isto , de menor posto.

Os procedimentos empricos da tcnica consistem em construir


uma srie de itens sobre um construto de tal forma que os itens possam
ser escalonados cumulativamente. Assim, o sujeito que concorda com um
item que expressa um certo nvel de atitude com respeito ao construto
concordar com todos os itens que tm um nvel menor. Desta forma, uma
srie de itens (cerca de dez) podem ser escalonados do mais fraco ou
brando at o mais extremo, produzindo uma escala, pelo menos, ordinal.
Sendo isto verdade, basta saber o item mais extremo com o qual o sujeito
concorda para podermos reproduzir perfeitamente suas respostas nos
outros itens. Na realidade, porm, as coisas no acontecem to certas
assim, de sorte que a reproduo das respostas do sujeito nunca ser
perfeita. Ento se pergunta: qual o mnimo de reprodutibilidade das
respostas aceitvel para se poder dizer que uma escala satisfaz o critrio
de cumulatividade? Com este intuito, Guttman desenvolveu procedimen-
tos analticos para determinar um ndice de reprodutibilidade, o qual
resulta da comparao entre as respostas correta e incorretamente
endossadas. Suponha o seguinte: quatro afirmaes sobre um construto
psicolgico (tendo valor 1 a afirmao mais extrema de atitude) respondi-
das por seis sujeitos em termos de estar de acordo (valor 1 ) ou no-acordo
(valor 0). A Tabela 4-5 recolhe os resultados fictcios obtidos.

Tabela 4-5 Dados fictcios para a escala de Guttman


SUJEITOS AFIRM AES SOMA ERROS
1 2 3 4

1 1 11 01 11 3 1
23 00 00 11 1 3 00
45 00 0 0 01 21 1
1 0

Esta tabela montada de tal forma que nas colunas esto dispostos
os itens em ordem decrescente, do mais extremado ao mais brando, em
termos de atitude em relao ao construto, e nas linhas esto dispostos os
sujeitos, tambm em ordem decrescente do escore total obtido nos itens
(para cada item com o qual est de acordo, o sujeito recebe um ponto). Um
item que recebeu o acordo pelo sujeito obtm valor 1 e obtm 0 se o sujeito
no o marcou. Assim se forma uma tabela triangular, de tal sorte que
acima da diagonal deveriam aparecer somente 1 e abaixo somente 0. No
caso em pauta, como o item #1 o que expressa a atitude mais extrema
em relao ao construto, o sujeito que est de acordo com este item
deveria necessariamente marcar todos os outros itens, fato que no
ocorreu com o sujeito 1, que marcou o item #1 mas no marcou o item #3.
Situaes desta natureza provocam a ocorrncia de 0 acima da diagonal,
o que contado como um erro. Para o clculo do ndice de reprodutibilida-
de contam-se todos os erros, isto , os 0 acima da diagonal, que, no caso,
so dois. Assim, o nmero de valores apropriados na tabela 20 - 2 = 18.
O coeficiente de reprodutibilidade ser 18/20 = 0,90. Guttman afirma que o
coeficiente deve ser pelo menos de 0,90 para que a escala possa ser
considerada adequada.
Escalas tipo escalograma tm a vantagem de avaliar a unidimensio-
nalidade, bem como de apresentar uma garantia de que a amplitude do
contnuo do construto est sendo coberta, particularmente se o nmero de
itens for grande (pelo menos 10, sugere Guttman). Contudo, relativamente
raro de se encontrar na literatura esta forma de escalas. Por qu?
Primeiramente, nem todos os construtos psicolgicos permitem escalabli-
dade. Por exemplo, em atitude poltica, o sujeito pode estar de acordo com
uma posio do candidato e no com outra, o que poderia inclusive estar
indicando falta de unidimensionalidade da escala. Alm disso, Guttman
no oferece dicas de como elaborar os itens, isto , o escalograma tem
pouco poder heurstico; ele parece ser mais til para a anlise de uma
escala do que para guiar a construo dela.

O ENFOQUE DO DIFERENCIAL SEMNTICO

Osgood (Osgood, Suci, 1952; Osgood, Suci, Tannenbaum, 1957)


desenvolveu o plo terico de sua posio e uma tcnica para medir o
conceito de significado (meaning). Este concebido como um estado
cognitivo, entendido como um processo de mediao representativa da
realidade. O objetivo do Diferencial Semntico consiste em especificar as
condies de estmulo e de resposta sob as quais este processo funciona.
O processo de mediao concebido como algo que se intercala entre o
estmulo e a resposta, como segue:

O processo mediativo constitudo pela relao r->s, significando


que o E (estmulo externo) detona um processo psicolgico interno
composto de uma reao interna (r) ao E externo, a qual provoca estimu-
laes internas (s), levando este processo s->r a uma ao externa (R).
Este processo cognitivo d o significado ao E para produzir a ao R.
Atravs de estudos fatoriais, Osgood chegou a definir este processo
cognitivo mediativo corno sendo caracterizado por trs grandes fatores: o
processo apresenta um aspecto avaliatrio (emocional), um de poder e um
de atividade. Isto quer dizer que o significado varia em termos destes trs
fatores.
Como este processo que determina o matiz da ao do sujeito (a
resposta R), seria de importante utilidade poder-se medi-lo. o que
pretende fazer o Diferencial Semntico.
Os procedimentos empricos consistem em elaborar uma srie de
escalas (itens) que devem constituir uma amostra representativa para a
descrio de um conceito. Para ser representativa, esta srie deve cobrir
as dimenses do significado acima assinaladas (os trs fatores). Estas
escalas so apresentadas, em forma de adjetivos descritivos bipolares, a
uma amostra de sujeitos que as avaliam em relao a um conceito, para
ver qual o significado que os sujeitos do a tal conceito, por exemplo, de
pai, nao, etc. O formato das escalas ou adjetivos bipolares apresen-
tado como segue:

PAI
forte __ :__ : __ :__ : __ :__ :_ fraco
bom _ :__ : __ :__ : __ : __ :_ mau
ativo _ :__ : __ :__ : __ :__ :_ passivo

O sujeito deve marcar um dos sete segmentos da linha que vem


ancorada com os adjetivos bipolares. Esta marca indica duas tendncias:
uma direo para um dos dois plos e uma intensidade, desde que a
marca seja colocada mais prxima ou mais longnqua do plo escolhido da
escala.
Os procedimentos analticos consistem em verificar, pelo menos,
dois aspectos: o significado que o conceito tem para o sujeito ou grupo de
sujeitos em termos dos trs fatores e a distncia que diferentes conceitos
mantm entre si para estes mesmos sujeitos.
Para efetuar estas anlises, os sete segmentos das escalas (itens)
so definidos por uma escala numrica da seguinte forma:

-3.-2.-1. 0 . +1 . +2 . +3

Somando-se os escores de cada item por fator e dividindo pelo


nmero de itens no fator, so obtidos os escores dos sujeitos nos trs
fatores para o conceito envolvido. Assim, 100 sujeitos avaliaram cinco
conceitos em nove escalas (trs para cada fator), resultando nos dados da
Tabela 4-6 (dados fictcios).
Tabela 4-6 Matriz de seis conceitos avaliados por 100 sujeitos em
nove escalas (dados fictcios)
ESCALAS CONCEITOS

Pai Heri Destino Guerra Paz


Bom Ruim Doce 3 3 0 -3 3
Amargo Agradvel 2 3 0 -3 2
Desagradvel Forte 2 2 -1 -3 3
Fraco Grande Pequeno 1 3 3 -2 2 3
Poderoso Impotente Ativo 1 3 3 3 1
Passivo Rpido Vagaroso 2 2 2 -2 3 0
Cortante Embotado 1 2 1 -3 1
1 3 2 1
0 0 2 1

Assim, o pai bom, bastante poderoso e algo ativo, ao passo que


guerra ruim, impotente e passiva, etc.
Alm dessa descrio dos conceitos, eles podem ser comparados,
verificando a distncia semntica entre eles atravs da frmula geral de
distncia:

onde Dij a distncia linear entre os conceitos i e I e dij a diferena


algbrica entre as coordenadas para os dois conceitos envolvidos. Por
exemplo, a distncia semntica entre os conceitos Heri e Destino : (3
- -l)2 + (3 - 0)2 + (3 - -2)2 = 50, sendo a raiz quadrada igual a 7,07, a qual
constitui a distncia semntica entre os dois conceitos. O clculo destas
distncias permite colocar os conceitos num espao n-dimensional,
formando uma estrutura espacial semntica, como na Figura 4-1,
sabendo-se que as distncias semnticas entre Pai e Heri de 2,06 e
entre Pai e Destino de 5,59.
As escalas de tipo diferencial semntico tm-se mostrado bastante
fidedignas, com ndices de preciso teste-reteste variando entre 0,83 a 0,91
(Osgood, Suci, Tannenbaum, 1957), chegando at a 0,97 (Jenkins, Russell,
Suei, 1957). Osgood e colaboradores (1957) apresentam tambm altos
ndices de validade concorrente do Diferencial Semntico com as escalas
de Thurstone (entre 0,74 e 0,82) e de Guttman (da ordem de 0,79).
Para o leitor brasileiro, h uma exposio clara e prtica da tcnica
de Osgood no livro O Diferencial Semntico: uma Tcnica de Medida nas
Cincias Humanas e Sociais, de CA. Alves Pereira (1986), Editora tica,
So Paulo.
Figura 4-1 Estrutura espacial semntica de trs conceitos.

O ENFOQUE DE FISHBEIN E AJZEN

Fishbein e Ajzen (1975) desenvolvem o seu modelo de escala sob


a Teoria da Ao Racional. A teoria e a tcnica destes autores esto
desenvolvidas no captulo 14, para o qual remetemos o leitor.

ESCALA MULTIDIMENSIONAL

Plo terico
As escalas at aqui apresentadas so ditas unidimensionais, porque
elas visam avaliar os sujeitos em apenas um trao psicolgico. Falando-se
de uma escala multifatorial, neste caso, entender-se-ia um conjunto de
vrias escalas, cada uma medindo um fator ou trao independentemente.
Entretanto, um objeto psicolgico pode ser avaliado sob vrios aspectos ou
traos simultaneamente. Por exemplo: um candidato presidncia pode ser
avaliado em termos de sua filiao partidria (liberal vs. conservador),
recebendo uma pontuao nesta escala; ao mesmo tempo e independen-
temente, ele pode ser avaliado em termos de sua juventude (jovem vs. velho),
recebendo nesta escala uma outra avaliao, independente da que recebeu na
primeira escala. Teramos aqui, ento, duas escalas unidimen-sionais,
produzindo dois escores independentes. Contudo, pode-se pedir uma avaliao
simultnea do candidato em termos de ambos os atributos, a saber, filiao
partidria e juventude. No primeiro caso, o candidato teria dois escores: um em
filiao partidria e outro em juventude. No segundo caso, entretanto, o
candidato receberia apenas um escore, mas definido em termos de duas
dimenses, que seria ilustrado num espao bidimensional, onde um ponto
expresso por duas coordenadas. Assim, o escore dele, neste caso, seria
expresso como Xij , e no por X e Xj. Continuando nesta ilustrao, o mesmo
candidato poderia ser avaliado numa srie de n traos simultaneamente, de
sorte que o escore dele poderia ser expresso num espao n-dimensional, com
tantos subscritos quantos os traos sob os quais ele foi avaliado. Estas so as
escalas multidimensionais. No caso de uma avaliao em termos de duas
dimenses, o escore do candidato poderia cair em qualquer um dos quatro
quadrantes que resultam do espao bidimensional, como na Figura 4-2, onde o
candidato Xise situa em (-1,2).

Figura 4-2 Sujeito X1 situado em um espao bidimensional.


Ao ser avaliada uma srie de candidatos, cada um deles seria
expresso por um ponto que se situaria num dos quadrantes. Os pontos
mantm uma relao de proximidade (distncia) entre si expressa
simultaneamente com respeito a dois traos: filiao partidria (eixo
horizontal) e juventude (eixo vertical). Para n dimenses, o ponto de cada
candidato teria, obviamente, proximidades entre si com respeito a n eixos
(num espao n-dimensional).

Plo experimental
A tcnica para levantar os dados de escalas multidimensionais
consiste em pedir ao(s) sujeito(s) para avaliar(em) um objeto psicolgico
(candidato), no em um trao de cada vez, mas em comparar vrios
objetos psicolgicos em vrios traos. Por exemplo: Dados os candi-
datos A B C D, avaliar se os candidatos A e B so mais semelhantes
(prximos, iguais, etc.) entre si que os candidatos C e D. Assim, a
tcnica para a coleta da informao usa termos que se referem a
"distncia psicolgica" ou "proximidade psicolgica". Esta proximidade
vem designada sob vrios termos, tais como parentesco, dependncia,
associao, complementaridade, substitutividade, proximidade,
distncia, interao, etc.
Um exemplo poder ilustrar os procedimentos da tcnica das
escalas multidimensionais. Suponha quatro candidatos presidncia (A,
B, C ,D). Os respondentes reagem instruo de emparelhar 2 a 2 os
candidatos e dizer qual o candidato preferido entre os dois (i > j). Deste
procedimento podem surgir os seguintes dados:

i
CANDIDATOS A B C D

j A 7
B 5 8-
C 3 6 9
D

O candidato A foi preferido 7 vezes a B, 5 vezes a C e 3 vezes a D,


etc. Estes nmeros podem ser considerados como indicando distncias
entre os candidatos e serem expressos numa matriz de distncias. Neste
caso, surge uma matriz simtrica, onde a distncia dij igual a dij e tendo
o valor 0 na diagonal, como segue (note que nem sempre d, deve ser
necessariamente igual a d ):
Com referncia ao plo analtico, a frmula para clculo das distncias
a frmula euclidiana normalmente utilizada para distncias, qual seja:

ou, sumariamente, dij

onde r corresponde ao nmero de dimenses (fatores) sob as quais os


candidatos foram avaliados no nosso caso, supostamente duas: filiao
partidria e juventude.
Para a determinao da dimensionalidade que subjaz s proximidades
encontradas entre os objetos psicolgicos avaliados (candidatos, no nosso
caso), h vrios enfoques estatsticos, tanto paramtricos quanto no-
paramtricos: Coombs' unfolding technique (Coombs, 1964), o modelo de
Tucker e Messick (Tucker, Messick, (963), o modelo de Torgerson (1958), o
modelo de Ekman (1963), etc. Para tanto, consultem-se Kruskal e Wish (1991)
e Delbeke(l968). Existe, igualmente, uma srie de programas de computador
para as anlises com escalas multidimensionais (Kruskal, Wish, 1991, p.79).
A tecnologia das escalas multidimensionais tem sido usada por
psiclogos, socilogos, antroplogos, economistas e educadores (Uslaner, apud
Kruskal, Wish, 1991). Seu uso em Psicologia, no entanto, no tem sido muito
extenso, apesar do seu carter promissor na determinao da dimensionalidade
nas preferncias psicolgicas dos indivduos. O carter de complexidade
estatstica talvez seja uma das razes para o pouco uso que se faz das escalas
multidimensionais.

PRINCIPIOS DE ELABORAO DE ESCALAS

Dado o grande uso que se faz das escalas, parece importante


apresentar alguns princpios e as etapas relevantes para a elaborao e
validao de tais escalas. A maioria dos princpios valem tambm para a
elaborao de qualquer instrumento psicomtrico.
H, pelo menos, trs grandes plos a serem levados em conta ao se
tentar elaborar escalas: os plos terico, emprico e analtico.
O plo terico enfoca a questo da teoria que deve fundamentar
qualquer empreendimento cientfico, no caso, a explicitao da teoria sobre o
construto ou objeto psicolgico para o qual se quer desenvolver um instrumento
de medida e a operacionalizao do construto em itens. Este plo explicita a
teoria do trao latente, bem como os tipos de comportamentos que constituem
uma representao adequada do mesmo trao.
O plo emprico ou experimental define as etapas e tcnicas da
aplicao de instrumento piloto e da coleta da informao para proceder
avaliao da qualidade psicomtrica da escala.
O plo analtico estabelece os procedimentos de anlises estatsticas a
serem efetuadas sobre os dados para levar a um instrumento vlido, preciso e,
se for o caso, normatizado.
A Figura 4-3 mostra o organograma destes procedimentos.

Fig. 4-3 Organograma para elaborao de escalas de medida psicolgica.


Os procedimentos tericos devem ser elaborados para cada escala,
dependendo, portanto, da literatura existente sobre o construto psicolgico
que a escala pretende medir. A teoria , infelizmente ainda, a parte mais
fraca da pesquisa e do conhecimento psicolgico, o que tem como conse-
qncia a precariedade dos atuais instrumentos psicomtricos de medida
nesta rea. Na verdade, os instrumentos baseados numa teoria psicolgica
prvia mais elaborada (por exemplo, Edwards Personal Preference
Schedule) no so dos melhores no mercado. Tal ocorrncia explica por
que os psicometristas sistematicamente fogem da explicitao de uma
teoria preliminar e iniciam a construo do instrumento pela coleta intuitiva
e mais ou menos aleatria de uma amostra de itens que dizem possuir
face validity, isto , que parecem cobrir o trao para o qual eles querem
elaborar o instrumento de medida. Embora isto no parea muito cientfico,
infelizmente o que ocorre mais freqentemente na construo de
instrumental psicolgico. A inexistncia de teorias slidas sobre um
construto no deve ser desculpa para o psicometrista fugir de toda a espe-
culao terica sobre o mesmo. obrigao dele levantar, pelo menos,
toda a evidncia emprica sobre o construto e procurar sistematiz-la e,
assim, chegar a uma miniteoria sobre o mesmo para gui-lo na elaborao
de um instrumento de medida para o tal construto. Apesar do avano e
sofisticao estatsticos na psicometria, parece ser esta fraqueza da base
terica que vem maculando a imagem dos procedimentos psicomtricos
na observao dos fenmenos psicolgicos. Na verdade, com uma base
terica coerente e, quanto possvel, completa, torna-se vivel uma
definio dos tipos e caractersticas dos comportamentos que iro
constituir a representao emprica dos traos latentes e, assim, operacio-
naliz-los adequadamente (isto , a construo dos itens se torna
coerente e adequada).
Os procedimentos analticos so encontrados na literatura psicom-
trica e estatstica (vide cap. 6). Acrescentamos aqui apenas uma coletnea
de regras teis para a construo dos itens, que tipicamente constitui a
parte mais laboriosa na elaborao das escalas.
A construo dos itens deve seguir certos requisitos, que podem ser
explicitados nas regras ou critrios seguintes:
1 Critrio comportamentali o item deve expressar um compor-
tamento, no uma abstrao ou construto. Segundo Mager (1981), o item
deve poder permitir ao sujeito uma ao clara e precisa, de sorte que se
possa dizer a ele "v e faa". Assim, 'reproduzir um texto' um item
comportamental (v e reproduza...), ao passo que 'compreender um texto'
no o , pois o sujeito no sabe o que fazer com 'v e compreenda...'.
2 Critrio de objetividade ou de desejabilidade: para o caso
de escalas de aptido, os itens devem cobrir comportamentos de fato,
permitindo uma resposta certa ou errada. Para o caso das atitudes e de
personalidade em geral, os itens devem cobrir comportamentos desejveis
(atitude) ou caractersticos (personalidade). O respondente, neste caso,
deve poder concordar ou discordar ou opinar sobre se tal comportamento
convm ou no para ele, isto , os itens devem expressar desejabilidade
ou preferncia.
3 Critrio da simplicidade: um item deve expressar uma nica
idia. Itens que introduzem explicaes de termos ou oferecem razes ou
justificativas so normalmente confusos, porque introduzem idias variadas
e confundem o respondente. Por exemplo: "Gosto de feijo porque
saudvel". O sujeito pode de fato gostar de feijo, mas no porque seja
saudvel; assim, ele no saberia como reagir a tal item: se porque o feijo
gostoso ou porque saudvel. O item exprime duas idias.
4 Critrio da clareza: o item deve ser inteligvel at para o estrato
mais baixo da populao meta; da, utilizar frases curtas, com expresses
simples e inequvocas. Frases longas e negativas incorrem facilmente na
falta de clareza.
5 Critrio da relevncia (pertinncia, saturao, unidimensional-
dade, correspondncia): a expresso (frase) deve ser consistente com o
trao (atributo, fator, propriedade psicolgica) definido e com as outras
frases que cobrem o mesmo atributo. Isto , o item no deve insinuar
atributo diferente do definido. O critrio diz respeito saturao que o item
tem com o construto, representada pela carga fatorial na anlise fatorial e
que constitui a covariancia (correlao) entre o item e o fator (trao).
6 Critrio da preciso: o item deve possuir uma posio definida
no contnuo do atributo e ser distinto dos demais itens que cobrem o
mesmo contnuo. Este critrio supe que o item possa ser localizado numa
escala de estmulos; em termos de Thurstone, diramos que o item deve ter
uma posio escalar modal definida e um desvio padro reduzido. Em
termos da IRT, este critrio representa o parmetro 'b' (dificuldade) e pode
realmente ser avaliado definitivamente somente aps coleta de dados
empricos sobre os itens.
7 Critrio da amplitude: este critrio de fato se refere escala total
e afirma que o conjunto dos itens referentes ao mesmo atributo deve cobrir
toda a extenso de magnitude do contnuo deste atributo. Critrio nova-
mente satisfeito pela anlise da distribuio dos parmetros 'b' da IRT.
8 Critrio do equilbrio: os itens do mesmo contnuo devem
cobrir igualmente ou proporcionalmente todos os segmentos (setores) do
contnuo, devendo haver, portanto, itens fceis, difceis e mdios (para
aptides) ou fracos, moderados e extremos (no caso das atitudes). De fato,
os itens devem se distribuir sobre o contnuo numa distribuio que se
assemelha da curva normal: maior parte dos itens de dificuldade
mediana e diminuindo progressivamente em direo s caudas (itens
fceis e itens difceis em nmero menor).
9 Critrio da variedade: dois aspectos especificam este critrio:
a) variar a linguagem: uso dos mesmos termos em todos os itens confunde
as frases e dificulta diferenci-las, alm de provocar monotonia, cansao
e aborrecimento; b) no caso de escalas de preferncias: formular a metade
dos itens em termos favorveis e metade em termos desfavorveis, para
evitar erro da resposta estereotipada esquerda ou direita da escala de
resposta.
10 Critrio da modalidade: formular frases com expresses de
reao modal, isto , no utilizar expresses extremadas, como 'excelente',
'miservel', etc. Assim, ningum infinitamente inteligente, mas a maioria
bastante inteligente.
11 Critrio da tipicidade: formar frases com expresses condi-
zentes (tpicas, prprias, inerentes) com o atributo. Assim, a beleza no
pesada, nem grossa, nem nojenta.
12 Critrio da credibilidade (face validity): o item deve ser
formulado de modo que no aparea sendo ridculo, despropositado ou
infantil. Itens com esta ltima caracterizao fazem o adulto se sentir
ofendido, irritado ou coisa similar. Enfim, a formulao do item pode
contribuir e contribui (Nevo, 1985; Nevo, Sfez, 1985) para uma atitude
desfavorvel para com o teste e assim aumentar os erros (vieses) de
resposta. Este tema, s vezes, discutido sob o que se chama de validade
aparente (face validity), que no tem nada a ver com a validade objetiva do
teste, mas pode afetar negativamente a resposta ao teste, ao afetar o
indivduo respondente.

CONCLUSO

Apesar dos muitos problemas que ainda existem na teoria da


medida em cincias sociais e do comportamento, o uso de escalas,
especialmente em Psicologia Social e da Personalidade, alm de
apresentar uma histria de mais de meio sculo, ainda muito difundido.
Esta ocorrncia no pode ser considerada fortuita, mas deve proceder do
fato de que as medidas escalares so capazes de produzir conhecimento
vlido nas cincias do comportamento. As vrias tcnicas expostas (Likert,
Thurstone, Guttman, etc.) tm apresentado razovel consistncia, tanto em
sua estrutura interna quanto nos resultados obtidos atravs delas. Todas
essas tcnicas, na verdade, oferecem procedimentos estatsticos que
permitem avaliar essa consistncia interna. Quanto consistncia dos
resultados que produzem, a situao das escalas existentes e as prprias
tcnicas propostas para a sua construo no aparecem ainda como
empolgantes. possvel, e qui provvel, que este fenmeno se deva em
grande parte falta de definio mais precisa destas mesmas tcnicas
quanto aos procedimentos tericos envolvidos na elaborao dos
instrumentos. H uma preocupao grande, e louvvel, referente
adequao dos procedimentos estatsticos, mas estes no do dicas
fundamentais quanto ao verdadeiro problema da escala, que a cons-
truo de um instrumento vlido, isto , que de fato esteja medindo algo de
psicologicamente relevante. Sem uma boa teoria psicolgica que a fun-
damente, a escala pode at aparecer estatisticamente perfeita e consis-
tente, mas medindo nada de relevante ou medindo algo desconhecido.

REFERNCIAS BIBLIOGRFICAS

ALBANESE. MA., FORSYTH, R.A. The one-, two- and modified two-parameter latent trait
models: an empirical study of relative fit. Educational and Psychological Measurement.
Durham (NC), v.44 n.2, p.229-246, 1984.
BALLIN. M.. FARNSWORTH, P.R. A graphic rating method for determining the scale values
of statements in measuring social attitudes. Journal of Social Psychology. Provincetown
(MA), v.13, p.323-327.1941.
BENDIG. AW. Reliability and the number of rating scale categories. Journal of Applied
Psychology. Washington, D.C., v.38, p.38-40. 1954.
BIRD, C. Social psychology. New York: Appleton-Century-Crofts. 1940.
BIRNBAUN, A. Some latent trait models and their use of inferring an examinee's ability. In:
LORD, F.M., NOVICK, M.R. (Eds.). Statistical theories of mental test scores. Reading
(MA): Addison-Wesley, 1968.
CAMPBELL, N.R. An account of the principles of measurement and calculations. London:
Longmans Green, 1928.
-------------- . Symposium: Measurement and its importance for philosophy. Proceedings Aristot.
Society Suppl.. London, v.17, p.121-142. 1938.
COOMBS, C.H. A theory of data. New York: Wiley. 1964.
DE BRUYNE, P., HERMAN, J DE SCHOUTHEETE, M. Dinmica da pesquisa em cincias
sociais. .Ved. Rio de Janeiro: Francisco Alves. s.d.
DEBETS. P.. BROUWER. E.. SIJTSMA, K., MOLENAAR, I.W. MSP: a computer program for
item analysis according to a nonparametric IRT approach. Educational and Psychological
Measurement. Durham (NC), v.49. n.3. p.609-613, 1989.
DEBETS. P., BROUWER, E. MSP: a program for Mokken Scale analysis for polychotomous
items. Groningen: IEC ProGAMMA, 1989.
DELBEKE, L. Construction of preference spaces. Louvain: Publications of the University of
Louvain, 1968.
EDWARDS, AL. Techniques of attitude scale construction. New York: Appleton-Century-
Crofts. 1957.
EDWARDS. AL., KENNY, K.C. A comparison of the Thurstone and Likert techniques of
attitude scale construction. Journal of Applied Psychology, Washington, D.C., v.53, p. 72-
83, 1946.
EDWARDS, A.L, KILPATRICK, F.P. A technique for the construction of attitude scales. Journal of
Applied Psychology, Washington, D.C., v.32, p.374-384, 1948.
EKMAN. P. (s.n.t.) 1963.
FISHBEIN, M. AJZEN, I. Beliefs, attitude and intention: an introduction to theory and research. Reading
(MA): Wesley, 1975.
GOLDSAMT, M.R. Effects of scoring method and rating scale length in extreme response style
measurement. College Park (MD): University of Maryland, 1971. (Unpublished doctoral
dissertation)
GUILFORD, J.P. Psychometric methods. 2ed. New York: McGraw-Hill, 1954.
GUTTMAN, L. A basis for scaling qualitative data. American Sociological Review, Washington,
D.C..V.9, p.139-150. 1944.
---------------- . The basis for scalogram analysis. In: STOUFFER, SA. et al. Measurement and
prediction. Princeton (NJ): Princeton University Press, 1950. p.60-69.
. The Cornell technique for scale and intensity analysis. Educational and Psycholog
ical Measurement. Durham (NC), v.7, p.247-280, 1947.
---------------- . The problem of attitude and opinion measurement. In: STOUFFER, S.A. et al.
Measurement and prediction. Princeton (NJ): Princeton University Press. 1950. p.46-59.
--------------- . On Festinger's evaluation of scale analysis. Psychological Bulletin. Washington,
D.C., V.44, p.451-465, 1947.
---------------- . Questions and answers about scale analysis. Research Branch, Information and
Education Division, Army Service Forces. Report D-2. 1945.
JENKINS. J.J., RUSSELL, W.A., SUCI. G.J. An atlas of semantic profiles for 360 words. In: Studies on
the role of language in behavior. Tech. Rep. No. 15. Minneapolis: University of Minnesota, 1957.
JONES, R.R. Differences in response consistency and subject's preferences for three personality
inventory response formats. Proceedings of the 67th Annual Convention of the American
Psychological Association, v.3, p.247-248, 1968.
KOMORITA. S.S. Attitude content, intensity, and the neutral point on a Likert scale. Journal of Social
Psychology. Provincetown (MA), v.61, p.327-334, 1963.
KRUSKAL, J.B., WISH, M. Multidimensional scaling. Newbury Park (CA): Sage Publications, 1991.
LIKERT, R. A technique for the measurement of attitudes. Archives of Psychology . v. 140, 1932.
LORD, F.M. A theory of test scores. Psychometric Monograph, Chicago (IL), n.l, 1952.
---------------- .Applications of item-response theory to practical testing problems. Hillsdale (NJ):
Lawrence Erlbaum, 1980.
MAGER, R.F. Medindo os objetivos de ensino ou "conseguiu um par adequado". Porto Alegre: Globo,
1981.
MATELL, M.S., JACOBY, J. Is there an optimal number of alternatives for Likert-scale items? Journal of
Applied Psychology. Washington, D.C., v.56, n.6, p.506-509, 1972.
---------------- . Is there an optimal number of Likert scale items? Study I: Reliability and validity.
Educational and Psychological Measurement, Durhan (NC), v.31, p.657-674, 1971.
MOLENAAR, I.W., SIJTSMA, K Mokken's approach to reliability estimation extended to multicategory
items. Kwant'rtatieve Methoden. Rotterdam, v.9 n.28, p.l 15-126,1988.
NEVO, B. Face validity revisited. Journal of Educational Measurement, Washington. DC, v.22, p.287-
293, 1985.
NEVO, B., SFEZ, J. Examinees' feedback questionnaires. Assessment and Evaluation in Higher
Education, Bath, v. 10, p.236-249, 1985.
OSGOOD, C.E., SUCI, G.J., TANNENBAUM, PH. The measurement of meaning. Urbana (IL):
University of Illinois Press, 1957.
----------------. A measure of relation determined by both mean difference and profile information.
Psychological Bulletin, Washington, D.C., v.49, p.251-262.
PEREIRA, CA. Alves. O diferencial semntico: uma tcnica de medida nas ciencias humanas e sociais.
So Paulo: tica, 1986.
POPPER, K.R. A lgica da pesquisa cientifica. So Paulo: Cultrix, 1972.
RASCH, G. Probabilistic models for some intelligence and attainment tests. Copenhagen: Danish
Institute for Educational Research, 1960.
SAFFIR, M.A. A comparative study of scales constructed by three psycho-physical methods.
Psychometrika, v.2, p. 179-198, 1937.
SEASHORE, R.H., HEVNER, K. A time-saving device for the construction of attitude scales. Journal of
Social Psychology, Provincetown (MA), v.4, p.366-372, 1933.
SIEGEL, S. Nonparametric statistics for the behavioral sciences. New York: McGraw-Hill, 1956.
SIJTSMA, K., DEBETS, P., MOLENAAR, I.W. Mokken scale analysis for polychotomous items: theory,
a computer program and an empirical application. Quality & Quantity, apud DEBETS, P..
BROUWER, E., SIJTSMA, K., MOLENAAR, I.W. MSP: a computer program for item analysis
according to a nonparametric IRT approach. Educational and Psychological Measurement, Durham
(NC), v.49 n.3, p.609-613, 1989.
STEVENS, S.S. Mathematics, measurement, and psychophysics. In: STEVENS, S.S. (Ed.). Handbook
of experimental psychology. New York: Wiley, 1951. p.1-49.
THURSTONE, L.L. A law of comparative judgment. Psychological Review, Washington, D.C., V.34,
p.273-286, 1927.
----------------. Psychophysical analysis. American Journal of Psychology, Champaign (IL), v.38,
p.368-389, 1927.
--------------- . The method of paired comparisons for social values. Journal of Abnormal and Social
Psychology, v.21, p.384-400, 1927.
--------------- . Equally often noticed differences. Journal ot Educational Psychology. Washington,
D.C.,v.l8,p.289-293, 1927.
THURSTONE. L.L, CHAVE, E.J. The measurement of attitude. Chicago (IL): University of Chicago
Press, 1929.
TORGERSON, W.S. Theory and methods of scaling. New York: Wiley, 1958.
TUCKER, L.R., MESSICK, S. An individual differences model for multidimensional scaling.
Psychometrika, v.28, p.333-367, 1963.
VAN DR VEER, F., HOWARD, K.I., AUSTRIA, A.M. Stability and equivalence scores based on three
different response formats. Proceedings of the 78th Annual Convention of the American
Psychological Association, v.5, p.99-100, 1970.
WEBB, S.C. A generalized scale for measuring interest in science subjects. Educational and
Psychological Measurement, Durham (NC), v.ll, p.456-469, 1951.
CAPITULO 5

ESCALAGEM PSICOLGICA UNIDIMENSIONAL

Jorge de Souza
Departamento de Economa Universidade
Federal de Pernambuco

D
esde os primeiros estudos da psicofisica alem, na segunda
metade do sculo XIX, os psicometristas lidam com o problema de
ordenao de um conjunto de estmulos ou objetos psicolgicos
relativamente a uma de suas propriedades. D-se o caso, por exemplo,
quando os sujeitos do experimento, juizes ou examinandos, so instados
a manifestarem-se sobre qual o sinal sonoro, entre dois sinais a eles
submetidos, o mais intenso. Postos, assim, diante de um conjunto de
sinais sonoros expostos dois a dois, os juizes do as suas respostas, e
o objetivo do experimento obter uma ordenao ascendente dos
estmulos quanto s suas intensidades. Essa mesma ordenao
comparada com a correspondente ordem natural sob controle do
pesquisador. Quanto mais elevada for a compatibilidade entre as duas
seqncias, maior a acuidade perceptiva do examinando.
Sob esse enfoque, os diversos sentidos da percepo humana,
como a viso, a audio, a sensao de peso, etc, foram investigados na
psicofisica e, a partir deles, estabeleceram-se as chamadas leis da
psicofisica.
Retomando essas idias no sculo XX, Louis Thurstone, o grande
psicossociometrista norte-americano, concebeu uma situao mais geral
e pde estender as idias da psicofisica a uma classe mais ampla de
problemas que envolviam o conceito de trao psicolgico. O trao
psicolgico uma propriedade ou uma varivel de carter latente e,
portanto, no diretamente observvel ligada a algum sujeito ou objeto
de investigao. Enquadra-se nessa ordem, por exemplo, a varivel
latente que leva os consumidores a manifestarem suas preferncias entre
diversas marcas de um produto ou os cidados a escolherem seus
polticos preferidos num elenco de homens pblicos.
Algumas das teorias psicomtricas sobre o tratamento deste tema
so o objeto deste captulo.
O MODELO DOS JULGAMENTOS COMPARATIVOS

Para o propsito de formalizao matemtica, considere-se o con-


junto {O1, 02, ..., Om} constituido pelos m objetos psicolgicos ou
estmulos O1, 02, ..., Om. Esses estmulos, quando submetidos aos
julgamentos de n juizes ou examinandos J1 J2, ..., Jn, suscitam reaes
comparativas relativamente ao trao psicolgico, psicofisico ou paranor-
mal que eles representam. Dois modelos estatsticos de reao dos juizes
aos estmulos ressaltam neste captulo:
I) se aos juizes so apresentados os pares de estmulos (Oi, Oj)
(>j), eles enunciam suas preferncias, que podem ser dos dois tipos
seguintes:
Oi ]Oj (o juiz prefere Oi a Oj)
Oi ]Oj (o juiz prefere Oi a Oj), no sendo consideradas aqui nem a
omisso da opinio e nem tampouco a indiferena no julgamento;
II) se aos juizes so apresentados todos os m estmulos O1,, O2, ...,
Om, eles manifestam suas preferncias atravs de uma ordenao decres
cente na intensidade com que o trao psicolgico, segundo seus juzos,
est neles contido. Essa ordenao genrica representada pela seqn
cia Oi1 ] Oi2 ] ... ] Oim, onde (i1, 2, ..., im) uma permutao qualquer
dos objetos.
O primeiro tipo de reao d origem ao chamado modelo dos jul-
gamentos comparativos e o segundo nomeia o denominado modelo dos
julgamentos categorizados. Ambos so atribudos ao engenho estatstico de
Louis Thurstone (1927).
Duas situaes, bem simples e cotidianas, podem ilustrar o que
acima se descreveu:
I) em uma pesquisa poltica, os estmulos podem representar
alguns lderes polticos, os juizes so uma amostra de eleitores e o trao
psicolgico medido pode ser a preferncia ideolgica;
II) Em uma pesquisa mercadolgica, os estmulos podem signi
ficar as diversas marcas de um produto, os juizes constituem uma amostra
de consumidores e o trao psicolgico pode ser a simples preferncia
pela marca.
As duas situaes enunciadas escondem, na realidade, algumas
questes relevantes no estudo dos problemas comportamentais atravs de
modelos estatsticos. Com efeito, em ambos os exemplos fica patenteada
a idia, bastante geral, de que se lida com uma amostra de examinandos
e no com a sua totalidade ou a populao. Esta restrio conduz,
claro, a um problema de inferncia estatstica concernente induo
emprica. Quanto aos estmulos, muitas vzes, tambm se lida com uma
amostra obtida de uma populao de infinitas possibilidades. Diz-se, neste
caso, que os estmulos escolhidos constituem manifestaes do trao psi-
colgico estudado e que a populao de todas as manifestaes possveis do
trao o seu universo de contedo. H, desse modo, um segundo tipo de
problema inducional, chamado por Hotelling de inferncia psicolgica
(Hotelling, 1933).
O modelo dos julgamentos comparativos admite a existncia de um
continuum psicolgico, onde todo examinando ou juiz faz a sua
avaliao do contedo do trao contido em cada estmulo ou objeto
psicolgico. Esse mecanismo de avaliao inconsciente, e cada juiz por
eles manifesta a sua preferncia aps comparar as avaliaes efetuadas
no continuum psicolgico. As avaliaes do contedo, independentemente
dos juizes que as efetuam, so denominadas de valores de escala do
estmulo. Dessa maneira, um valor de escala seria a medida verdadeira
do contedo do trao existente no estmulo. Entretanto, h que se convir
que as avaliaes do contedo do trao em um dado objeto psicolgico
podem variar de juiz a juiz ou, para um mesmo juiz, flutuar segundo o
instante de medio. No primeiro caso, est-se estudando um problema
de Psicologia Diferencial e, no segundo, um problema de Psicologia
Comportamental.
O modelo dos julgamentos comparativos pode ser imaginado,
segundo as descries anteriores, como se a avaliao de um juiz gen-
rico a um estmulo Oi fosse uma varivel aleatria Xi cuja esperana
matemtica E[Xi] representa o valor de escala do objeto psicolgico O (i
- 1, 2, ..., m). Essa concluso implica dizer que as avaliaes Xi dos
juizes flutuam em torno do valor de escala i a menos de um erro aleatrio
e, de esperana matemtica nula, ou seja, que

(5.1)

onde E[E] = 0 e sendo desconhecido (i = 1, 2,..., m).


A regra decisoria, de carter estatstico, alm de inconsciente ou la-
tente e que possibilita a um juiz genrico optar por um dos estmulos O ou
Pj a seguinte: "Oi ] Oj, ou seja, prefere Oi a Oj, se e somente se Xi > Xj
onde Xi e Xj so as avaliaes do trao psicolgico feitas pelo juiz e que,
na realidade, so desconhecidas". Essa regra de deciso estabelece,
assim, uma relao de correspondncia entre plano psicolgico ou
mental e o plano de opinies, de acordo com o esquema seguinte:

PLANO PSICOLGICO PLANO DE OPINIES


Xi > Xj Oi ] Oj
xi < xj oi [ oj
Considerando, agora, a natureza probabilistica da deciso mental a
partir das avaliaes individuais dos juizes, pode-se estabelecer a se-
guinte equao para caracterizar o modelo dos julgamentos comparativos:

(5.2)

isto , so iguais as probabilidades da preferncia de Oi relativamente a


Oj e do evento que expressa o fato de o valor de escala de Oi
ser maior do que o correspondente valor de escala de Oj.
O modelo se completa, desde o ponto de vista estatstico, com a
especificao de algumas propriedades adicionais relativas s distribui-
es de probabilidades das m variveis aleatrias repre-
sentativas dos erros. Louis Thurstone formulou, em 1929, as hipteses de
que os m erros tm distribuies normais, mediante as
seguintes especificaes numricas:
i) (i = 1, 2,..., m), isto , os erros tm esperanas matemticas
nulas;
ii) (i = 1,2 ..... m), ou seja, os erros i, tm varincias iguais
a ";
ii) Corr (i, j = 1, 2,..., m), isto , os erros i, e j tm coeficien-
tes de correlao igual a ij
Sob tais hipteses, laborando em torno da equao 5.2, pode-se
escrever que

(5.3)

Tendo em vista que a varivel aleatria correspondente ao primeiro


membro da desigualdade tem distribuio normal (0,1), resulta que

onde ij = Prob [Oi > Oj] representa a probabilidade da preferncia Oi ] Oj


Agora, fazendo
(5.5)

Fig. 5-1

Dessa maneira, a partir da ltima conveno estabelecida em (5.4),


pode-se escrever que

(5.6)
Ao modelo por esse modo caracterizado d-se o nome de modelo
de julgamentos comparativos de Thurstone.

O sistema de equaes estabelecido em (5.4) constitudo por

equaes e pelas 2m incgnitas adicionais

s incgnitas referentes s correlaes, ou seja, o sistema

subidentificado por possuir equaes e


incgnitas.

O seu caso particular mais simples pressupe que sejam iguais as


varincias dos erros e nulas as correlaes entre eles, isto ,
Nessas circunstncias, pode-se escrever o sistema de
equaes anterior como ou, ainda, como
donde se conclui que

(5.7)

O fator apenas afeta multiplicativamente os valores de escala

e pode ser desprezado desde que se interpretem os resultados numa


escala ordinal. Dessas digresses resulta que os m valores de escala
devem ser estimados atravs de um sistema superidentificado formado
pelas equaes

(5.8)

Ele pode ser resolvido, por exemplo, atravs do mtodo dos mnimos
quadrados, onde deve ser minimizada a funo
Derivando-se relativamente aos valores de escala, encontra-se que

e assim sucessivamente.

Em geral, tem-se que e, portanto, os esti-

madores mnimo-quadrticos dos valores de escala dos

objetos psicolgicos sero dados pela soluo das equaes

= 0 (i=1, 2, .... m-1), ou seja:

(i=1, 2

................................................................ m-1)

Simtricamente, a soma poderia ser obtida com j < i e isto eqivale-


ria a escrever

Adicionando essas duas

equaes, tem-se que


ou ainda, somando e subtraindo , do primeiro membro dessa ltima
equao
Impondo-se a restrio de que = 0, o que equivale apenas a

mudar a origem dos valores de escala, tem-se que

Convencionando-se, agora, sem nenhuma perda de generalidade,

que zii = 0 (=1,2, ..., m), tem-se que ou seja,


ou, finalmente, em razo do mesmo argumento de simetria sobre os valo-
res de z:

(5.9) ( / = 1 , 2 ......................m).

Esta ltima expresso permite concluir que o valor de escala


estimado do objeto psicolgico 0 (i = 1,2,..., m) s pode ser interpre-
tado numa escala ordinal e seu valor encontrado considerando as fre-
qncias relativas = Freq Rel [Oi ] Oj das preferncias que
sobrepem O, ao estmulo O, e aos correspondentes zij, valores da
curva normal padronizada, de acordo com a Figura 5-1.0 valor de
escala , a mdia

onde se convencionou que zii = 0.

O MODELO DOS JULGAMENTOS CATEGRICOS

Thurstone seguiu ainda uma outra ordem de idias, a fim de explicar


o processo decisrio de preferncias dos juizes ou examinadores. Desse
modo, se no modelo dos julgamentos comparativos os juizes faziam
avaliaes das intensidades dos estmulos no chamado continuum
psicolgico, agora, seguindo uma outra formulao, Thurstone admitiu que
os juizes julgavam os estmulos localizando-os em um conjunto ordenado
de categorias representadas por intervalos do mesmo continuum psicolgi-
co. Nesse caso, deve-se atribuir valores de escala no s aos estmulos
como, igualmente, aos limites que definem as diversas categorias do
continuum psicolgico onde os estmulos so classificados. Suponha,
assim, em razo disso, que os m estmulos ou objetos psicolgicos O1, O2
.... Om devam ser classificados pelos juizes em um dos seguintes k
intervalos que constituem uma partio do continuum psicolgico
, (ck, +), naturalmente ordenados de
modo ascendente, sendo essa ordenao simbolizada pela seqncia
I
Por outro lado, sendo , o valor de escala do estmulo
m), a regra decisria mental de cada juiz estabelecida pela seguinte
equivalncia lgica: "O estmulo Oi classificado em um dos j primeiros
intervalos se e somente se seu valor de escala
menor ou igual ao valor extremo cj do intervalo de maior intensidade".
Desde um ponto de vista eminentemente simblico, essa regra pode ser
representada do seguinte modo: se e somente se
, onde o j-simo intervalo da partio".
Impe-se considerar, ainda, no referente a esse novo modelo, que os k
intervalos I1,, l2,..., Ik em que so classificados os m estmulos O1, O2, ..., Om,
podem ser vistos como representantes de uma ordenao em que, sendo k < m,
os estmulos so classificados nos lugares 1, 2.,... e k-simo, havendo,
portanto, a necessidade de alguns empates. No caso em que se tem k = m, ou
seja, quando o nmero de intervalos classificat-rios coincide com o nmero de
estmulos, esses empates j no so permitidos.
O mtodo da categorizao de Thurstone de uso aconselhvel, por
exemplo, quando o nmero de estmulos grande. Com efeito, a comparao
por pares no modelo dos julgamentos comparativos exige de cada
juiz a manifestao de julgamentos, enquanto no modelo de ca-

tegorizao os julgamentos correspondentes so em menor nmero.

Pelas razes j consideradas anteriormente, tanto as diferenciaes nos


julgamentos dos juizes quanto as prprias variaes temporais dos seus
comportamentos levam agora substituio dos valores de escala i e Cj por
variveis aleatrias i, e j, nessa ordem, alm, claro, da mudana da regra
decisria para a sua correspondente expresso probabilistica na categorizao.
Nessas circunstncias, tendo em vista o carter classificatrio do modelo,
designar-se- por a probabilidade de que
o estmulo Oi seja classificado em uma das j primeiras categorias representadas
pelos intervalos I1,, I2, ..., I3, ou seja:

(5.10)

onde o superindice (A) designa o fato de que se trata de uma probabilidade


acumulada. Do exposto, ento, pode-se afirmar que tal probabilidade expressa-
se em termos dos valores da escala aleatorizada, atravs da
equao (i = 1, 2,..., m; j = 1, 2,..., k)
Thurstone impe, tambm s variveis aleatrias alm da

normalidade de suas distribuies, as seguintes estatsticas:


i)(- 1,2, ...,m)
) (j= 1,2,..., k)
iii) so nulas todas as correlaes entre as variveis aleatrias.
Tratando a ltima expresso da probabilidade acumulada do mesmo
modo que no modelo dos julgamentos comparativos, pode-se concluir fa-
cilmente que

(5.11)

Do mesmo modo, considerando que as variveis aleatrias de


escalagem tm distribuies normais, alm de
incorrelacionadas, pode-se escrever que

ou seja:
, ou
ainda

Supondo que sejam constantes as varincias e, portanto,


sem perda de generalidade, fazendo-se
2, ..., K), chega-se ao seguinte sistema de equaes
m; j = 1,2,..., K), onde zij representa a abcissa da curva normal tal que a
rea sua esquerda corresponde probabilidade do estmulo Oi estar nos j
ltimos lugares de preferncias dos juizes.

Fig. 5-2

A estimao mnimo-quadrtica dos m + k parmetros objeto de


minimizao da funo
Derivando-a relativamente a e cj e escrevendo as equaes de Ia
ordem de otimizao, obtm-se as equaes:
(i = 1, 2,..., m; j=l,2, ...,k)

donde se conclui que

(i- 1,2, ...,m; j= 1,2, ..., k)

ou ainda, equivocantemente,

(i- 1,2, ..., m; j= 1,2,..., k).

Convencionando tambm que o que no implica nenhu-

ma perda de generalidade, obtm-se a expresso

(5.12) (j = 1, 2...................... k)

Substituindo esse resultado nas primeiras equaes tem-se que

, ou seja,

ou, ainda, que

( / = 1.2........ m).

Tendo em vista a interpretao estritamente ordinal que se d aos


valores de escala dos estmulos, conclui-se que

(/= 1, 2 .......... m) ou, finalmente,

(5.13)
O MODELO DE LUCE

Ainda sob o mesmo enfoque metodolgico dos modelos de


Thurstone, pode-se desenvolver um outro modelo, devido a Luce (1963)
e que possibilita aos juizes a natural opo por uma indiferena ou empate
entre os estmulos, o que muito freqente no comportamento humano.
Considere-se, para esse fim, a correspondente extenso do modelo
dos julgamentos comparativos de Thurstone ao caso em que os juizes
podem optar por um empate entre as intensidades de dois estmulos.
Desse modo, desde o ponto de vista decisional, aos valores de escala i
(1-1,2,..., m) acrescenta-se ao modelo de Luce um parmetro "e" positivo
(e > 0), de tal modo que os novos critrios de manifestao dos juizes so
agora exprimidos do seguinte modo:

se e somente se se e
(5.14)
somente se
em que o smbolo denota o empate entre os
estmulos O e Oj e o parmetro "e" positivo uma espcie de limiar que,
se no ultrapassado, impede a discriminao entre os estmulos Oi e Oj
desde o ponto de vista da manifestao de uma preferncia. Pela mesma
ordem de idias usadas anteriormente, transformam-se essas regras
para a correspondente verso probabilistica, ou seja, impem-se, agora,
os seguintes critrios decisorios de carter estatstico:

(5.15)

onde n uma varivel aleatria normal com mdia igual a e e varincia


igual a 2, e ij, denota a probabilidade do empate ou indiferena Oi, = Oj.
Operando de modo anlogo quele do modelo de Thurstone, conce-
bem-se as seguintes relaes:

(5.16)

(5.17)

Seja, agora, o valor da abcissa da curva normal (0,1 )


correspondente preferncia ou seja, a abcissa cuja rea sua
direita, sob essa curva, igual a . Da, vem que
(5.18)

A preferncia inversa Oi ] Oj, por outro lado, fica caracterizada pela


correspondente equao
Fazendo agora

(5.19)

onde zi[j a abcissa da curva normal (0,1) cuja rea esquerda desse
valor igual a nji; deve-se notar que, desse modo, para o modelo Luce,
encontram-se duas abcissas, de acordo com a figura 5-3.

Fig. 5-3

Supondo agora, tal como no modelo de Thurstone, inter-relacionadas


todas as variveis aleatrias, torna-se claro que se tem

e, assim, pode-se escrever que

(5.20)

(5.21)
Supondo, tambm, simplificadamente, que as varincias i
sejam independentes dos estmulos, concebe-se
que ser constante e, desse modo, pode-se faz-la
unitria porque esta hiptese corresponde apenas a uma mudana de
escala nos valores de escala, sempre interpretados na escala ordinal.
Desse modo, somando e subtraindo as duas equaes anteriores,
obtm-se as expresses

Diante das manifestaes colhidas de n juizes, escrevem-se as


seguintes expresses para os estimadores naturais , e (i = 1, 2,..., m),
dos parmetros do modelo:

(5.22)

(5.23)

Impondo, agora, do mesmo modo que antes aos


estimadores , (i= 1,2,..., m) a condio = 0, chega-se
facilmente expresso final

(5.24)

O MODELO DE BRADLEY- TERRY

Bradley e Terry (1952) consideraram uma outra linha de argumen-


tao para escalar um conjunto de m estmulos ou objetos psicolgicos
baseados, ainda, no mesmo mtodo das pareaes, ou seja, na compa-
rao de todos os pares de estmulos efetuada por n juizes. Eles supuse-
ram. Dar isso, que a cada estmulo O, est associado um valor de escala
(i - 1, 2, ..., m) e que, para um juiz genrico, a probabilidade da
preferncia O, ] Oj definida pela equao

(5.25)

Ressaltam, dessa hiptese, as duas seguintes concluses:


I) a preferncia porventura existente entre dois estmulos no afetada
pelos (m - 2) estmulos restantes;
II) a hiptese formulada assemelha-se a um modelo de urnas para a
deciso sobre as preferncias no continuum psicolgico.
Ambas as restries so motivos de fortes questionamentos que
enfraquecem o embasamento terico do modelo de Bradley-Terry.
Entretanto, por sua simplicidade e, tambm, porque suas solues
ordenam os estmulos de modo muito assemelhado ao do modelo dos
julgamentos comparativos de Thurstone, recomenda-se o seu uso.
No concernente estimao de seus parmetros, dois mtodos
podem ser chamados para esse fim. O primeiro, o mtodo dos momentos,
considera as freqncias absolutas nij observadas para as preferncias
Por elas pode-se escrever, de modo natural, as equaes que
determinam os estimadores resultantes do mtodo dos momentos

(5.26)

sem que, necessariamente, se tenha nij + nji= n, ou seja, possvel no


opinar quanto preferncia no modelo proposto.
Aps manipulaes algbricas elementares, esse sistema se
transforma no sistema linear e homogneo escrito matricialmente como

(5.27)

ou, ainda, equivalentemente,

(5.28)

fcil ver que a matriz N singular porque suas linhas so


linearmente dependentes (so nulas as somas dos elementos de cada
coluna), e que, por outro lado, os valores de escala devem satisfazer
condio natural

Desse modo, substituindo uma equao genrica do sistema (5.28)


por essa ltima equao, pode-se encontrar uma soluo do problema.
Assim, sendo substituda a linha j da matriz N pelo vetor 1 e sendo ej o j-
simo vetor unitrio, ou seja, o vetor cuja j-sima componente igual
unidade sendo nulas as demais, o sistema de equaes anterior
expressado matricialmente por

(5.29)
onde Nj nova matriz que resulta de N pela substituio antes enunciada.
Nesse caso, a soluo do problema de escalagem igual a

(5.30)

ou seja, fi a j-sima coluna da matriz Nj-1, inversa de Nj, Pode-se


mostrar, facilmente, que essa soluo independe de j, ou seja, que ela
independente da equao substituda.
O outro mtodo de estimao para o modelo de Bradley-Terry
segue um algoritmo geral de Ford (1957), desenvolvido para resolver um
sistema de equaes resultante da aplicao do mtodo da mxima-
verossimilhana. Assim, para as observaes do modelo de Bradley-Terry
fcil concluir que sua funo de verossimilhana dada pela expresso

(5.31)

Convencionando-se que nij = 0 (i = 1,2, ..., m) e maximizando o


logaritmo natural Lg L da funo de verossimilhana, obtm-se facilmente
o seguinte sistema de equaes mximo-verossmeis, cuja soluo for-
nece os valores de escala dos estmulos

(5.32)

Dessas equaes resulta que

(5.33)

O mtodo de soluo de (5.33) consiste em usar um algoritmo


iterativo convergente usando a seguinte frmula de recorrncia, em que

(k) denota a aproximao de l na k-sima iterao do algoritmo

(5.34)
A implantao do algoritmo anterior requer, para sua implementao
mais eficaz, as seguintes providncias:

155
I) uma boa aproximao inicial para a sua rpida convergncia;
II) uma normalizao das aproximaes obtidas
em cada etapa.
A aproximao inicial, aqui sugerida, consiste simplesmente em
fazer ( = 1,2,..., m), isto , supe-se inicialmente uma prefern-
cia manifestada imparcialmente sob a hiptese de absoluta ignorncia no
concernente natureza dos estmulos.
A condio de normalizao naturalmente imposta em cada etapa
e consiste em substituir cada por

para satisfazer condio

possvel considerar, tambm, como Rao and Kuper (Sijberg, 1967),


uma generalizao do modelo de Bradley-Terry para escalagem de est-
mulos de modo a contemplar os julgamentos de preferncias que passem
pela indiferena entre dois estmulos. O mtodo prprio consiste, obvia-
mente, em reduzirem-se as probabilidades das preferncias
Oi ] Op de modo a poder debitar seus saldos nas indiferenas Oi = Oj.
Segundo esse enfoque, agrega-se ao modelo tradicional de
Bradley-Terry um parmetro 0 (O<0<1), de tal sorte que se tenham as
seguintes probabilidades:

(5.34)

(5.35)

(5.36)

A estimao, nesse caso, tambm pode ser submetida ao mesmo


algoritmo descrito anteriormente.
ALGUMAS CONSIDERAES ADICIONAIS

O leitor deve estar atento a algumas diferenciaes entre as duas


grandes linhas clssicas de desenvolvimento de modelos de escalagem
psicolgica unidimensional. Cumpre, assim, em primeiro lugar, dar des-
taque ao fato de que os modelos dos julgamentos comparativos e dos
julgamentos categricos de Thurstone so dotados de uma racionalidade
aceitvel desde o ponto de vista da teoria psicolgica. Esta racionalidade,
entretanto, j no aceitvel pelo modelo de Bradley-Terry. Este ltimo
assemelha-se a certas formulaes da teoria matemtica da aprendiza-
gem, desde que se concebam a irracionalidade do processo decisrio e a
contrapartida de penalidades ou sanes para uma escolha equivocada.
Nessa situao, bvio, as opes de preferncias entre os estmulos i
e j, devero repartirem-se proporcionalmente s probabilidades

Alm disso, no que se refere, ainda, s concepes psicofsicas de


Thurstone, cujas origens remontam aos trabalhos de Fechner na escola
alem de psicofisica, j foi feita referncia influncia que sobre suas
idias exerceu a teoria dos erros, que durante muito tempo dominou as
formulaes estatsticas de Pearson, de Fisher e de Neyman da teoria
estatstica clssica. Nada impede, entretanto, que as variveis aleatrias
de escalagem tenham distribuies assimtricas representando as
disposies psicolgicas diferentes dos juizes que, no caso de assimetrias,
acolhem as naturais tendncias de se fazer avaliaes severas ou
magnnimas.
Com efeito, um juiz severo tender a fazer avaliaes baixas em
detrimento das avaliaes mais elevadas e, contrariamente, um juiz
magnnimo se comportar seguindo uma postura inversa. Nessas
circunstncias, torna-se perfeitamente admissvel supor que as variveis
aleatrias de escalagem , dos estmulos Oi, tenham distribuies de
probabilidades F(x) assimtricas ou concentradas lateralmente.
Para obter a generalizao intuda a partir dos comentrios
anteriores, considere as equaes de escalagem do modelo dos julgamen-
tos comparativos de Thurstone,
Neste caso, uma outra forma de express-las consiste em escrever
que

(5.37)

ou, ainda, que


(5.38)

Segundo esse resultado, ao utilizar-se, por exemplo, uma distri-


buio do tipo gama, apresentam-se ao modelo os seus dois parmetros
caracterizadores, alm, claro, dos valores de escala dos estmulos. Esses
parmetros, quando estimados, permitem fazer apreciaes sobre a seve-
ridade ou a magnanimidade dos juizes.
Desde um outro ponto de vista, entretanto, a dicotomia sobre a
justeza dos julgamentos efetuados pode ser o fruto exclusivo das dis-
paridades nos contedos latentes dos estmulos examinados, ou seja, se
a maioria deles contm baixos teores do contedo latente e os juizes so
equilibrados, a tendncia destes atribuir-lhes valores de escala
concentrados esquerda, enquanto, no caso inverso, os valores de escala
concentrar-se-o direita. Estas observaes apontam para novas
direes no exame do tema.

REFERENCIAS BIBLIOGRFICAS

BRADLEY, R.A.. TERRY. M.E. The rank analysis of incomplete block designs I: the method of paired
comparisons. Biometria, v.39, p.324-345, 1952.
FORD JR., L.R. Solution of a ranking problem from binary comparisons. American Mathematical
Monthly. Washington. D.C.. v.64. p.28-33, 1957.
GREENBERG, MG. A modification of Thurstone's law of comparative judgment category of equal or no
difference. Psychological Bulletin. Washington. D.C.. v.64. 108-112, 1965.
GUTTMAN, L. An approach for quantiting paired comparisons and rank order. Annals of Mathematical
Statistics. Hayward (CA), v.17, p.144-163. 1946.
HOTELLING, N. Analysis of a complex of statistical variables into principal components. Journal of
Educational Psychology. Washington. D.C.. v.24, p.417-441; 498-520,1933.
LUCE, R.D. Discrimination. In: LUCE, R.D., BUSH, R.R., GALANTER, E. Psychology. New York: Wley.
1963. v.1.
MICHAUD. P. Opinions aggregations. In: JANSE, J.. MARCOTORCHINO, J.F., PROTH, J. M. (Eds.).
New trends in data analysis and applications. Amsterdam: North Holland, 1983.
NISHISATO, S. Analysis of categorical data: dual scaling and its applications. Toronto: University of
Toronto Press, 1980.
--------------- . Optimal scaling of paired comparison and rank order data: an alternative to Gut-
tman's formulation. Psychometrika, v.43, p.263-271, 1978.
SIJBERG, L. Successive intervals scaling of paired comparisons. Psychometrika, v.32, p.297-308,1967.
SOUZA, J. de. Mtodos de escalagem psicossocial. Braslia: Thesaurus, 1987.

THURSTONE, L.L. A law of comparative judgment Psychological Review. Washington, D.C., v.34,
p.273-286, 1927.
CAPITULO 6

EM TORNO DO ENSINO DE ESTATSTICA


NOS CURSOS DE BASE PSICOSSOCIAL
Jorge de Souza
Departamento de Economia
Universidade Federal de Pernambuco

mais do que freqente e eu diria mesmo justificvel a rejeio


por psiclogos, socilogos e outros profissionais aos mtodos
psicossociomtricos e s muitas tcnicas estatsticas abusiva e
equivocadamente aplicadas no trabalho investigativo nos domnios
de suas cincias. Causas diversas contribuem para essa verdadeira
averso aos conhecimentos psicomtricos e estatsticos, que se
manifesta, inicialmente, por um difuso sentimento de inadequao de
suas formulaes, sobretudo no que concerne cincia psicomtrica
fundada pelos notveis estatsticos ingleses Charles Spearman e Karl
Pearson, no que diz respeito aos seus fundamentos estatsticos, e pelo
mdico e psiclogo francs Alfred Binet, no que se refere formulao
adequada dos instrumentos conceituais de mensurao psicolgica."
De fato, essa inadequao generalizadamente sentida, mas insatis-
fatoriamente justificada, , em muitos casos, o resultado de concepes
tericas que no encontram respaldo nem nas teorias estabelecidas e
muito menos na experincia com as fenomenologas psicolgica, sociol-
gica ou psicossocial, de um modo mais amplo. isso que se d, por
exemplo, no uso abusivo que se faz da clssica Anlise Fatorial com
fatores ortogonais como instrumento de pesquisa no domnio do psicos-
social. Atropela-se com ela qualquer expresso de bom-senso, pela
impertinencia do uso desrespeitoso dos fundamentos dessa tcnica to
atraente quanto perigosa.
Esse exemplo serve ao propsito de considerar a questo objeto
deste captulo por suas verdadeiras dimenses epistemolgicas. Com

* Note-se que. neste trabalho, concebem-se de modo inovador as bases histricas da Psi-
cometria como o resultado da confluncia entre os esforos de psiclogos e estatsticos.
Para um mais amplo entendimento de uma formulao da histria da Psicometria, pode-se
consultar, deste mesmo autor. Histria das Idias Estatsticas. Recife: UFPE. 1995. Notas
internas.
efeito, no caso em tela, a inadaptabilidade do mtodo fatorial manifesta-se,
em primeiro lugar, pela justificvel rejeio que se deve esperar relativa-
mente a uma das hipteses nele implcitas, configurada como a incorrela-
o dos fatores ou variveis latentes. Nesse sentido, o leitor j deve
beneficiar-se da dvida natural que se lhe acomete sub-repticiamente,
bem verdade quanto adequao da Anlise Fatorial. Mas essa
mesma rejeio aos fatores ortogonais pode ser tambm justificada pela
ignorncia de quem os manuseia no referente hiptese de ortogonalida-
de ou incorrelao entre os fatores.
Infere-se daqui, na realidade, uma dupla manifestao da ignorncia
cientfica. Em primeiro lugar, no concernente s hipteses fundamentais
dessa frtil tcnica psicomtrica e, em segundo lugar, pelo desconheci-
mento de alternativas metodolgicas que superam satisfatoriamente a
restrio interposta. Assim, no caso, poder-se-ia optar pelo mtodo
sucedneo da Anlise Fatorial Oblqua como um meio propcio supe-
rao da sria restrio de ortogonalidade. Esta, sabe-se bem, no
encontra respaldo nem nos dados observacionais e nem, tampouco, nas
formulaes tericas subjacentes de todas as cincias psicossociais
pode-se dizer sem medo de errar.
No se h de inferir, desse exemplo e essa formulao consubs-
tanciaria, tambm, um erro inaceitvel , que a Anlise Fatorial clssica
com fatores ortogonais deva ser abandonada enquanto conhecimento
metodolgico no. O leitor mais versado nas literaturas estatstica e
psicomtrica iria logo nelas reconhecer a sua imprescindibilidade como
base ou etapa intermediria para alcanar a formulao mais pertinente ao
embasamento terico da sucednea e mais pertinente Anlise
Fatorial Oblqua.
Toda essa teia de consideraes apoiada no paradigma da Anlise
Fatorial auxilia-nos a concluir que, no geral, ignorncia quanto s bases
ou hipteses que sustentam os mtodos ou as tcnicas psicomtricas e
estatsticas o fator primordial de sua inadequao na abordagem dos
dados observacionais. Na realidade, essa ltima afirmao por demais
abusiva, porque a inadaptabilidade constatada no reside nos mtodos em
si mesmos, mas nas suas condies de aplicao. que eles se compor-
tam com neutralidade, esperando, ingenuamente, que seus usurios
saibam manej-los com respeito s suas idiossincrasias. Seria fcil e
cientificamente desonesto, convenhamos, assacar contra a Psicometria ou
a Estatstica, rs inocentes que padecem da mesma injustia com que as
uvas maduras, na fbula de La Fontaine, passaram por verdes pela
frustrao da raposa incapacitada para alcan-las.
Uma outra ordem de idias sobre a insuficincia dos conhecimentos
psicomtrico e estatstico resulta da considerao dos fins a que eles se
destinam. Para ilustrao, ponha-se, ainda, o exemplo com que se vem
tratando o tema. E muito comum encontrarem-se dezenas de complexos
artigos que versam sobre a inferncia estatstica em Anlise Fatorial. A to
conhecida e importante revista pioneira Psychometrika detentora de
recordes nesse sentido. Muito bem digo com nfase , esses artigos
laureiam seus autores pela originalidade de suas concepes, pela
sofisticao estatstica e matemtica que nos deixam complexados e com
sentimentos mesmo que ora so os da inferioridade, vezes outras os da
frustrao e esse o mais justo, reconheamos o do temor! Todas
essas dolorosas sensaes, infelizmente, no so manifestadas de modo
explcito; no as revelamos para no nos desnudarmos diante dos colegas
que, eles mesmos, ironicamente, tambm as padecem no altar sofrido de
limitaes iguais s que nos acicatam. E, se algo revelamos sobre isso em
algum momento, uma espcie de rancor que gera, a meu juzo, esse
sentimento difuso de averso Psicometria e, tambm, Estatstica de um
modo geral. Como bom psicanalista inquieto, eu veria como normais esses
sentimentos e, at mesmo, consider-los-ia mais que pertinentes ou
saudveis. que h algo de errado ou talvez inadequado por trs dessas
formulaes estreis, e exatamente essa sensao que quero analisar
friamente. Onde sustentar-se, ento, para consider-la em suas di-
menses corretas? Em que se podem apoiar os mortais psiclogo e
socilogo, condenados ambos, juntamente com politiclogos e pedagogos,
ao sacrifcio irremedivel nesse altar de formalismos lgico-matemticos?
H um caminho fcil, leitor, quero dizer, perfeitamente trilhvel, porque
possui para o intento apenas a difcil e delicada capacidade de observar;
mas deve-se faz-lo, claro, judiciosamente e sem idias preconcebidas
isso essencial. Com efeito, todos esses conhecimentos que se
diriam de cunho estatstico-inferenciais relativamente Anlise Fatorial
sustentam-se, entre vrias outras, na hiptese simples de que os erros dos
testes ou instrumentos de medio que geram os escores ou notas tm
distribuio normal de Gauss-Laplace. Essa a questo que deve ser
considerada quando nos propomos a dissecar a plausibilidade de
Psicometria no contexto psicossocial a que ela se destina. Interroguemo-
nos, assim, se a destacada hiptese estatstica sobre a normalidade dos
erros decorre da observao, do exame dos fatos, ou se, contrariamente,
ela fruto da gratuidade ou da convenincia com que, Procustos neurti-
cos da novidade cientfica, limitamos a realidade ao leito de ferro de
nossas convenincias acadmicas, para brilharmos nesse mundo falso de
publicaes e bibliografias!
No h aqui como fugir-se, tambm, sempre presente historicida-
de da cincia, sua realidade de poca, s marcantes influncias
importadas e, sobretudo, engolidas sem a imprescindvel digesto
presidida pelo amparo da crtica epistemolgica! Com efeito, a Anlise
Fatorial, desde os seus primrdios londrinos de 1904, sob a inteligncia de
Spearman e, sobremodo, sob a tutela posterior de estatsticos como
Hotelling, Thurstone, Wishart, Roy, Fisher e outros que, nos anos 30 e 40
deste sculo, consolidaram-na como uma teoria normal da Analise Estatstica
Multivariada, estava marcadamente influenciada pela mais que centenria teoria
dos erros normais, essa fecunda fonte de toda cincia observacional que
sustentou, tambm, a Estatstica Inferencial da linha desenvolvida de Ronald
Fisher, Egon Pearson e Jerzy Neyman. No entanto, preciso que se ressalte,
essa hiptese de normalidade, descoberta dos astrnomos e fsicos, era
adequada aos dados das cincias experimentais, era ditada pelas observaes
das cincias cujos experimentos eram controlados pelo pesquisador. Diante
disso, a concluso que nos compete enunciar a de que, infelizmente, o
conceito de erro distribudo normalmente no respaldado pela natureza das
observaes das variveis psicossociais obtidas, desde logo, mediante
instrumentos de mensurao mais precrios de que os das cincias
experimentais. Adot-la, assim, seria amarrar a realidade ao mesmo leito de
ferro das convenincias que nos servem ao papel de Procustos da cincia e no
a de verdadeiros cientistas ou, pelo menos, a de profissionais honestos e
capacitados. Que fazer? Essa a interrogao que, estarrecidos
justificadamente, nos fazemos agora. No h como precipitar-se diante disso.
Longe, muito longe mesmo, a idia de atirar tudo a esse lixo da cincia, to
impressionantemente rico de teorias, mtodos e tcnicas exibidos
pretensiosamente como os mais puros produtos da inteligncia e da cultura
humanas. Contenhamos a indignao natural diante da descoberta de que
tnhamos razo, de que no ramos to tolos quanto as complicaes
estatsticas nos faziam crer! J no nos devemos vexar, mas ver a tudo com
reservas deve ser a primeira atitude, o que sugere a prudncia, boa guia dos
nossos propsitos. E mais: antes de quaisquer outras consideraes, havemos
de concluir que a posio mais correta a de que, no estgio em que se situa a
inferncia da Anlise Fatorial e sobre ela que se sustenta o nosso
paradigma , que no convm adot-la a no ser em situaes muito
especficas. Isto porque, antes de mais nada, imprescindvel ver a Anlise
Fatorial Clssica como um mtodo eminentemente exploratrio, sem nenhum
cunho inferencial ou de confirmao de hipteses, que, este sim, o cerne da
Inferncia Estatstica. Alis, quase todo o aparato psicomtrico at hoje
conhecido convm que seja visto muito mais pela tica exploratria ou descritiva
e, menos do que desejam os seus tericos desavisados e usurios incautos,
pela viso ideal da induo estatstica.
A concluso a que chegamos sobre tudo o que se disse a de que, no
geral, o insucesso e a suspeio com que so vistos os mtodos psicomtricos
e estatsticos so fruto de vrias causas que se somam nessa empreitada de
desprezo pelo bom-senso: a falta de conhecimento das hipteses estatsticas
que lhes do respaldo, o seu uso abusivo, extrapolando-se os limites sem que
para isso haja autorizao cientfica e tcnica e, last but not least, o
desconhecimento de alternativas metodolgicas mais consentneas.
O ENSINO DA PSICOMETRIA E DA ESTATSTICA

A Psicologia se insere no frondoso ramo das ciencias psicossociais,


ou seja, no elenco de tdas as cincias que lidam com o subjetivismo
psicolgico do homem e das relaes humanas. Esse fato tem, para o
estatstico, uma conotao muito especial porque, contrariamente s
cincias experimentais, as cincias psicossociais, de que a Psicologia e a
Sociologia so membros proeminentes, so preponderantemente
dominadas por algumas caractersticas que, tornando-as especiais,
implicam uma fundamental diferenciao metodolgica do tratamento
estatstico de seus problemas. Com efeito, apesar de que, em alguns
contextos, possam a Psicologia e a Sociologia em particular submeterem-
se ao mtodo experimental, na quase absoluta maioria das vezes elas so
objeto do chamado mtodo observacional. Dessa importante distino de
cunho metodolgico o que mais ressalta a grande impossibilidade de
exerccio do controle direto de fontes de variao, ou seja, a sustentao
experimental da homogeneidade ou invarincia de certos fatores causais,
to tpicos das cincias experimentais. esse mesmo controle junto com
o princpio de aleatorizao, sabe-se bem, que vo propiciar a fundao,
pelo notvel estatstico ingls, Sir Ronald Aylmer Fisher, do Delineamento
Experimental e da Anlise Estatstica da Varincia. Esses mtodos
estatsticos propiciaram um grande avano experimentao, no s por
dot-la de instrumentos prticos de anlise como por possibilitar-lhe a
prpria cidadania cientfica.
A distino mais marcante entre as cincias observacionais e as
experimentais, todavia, d-se a partir de outras caractersticas que
separam integralmente as abordagens estatsticas de uma e de outra.
desse modo que, por exemplo, tem-se prevalncia nas cincias psicosso-
ciais das variveis definidas por construtos ou traos. Um construto, sabe-
se bem, um modo abstrato de conceber uma varivel correspondente a
uma grandeza que no pode ser medida diretamente. So exemplos de
construtos a inteligncia, a neurose e a ideologia. Um construto ou trao
tambm recebe outras denominaes, conforme o domnio de conheci-
mentos onde ele se insere. Dessa forma, so sinnimas de construto as
expresses varivel latente, varivel abstrata e fator, tomadas da prpria
Psicologia ou da Sociologia. Pode-se dizer, alm disso, que um construto
tambm se representa pela definio operacional, mas o fato que se
deseja pr em relevo nesta abordagem a sua marcante presena nas
cincias psicossociais em contraposio sua quase total ausncia nas
cincias experimentais. Enquanto nessas ltimas a mensurao o
resultado da aplicao de um instrumento fsico confivel, adredemente
preparado para esse clssico fim, nas primeiras a mensurao resulta do
uso de um instrumento conceptual, de confiabilidade duvidosa e funda-
mentalmente de validez discutvel. Com efeito, se, por exemplo, quer-se
usar um teste psicolgico para medir a inteligncia ou um questionrio
para avaliar o aprendizado, no h grande preciso ou estabilidade
estatstica nas correspondentes avaliaes e, com muito menos razo
ainda, pode-se garantir que eles medem, de modo incorruptvel, os
construtos para os quais foram destinados. Tem-se o direito de perguntar,
em um questionamento natural a respeito e abrindo-se alternativas a
muitas dvidas, se efetivamente o teste psicolgico mede a inteligncia ou
a cultura e se o questionrio mede o aprendizado ou a memria... Os
problemas da confiabilidade e da validez assumem, assim, um dramtico
papel nas cincias psicossociais, papel esse praticamente inexistente nas
cincias experimentais, pelo menos no que tange validez dos seus
instrumentos de mensurao. Ningum duvida, por exemplo, que um
termmetro sirva a outros propsitos que no o de medir temperaturas.
Entretanto, essa mesma certeza no preside o uso de um teste de
inteligncia, para ficar apenas nesse caso mais facilmente perceptvel.
Emergem dessas consideraes, tambm e com destaque, a
dramtica importncia dos erros de mensurao, alm da multiplicidade de
formas de medir a mesma varivel latente. Esta ltima questo no ocorre
na Fsica e nem tampouco na Qumica, por exemplo, mas, nas cincias
psicossociais comum lidar-se com ela sob a denominao de Problema
dos Indicadores Mltiplos. S agora, mais recentemente, atravs dos
chamados Modelos Estruturais Lineares (LISREL) ou Modelos de
Estruturas de Covariancia, que psicometristas, sociometristas, politiclo-
gos e econometristas tm atentado para essa importante questo. assim,
em decorrncia dessas abordagens mais recentes, que j se pode falar,
para o espanto dos economistas, em uma Econometria velha e em uma
Econometria nova!
H, no entanto, uma outra caracterstica que tambm distingue
profundamente, do ponto de vista da anlise estatstica, as duas grandes
ramificaes das cincias objeto destas digresses. Queremos referir-nos,
nesse contexto, s escalas de mensurao ou de expresso das variveis.
Com efeito, enquanto nas cincias experimentais pequena a presena
e o uso das escalas nominal e ordinal, nas suas pobres coirms, as
cincias psicossociais, elas so preponderantes e imprescindveis. Qual o
significado estatstico dessas constataes que eu enfatizo como o n
grdio do ensino da Estatstica e da Psicossociometria nos cursos de
Psicologia, Sociologia, Cincias Polticas e Pedagogia? A resposta inicial
e que vai surpreender, creio eu, a maioria dos leitores a quase absoluta
ausncia de contedos estatsticos correspondentes a essas necessida-
des, tpicas das cincias psicossociais, nos respectivos cursos universit-
rios. Pode-se propor essa mesma questo de uma outra forma ainda mais
contundente. Com efeito, pergunta-se: no estudo da Psicologia, por
exemplo, onde h uma macia presena de variveis nominais e ordinais,
por que o usual tratamento estatstico dessas variveis no vai alm de
uma descobrida e pouco reveladora representao grfica ou do clculo
de um sumrio modal, at o atrevimento de uma mais ousada medida de
associao estatstica? E esta, convenhamos, no vai mesmo alm do
coeficiente de associao de Goodman-Kruskal e jamais prescinde do sempre
mal utilizado e pouco compreendido qui-quadrado de Pearson? E as inferncias
estatsticas, ensinadas temerariamente j num primeiro curso de graduao e a
alunos absolutamente jejunos de qualquer compreenso da problemtica
cientfica, so pertinentes s necessidades profissionais da Psicologia? E os
socilogos, o que andam estudando? E mais ainda, pode-se perguntar: os
problemas cientficos das cincias de teor psicossocial, que nos servem ao
exerccio crtico neste trabalho, so compatveis com as inexorveis hipteses
estatsticas subentendidas pelos mtodos to irresponsavelmente ensinados? A
resposta a essas questes no pode prescindir do registro do espanto com que
eu vislumbro as faces dos meus leitores. H algo de podre nesse reino do
ensino da Estatstica e da Psicometria nas cincias psicossociais, e ns todos,
estatsticos ou psicossociometristas, no nos fartamos do neologismo, temos
alimentado irresponsavelmente esse estado de coisas, seja por omisso, por
falta de conhecimento ou, ainda, pela ausncia de um exerccio crtico que a
pressa na neurtica busca de resultados novidadosos nos tem eximido de fazer.
H uma outra caracterstica que distancia as cincias psicossociais das
cincias experimentais. Quero referir-me, aqui, multidimensiona-lidade que
marca as primeiras e que se acha bem menos representada nessas ltimas.
Com efeito, os fenmenos comportamentais de base psicolgica requerem, para
seu exame, a considerao de muitas variveis que se lhe associam numa
interao ou sinergia que tornam no s difcil o isolamento de uma ou de
poucas entre elas, mas que fazem prevalecer o conceito de associao ou de
correlao estatstica diante da noo clssica de causalidade. Emergem
dessas consideraes o carter mul-tivariado e acausai das variveis e
fenmenos psicossociais que, por sua vez, vo fazer prevalecer sobre a sua
abordagem estatstica a chamada Anlise Multivariada. Entretanto, o que se
ensina aos profissionais desses domnios , preponderantemente, Estatstica
Univariada ou Unidimensional que, bvio, no atende s suas necessidades.
Eu desejo enfatizar, tambm, para que no vistamos sozinhos a
carapua de desavisados, que os problemas at aqui exibidos so universais.
No se trata, dessa maneira, de circunscrev-los a uma esfera geogrfica
terceiro ou primeiro-mundista e nem tampouco ocorre unicamente na formao
bsica dos cientistas e profissionais da Psicossociologia em detrimento da
correspondente educao ps-graduada. Todos so padecentes desse grande
engodo que tem sido o ensino da Estatstica.
Nesta altura, entretanto, j no h como prescindir do enunciado de
algumas causas, sob pena de estar aqui, este autor, a despejar nos leitores
umas tantas gratuidades, porque, reconheo tambm, de equvocos
e certas exageraes que fortificam do gosto literrio, mas auxiliam-se na
pedagogia, no me eximo. Haverei de comet-los sim, mas no grau menor
do passvel, do no-essencial, e isso o que importa. H algumas
respostas volto s indagaes para que possamos entender esse
estado de coisas e cito trs delas, todas convergentes e as mais impor-
tantes a meu juzo. A primeira a da tradio do ensino no-crtico dos
mtodos estatsticos, que foram desenvolvidos e sistematizados, com
sucesso, como j se disse, sob a esfera das demandas exigentes das
cincias experimentais; a segunda a da falta de sistematizao que tem
marcado o desenvolvimento dos mtodos estatsticos e psicomtricos
apropriados ao tratamento dos problemas da alada psicossocial; e a
terceira, finalmente, a ausncia de livros-textos crticos e atualizados, o
que tem possibilitado esse verdadeiro estelionato estatstico com que a
boa-f dos nossos educandos tem sido desgraadamente ludibriada.
H, tambm, unindo-se a essas causas, uma fora de inrcia que
age no somente sob o domnio exclusivo das cincias psicossociais, mas
geral no concernente ao ensino universitrio da Estatstica. Com efeito,
como responder a essa verdadeira obsesso de dotar os profissionais de
qualquer ramo da cincia de conhecimentos dos dificlimos mtodos
estatsticos? Por que o socilogo deve saber medir e por qu? O que se
deseja com isso? Por que um psiclogo que vai dedicar-se ao seu
consultrio ou ao departamento de pessoal de uma indstria, por exemplo,
deve conhecer umas tantas noes de Estatstica? Admitindo mesmo que
algo eles devam conhecer, o que ensinar? Seriam esses mais que
maltratados testes de hipteses ou uma muito incompreendida anlise de
varincia, ou deveramos p-los a par da importncia cientfica e tcnica
e das condies epistemolgicas inerentes s aplicaes dos mtodos
estatsticos em suas conjunturas profissionais e cientficas? Deveramos,
por outro lado, dar-lhes a prevalncia de uma adequada e intuitiva
formao estatstica no campo exploratrio ou descritivo dos dados, ou
ensinar-lhes esses arremedos caricatos da cincia inferencial, de uma
induo emprica mais do que capenga?
No seremos tolos ao ponto de achar que esse estado de coisas v
ser alterado rapidamente. Pelo contrrio, essa ltima questo, que bem
pode chamar-se de inrcia do ensino, serve a muitos propsitos e
interesses que no podem ser contrariados por sustentarem o comodismo
e a omisso dos professores de Estatstica e de mtodos de pesquisas
psicossociais mais qualificados academicamente. E bastaria, para compro-
var esse estado de coisas, perguntar quem so os que ensinam os cursos
de Estatstica dirigidos aos alunos dos departamentos de Psicologia, de
Sociologia, de Cincias Polticas e de Pedagogia das universidades. So
eles, os cursos, designados por aqui, no Brasil, de um modo um tanto
pejorativo sob a chancela de disciplinas de servios. Enquanto os seus
tutores so, no geral, professores-assistentes e, mais que isso, os menos
experientes, porque os mais antigos rapidamente livram-se do escolho de
ensinar o que tambm no sabem a alunos que ou no querem saber ou
no tm condies de aprender. Pode-se dizer, dessa maneira, sem medo
de errar ou de cometer-se qualquer tipo de injustias, que esses cursos
so ministrados pelos que no esto aptos a faz-lo, nem pedaggica e
muito menos tcnica e cientificamente. E uma verdadeira purgao, no
nos iludamos, ter-se que ensinar essa estatstica do equvocos a platias
pouco afeitas s abstraes e desapetrechadas do mnimo conhecimento
matemtico que o conhecimento da Estatstica mais sria requer... O
resultado de tudo isso muito doloroso, porque, se j no so convenien-
tes formao dos profissionais da rea psicossocial os contedos
programticos das disciplinas de Estatstica, Psicometria e quejandos,
agrava-se o problema pela deficiente qualificao cientfica de seus
responsveis. E, mais urna vez, em razo dos problemas expostos, os
professores dos departamentos psicossociais agem do modo mais
estranho, porque, ao acusarem de alienantes e inconvenientes os
insubstituveis mtodos estatsticos sem os quais no existiriam as suas
cincias , afastam-se das verdadeiras causas dos males de que muito
padecem. H, desse modo, um conluio de omisses e equvocos que
atenta contra a qualidade da formao profissional e que vai refletir-se, de
forma mais grave, nos trabalhos de pesquisa de que no podem eximir-se
os professores das cincias psicossociais. Assim, uma vez mais, volta-se
literatura, porque no so as uvas que esto verdes e nem s a raposa
foi incapaz de alcan-las, mas, estranhamente, tampouco o vinicultor
pde usufruir os mltiplos benefcios de seu cultivo...
Sou de opinio que os problemas expostos s sero superados
mediante um esforo conjunto de estatsticos e cientistas psicossociais
para aproximarem mais as suas cincias, ou melhor, para difundirem-nas
bem mais aprofundadamente, bem mais criticamente... Cabe, sobretudo
aos estatsticos, um grande esforo de absoro dos novos conhecimentos
da difusa estatstica observacional e dos correspondentes mtodos de
anlise. Isto significa renunciar no que diz respeito ao tratamento das
cincias psicossociais s j clssicas (e infladas de sucesso) posturas
estatsticas desenvolvidas sob a tica das cincias experimentais. Dos
cientistas psicossociais requerem-se, de outra parte, uma ampla mudana
de mentalidade bem como a coragem para reformular, e de modo radical,
os contedos programticos de todas as disciplinas de carter estatstico
de seus cursos. Isso, entretanto, tema para a prxima seo...

O QUE SE DEVE ENSINAR

Antes de quaisquer outras consideraes referentes aos contedos


programticos que devem constituir os cursos de Estatstica para a
formao dos profissionais da rea psicossocial, cumpre fazer alguns
comentrios pertinentes ao modo como a Estatstica interage com essas
cincias. Com freqncia, nesses domnios, cursos e livros toam nomes
diversos que podem ser classificados nas trs categorias seguintes, onde
a palavra Psicossociologia quer significar, como sempre, cada uma das
respectivas cincias do comportamento de base psicolgica antes menci-
onadas: Estatstica Aplicada Psicossociologia, Estatstica Psicossociol-
gica e Psicossociometria ou Estatstica Psicossociolgica.
Na realidade, esses ttulos so objeto de muita confuso e pouco
entendimento. Trata-se, na verdade, de trs categorias essencialmente
diferentes de contedos estatsticos, todos eles essenciais a um completo
entendimento do papel que a Estatstica exerce nas cincias psicossociais,
alm de complementares entre si. Com efeito, por Estatstica Psicossocio-
lgica entende-se o uso dos mtodos estatsticos para gerar os dados ou
observaes especficas dessas cincias; por Psicossociometria ou
Psicossociologia Estatstica quer-se referir formulao de modelos e
teorias psicossociolgicas, de cunho estatstico e probabilistico; e,
finalmente, por Estatstica Aplicada Psicossociologia traduz-se a
aplicao dos instrumentos estatsticos de natureza exploratria e infe-
rencial aos dados gerados pela Estatstica Psicossociolgica.
Desse modo, por exemplo, a Anlise de Varincias um mtodo
prprio de anlise estatstica e, em razo disso, pode ser aplicada a certos
contextos observacionais da Psicologia. Nessas circunstncias, a Anlise
de Varincia um mtodo de estatstica aplicada Psicologia. Em con-
traposio a isso, por outro lado, a Teoria da Confiabilidade dos testes
subjetivos Psicossociologia Estatstica, por ser uma teoria de cunho
psicossociolgico, tendo carter estatstico.
Essa distino no arbitrria e j tradicionalmente usada na
Economia, onde se conhecem e no se misturam as trs correspondentes
categorias estatsticas. Fsicos e astrnomos, de igual maneira, j h muito
tempo lidam com as suas particulares Fisicometria e Astronometria, s que
sob as denominaes alternativas e menos novidadosas de Fsica Estats-
tica e Astronomia Estatstica. Foram os economistas os responsveis por
essa onda de metrias que roubou Estatstica o seu claro e essencial
sentido de aplicabilidade. Feitas essas consideraes, j se pode lembrar
que existe um pensar estatstico inerente a cada cincia. Essa forma de
ver os fenmenos particulares de um domnio o resultado do reconheci-
mento da diferenciao entre indivduos ou objetos de investigao
constituintes do que se pode denominar coletivo e no concernente s suas
propriedades ou caractersticas. Sendo assim, cada indivduo ou objeto
possui uma medida de cada caracterstica geral, e a considerao do
conjunto dessas medidas leva noo de distribuio de freqncias das
correspondentes propriedades. Infelizmente, no geral, um coletivo no
pode ser abordado em sua integralidade e, desse modo, a cincia deve
fazer uso de suas partes abordveis, alcanveis ou disponveis, isto , ela
examina aquilo que tecnicamente se designa por amostras. Decorrem, dessas,
duas ordens gerais de conseqncias. Na primeira, uma amostra investigada
em suas propriedades em si, isto , ela explorada ou descrita desde o ponto
de vista de sua considerao como um coletivo restrito. Nesse caso,
desenvolve-se o que se denomina de Estatstica Exploratria ou Estatstica
Descritiva, ou, ainda, Anlise Estatstica de Dados. Por ela busca-se intuir as
propriedades que vo construir as hipteses. No segundo modo de ver uma
amostra, quer-se induzir as propriedades do coletivo a partir das revelaes
originadas na explorao, isto , trata-se de criar um mtodo de induo
emprica chamado de Inferncia Estatstica. Segundo essa forma de ver, uma
amostra deve ser obtida por um mecanismo de aleatorizao. Esta a grande
contribuio da Estatstica para resolver o clssico problema cientfico da
induo emprica, que, desde as formulaes de David Hume, John Stuart Mill,
Karl Pearson, Rudolf Carnap, Karl Popper e outros eminentes filsofos da
cincia, ainda no se encontra satisfatoriamente resolvido. A dificuldade
enfrentada pelas cincias psicossociais, no concernente Inferncia Estatstica,
reside, de um modo bem abrangente, no fato de que as suas amostras no so
probabilizadas, ou melhor, no so conhecidas as suas probabilidades de
seleo. por essa razo primordial apesar de existirem outras j
destacadas nas sees anteriores que tenho definido a prevalncia do estudo
estatstico de carter exploratrio no ensino universitrio das cincias
psicossociais. Pelo menos, essa deve ser a posio prevalente em cursos
profissionais. Apoiando-se, assim, nessas concluses, podem ser enunciadas as
linhas gerais que devem nortear, sobretudo, a formao estatstica dos cientistas
psicossociais. Pode-se, desse modo, oferecer s consideraes mais justas de
quantos se interessam por tais problemas as seguintes diretrizes gerais sobre o
ensino de Estatstica e Psicometria:
i) a formao estatstica deve ser eminentemente exploratoria;
ii) devem ser privilegiados os estudos referentes construo dos
instrumentos conceituais de mensurao;
iii) devem ser bem compreendidas as limitaes dos instrumentos de
mensurao e a natureza dos erros de mensurao;
iv) devem ser destacados os mtodos de explorao das variveis
expressveis nas escalas nominal e ordinal.

Em face desses princpios, o leitor j tem como aquilatar o divrcio


definitivo entre o que ele aprendeu ou vem ensinando e aquilo que o mais
adequado s suas necessidades cientficas e profissionais. Deve-se ter coragem
para renunciar ao que vem sendo oferecido como conhecimento estatstico sob
as variadas denominaes que tm camuflado o imenso fosso entre a
necessidade e a oferta desse conhecimento impres-
cindvel cincia, mas que no nos iludamos quanto a mudanas radicais.
Elas no ocorrero, at mesmo porque os departamentos de Estatstica
no contam com especialistas capazes de levar a bom termo essa her-
clea tarefa.
Antes que novos elementos sobre este assunto possam ser acres-
cidos, convm abordar a importante questo do livro-texto e das impres-
cindveis leituras de artigos tcnico-cientficos nas revistas especializadas.
Os livros disponveis no tratam de temas como a Escalagem Multivariada,
a Teoria das Respostas aos itens, a Anlise de Estruturas Latentes, os
Modelos Lineares Multiequacionais, os Modelos Loglineares, a Anlise de
Correspondncias Mltiplas, e outras sofisticadas tcnicas de cujo uso
cientfico ou aplicado muito se beneficiariam as cincias psicossociais. No
se pode ser injusto, entretanto, sobretudo com autores como Raymond
Boudon, Hubert Blalock Jr., Herbert Solomon, Louis Guttman, Paul
Lazarsfeld, WarrenTorgerson, Johan Galtung, C.H. Coombs, A. Birnbaum,
L.L. Crombach, K.G. Jereskog, F.M. Lord, M.R. Novick, G. Rash, Louis
Thurstone, R. Thorndike, J. Guilford e H. Gulliksen. Esses autores, se bem
que profundos em suas exposies, ora pecam pela extrema especializa-
o em alguns poucos tpicos, ora por transformarem em matemtica ou
estatstica complexa aquilo que poderia ser mais simplificado sem perda
do rigor lgico, ora por abordar insuficientemente temas to importantes.
Nesse rol amplo, esto includos quase todos os principais tericos do
domnio da Psicometria e da Estatstica Social.
Essas digresses levam-nos concluso de que, no concernente
a livros-textos, h uma total impertinencia de seus contedos estatsticos
relativamente s idias aqui expostas. Em particular, deve-se ressaltar,
so desatualizados e insuficientes. No que se refere, por outro lado, a
artigos nas revistas cientficas, observa-se, nas mais importantes, um
sofisticado e, muitas vezes, estril tratamento estatstico-matemtico que
afugenta de suas leituras o leitor de formao humanstica. Cumpre dizer
que, algumas vezes, tambm, os artigos tratam de generalizaes absolu-
tamente desnecessrias ou, em certas situaes, conferem a temas de
fcil compreenso um tratamento estatstico-matemtico que verdadeira-
mente deforma as suas concepes bsicas. Este , entretanto, um quadro
geral de todas as revistas cientficas que atendem s presses acadmicas
para que se publiquem artigos originais sem importarem-se com o leitor
mdio ou com as idias que deveriam ser prevalecentes, em detrimento
dos formalismos matemticos. Elas so, desse modo, uma espcie comum
de jogo de compadres, onde uns poucos se entendem e muitos, para no
ficarem atrs, alm de pagarem, fingem atualizarem-se. Assim, urge que
esses especialistas promovam os seus melhores esforos em prol da pu-
blicao de livros modernos de Estatstica Psicossocial e que contemplem
todas as cincias por ela envolvida, numa postura mais nomottica do que
ideogrfica, na linha do que eu tenho entendido como a Psicossociologia.
Com efeito, desse modo que se unem umbilicalmente, pela base da
subjetividade mental, grande parte das teorias sociolgicas e psicolgicas,
e as correspondentes mensuraes, nesses domnios, exibem bases cien-
tficas e metodolgicas equivalentes e muitas dificuldades comuns a serem
superadas mediante a imprescindvel unio de esforos. Posta dessa
maneira, a viso psicomtrica estrita, de tradio psicolgica, de cunho
ideogrfico, cede lugar, neste momento, expanso larga de seus limites,
tornando Psicometria velha apenas a semente de uma Psicossociometria,
cidad nomottica das cincias do comportamento de bases psicolgicas.
CAPTULO 7

TEORIA DA RESPOSTA AO ITEM IRT:


UMA INTRODUO
Luiz Pasquali
Instituto de Psicologia
Universidade de Braslia

IRT (Item Response Theory) j tem uma longa histria. Ela iniciou
com os trabalhos de Lord (1952, 1953) nos Estados Unidos e
Rasch (1960) na Holanda, que a utilizaram para testes de
desempenho e de aptido. Contudo, apenas ultimamente, a partir
de meados dos anos 80, a IRT vem se tornando a tcnica predominante
no campo dos testes. A razo da demora desta teoria em ser
amplamente utilizada em psicometria consiste na enorme complexidade
de manipulao de seus modelos matemticos, inviveis sem os
requintados programas de computador, e estes s comearam
efetivamente a entrar no mercado nos anos 80.
Atualmente, a IRT parece que veio para ficar e substituir grande
parte da teoria clssica da psicometria isto um fato que j ocorre no
Primeiro Mundo (USA, Canad, Europa, Japo, Israel, Austrlia); no res-
tante do mundo ela raramente utilizada, e no Brasil (Amrica Latina em
geral) ela sequer conhecida. Este captulo visa precisamente iniciar no
Pas o conhecimento e, esperamos, o uso desta tcnica no campo da
psicometria.
As publicaes em IRT vm crescendo e tomando conta das revis-
tas especializadas, como a Psychometrika. H centros importantes de
pesquisa nesta rea nos USA (University of Massachusetts at Amherst),
Holanda e Espanha (Universidade de Oviedo). Existe, inclusive, uma
sociedade internacional, a International Test Commission (ITC), que filia
seguidores da IRT. De fato, no Congresso Internacional da ITC, em
Oxford (Inglaterra), de julho de 1993, havia mais de 120 participantes de
cerca de 46 pases. Da Amrica Latina s estavam representados o Brasil
e a Argentina, com dois participantes cada.
O enorme impacto que a IRT vem tendo em psicometria se deve
ao fato de ela superar certas limitaes tericas graves que a psicometria
tradicional contm. Hambleton, Swaminathan e Rogers (1991) salientam
especialmente quatro dessas limitaes:
1) Os parmetros clssicos dos tens (dificuldade e discriminao)
dependem diretamente da amostra de sujeitos utilizada para estabelec-
los (group-dependenf). Da, se a amostra no for rigorosamente repre-
sentativa da populao, aqueles parmetros dos itens no podem ser
considerados vlidos para esta populao. Como conseguir amostras
representativas um problema prtico grave para os construtores de
testes; a dependncia dos parmetros dos itens na amostra obtida se
torna um empecilho de grandes propores para a elaborao de ins-
trumentos psicomtricos no enviesados.
2) A avaliao das aptides dos testandos tambm depende do
teste utilizado (test-dependent). Assim, testes diferentes que medem a
mesma aptido iro produzir escores diferentes da mesma aptido para
sujeitos idnticos. Testes com ndices de dificuldade diferentes evidente-
mente produziro escores diferentes. Mesmo no caso das formas
paralelas, h sempre a dificuldade de que o montante de erros nas duas
formas dificilmente seja o mesmo, o que produzir novamente escores
diferentes.
3) A definio do conceito de fidedignidade ou preciso na teoria
clssica dos testes constitui tambm uma fonte de dificuldades. Ela
concebida como a correlao entre escores obtidos de formas paralelas
de um teste ou, mais genericamente, como o oposto do erro de medida.
Ambos os conceitos apresentam dificuldades. Primeiramente, pratica-
mente impossvel satisfazer as condies de definio de formas
paralelas e, no caso do erro de medida, postulado que este seja
idntico em todos os examinandos postulado improvvel (Lord, 1984).
4) Outro problema da teoria clssica dos testes consiste em que
ela orientada para o teste total e no para o item individual. Toda a
informao do item deriva de consideraes do teste geral, no se
podendo assim determinar como o examinando se comportaria diante de
cada item individual.
Estas e outras dificuldades dos modelos e tcnicas clssicos de
medida incitaram os psicometristas procura de teorias alternativas que
pudessem permitir estabelecer (Hambleton et ai., 1991):
a) caractersticas do item sem ser dependente da amostra de sujeitos
utilizados;
b) escores dos examinandos independentes do teste utilizado;
c) um modelo em nvel do item em vez do teste;
d) um modelo que no exija formas rigorosamente paralelas para
avaliar a fidedignidade;
e) um modelo que oferea uma medida de preciso para cada escore
de aptido.
Essas caractersticas so precisamente oferecidas pela Teoria da
Resposta ao Item (Hambleton, 1983; Hambleton, Swaminathan, 1985; Lord,
1980; Wright, Stone, 1979; Hambleton, Swaminathan, Rogers, 1991; Muiz,
1990).

CARACTERSTICAS DA IRT

Teoria da IRT
Contrariamente teoria clssica de psicometria, a IRT trabalha com
traos latentes e coloca dois axiomas fundamentais: 1) o desempenho do sujeito
numa tarefa (item do teste) se explica em funo de um conjunto de fatores ou
traos latentes (aptides, habilidades, etc.) o desempenho o efeito, e a
causa so os traos latentes; 2) A relao entre o desempenho na tarefa e o
conjunto dos traos latentes pode ser descrita por uma equao monotnica
crescente, chamada de ICC (Item Characteristic Function ou Item Characteristic
Curve a curva caracterstica do item) e exemplificada na Figura 7-1, onde se
observa que sujeitos com aptido maior tero maior probabilidade de responder
corretamente ao item e vice-versa ( a aptido e P() a probabilidade de
resposta correta).
H um nmero ilimitado de modelos para expressar esta relao,
dependendo do tipo de funo matemtica utilizada e/ou do nmero de
parmetros que se quer descobrir para o item.

Fig. 7-1 A curva ICC.


Uma preciosa vantagem da IRT sobre a teoria clssica consiste em que
os modelos utilizados permitem desconfirmao. Na verdade, a demonstrao
da adequao do modelo aos dados (goodness-of-fif) um passo necessrio
nos procedimentos desta teoria.

Propriedades da IRT
Entre as caractersticas da IRT, duas so de especial relevncia:
unidimensionalidade e independncia local.

Unidimensionalidade
A IRT postula que h apenas uma aptido responsvel pela realizao de
um conjunto de tarefas (itens). Parece pacfico que qualquer desempenho
humano sempre multideterminado ou multimotivado, dado que mais de um
trao latente entra na execuo de qualquer tarefa. Contudo, para satisfazer o
postulado da unidimensionalidade, suficiente admitir que haja uma aptido
dominante (um fator dominante) responsvel pelo conjunto de itens. Este fator
o que se supe estar sendo medido pelo teste. O postulado da
unidimensionalidade ainda continua importante, dado que a IRT, embora
estudos estejam sendo feitos nesta rea, ainda no possui solues adequadas
para modelos multidimensional.

Independncia local
Este postulado afirma que, mantidas constantes as aptides que afetam
o teste, as respostas dos sujeitos a quaisquer dois itens so estatisticamente
independentes. Seja 0 o conjunto de aptides que afetam um conjunto de itens,
Uj a resposta de um sujeito ao item i (i = 1, 2, ..., n) e a probabilidade de
resposta do sujeito i com
aptido significa a probabilidade de uma resposta correta e
a probabilidade de uma resposta errada. A independncia local
pode ser matematicamente afirmada como

A independncia local significa que, para examinandos com uma aptido


dada, a probabilidade de resposta a um conjunto de itens igual aos produtos
das probabilidades das respostas do examinando a cada item individual. Assim,
se um sujeito acertou os itens 1 e 2 e errou o 3, a configurao de suas
respostas U, = 1, U2 = 1, U3 = 0 (1, 1, 0), e a independncia local implica que
sendo
Embora parea improvvel que os comportamentos de um mesmo
sujeito no estejam correlacionados, a independncia local afirma que, se
houver correlao, esta se deve influncia de fatores outros que no o
fator dominante. Se estes outros fatores forem controlados (mantidos
constantes), o fator dominante ser a nica fonte de variao, e as respos-
tas se tornam independentes. Assim, a independncia local implica a
unidimensionalidade (Lord, 1980; Lord, Novick, 1968)

MODELOS DA IRT

Embora seja ilimitado o nmero de modelos matemticos que


podem expressar a relao de probabilidade de sucesso em um item e a
aptido medida pelo teste (isto , a ICC), na prtica h trs que predomi-
nam. Estes se distinguem pelo nmero de parmetros que utilizam para
descrever o item os modelos logsticos de I, 2 e 3 parmetros, a saber:
a) que avaliam do item somente a dificuldade, b) a dificuldade e a discrimi-
nao, c) ou a dificuldade, a discriminao e a resposta correta dada ao
acaso.

Modelo logstico de 1 parmetro


Este modelo, inicialmente criado por Rasch (1960) e expresso como
modelo de ogiva, foi descrito para um modelo logstico por Wright (1977a,
1977b) e permite tratamento matemtico mais fcil. Sua frmula

( l = 1. 2........n),

onde Pi() a probabilidade de um examinando com aptido 0 responder


o item I e representado como uma curva tipo S; b, o parmetro de
dificuldade do item I; n o nmero de tens no teste; e um nmero
transcendental com valor de 2,718; D, constante que vale 1,7.
Pi() produz uma curva chamada curva caracterstica do item (ICC
Item Characteristic Curve), conforme a Figura 7-1.0 parmetro b do
item corresponde ao ponto, na escala de aptido 0, onde a probabilidade
de resposta 0,50. Quanto maior for o bi, maior deve ser o nvel de aptido
exigido para que o examinando tenha a chance de 50% de acertar o tem.
Transformando a escala da aptido em escores padres, com mdia = 0
e desvio padro = 1, os valores de b, tipicamente se situam entre -2 (itens
fceis) e +2 (tens difceis), conforme Figura 7-2, onde o item 1 exige
aptido de cerca de -1,10 e o item 2 aptido 0,50, sendo este item mais
difcil que o item 1.

Fig. 7-2 Parmetro de dificuldade (b) de dois itens.

A constante D foi includa na frmula para tornar a curva logstica


igual curva normal acumulada (ogiva) utilizada nos estudos pioneiros da
IRT.

Modelo logstico de 2 parmetros


Birnbaum (1968) desenvolveu a equao que serve para avaliar dois
parmetros do item: dificuldade e discriminao. A frmula

onde a, o parmetro de discriminao do item, que pode variar de - a


+, mas tipicamente varia entre 0 e 2. Valores negativos indicariam que a
probabilidade de acertar um item estaria inversamente relacionada com a
aptido, o que soa estranho. A Figura 7-3 mostra os dois parmetros do
item (b e ai). O ai representado pela inclinao da curva no ponto de
inflexo, onde a probabilidade de resposta correta 0,50.
Na ilustrao, o item 2 mais difcil que o item 1 (parmetro bi, mas
muito menos discriminativo (parmetro a), pois a inclinao da sua curva
bem menor que a do item 1.
Fig. 7-3 Parmetros de dificuldade (b) e discriminao (a) de
dois itens.

Modelo logstico de 3 parmetros


Desenvolvida por Lord (1980), a frmula deste modelo :

onde c o parmetro do item que avalia a resposta correta dada ao item


por acaso e expresso pela assntota inferior da curva. Se esta assntota
cortar a ordenada acima do ponto 0, h presena de acertos ao acaso
(Figura 7-4). No caso do item 2 na Figura 7-4, h 20% de probabilidade de
que o item seja acertado por acaso, sendo esta probabilidade de 0 para os
outros dois itens.

DETERMINAO DOS PARMETROS DE ITENS E APTIDES

A determinao destes parmetros constitui apenas uma das etapas


na elaborao de instrumentos psicolgicos. As etapas da elaborao de
instrumentos dentro da IRT dividem-se em trs nveis de procedimentos:
1) Procedimentos tericos, onde se incluem as etapas de a)
estabelecimento do sistema ou varivel (trao latente) a ser medido;
Fig. 7-4 ICC do modelo de trs parmetros para trs itens.

b) desenvolvimento da teoria psicolgica sobre este trao;


c) operacionalizao do trao atravs da elaborao dos comporta-
mentos que o representam (elaborao dos itens); e
d) anlise terica dos itens.
2) Procedimentos empricos, que consistem em
a) definio da amostra de sujeitos para a coleta da informao sobre
o teste que se quer utilizar no futuro na populao; e
b) aplicao dos itens a esta amostra.
3) Procedimentos analticos, que consistem em
a) escolha do modelo de IRT;
b) estabelecimento da dimensionalidade do trao (unidimensionali-
dade dos itens);
c) avaliao dos parmetros dos itens e da aptido do sujeito (o trao
0);e
d) demonstrao da adequao do modelo aos dados empricos.
Na IRT, o desempenho do sujeito numa tarefa (item), isto , a
probabilidade de resposta correta [P(0)], depende de 1 ) aptido do sujeito
(0) e 2) dos parmetros dos itens (ai, bi e ci). Da, a primeira tarefa do IRT
viabilizar modelos que possam permitir a descoberta dos parmetros dos
itens.
Com base nos dados empricos, isto , as respostas da amostra de
sujeitos aos itens, se faz a estimativa dos parmetros destes itens. Isto
consiste em se escolher corno parmetros para os tens aqueles valores que
maximizam a probabilidade de ocorrncia dos dados que de fato apareceram
nas respostas dos sujeitos. Por exemplo, se se lanar 100 vzes uma moeda
(cara ou coroa) e aparecer 60 caras e 40 coroas, a probabilidade mais
verossmil de que aparea cara de 60/100, isto , 0,60. Assim, estima-se que
0,60 o valor mais provvel de aparecer cara. Este mtodo de avaliao se
chama de mxima verossimilhana (maximum likelihood), porque os valores
estimados so os mais verossmeis, plausveis, com respeito aos dados
empricos obtidos.
A estimao dos parmetros se faz por aproximaes sucessivas
(iterao), utilizando-se pacotes estatsticos apropriados, tais como BICAL
(Wright et al., 1979), para modelos logsticos de 1 parmetro, e BILOG (Mislevy,
Bock, 1984) e LOGIST (Wingersky, Barton, Lord, 1982), para modelos de 1,2 e
3 parmetros. Estes pacotes produzem tanto os parmetros dos itens quanto os
valores de 0 dos sujeitos (Baker, 1987; Birnbaum, 1968; Lord, 1980;
Swaminathan, 1983; Hambleton, Swaminathan, 1985).
A lgica destes procedimentos ser ilustrada brevemente, seguindo
Muiz Fernndez (1990). Os valores estimados para os parmetros pelo mtodo
da verossimilhana so os que maximizam a probabilidade de que ocorram
aqueles valores (respostas) dados pelos sujeitos. Ento procura-se uma funo
matemtica que produza estes mximos, como ilustrado na Figura 7-5 (onde o
sujeito 1 tem seu mximo em 0 = - 1,50 e o sujeito 2 em 0=1).

Fig. 7-5 Mximos da funo de verossimelhana.


Seja U a resposta ao item. Em testes de aptido, U = 1 se o item for
corretamente respondido ou U, = 0 se o sujeito errar o item. A equao ICC
d precisamente a probabilidade de acerto e erro para um dado valor de
aptido 0, sendo , onde se
entende como a probabilidade de uma resposta correta para um
tal valor de G. Exemplo: a probabilidade de acertar o item na Figura 7-6
de 0,60 e a de errar de 0,40 para um valor 0 de 1:

Aptido (0) Fig. 7-6


Probabilidade 0.60 de acerto do item a 0 = 1.

Como a resposta a um item para um dado valor de 0 uma prova


de Bernoulli, segue que

No nosso caso,

Como um teste tem n itens, a probabilidade de um padro de


resposta dado pelo produto das probabilidades de cada item (dado o
axioma da independncia local). Assim, um padro 11010 para cinco itens
ser:

que a funo de verossimilhana (maximum likelihood function).


Esta equao vem normalmente expressa em termos de logaritmos
por ser mais fcil de operar, pois

Assim, a equao de verossimilhana se escreve

AJUSTE DO MODELO (model-data goodness-of-fif)

Estabelecidos os parmetros do modelo, preciso demonstrar que


o modelo IRT escolhido se adapta aos dados empricos, isto , se os
valores P(0) estimados pelo modelo no diferem dos valores obtidos
empiricamente (a saber, a proporo de sujeitos que de fato acertaram o
item).
Para tal demonstrao h uma srie de procedimentos estatsticos
que constituem ainda o ponto fraco da IRT (Muiz, 1990; Hambleton et al,
1991). Entre eles, h o x2 e a anlise dos resduos.

Wright e Panchapakesan (1969, apud Muiz, 1990) utilizam uma


estatstica parecida com o x2 para verificar o ajuste do modelo:

onde k = nmero de categorias em que se dividiu 0 ,nj = nmero de


sujeitos dentro da categoria, P(j) = valor da ICC para a categoria j dado
pela frmula do modelo, Pe(j) = proporo de sujeitos que de fato
acertaram o item para a categoria J e x2 se distribui com k-1 graus de
liberdade.

onde In = logaritmo natural e u = vetor das respostas.


Exemplo (Muiz, 1990, p.51-53): Mil sujeitos responderam 20 itens. O
programa LOGIST estimou os parmetros, mostrando que o modelo de dois
parmetros seria o aconselhvel. Para o item 10, o programa deu que a=l e
b=2. O foi dividido em 5 categorias (usa-se o ponto mdio das categorias
para os clculos) e os resultados foram os da tabela 7-1.

Tabela 7-1 Proporo de 1.000 sujeitos acertando item 10 por


categoria de 0

ny Pe(y) P(y)

4-5 70 0,97 0,99


3-4 90 0,95 0,92
2-3 200 0,70 0,70
1-2 300 0,35 0,30
0-1 340 0,10 0,07

1.000

Os valores P(0) calculados pelo modelo de dois parmetros [Pj)] foram


conseguidos usando a frmula deste modelo, onde os parmetros para o item
10 foram: a = 1 e b = 2.
Aplicando-se a frmula do x2 resulta:

x2 =

que, para graus de liberdade k-1 = 5-1 = 4, a probabilidade de tal x2 (=12,2) a gl


= 4 ocorrer por acaso se situa entre 0,02 e 0,01. Portanto, somente no nvel de
98% de confiana pode-se afirmar que o modelo de dois parmetros se ajusta
aos dados empricos do item 10. Pela Figura 7-7, v-se que os valores
empricos, Pe(0), e os calculados, P(0), so bastante similares.

Anlise dos resduos


Esta anlise consiste em verificar se a diferena entre o desempenho
real dos sujeitos num item e o desempenho predito pelo modelo no
estatisticamente diferente de 0:
Fig. 7-7 Valores preditos pelo modelo Pe(j) e valores empricos P(j).

onde r, = resduo, Pij = desempenho real, isto , proporo de respostas


corretas ao item i na categoria j da aptido , e E(Pj) = desempenho
predito pelo modelo.
Normalmente, este resduo expresso em dados padronizados
(resduo padronizado - zij):

sendo N o nmero de sujeitos na categoria. Esta categoria se refere a que


o 0 deve ser dividido em categorias (10 a 15), como no caso do x2.
A Figura 7-8 mostra que os dados empricos no se coadunam com
os preditos, pois as duas linhas no coincidem.

INVARIANZA DOS PARMETROS

A invarincia dos parmetros constitui o ponto central da IRT e


afirma que se pode estimar 1) os escores dos sujeitos independentemente
do teste utilizado e 2) os parmetros dos itens independentemente da
amostra de sujeitos utilizada. Se o modelo IRT utilizado se ajusta aos
dados empricos, ento so salvos estes objetivos, ilustrados na Figura 7-9.
Fig. 7-8 Discrepncia entre modelo e dados empricos.

Fig. 7-9 ICC para dois itens e distribuio de 0


para dois grupos de sujeitos.
A Figura 7-9 mostra que 1) as curvas ICC para os dois itens podem
ser obtidas tanto com a amostra N, quanto com a N2 conseqentemente,
os parmetros dos itens independem da amostra utilizada; e 2) o valor da
aptido j pode ser obtido utilizando-se tanto o item 1 quanto o item 2
este j corresponde probabilidade de acerto de 75% do item 1 e 50% do
item 2. Continua valendo, contudo, como em qualquer estimao estatsti-
ca, que quanto maior e mais heterognea a amostra de sujeitos, mais
precisa ser a estimao dos parmetros.

Para demonstrar a invarincia da aptido (0), se aplicam dois testes


com itens diferentes, mas que medem a mesma aptido, a uma mesma
amostra de sujeitos, e os resultados mostraro se h ou no coincidncia.
Se houver coincidncia, ento os itens dos dois testes se distribuiro em
torno de uma linha reta num sistema de coordenadas, como na Figura 7-10,
e uma indicao numrica ser dada pela correlao de Pearson entre as
duas avaliaes.

Fig. 7-10 Valores 9 obtidos por testes diferentes.

Evento similar ocorre na demonstrao da invarincia dos parme-


tros dos itens (a, b, c). Aqui se usam duas amostras de sujeitos para
responder ao mesmo teste. Se os parmetros dos itens (por exemplo, a
dificuldade b vide Figura 7-11) so os mesmos nas duas amostras,
novamente surgir uma linha reta nas coordenadas e a correlao de
Pearson estima a coincidncia dos parmetros.
Fig. 7-11 Valores b obtidos em duas amostras diferentes de sujeitos.

FUNCOES DE INFORMAO E EFICIENCIA

Um poderoso mtodo para descrever itens e testes bem como para


selecionar itens dado pela funo de informao do item e do teste. Ela
permite analisar quanto um item ou um teste traz de informao para a
medida da aptido.

Funo de informao do item

A frmula da funo

onde Ij() a "informao" fornecida pelo item i no nvel da aptido G,


Pi() a derivada de Pi() com relao a , Pi() a ICC e Qi() = 1 - Pi().

No caso do modelo logstico de trs parmetros, a equao se


simplifica para
Esta equao mostra a importncia que tm os trs parmetros
sobre o montante de informao do item. Na verdade, a informao 1)
maior quando b se aproxima de 0; 2) maior quanto maior for o a; e 3)
aumenta com a diminuio de ci, para , como mostra a figura 7-12.

Fig. 7-12 Funo de informao para quatro itens.

Observa-se na Figura 7-12 que o item 1 fornece a maior informao


a = 1,5 e o item 2 a = -1,5. O item 3 d bem menos informao que os
itens 1 e 2, porque o c, > 0, mas d mais informao do que estes itens no
nvel de = 0. O item 4, devido ao grande c (c4, = 0,15), tornou-se intil no
teste, pois no produz qualquer informao a mais do que a j produzida
pelos itens 1, 2 e 3 em qualquer nvel de .

Funo de informao do teste

A informao fornecida pelo teste simplesmente a soma das


informaes fornecidas por cada item do mesmo:
Outra maneira de representar esta funo de
informao do teste atravs do erro padro de medida, chamado na
IRT de erro padro de estimao. A 1(), na verdade, o inverso deste
erro:
erro padro de estimao.
Similarmente ao erro padro de medida da teoria psicomtrica
clssica, o EPE permite estabelecer intervalos de confiana em torno dos
escores 0 dos sujeitos.
Exemplo: Um teste de 50 itens aplicado a 100 sujeitos deu 1( = 4 para
= 3. Para nvel de confiana de 95%, qual o intervalo em que cai o 0?
Resposta:

1) para 95%, z= 1.96

2) erro mximo =

3) assim, o intervalo para 0 ser 3 0,98, sto , 2,02 a 3,98.

Eficincia relativa
A l(0) permite comparar a relativa eficincia de um teste com relao
a outro em sua capacidade de estimar a aptido 0:

onde ER() = eficincia relativa e l1,() e l2() so funes de informao


dos testes 1 e 2, respectivamente.
Exemplo: Se 1,() = 30 e l2() = 15, ento ER() = 30/15 = 2. O teste
1 duas vezes mais eficiente que o teste 2 para estimar 0, isto , o
teste
1 poderia ser reduzido pela metade ou o teste 2 aumentado 50% para
ambos terem o mesmo nvel de eficincia.

TRANSFORMAES DO 0

O valor 0 de um sujeito define a probabilidade de ele acertar um


dado item. A escala 0, onde se situa o escore do sujeito, veio expressa
neste captulo em termos de escores padres com mdia = 0 e desvio
padro = 1. Entretanto, para facilitar o uso prtico do 0, este pode ser
expresso em termos de escalas mais apropriadas e mais inteligveis,
fazendo uso de transformaes lineares ou no-lineares.
As transformaes lineares consistem em expressar o 0 acrescen-
tando-se a ele uma constante e, alm de uma constante, tambm um fator
multiplicativo. Contudo, ao se fazer tal operao no 0, necessrio que se
faa o mesmo aos parmetros dos itens para, assim, manter a invarincia
da escala 0.
Assim, tem-se,

Para modelo de 1 parmetro:

Para modelo de 2 parmetros:

Para modelo de 3 parmetros:

Por exemplo, Woodcock (1978) fez a seguinte transformao para


seu teste:
Entretanto, a transformao linear mais interessante aquela que
transforma o 0 no escore verdadeiro (x) da psicometria clssica:

Contudo, enquanto o 0 se estende de - a +, o se situa entre 0


e n (nmero de itens do teste), dado que cada item pode contribuir com 1
(acerto) ou 0 (erro). Assim, o 0 expresso em termos de x corresponde
escala dos acertos, que mais facilmente entendida pela grande maioria
das pessoas.
Quanto s transformaes no-lineares, deve-se dizer que h uma
srie delas; contudo, normalmente elas no facilitam a interpretao dos
escores, o que, afinal, a razo principal das transformaes. De qualquer
forma, a mais utilizada a transformao logits, que faz uso de logaritmos
naturais de base e. No caso do modelo de 1 parmetro, ela seria

onde

191
APLICAES DA IRT

Entre as inmeras possveis aplicaes da IRT na teoria dos testes,


algumas so especialmente relevantes, nas quais a IRT tem contribuies
inovadoras e promissoras.

Banco de itens

Na era do computador, a existncia de banco de itens permite uma


utilizao no somente mais sofisticada, mas muito mais expediente,
prtica e eficiente da medida psicolgica. A construo do banco de itens
vivel dentro da teoria psicomtrica clssica, fornecendo os parmetros
de dificuldade e discriminao de cada item. Entretanto, nesta teoria, os
parmetros so dependentes da amostra de sujeitos utilizada. A IRT
permite estabelecer os mesmos parmetros independentemente da
amostra utilizada; da possvel incluir sempre novos itens diretamente
comparveis com os j inclusos no banco. A tcnica para esta faanha,
entre outras, consiste em aplicar os novos itens juntamente com uma
amostra de itens j includos no banco a uma amostra razovel de sujeitos
e estimar os parmetros dos novos itens em confronto com os dos itens
utilizados do banco de itens. Assim os novos itens entram no banco nas
mesmas condies que os velhos.

Testes a medida (computerized adaptive testing CAT)

Anteriormente, foi visto que um teste fornece uma medida mais


precisa da aptido (0) do sujeito quando seus itens se situam no nvel de
dificuldade correspondente ao nvel da aptido do sujeito. Assim, um
sujeito com G = 2 deveria ser examinado com itens de dificuldade (b) em
torno de 2, dado que a funo de informao deles, para tal 0, mxima
a esse nvel. Na utilizao tradicional dos testes, costumeiro aplicar-se
um mesmo teste a sujeitos de nveis diferentes de 0. Num caso destes, o
teste avalia bem alguns sujeitos e mal outros. O ideal seria aplicar para
cada sujeito um teste diferente, obviamente medindo a mesma aptido,
mas que se emparelhe, em termos de dificuldade, ao nvel G de cada
sujeito. Esta a idia atrs dos testes feitos a medida (tailored ou
computer adaptive testing). Nesta situao, a seqncia dos itens
submetidos ao examinando depende do desempenho do mesmo no item
anterior; assim, para cada sujeito, a seqncia de itens diferente de
sujeito para sujeito. O que fica de problemtico em tal procedimento a
garantia de que sujeitos diferentes submetidos a itens diferentes estejam
sendo avaliados da mesma forma. A IRT, podendo estabelecer os
parmetros e as funes de informao dos itens, pode tambm demons-
trar a equivalncia entre testes diferentes, ou melhor, selecionar, para
sujeitos diferentes, itens diferentes mas equivalentes.
Equiparao de escores (test score equating)

O problema que a equiparao dos escores procura resolver o


seguinte: se dois examinandos tomam testes diferentes para avaliar a
mesma aptido, possvel comparar os seus escores? Por exemplo, na
seleo para entrada na universidade nos USA tomam-se decises sobre
quem aprovado ou no baseadas em escores de testes diferentes para
diferentes sujeitos. isto justificvel? Sim, se os escores so comparveis.
Este problema, que j vinha sendo tratado na psicometria clssica,
particularmente desde o trabalho de Angoff (1971), recebeu soluo bem
mais condizente com a IRT. Se se dispe de um banco de itens constru-
dos atravs da IRT, ento tem-se disposio um elenco grande de itens
cujos parmetros so conhecidos. Para avaliar um nvel qualquer de 0,
indiferente qual a amostra de itens utilizados, dado que o 0 independe do
instrumento (elenco de itens) usado, conquanto se trate de itens que
meam a mesma aptido, claro, e cujos parmetros sejam conhecidos.
Quando se quer utilizar itens novos com sujeitos novos, preciso que
neste procedimento se incluam itens do banco, cujos parmetros so
conhecidos, para equiparar os parmetros dos novos itens faanha que
tipicamente viabilizada na IRT (veja Banco de itens, na pgina anterior).

Identificao de itens enviesados

A questo a que se refere este problema a de justia social. O


teste no pode prejudicar um sujeito por causa de sua raa, sexo ou coisas
similares (as minorias) que, em tese, no tm nada a ver com a aptido
sendo medida problema levantado sobretudo por Jensen (1969, 1980).
A questo em pauta se refere a que um mesmo instrumento produz
medidas diferentes de uma mesma aptido, porque entram, numa situao,
fatores estranhos que no esto presentes na outra. Por exemplo: medir
a temperatura da gua fervente ao nvel de mil metros de altitude sempre
diferente de quando medida ao nvel do mar. Isto ocorre no porque a
gua ferve em graus diferentes segundo o termmetro, mas porque h, no
caso, a presena da altura em relao ao nvel do mar. Para comparar as
duas medidas, preciso controlar o fator altura. Vrias tcnicas foram
propostas para tratar deste problema na psicometria clssica com
referncia aos testes (Scheuneman, 1979; Angoff, Ford, 1973;Angoff, 1982),
mas foi a IRT que trouxe tcnicas mais apuradas para esta tarefa. Basica-
mente, a tcnica da IRT para corrigir a "injustia" dos testes consiste em
comparar as ICC resultantes do mesmo item ou teste para sujeitos
diferentes e compar-las, para verificar qual o desvio das mesmas entre
um grupo de sujeitos e outro. Assim, possvel estabelecer o funciona-
mento diferencial {differential item functioning - DlF) que cada item do
teste tem com relao a estes grupos de sujeitos. O DlF definido como:
um item mostra DIF se sujeitos com a mesma aptido 0, mas de grupos
diferentes, no tm a mesma probabilidade de acertar o item. O item que
apresentar tal problema, o DIF, dever ser revisto, refeito ou eliminado do
teste. H vrias tcnicas estatsticas para estabelecer o DIF (Hambleton,
Swaminathan, Rogers, 1991; Ellis, 1991; Hambleton, Swaminathan, 1985).

CONCLUSO

AIRT no veio somente para ficar, mas constitui a teoria psicomtrica


predominante no dito Primeiro Mundo de hoje. Embora ela seja teorica-
mente complexa e praticamente exigente em seus procedimentos anal-
ticos, parece imprescindvel que todos os que trabalham com testes
psicolgicos tenham conhecimento da mesma e dela faam uso na elabo-
rao de seus instrumentos. A literatura abundante na rea, e a disponi-
bilidade de softwares apropriados o igualmente. O desconhecimento da
IRT no Brasil vem complicar ainda mais o lastimvel estado atual dos
instrumentos psicolgicos aqui utilizados, dado que nem a psicometria
clssica ensinada adequadamente na grandssima maioria das universi-
dades brasileiras.

REFERNCIAS BIBLIOGRFICAS

ANGOFF, W.H. Scales, norms, and equivalent scores. In: THORNDIKE. R.L. (Ed.). Educational
measurement. 2.ed. Washington, D.C.: American Council on Education, 1971. p.508-GC)0.
------------------ . Use of difficulty and discrimination indices for detecting test bias. Baltimore (MD):
The Johns Hopkins University Press. 1982.
ANGOFF, W.H., FORD, S.F. Item-race interaction on a test of scholastic aptitude. Journal of
Educational Measurement. Washington, D.C.. v.10, p.95-105, 1973.
BAKER. F. B. Methodology review: item parameter estimation under the one-, two-, and three-
parameter logistic models. Applied Psychological Measurement. St. Paul (MN). v.ll, p. 111-142,
1087.
BIRNBAUM, A. Some latent trait models and their use in inferring and examinee's ability. In: LORD,
F.M.. NOVICK, M.R. Statistical theories of mental test scores. Reading (MA): Addison-Wesley,
1968. p. 17-20.
ELLIS, B.B. Item Response Theory: a tool for assessing the equivalence of translated tests. Bulletin of
the International Test Commission, v.19 n.1/2, p.33-51, 1991.
HAMBLETON, R.K. Principles and selected applications of Item Response Theory. In: LINN, R.L. (Ed.).
Educational measurement 3.ed. New York: McMillan. 1989. p.147-200.
HAMBLETON, R.K. (Ed.). Applications of Item Response Theory. Vancouver (BC): Educational
Research Institute of British Columbia. 1983.
HAMBLETON. R.K.. SWAMINATHAN, H. Item Response Theory, principles and applications. Boston
(MA): Kluwer, 1985.
HAMBLETON, R.K., SWAMINATHAN. H., ROGERS. H.J. Fundamentals of Item Response Theory.
London: Sage, 1991.
JENSEN, A.R. Bias in mental testing. New York: Free Press, 1980.

------------------. How much can be boost IQ and scholastic achievement? Harvard Educational
Review, Cambridge (MA), v.39, p.1-123, 1969.
LORD, F.M. An application of confidence intervals of maximum likelihood to the estimation of an
examinee's ability. Psychometrika. v. 18, p.57-75.1953.
----------------- .Applications of Item Response Theory to practical testing problems. Hillsdale (NJ):
Lawrence Erlbaum, 1980.

------------------. Standard error of measurement at different ability levels. Journal of Educational


Measurement, Washington, D.C., v.21, p.239-243, 1984.
------------------. A theory of test scores. Iowa City (IA): Psychometric Society, 1952. (Psychometric
Monograph, 7).

LORD, F.M., NOVICK, M.R. Statistical theories of mental test scores. Reading (MA): Addison-Wesley.
1968.

MISLEWY. R.J., BOCK, R.D. BILOG: maximum likelihood item analysis and test scoring logistic models.
Mooresville (IN): Scientific Software, 1984.
MUIZ FERNANDEZ. J. Teora de respuesta a los tems: un nuevo enfoque en la evolucin psicolgica
y educativa. Madrid: Piramide, 1990.
RASCH, G. Probabilistic models for some intelligence and attainment tests. Copenhagen: Danish
Institute for Educational Research, 1960.
SCHEUNMAN, J. A method of assessing bias in the test items. Journal of Educational Measure-ment.
Washington, D.C., v.16, n.3, p.143-152. 1979.

SWAMINATHAN, H. Parameter estimation in Item-response models. In: HAMBLETON, R.K. (Ed).


Applications of Item Response Theory. Vancouver (BC): Educational Research Institute of British
Columbia, 1983. p.24-44.
WINGERSKY. M.S., BARTON, M.A., LORD, F.M. LOGIST users guide. Princeton (NJ): Educational
Testing Service, 1982.

WOODCOCK, R.W. Development and standardization of the Woodcock-Johnson Psycho-Educational


Battery. Hingham (MA): Teaching Resources Corporation, 1978.

WRIGHT, B.D. Misunderstanding of the Rasch model. Journal of Educational Measurement.


Washington, D.C., v. 14, p.219-226, 1977a.

------------------. Solving measurement problems with the Rasch model. Journal of Educational
Measurement. Washington, D.C., v.14, p.97-116. 1977b.

WRIGHT. B.D., STONE, M.H. Best test design. Chicago (IL): MESA Press. 1979.

WRIGHT. B.D.. MEAD, R.J., BELL, S.R. BICAL: calibrating items with the Rasch model. Chicago (IL):
University of Chicago. School of Education. 1979. (Statistical Laboratory Research Memorandum,
23B).

WRIGHT, B.D., PANCHAPAKESAN, N. A procedure for samplefree item analysis. Educational and
Psychological Measurement, Durham (NC), v.29, p.23-48, 1969.
2 PARTE

MTODOS E TCNICAS DE MEDIDA EM CIENCIAS DO COMPORTAMENTO

Cap. 8 Consideraes em torno da Medida da Inteligncia 199


Leandro da Silva Almeida

Cap. 9 La Medicin de la Organizacin Lgica del Pensamiento 225


Alfredo O. Lpez Alonso

Cap. 10 Observao do Comportamento 263


Cecilia Guarnieh Batista

Cap. 11 A Medida da Criatividade 305


Eunice M. L. Soriano de Alencar

Cap. 12 Estratgias e Medidas em Anlise de Contedo 319


Edson A. de Souza Filho

Cap. 13 Medida Projetiva 341


Jurema Alcides Cunha
Maria Lcia Tiellet Nunes

Cap. 14 A Medida na Teoria da Ao Racional 367


Maria Alice D'Amorim

Cap. 15 Desenvolvimento de Instrumento


para Levantamento de Dados (Survey) 387
Hartmut Gnther

Cap. 16 Evaluacin Conductual: una Experiencia de Integracin 405


Eleonora Vivas
CAPTULO 8

CONSIDERAES EM TORNO DA MEDIDA


DA INTELIGNCIA
Leandro S. Almeida
Universidade do Minho, Portugal

e permanece atual na Psicologia e na sociedade em geral o


estudo e a medida da inteligncia, se muitas das nossas
apreciaes dirias e decises decorrem de inferncias que
fazemos a propsito das nossas capacidades e das capacidades dos
outros, certo que bastante dvidas se vo acumulando no seio dos
psiclogos quanto a um eventual consenso de perspectivas num futuro
prximo a propsito da sua definio e medida. A polmica em torno
quer da definio quer da medida da inteligncia tem permanecido ao
longo do tempo, ultrapassando o perodo ureo da abordagem diferen-
cial e dos testes (Almeida, 1988). Se muitas crticas foram formuladas a
propsito dos autores fatoralistas da inteligncia, apontando-se
nomeadamente que descreviam produtos do desempenho e no a
inteligncia na sua essncia e no seu exerccio, certo que duas dezenas
de anos de pesquisa no seio da Psicologia Cognitiva, j com estudos de
incidncia experimental, no tm conseguido maior uniformidade de
posies no nvel terico e da prtica. Se juntarmos a afirmao
atribuda a Jensen (1969) intelligence, like electricity, is easier to
measure than to define possibilidade de que no virar do sculo, e
apesar de tdas as crticas, a avaliao da inteligncia ser ainda feita
pelos testes tradicionais e nos mesmos moldes das provas com quase
um sculo de existncia (Horn, 1979), ento podemos iniciar este texto
dizendo quo difcil falar sobre "medida da inteligncia" ou pretender
ter um discurso coerente e integrador das posies mais significativas
no assunto.

Este captulo reporta-se, sobretudo, ao conceito de inteligncia


como capacidade cognitiva no sentido do conceito de "inteligncia
geral". oportuno lembrar tambm que as aptides especficas no
sero alvo deliberado deste texto e menos ainda a referncia s
medidas do rendimento (achievement tests), mais associadas aos
conhecimentos e aprendizagem.
POR QUE FALAR AINDA EM MEDIDA DA INTELIGENCIA?

Temos assistido nos ltimos anos a uma diminuio do nmero de


referncias, de ttulos de livros e artigos ou de comunicaes em con-
gressos usando as expresses tradicionais de "inteligncia", "aptides",
"capacidade intelectual" ou "quociente de inteligncia". Por outro lado,
utilizam-se hoje mais conceitos substitutivos como "cognio", "processos
cognitivos", "aptido escolar", "aptido cognitiva" ou "aptido escolstica"
(Reschly, 1990). Este fato, no entanto, no pode assumir-se como refle-
tindo menor interesse pelo estudo da inteligncia ou querendo traduzir
alteraes significativas quer na definio quer, e muito menos, na avalia-
o da inteligncia. Por exemplo, a WISC-R, mantendo o termo "inteligncia"
na sua designao, interpreta o Ql calculado como school functioning level
(SFL); o Lorge-Thorndike Intelligence Test passou a designar-se Cogni-
tive Ability Test, o Otis-Lennon Mental Ability Test designa-se agora Otis-
Lennon School Ability Test, e na 4 reviso da Stanford-Binet (1986) o
tradicional Ql passou a designar-se Standard Age Scores (SAS). As
alteraes, como se depreende, foram mais de "circunstncia" que de
"substncia", muito embora podero melhor enquadrar o uso dos testes
e os seus resultados num movimento scio-cultural que relativizou a sua
objetividade, rigor e valor, ou em modelos da interveno psicolgica
menos circunscritos avaliao.
Como explicar tudo isto? Interessa ainda o estudo da inteligncia?
Sero ainda necessrias as medidas da inteligncia?
Podemos enquadrar a resposta a esta questo fazendo referncia
a dois tipos de variveis, alis tambm importantes para explicar a
diminuio do uso do termo "inteligncia" ou a sua substituio por
outros. A primeira tem a ver com o desencanto no seio dos psiclogos e
da opinio pblica com alguns excessos associados a meio sculo de uso
e abuso da medida da inteligncia (tambm da medida em geral na Psico-
logia). Poderiam os psiclogos no saber verdadeiramente o que os testes
mediam, mas, desde que servissem para diferenciar e apresentar alguma
correlao com o desempenho futuro dos sujeitos noutras situaes, eram
necessrios e suficientes. Poder-se-ia no saber o que era a inteligncia,
mas, desde que se assumisse que o teste a avaliava, ento ela passava
a ser definida por "aquilo que o teste mede". Um verdadeiro ciclo vicioso
se instalava na pesquisa e na prtica. Empresas e recursos so maiorita-
riamente conduzidos para a construo de novos testes, para a estandar-
dizao dos seus resultados, para o reforo da sua capacidade preditiva
e para os estudos diferenciais, tomando as caractersticas scio-culturais
dos indivduos.
Um segundo tipo de aspectos decorre da percepo hoje tida de
que alguns construtos psicolgicos necessitam ser melhor definidos
tomando a sua essncia e no apenas as suas manifestaes externas.
Inclusive, algumas vzes, questionamo-nos se algumas das variveis
psicolgicas que estudamos e isto no exclusivo da inteligncia
tm uma existncia e substncia prprias ou podero no traduzir mais
que meros artefatos e realidades criadas pelos psiclogos. Claro est que,
mesmo sendo realidades criadas, elas podem ser igualmente teis para
descrever e analisar a realidade psicolgica, ou seja, o comportamento
humano. Contudo, nesse caso, temos que assumir uma postura diferente
e mais humilde comparativamente quela que nos caracterizou entre os
anos 40 e 60 a propsito da medida da inteligncia e das implicaes
prticas decorrentes dos seus resultados. Nessa altura, como os profis-
sionais dos testes e, por meio destes, os analistas da mente, fomos
afirmando no s a existncia como a hereditariedade da inteligncia, no
s as diferenas interindividuais de capacidade como decidindo os proje-
tos scio-profissionais des sujeitos.
Dentro de uma postura mais relativista, podemos concordar com
Anastasi (1986, p.5) que the term intelligence has acquired too many
excess meaning that obfuscate its nature. Um pouco narcisicamente, os
investigadores foram defendendo as suas posies, avolumando o
nmero de dados a favor das suas teorias e justificando o interesse
comercial das suas baterias de testes. Os psiclogos, na prtica, pouco
interessados no alcance terico de tais discusses, acabavam por utilizar
os testes que comercialmente se encontravam disponveis. Com alguma
intuio mistura, eles acreditavam que tomando os resultados nos testes
decidiam melhor da colocao profissional e da orientao vocacional dos
indivduos. Os testes ajudavam a cometer menos erros inferenciais na
rotulao de uma criana como "deficiente mental" ou na fixao de um
grau de demncia a um adulto acusado judicialmente de um crime.
Basicamente, eram essas as condies do uso dos testes de
inteligncia. No contexto escolar importava definir em que medida a
criana possua as capacidades e os nveis de desenvolvimento intelectual
requeridos para prosseguir uma escolaridade dita normal ou regular, ou
qual o seu perfil de aptides tendo em vista uma orientao escolar e
profissional no quadro das alternativas sociais existentes. No contexto
laborai, a avaliao da inteligncia e das aptides intelectuais foi ampla-
mente usada em seleo profissional. Nas situaes de clnica e de
justia, a avaliao da inteligncia servia definio do grau de conscin-
cia, de julgamento ou de crtica, a par de consideraes sobre estados de
demncia ou de deteriorao intelectual.
Permanecem atuais estes problemas? Permanecem atuais as
formas de medida e o uso dado tradicionalmente avaliao realizada?
Infelizmente, os problemas de insucesso nas aprendizagens
escolares permanecem e algumas crianas apresentam dificuldades
cognitivas acentuadas. Tambm e aqui podemos dizer que felizmente ,
as alternativas de realizao pessoal diversificam-se em termos escolares
e profissionais, exigem-se nveis mais elevados de especializao de
conhecimentos, ao mesmo tempo que nalgumas profisses se exige uma
grande capacidade cclica de reconverso profissional. Por tudo isso
permanece necessrio compreender as dificuldades de aprendizagem
apresentadas por alguns alunos, orientar vocacionalmente os indivduos
e proceder a selees no quadro do mundo do trabalho. Tambm ao nvel
da clnica e da justia, os exemplos que atrs descrevemos continuam
presentes na sociedade dos nossos dias e, possivelmente, justificando
uma maior ateno por parte das autoridades e instituies. A evoluo
da sociedade no diminuiu a incidncia de alguns problemas e dificul-
dades individuais; nalguns casos permitiu a sua mais livre manifestao,
sensibilizou as pessoas para a sua existncia ou, ainda, foi ocasio da sua
maior freqncia.
Nao possvel diagnosticar tais problemas sem instrumentos
adequados de medida, nem prevenir a sua manifestao sem a respectiva
avaliao. Tampouco possvel realizarmos investigao nesses dom-
nios sem bons instrumentos de medida. Se verdade que para algumas
situaes de realizao escolar e profissional algumas medidas mais
diretas do desempenho parecem substituir as medidas mais diferidas,
nomeadamente os testes tradicionais de inteligncia e de aptides, certo
que estes ltimos ocupam ainda um papel importante na avaliao psico-
lgica. Por outro lado, se o desempenho da criana em tarefas escolares
concretas ou a performance do adulto em determinadas atividades profis-
sionais podem melhor servir o objetivo de uma avaliao contextualizada
das capacidades de um e outro para aprender e para realizar, algumas
vezes os testes psicolgicos podero ser necessrios quando maior obje-
tividade reclamada na avaliao, quando interessa confrontar os
desempenhos individuais com os resultados reportados a grupos de
pertena (anlise interindividual) ou quando importa recolher informao
tendo em vista a estimao do desempenho futuro dos indivduos. pos-
svel, ainda, defender o uso dos testes como medida da inteligncia
menos contextualizada, ou mais na sua essncia, ultrapassando-se mais
facilmente experincias e conhecimentos singulares de cada indivduo. Os
objetivos da avaliao devem determinar a tipologia de instrumentos a
usar, e verdade que para algumas situaes, onde antes se usavam os
testes, recorre-se hoje a medidas mais diretas e mais contextuis do
desempenho cognitivo.
Por outro lado, podemos afirmar que a avaliao das aptides
cognitivas permanece hoje um dos domnios mais significativos da
aplicao da Psicologia (Wigdor, Garner, 1982), mesmo que se tenha
complementado os testes tradicionais com formas mais comportamentais
de medida, como revelam os resultados de inquritos junto aos psiclogos
(Cruz, Almeida, Ribeiro, 1993; Murphy, Davidshofer, 1988), ou que se tenha
substitudo a lgica seletiva anterior associada aos testes por uma outra
tendo em vista o conhecimento e o aproveitamento de cada indivduo
(Tyler, 1981). Oakland e Hu (1992), tomando as respostas de psiclogos
de 44 pases, verificaram que, entre os dez testes mais usados internacio-
nalmente junto a crianas e jovens, quatro deles dizem respeito a testes
de inteligncia geral (WSC/WISC-R na Ia posio; Raven na 28 posio;
Stanford-Binet na 5 posio; WAIS/WAIS-R na 6a posio), dentre outros
testes cognitivos (Bender, DAT, Frostig) e da personalidade (Rorschach,
TAT, MMPI).

FORMAS DE AVALIAO DA INTELIGNCIA

No faz sentido falarmos em formas de avaliao da inteligncia


sem primeiro abordarmos a sua definio. Alis, ou fazemos esse esforo
e conseguimos algum acordo entre os autores, ou todas as formas de
medida que se proponham so no mnimo criticveis. Julgamos que
importante interligar formas de avaliao a definies prvias, e minima-
mente aceitas, at para podermos interpretar convenientemente os resul-
tados e saber diferenciar criticamente os diversos tipos de instrumentos
disponveis.
Duas abordagens da inteligncia permaneceram na investigao e
na prtica psicolgica em termos de definio e de medida da inteligncia.
Por um lado, a concepo de inteligncia como uma entidade simples ou
como entidade integradora de funes (vejam-se os conceitos de "inteli-
gncia geral", de "fator geral de inteligncia", de "inteligncia compsita"
ou de "quociente de inteligncia"); por outro, a concepo de inteligncia
como uma estrutura de aptides diferenciadas ou independentes entre si.
Para o primeiro caso aquele em que se situa este texto podemos
mencionar os trabalhos de Binet e de Wechsler, autores que no s
definiram a inteligncia como conjunto integrado de funes mentais
entidade unitria e global como produziram baterias tambm elas
reunindo itens diversificados tendo em vista a medida dessa globalidade
funcional. Temos ainda autores como Spearman (1927), Vernon (1965) ou
Cattell ( 1971) para quem a inteligncia era sobretudo, ou em primeiro lugar
em termos de importncia, um fator geral entendido como capacidade de
apreender e estabelecer relaes, muito embora os dois ltimos acres-
centem fatores de segunda ordem ou de grupo. Se para Binet e Wechsler
a inteligncia seria melhor avaliada atravs de uma multiplicidade de
tarefas cognitivas de ndole verbal e prtica, para Spearman ela s-lo-ia
atravs de tarefas abstratas, mais pautadas pela novidade que pelo
conhecimento anterior do sujeito, e envolvendo o raciocnio indutivo e
dedutivo.
Contrariamente a este primeiro grupo de autores, Thurstone (1938)
e Guilford (1959) defenderam uma inteligncia formada por aptides
independentes. No primeiro caso so propostas 7 aptides diferenciadas,
como compreenso verbal, fluencia verbal, aptido numrica, velocidade
perceptiva, aptido espacial, memria e raciocnio (estas aptides
aparecem avaliadas atravs da bateria PMA do mesmo autor Primary
Mental Abilities). Guilford defende um nmero bastante mais elevado de
aptides, de acordo com o seu modelo Structure-of-lntellect (S.O.I.). Na
verso mais recente do seu modelo, tomando a combinao de S opera-
es mentais, de 5 contedos das tarefas e de 6 produtos possveis do
trabalho mental, chega proposta de 150 aptides diferentes (Guilford,
1982). Neste texto preocupa-nos a inteligncia, definida no sentido de
inteligncia geral ou fator g, pelo que nos remeteremos exclusivamente ao
primeiro grupo de autores.
A inteligncia, dita inteligncia geral, tem sido sobretudo avaliada
atravs de tarefas envolvendo a compreenso, o raciocnio e a resoluo
de problemas, em contedos diversos (verbal, numrico, abstrato, espacial)
e onde o que est mais particularmente em causa so os processos
cognitivos associados ao relacionamento da informao e aplicao de
leis, princpios e relaes inferidas. Por outras palavras, podemos afirmar
que predominam aqui as funes cognitivas mais complexas comparati-
vamente s funes simples de reconhecimento ou de memria, ou ainda
s formas sensrio-motoras predominantes nos testes de Galton e de
MacKeen Cattell no comeo do sculo (Almeida, 1988). Estudos numa ori-
entao mais cognitiva de inteligncia permitem-nos, de novo, reforar a
importncia das componentes relacionais e inferenciais na sua descrio
operacional (Sternberg, 1980).
A unanimidade dos autores em torno dos processos mentais mais
valorizados e o recurso a materiais diversos na formulao das tarefas
justificam que alguns autores falem numa inteligncia verbal, numa inteli-
gncia prtica ou numa inteligncia abstrata. Jensen (1981) classifica os
testes de inteligncia geral em testes verbais (requerem o uso da
linguagem, por exemplo provas de vocabulrio ou analogias verbais),
testes no-verbais (no requerem explicitamente o uso da linguagem, por
exemplo os testes papel-lpis de matrizes, analogias ou seqncias
figurativas) e os testes de realizao (requerem o desenho do sujeito, a
construo de algo ou a manipulao de materiais, por exemplo as provas
de cubos ou de puzzles). As escalas de inteligncia de Wechsler, por
exemplo, recorrem a essa diversidade de situaes.
A grande classificao que se pode assumir nos testes de
inteligncia geral, em nosso entender, basicamente serem testes
coletivos ou testes individuais. Veremos, ento, vrias especificidades
destes testes tomando essa subdiviso.
ESPECIFICIDADES DOS TESTES COLETIVOS

Os testes de inteligncia de aplicao coletiva datam da I Grande


Guerra e do contributo dos psiclogos americanos na seleo dos recru-
tas. J em 1923, no seu livro Intelligence Testing, Pintner identificava 37
testes coletivos de inteligncia, entre os quais cinco no recorrendo lin-
guagem (tudo neles, inclusive as instrues, era figurativo) e seis no
verbais.
So exemplos mais recentes de testes coletivos de inteligncia: 1)
o Culture Fair Intelligence Tests (Cattell, 1973), onde os itens, pretensa-
mente avaliando a inteligncia sem a interferncia de fatores culturais,
atravs do uso de figuras abstratas, cobrem diferentes tarefas sries
progressivas, classificao, matrizes e descoberta de propriedades
comuns , e 2) as Raven's Progressive Matrices (Raven, 1941, 1981,
1985), onde os itens so figuras geomtricas na forma de matriz e onde
falta uma parte a escolher entre 6-8 alternativas. Estas compreendem trs
verses devidamente diferenciadas: a) a Coloured Progressive Matrices,
destinada a crianas; b) a verso estandardizada, composta por 60 itens;
e c) a Advanced Progressive Matrices, formada por 36 itens e destinada
a adultos mais desenvolvidos intelectualmente.
Algumas caractersticas gerais dos testes coletivos de inteligncia
podem apontar-se. Em primeiro lugar, so testes papel-lpis e, por
norma, so realizados num tempo previamente definido. O limite de tempo
no , no entanto, fator decisivo no desempenho (trata-se de testes de
competncia e no de velocidade). Esse tempo limite serve sobretudo
busca de maior objetividade na avaliao e de maior diferenciao
interindividual dos resultados. Nos testes de inteligncia, como nos demais
testes referenciados a normas, um procedimento usado na fixao do
tempo limite num teste tomar o tempo necessrio para que 20% da
populao o possa concluir na globalidade dos seus itens.
Em segundo lugar, o formato dos itens nos testes coletivos de
inteligncia geralmente de escolha mltipla (multiple-choice), cabendo
ao sujeito assinalar a alternativa que lhe parea mais correta. Sobretudo
a partir dos testes coletivos usados na 1 Grande Guerra, e com a genera-
lizao da avaliao da inteligncia no campo da indstria e do ensino, a
quase totalidade dos testes coletivos apresentam alternativas de resposta
para escolha do sujeito. Este formato assegura uma maior objetividade na
avaliao, nomeadamente no nvel da escorizao e cotao (permite,
alis, na maioria dos casos, uma informatizao de tais procedimentos).
O nmero de alternativas varivel, contudo procura-se que no seja
inferior a quatro ou cinco, para reduzir a probabilidade de acerto mera-
mente ocasional num item a 25% ou a 20%, respectivamente.
Em terceiro lugar, comparativamente aos testes individuais, mais
fcil a estandardizao das condies de aplicao e de escorizao dos
resultados em testes coletivos. O aplicador pode estar menos presente na
situao de avaliao, justificando isso inclusive uma certa tendncia atual
para a administrao informatizada destes mesmos testes. Em termos de
estandardizao, podemos afirmar que, respeitando-se as instrues que
constam dos manuais, e sendo a correo e escorizao igual para todos
os sujeitos, as diferenas encontradas nos resultados podem assumir-se,
logicamente, como manifestao das capacidades individuais. Por ltimo,
a sua aplicao coletiva traduz, por norma, uma economia de recursos.
A sua principal dificuldade ou limitao tem a ver com a pouca
ateno dada forma como os sujeitos respondem ou a outros aspectos
que poderiam servir a interpretao dos resultados, por exemplo as
razes que levam um sujeito a escolher determinada alternativa no tida
como correta pelo construtor do teste. Associada a esta limitao est
uma outra que tem a ver com a percepo de uma discrepncia entre o
resultado final do sujeito (ou seja, o nmero de itens corretamente
resolvidos) e a sua capacidade real em face da pouca interao entre o
avaliador e o sujeito, ou seja, os poucos espaos para o confronto do
sujeito com o seu desempenho. Por outro lado, o fornecimento das
alternativas de resposta, ainda que favorea a estandardizao do testing,
pode provocar o aparecimento de padres especficos de resposta
(raciocnio, comparao, justificao) ou tambm respostas ocasionais
nem sempre devidamente ponderadas na anlise dos desempenhos
individuais. Apesar destas desvantagens, a informao disponvel
permite-nos afirmar que estes testes medem de fato, de alguma forma ou
em certa medida, a inteligncia (Jensen, 1980; Jackson, 1984).

ESPECIFICIDADES DOS TESTES INDIVIDUAIS

Os testes individuais de inteligncia so hoje ainda bastante


utilizados. Ou porque os testes coletivos podem sofrer de certa "crise"
presente em face das reaes suscitadas pelas avaliaes massivas das
populaes escolares, ou porque os testes coletivos podero no
aprofundar a avaliao cognitiva requerida para certas decises de
classificao ou de seleo a tomar, certo que os testes individuais de
inteligncia permanecem bastante utilizados e a definir o principal papel
dos psiclogos, por exemplo os psiclogos escolares nos Estados Unidos
(Reschly, 1990).
So exemplos de testes individuais as bem conhecidas escalas de
inteligncia de Binet e de Wechsler. A Escala de Inteligncia Binet-Simon
(1905)foi objeto desucessivas reformulaes nos Estados Unidos (Escala
de Inteligncia Stanford-Binet; Terman, 1916; Terman, Merrill, 1937, 1960)
e uma mais recente na Frana (Nouvelle Echelle Mtrique de l'Intelligence
NEMI; Zazzo et al., 1966). Na sua reviso mais recente nos Estados Unidos, ou
seja, a 4 verso (Thorndike, Hagen, Sattler, 1986), a escala tenta integrar-se
num modelo dito hierrquico de inteligncia, onde, a par de um fator geral de
inteligncia, podemos falar em trs fatores de grande grupo, como a aptido
cristalizada (raciocnio verbal e raciocnio quantitativo), a aptido fluida ou
analtica e a memria a curto prazo.
As escalas de inteligncia de Wechsler, em termos de concepo de
inteligncia, no se diferenciam das de Binet (inteligncia como conjunto de
funes cognitivas). Alis, contrastando com Spearman, refere que quanto mais
se procura purificar os testes em termos de um fator geral mais este perde a
sua capacidade avaliativa da prpria inteligncia. Esta no apenas uma
funo mental simples, mas, antes, uma parte de um todo ainda maior, a
personalidade (Wechsler, 1950). A principal diferena foi o abandono do Ql de
razo e, logicamente, do conceito de idade mental, das vicissitudes do seu
clculo e a adoo do Ql de desvio.
A primeira escala construda designou-se Wechsler-Bellevue Intelligence
Scale (Wechsler, 1939), que em 1955 passou a designar-se Wechsler Adult
Intelligence Sca/e(WAIS) e da qual existe uma reviso mais recente (WAIS-R,
1981). Trata-se de uma escala destinada avaliao da inteligncia do adulto
atravs de 11 subtestes seis verbais (informao, memria de nmeros,
vocabulrio, aritmtica, compreenso e semelhanas) e cinco de realizao
(completamento de gravuras, cubos, puzzles, arranjo de imagens e cdigo) e
que permite a obteno, no final, de trs quocientes de inteligncia (Ql verbal,
Ql de realizao e Ql global). Duas outras escalas foram ainda desenvolvidas
por Wechsler para a avaliao intelectual das crianas. Referimo-nos
Wechsler Intelligence Scale for Children (WISC), para as idades dos 6 aos 16
anos, e Wechsler Preschool and Primary Scale of Intelligence (WPPSI), para
as idades dos 4 aos 6 ou 6V2 anos. A WISC foi criada em 1949, tendo a sua
primeira reviso em 1974(WISC-R). A WPPSI foi desenvolvida em 1968. Ambas
as provas se assemelham, em termos de estrutura, aplicao, scores e
interpretao, WAIS.
Algumas caractersticas dos testes individuais de inteligncia podem
apontar-se. Nos testes individuais, para alm da estandardizao dos estmulos
e das condies de testing que poderamos afirmar serem tambm
preocupao nos testes coletivos de inteligncia, importante considerar a
relao interpessoal que se estabelece entre o avaliador (por norma um
psiclogo) e o sujeito (criana ou adulto). Para alm de nessa relao
interferirem variveis diversas do avaliador e do sujeito, como o sexo, a idade, a
classe social ou a atrao fsica, convm no esquecer que a prpria situao
de avaliao j uma relao percepcionada de formas diversas pelos
diferentes sujeitos e que tal percepo interfere no desempenho. Trabalhos
clssicos confirmam, de fato, diferenas nos
desempenhos em funo das percepes individuais da utilidade, da
dificuldade e do sentido do testing (Roazzi, Spinillo, Almeida, 1991).
Como se tem afirmado, na avaliao individual, o sujeito percepciona-
se a responder no aos itens ou ao teste, mas ao prprio psiclogo. Isso
complica ainda mais a situao por exemplo, as reaes em face dos
itens fceis ou difceis que a prova comporta. Por todas estas razes,
decisiva a relao criada na avaliao da inteligncia atravs de testes
individuais, devendo ser dada particular ateno aos primeiros momentos
da avaliao. Mais uma vez, importa aqui assinalar que estes testes
devem no apenas ser de aplicao exclusiva por psiclogos, como estes
devem ter uma formao geral e especfica nas tcnicas usadas.
Comparativamente aos testes coletivos, nos testes de aplicao
individual, por norma, no so fixados limites de tempo (o que no impede
de se fixarem bonificaes nos resultados para desempenhos mais
rpidos). Por outro lado, freqente estes testes inclurem provas com
manipulao de materiais e onde se procura uma informao avaliativa
complementar ou alternativa realizada atravs de itens verbais ou
meramente figurativos. Finalmente, nos testes individuais, o sujeito no se
limita a escolher uma alternativa, antes organiza uma resposta que ser
pontuada de acordo com o seu grau de adequao e de rigor em face da
situao ou do problema apresentado. Alis, na grande maioria destes
testes, os sujeitos respondem a itens mais adequados ao seu nvel de
capacidade (evitam-se itens demasiado fceis ou demasiado difceis). Ao
longo da aplicao das provas, o psiclogo, partindo das respostas
corretas ou erradas anteriores, vai definindo que itens posteriores so
passados ao sujeito.
Finalmente, os testes individuais so uma ocasio para a avaliao
de aspectos cognitivos e no estritamente cognitivos do desempenho e
importantes na interpretao dos resultados finais. O fato de a avaliao
ocorrer numa situao individual, quase situao de "entrevista-clnica"
ou "experimental-clnica", permite apreciar aspectos como: 1 ) a reao do
sujeito ao testinge sua prossecuo (cooperao, ansiedade, bloqueios,
persistncia, etc), 2) o impacto de variveis pessoais e situacionais no
prprio desempenho (fadiga, motivao, autoconfiana, etc.) e 3) infor-
mao referente s respostas corretas e aos erros dados, designadamente
em relao aos processos cognitivos a usados. Consegue-se, assim,
uma avaliao da inteligncia mais aprofundada e interligando infor-
maes de ndole quantitativa (pontos, notas, normas) e qualitativa
(comportamentos, reaes, relao, personalidade), utilizando-se os
testes individuais em situaes de diagnstico e de seleo que requeiram
uma maior exigncia e individualizao da informao. Possivelmente,
em face da menor incidncia da avaliao para efeitos de diagnstico e
de estimao das diferenas interindividuais, a favor de uma lgica mais
preventiva e desenvolvimental, os testes individuais de inteligncia
permitem uma avaliao mais compreensiva das capacidades dos sujei-
tos, nomeadamente tomando na anlise do desempenho a interao entre
capacidade e contexto ou tarefa (Roazzi, Spinillo, Almeida, 1991).

CONTROVRSIAS EM TORNO DA AVALIAO DA INTELIGNCIA

O aparente sucesso verificado no recrutamento por ocasio da ia.


Grande Guerra atravs de testes de inteligncia conduziu a um verdadeiro
boom destes mesmos testes na sociedade civil a partir de ento,
nomeadamente nos Estados Unidos. Surge, ento, uma grande indstria
voltada para a avaliao em larga escala da inteligncia (Murphy,
Davidshofer, 1988), particularmente voltada para a satisfao de necessi-
dades de maior objetividade e pretensa cientificidade das tarefas de
seleo e classificao profissional.
No setor da Educao, e tambm nos Estados Unidos, esse boom
teve lugar nos anos 60. O lanamento do Sputnik pela Unio Sovitica
despolutou um maior investimento do governo americano na educao,
quer atravs de programas scio-educativos voltados para a "compen-
sao educativa" das crianas provenientes de meios scio-culturais
menos estimulantes, quer atravs da introduo nas escolas de uma
prtica sistemtica de avaliao das capacidades intelectuais. De novo
buscava-se a "excelncia", e os testes voltaram a ser massivamente
aplicados.
A controvrsia em torno dos testes, se era j uma realidade,
ganhava logicamente particular incidncia nesses momentos de utilizao
massiva. O uso desenfreado dos testes e a tomada dos seus resultados
como absolutos suscitaram receios e reservas pblicas. A partir de ento
esta controvrsia torna-se objeto de preocupaes legislativas. Nalguns
estados americanos, por exemplo, os testes de inteligncia so pura e
simplesmente abolidos, ou limitadas juridicamente as decises com base
nos resultados em testes.
Esta controvrsia assumiu diferentes argumentos, vrios deles em
torno do rigor e da validade das medidas de inteligncia. Sem dvida, os
aspectos mais decisivos nesse debate pblico, inclusive no seio dos
psiclogos, passavam pela questo da sua neutralidade social e pela
questo do seu rigor cientfico. Em ambos os casos, o problema consistia
na defesa/recusa de que um mesmo teste pudesse avaliar e comparar a
inteligncia dos indivduos independentemente das suas origens e expe-
rincias scio-culturais. Mltiplos argumentos foram usados contra os
testes. Pondo de lado aqueles argumentos que mais podero traduzir a
animosidade do pblico, centrar-nos-emos nos que decorrem do baixo
valor cientfico da medida da inteligncia.
A neutralidade social dos testes de inteligncia
Na segunda metade deste sculo, a contestao scio-cultural aos
testes de inteligncia foi-se acentuando. Os grupos sociais mais
desfavorecidos apresentavam resultados mais fracos nos testes tradicio-
nais de inteligncia e, por causa desse desempenho inferior, apareciam
com maior freqncia segregados em termos de ensino e de emprego.
Colocava-se, ento, em causa a pretensa neutralidade social e validade
cientfica dos testes. Falando em nome da Black Psychological Associ-
ation, Jackson (1975) afirmava tal enviezamento nos testes e tomava-os
como quasi-scientific tool for perpetuating racism. Claro est que esta
mesma questo se pode generalizar a outras especificidades scio-
culturais dos individuos, que no apenas tnicas, nomeadamente quando
especficas dos grupos sociais ditos minoritrios.
Assim colocado o problema, podemos formar duas orientaes na
sua anlise. Uma primeira que apreciar os aspectos sociais que
interferem na avaliao, dificultando desse modo a sua neutralidade
social. Nesta altura, o esforo dos investigadores deveria ser dirigido para
a concepo de formas de avaliao da inteligncia menos afetveis
socialmente. Uma segunda orientao, mais radical, parte da afirmao
da inteligncia como uma construo social e, como tal, no pode ser
avaliada fora do seu contexto. Neste ltimo caso, a questo da neutrali-
dade social da inteligncia no faz qualquer sentido. Apenas respeitando
as experincias scio-culturais se poder avaliar a inteligncia, o mesmo
dizer que no podemos com um nico teste ou tipo de testes avaliar a
inteligncia junto de qualquer grupo.
No quadro da primeira orientao, vrias pesquisas procuraram
diminuir a incidncia dos fatores culturais na avaliao da inteligncia.
Umas centraram-se nos prprios testes e respectivos itens, enquanto
outras procuraram cuidar das prprias condies de avaliao (situao
de testing). Esto neste caso as tentativas de construo de testes livres
de influncias culturais (free culture tests) ou das experincias educacio-
nais dos indivduos (Eels et ai., 1951). Tais testes, de contedo figurativo-
abstrato, permanecem, ainda hoje, como uma tentativa sria de diminuir
que no eliminar a influncia de tais variveis na avaliao da
inteligncia e, ainda hoje, esse tipo de testes usado em investigaes
transculturais como "um mal menor".
Para alm do contedo e do formato dos itens nos testes de
inteligncia, em vrias investigaes questionou-se o impacto da prpria
relao avaliador-avaliado nos resultados de tais testes. A influncia
dessa relao no desempenho, e sendo essa influncia diferente de acordo
com as origens social e tnica dos sujeitos (Labov, 1970), veio reforar o
movimento anti-testing. As crticas foram-se tornando cada vez mais
incisivas e abrangentes e, nalguns momentos, os testes foram associados
a prticas racistas (Jackson, 1975; Jones, Wilderson, 1976) ou aformas de
desumanizar e de destruir crianas e jovens negros (Williams, 1970). Este
ltimo autor (Williams, 1972) construiu um teste em sua opinio melhor
adequado avaliao intelectual de crianas negras, pois que assente nas
suas experincias culturais. Tentou demonstrar tambm que um teste de
inteligncia, enviesado culturalmente, poderia favorecer um grupo de crianas
em relao a outros. Referimo-nos ao Black Intelligence Test of Cultural
Homogeneity (BITCH), um teste de vocabulrio assente nos conhecimentos
culturais dos ghettos negros; nesta prova, as crianas negras obtm melhores
desempenhos que as brancas (Matarazzo, Wiens, 1977). Contudo, o fato dos
itens estarem mais centrados em contedos especficos do que em processos
cognitivos de tratamento da informao e de resoluo de problemas questiona
muito se de fato estamos perante medidas vlidas de inteligncia (Cronbach,
1978; Jensen, 1980; Matarazzo, Wiens, 1977), parecendo igualmente irrefutvel
que os sujeitos realizam melhor quando as tarefas dos testes se aproximam do
seu quadro de referncia cultural (Sternberg, 1991).
Permanece o problema e a controvrsia em seu redor. Ser que os
testes medem a mesma coisa em qualquer grupo humano? A questo pode ser
mais bsica ainda, ou seja: como pretender avaliar a inteligncia pelo menos
parcialmente um produto cultural pretendendo-se prescindir da sua origem?
Ser que alguma vez a avaliao da capacidade intelectual pode prescindir das
experincias dos indivduos? No afetaremos os processos cognitivos
avaliados ao pretendermos avali-los atravs de tarefas libertas dos
conhecimentos culturais?
Os testes de inteligncia, segundo alguns, seriam apenas fiis e vlidos
para indivduos da etnia branca e escolarizada (Williams, 1974). Com efeito, os
sujeitos da etnia branca e escolarizada esto mais freqentemente em contato
com as atividades culturais, de resoluo de problemas e de leitura e escrita
que compem as tarefas dos testes. Os testes cujos itens se aproximam ou
refletem os conhecimentos e a experincia escolar no so socialmente
neutros, pois tais aspectos no se encontram igualmente distribudos. Os tens
verbais so aqueles mais facilmente afetados. Jensen (1980, p.637) acrescenta
que os testes papel-lpis, requerendo a leitura, respostas escritas, velocidade,
contedo verbal e evocao de informao antes aprendida so mais
facilmente influenciados pelos aspectos culturais que, comparativamente, os
testes de realizao, figurativos, respostas orais, contedo no-verbal, potncia
e resoluo de problemas. As implicaes decorrentes destas consideraes
podem assumir alguma gravidade. O valor inquestionvel dos testes pode
perpetuar medidas socialmente discriminatrias. Os professores podem tender
a explicar o baixo rendimento dalguns grupos de alunos tomando como
referncia o seu baixo desempenho em testes de Ql (cooling out - Mercer,
1973). Ao mesmo tempo, a constatao de que
certos grupos so superiores e outros inferiores nos testes de inteligncia
pode sugerir uma determinao gentica para tais diferenas (Jensen,
1969; Hernstein, 1971) e, em boa verdade, alguns setores da populao
pensam dessa forma. A questo da universalidade da medida e da com-
parabilidade interindividual dos resultados em testes de inteligncia
merece, no mnimo, maiores cuidados nas inferncias e nas concluses
que os psiclogos produzem neste domnio.

A fidelidade e a validade dos resultados nos testes


Sem desmerecer o mrito e o rigor dos argumentos por detrs da
controvrsia social antes apontada, mencionaremos agora alguns pontos
que mais de perto parecem decorrer do estatuto "cientfico" da prpria
avaliao. Em primeiro lugar, difcil assegurarmos que se avalia algo, ou
convencer disso algum, quando o prprio objeto da avaliao no se
encontra ainda perfeitamente definido. Pelos menos em parte, esta a
situao ou a verdade a propsito da inteligncia. Alis, em algum
momento avana-se num determinado sentido e mais tarde retoma-se o
que havia sido abandonado. Como exemplo, volta-se hoje a reativar o
interesse, j presente no comeo do sculo, pela medida da inteligncia
tomando indicadores de natureza fisiolgica (tempos de reao, potenciais
evocados, condutibilidade eltrica da pele, etc). Por outras palavras,
parece-nos que os testes sero sempre medidas possveis da inteligncia,
mas nunca pelo menos neste momento "as medidas da inteligncia".
A falta de uma definio clara e precisa de inteligncia, capaz de
reunir o consenso dos investigadores e estimular a produo de indicado-
res mais universais da inteligncia, explica porque alguns investigadores
e profissionais do terreno no se identificam com o tipo de testes exis-
tentes atualmente (cf. Sternberg, 1991); em sua opinio, os testes
existentes valorizam determinados aspectos e no outros do desempenho
cognitivo. Por exemplo, do pouca ateno aos estilos cognitivos,
criatividade, s interfaces com o conhecimento dos indivduos, s suas
expectativas ou aos aspectos scio-relacionais, favorecendo uma lgica
"intelectiva" (Roazzi, Spinillo, Almeida, 1991).
Em nossa modesta opinio, a busca de estandardizao e objeti-
vidade no material do teste (formato e contedo dos itens, procedimentos
de resposta, tempo de execuo, parmetros de cotao, por exemplo)
tero justificado um "artificialismo" nas situaes apresentadas e na
prpria execuo que, certamente, impede a todos os sujeitos a expres-
so das suas reais capacidades e, muito menos, a sua avaliao de uma
forma mais compreensiva por exemplo, como se organizam, funcionam
ou manifestam nas situaes concretas. Se alguns sujeitos se adaptam
com facilidade s novas tarefas, ou mesmo ao "jogo" que se prope,
outros existem que apenas parcialmente se envolvem. Mais uma vez
defendemos o teste como um instrumento ou meio de avaliao, e no
corno a avaliao no seu todo ou forma exclusiva de recolha da infor-
mao sobre a capacidade e o funcionamento cognitivo dos indivduos.
interessante assinalar que este "artificialismo" foi vrias vezes
justificado, quer para assegurar a objetividade da medida, quer para
assegurar a sua prpria neutralidade social. Procurou-se atravs dele
diminuir o impacto das variveis scio-culturais e das experincias
educativas na avaliao, seja de uma "inteligncia pura", seja das
diferenas interindividuais. Mais uma vez, aceitando-se a inteligncia
pelo menos parcialmente como um produto da socializao dos
indivduos, tal artificialismo deixa de ter sentido, pois, inclusive, dificulta
a medida da inteligncia na sua essncia. Quando falamos no
artificialismo dos itens ns estamos de algum modo a criticar a falta de
ligao imediata entre o contedo, o formato e a linearidade dos
processos subjacentes aos itens nos testes e conhecimentos anteriores
ou as tarefas quotidianas dos indivduos. Por norma, as tarefas nos
testes so breves, simples e de execuo linear, o que no
corresponde realidade quotidiana (Sternberg, 1985, p.30). Resta
saber se, sendo isso necessrio por razes de objetividade e de
economia de recursos na avaliao, tais itens se constituem como
elementos bsicos (validade de contedo) e como bons indicadores
(generalizao) do desempenho habitual, ou se isso se aplica da
mesma forma a todo e qualquer sujeito (universalidade). Alis, o prprio
"artificialismo" veja-se a forte componente "abstrata" e "racional" dos
itens pode mais facilmente fazer parte das experincias de crianas
e adultos da classe mdia, das sociedades mais industrializadas e
escolarizadas.
Um outro aspecto prende-se com a melhoria dos desempenhos nos
testes de inteligncia com o treino ou a sua realizao repetidas vezes.
Para alm de se questionar os ganhos da decorrentes em face das defi-
nies de inteligncia algumas vezes avanadas por exemplo, a sua
estabilidade e a sua independncia em face da aprendizagem ou conhe-
cimentos especficos , podemos afirmar que tais ganhos afetam, no
mnimo, ou a objetividade ou a validade dos resultados obtidos. A partir
das instrues, os exemplos ou os exerccios de treino que so includos
em cada teste deveriam, por norma, possibilitar a cada indivduo a apren-
dizagem requerida para o desempenho de modo a este traduzir a sua
"potncia" (capacidade possuda). A melhoria verificada nos resultados
com a repetio da realizao de um teste, que no nos parece difcil de
compreender ou explicar, questiona no imediato a idia de que todos
estejam partida em igualdade de condies e, no final, sejam as dife-
renas observadas apenas interpretadas como refletindo diferenas reais
nos nveis de capacidade possuda. Mais complicado, ainda, a relao que
alguns estudos defendem entre as expectativas e as atribuies causais
dos indivduos (mais do foro scio-motivacional) e os seus resultados nos
testes. Apesar da natureza essencialmente "intelectiva" destes testes, os
resultados refletem tambm outras facetas dos indivduos, ou seja, o impacto
de variveis mais ligadas motivao e personalidade (Barros, Almeida,
1991).
Outras dificuldades podem apontar-se, nomeadamente quanto forma
como so usados os testes. Algumas vezes eles no se encontram
convenientemente adaptados e aferidos para os grupos populacionais onde
aparecem usados, quer ao nvel da investigao, quer da prtica psicolgica.
Muitas vezes acaba-se por no respeitar nem atender s especificidades
lingsticas e culturais dos indivduos (Reschly, 1981). Claro est que aqui o
problema pode ser tido como anterior ao teste. Contudo tambm verdade que
alguns estudos sobre a validade preditiva dos testes partiram da formao
prvia de grupos contrastantes de sujeitos. Por exemplo, em muitos trabalhos e
na prtica psicolgica, a avaliao, por norma, ocorre j quando um problema
de comportamento ou quando uma deficincia cognitiva se encontra
identificada. Nessa altura no difcil encontrar correlaes mais ou menos
elevadas entre os dois tipos de ocorrncias. Em tais estudos, mais que estudar
o poder prognstico dos testes, refora-se o sentido de diagnstico do uso dos
testes como se a cincia psicolgica se resumisse, ou socialmente se justifi-
casse, por essas atividades.
Finalmente, as condies do testing so diversas e decisivas para os
resultados, e uma avaliao minimamente consciente requer uma
individualizao da informao. Esta individualizao mostra-se particularmente
importante em avaliaes atravs de testes coletivos, pois que pouca
informao o psiclogo pode obter a propsito das justificaes e dos
processos usados pelo sujeito nas suas respostas. Importa uma avaliao que
permita uma imagem compreensiva e funcional do sujeito, o que em boa
verdade nem sempre acontece na avaliao tradicional. Indivduos com timos
resultados nos testes nem sempre se apresentam socialmente eficientes, ao
mesmo tempo que outros diagnosticados como "limtrofes" (entre a normalidade
e a deficincia) se manifestam gnios em algumas reas cientficas e culturais.
Algumas tentativas existem para esta avaliao compreensiva, mas so ainda
mais a exceo do que a regra.
Uma das propostas mais conhecidas para uma avaliao abrangente e
individualizante da inteligncia o programa System of Multicultural Pluralistic
Assessment (SOMPA), de Mercer e Lewis (1978). O SOMPA destina-se a
crianas entre os 5 e os 11 anos e integra a informao decorrente da 1)
aplicao da escala WISC-R com a informao obtida atravs de 2) entrevistas
aos pais, da 3) entrevista individual criana, da 4) sua histria mdica, da 5)
sua avaliao sensrio-motora e perceptiva e da 6) aplicao de um Inventrio
de Comportamentos Adaptativos para Crianas. A informao referente ao
background scio-econmico deve
entrar numa equao de regresso para transformar o score de Ql
(WISC-R) num score standard reportado como Potencial de Aprendiza-
gem Estimado (Estimated Learning Potential ELP). A vantagem do
SOMPA (dito programa de avaliao compreensiva da inteligncia),
segundo o seu prprio autor (Mercer, 1973; 1978), o de permitir uma
interpretao diferente para os scores obtidos (no a predio do sucesso
esperado no futuro, mas o proveito que a criana poder fazer das situa-
es de aprendizagem que atendam ao seu contexto scio-cultural) e o
de no associar ao "estigma da deficincia" as percepes de incapaci-
dade, dadas as conseqncias sociais e psicolgicas nefastas que da
decorrem.

ALTERAES PREVISVEIS NA AVALIAO DA INTELIGNCIA

Algumas alteraes so previsveis, e em parte vo j sendo reali-


dade, no que toca avaliao da inteligncia. Outras podem ter-se, para
j como desejveis num futuro prximo, em face da pertinncia das crti-
cas formuladas aos testes tradicionais de inteligncia.
Uma primeira alterao podemos aqui tom-la como esforo de
maior pormenorizao. Este esforo pode situar-se em diferentes nveis
por exemplo, tentando-se decompor conceitos clssicos de inteligncia
(aptido verbal, quociente de inteligncia, raciocnio) nos seus elementos
processuais mais bsicos e, com isto, no s "purificar" o teste como
tambm o significado da sua informao. Um outro enfoque da pormenori-
zao passa pelo maior interesse na anlise intra-individual do desempe-
nho no teste, em alternativa a uma apreciao reportada exclusivamente
a normas de grupo (Perlman, Kaufman, 1990), sendo previsvel o apareci-
mento de um maior nmero de provas referenciadas a critrio (criterion-
referenced tests). Este esforo de maior pormenorizao permite antever
uma informao qualitativamente superior, pois integra e atende aos
processos cognitivos utilizados pelos sujeitos na obteno dos seus
scores globais, ao mesmo tempo que permite contextualizar essa infor-
mao nas experincias educativas, nos procedimentos de resoluo de
problemas ou nas estratgias e estilos cognitivos do sujeito em causa.
Uma segunda alterao prende-se com o alvo da avaliao. Aqui
algumas mudanas parecem ser desejveis, por exemplo uma valorizao
progressiva das capacidades e dos aspectos cognitivos mais diretamente
ligados s aprendizagens e ao conhecimento, em desproveito de uma
avaliao fortemente orientada para aptido mental ou intelectual pura
(Horn, 1979; Resnick, 1979; Sattler, 1988). Neste mesmo sentido vo as
preocupaes com avaliaes intelectuais mais compreensivas, por
exemplo integrando na avaliao da inteligncia componentes no
estritamente cognitivas (autoconceito, auto-eficcia, expectativas de
sucesso ou de fracasso), alis, tambm no exclusivamente centradas
nas aprendizagens curriculares (experincias e conhecimentos quotidia-
nos). Espera-se que daqui possa resultar uma melhor compreenso
quanto s formas habituais de adaptao e de resoluo de problemas no
quotidiano pessoal (Perlman, Kaufman, 1990).
Em terceiro lugar, a avaliao da inteligncia dever passar a incluir
aspectos mais dinmicos do prprio exerccio e funcionamento cognitivo.
Referimo-nos, por exemplo, aos estilos cognitivos ou s estratgias de
processamento da informao ou, por outras palavras, no apenas e no
tanto ao "quanto se inteligente", mas ao "como se funciona cognitiva-
mente". O teste K-ABC atende j a esta preocupao ao incluir provas
para avaliao do processamento seqencial e simultneo de informao.
Julgamos que este ponto de novo nos remete para a possvel discrepn-
cia entre capacidade ou capacidades possudas e desempenho manifesto
nos testes e para a possibilidade dessa discrepncia estar parcialmente
associada aos procedimentos resolutivos menos adequados usados pelos
sujeitos nas tarefas (cf. o conceito de "zona do desenvolvimento proximal"
introduzido por Vygotsky, 1978).
Por ltimo, o futuro da avaliao da inteligncia dever passar pelo
impacto dos desenvolvimentos tericos que hoje se esto a operar no
campo da cognio (Lindemann, Matarazzo, 1990; Sternberg, 1991),
nomeadamente os estudos experimentais no quadro da teoria do proces-
samento da informao, a simulao dos processos mentais atravs do
computador (ou o mero uso do computador na avaliao) e os estudos em
psicofisiologia (compreenso dos fatores neurolgicos, bioqumicos e
fisiolgicos relacionados com a atividade inteligente). Em primeiro lugar,
os avanos registrados no campo da informtica e da tecnologia em geral
esto a ter algum impacto nas formas habituais de avaliao da intelign-
cia. Se num primeiro momento apenas a escorizao era feita de uma
forma mecnica e rpida atravs destes meios, hoje a prpria aplicao,
organizao de itens e elaborao de relatrios-sntese aparecem
realizados atravs do computador. Potenciais vantagens deste procedi-
mento tm a ver com 1) um conhecimento mais apurado das respostas
aos itens isolados (tempo de latncia, por exemplo), o que no possvel
em testes coletivos papel-lpis, 2) uma aplicao mais de acordo com as
reais caractersticas e capacidades dos sujeitos (eliminao dos itens
anteriores (Weiss, Davidson, 1981) e 3) um menor tempo, menor custo e
maior objetividade que da podemos retirar. Evidentemente que estas
vantagens no so absolutas. Importa verificar e controlar o uso, s por
si, do computador. A familiaridade e a relao estabelecida com a
mquina e o teste podem influenciar o desempenho, embora parea j
haver alguma informao de que em relao aos testes coletivos no se
verifica uma perda significativa na acuidade dos resultados (Murphy,
Davidshofer, 1988). Importa que os ganhos da decorrentes em termos de
recursos humanos e materiais envolvidos no se convertam em perda de
informao do testing e, conseqentemente, do prprio sentido e relevn-
cia da avaliao psicolgica (Perlman, Kaufman, 1990), muito embora
tenhamos tambm que reconhecer e isto infelizmente que nem toda
a avaliao anterior da inteligncia atendia e integrava a diversidade de
informaes relativas situao de teste.
Finalmente, os trabalhos experimentais analisando as correlaes
entre a inteligncia e as tarefas cognitivas bsicas, j muito prximas do
substrato neurolgico, permanecem ainda envoltos em grandes dvidas
quanto ao seu contributo efetivo para a avaliao da inteligncia (Stern-
berg, 1991). Muito embora nas duas ltimas dcadas seja substancial o
volume de investigaes nesta rea e se possa pensar que ultrapassamos
j a falta de rigor nas medidas de Galton (Ceci, 1990), certo que ainda
bastante cedo para se concordar com autores que tomam os tempos de
reao e outros indicadores bsicos do processamento da informao
como uma das medidas mais vlidas e culturalmente neutras da intelign-
cia (Eysenck, 1982).

CONCLUSO

Uma posio relativistica e crtica em relao aos testes justifica-se


no presente, at para defesa dos prprios testes e do seu valor na prtica
psicolgica. Diramos que, olhando pelo prisma das suas caractersticas
mtricas, os testes de inteligncia, sem se poderem tomar como rigorosos
a 100%, garantem confiana e ajudam a tomar decises. A margem de
erro nas estimativas e nas decises menor com o seu uso do que sem
ele. Evidentemente que esta margem de erro aumenta quanto mais pr-
ximo de um indivduo caso individual se situarem a avaliao e as
decises. Ela menor quando nos reportamos a grupos e particularmente
a grandes grupos.
Reportando-nos aos testes mais referenciados na bibliografia ou
usados na prtica para avaliar as caractersticas intelectuais dos indi-
vduos, podemos afirmar que eles apresentam resultados satisfatrios em
termos da sua fidelidade e validade. De um modo geral, os coeficientes de
fidelidade assentes na estabilidade dos resultados e na consistncia
interna dos itens atingem valores acima de .75 e de .85, respectivamente.
Alguma estabilidade de desempenho parece verificar-se ao longo da
idade dos indivduos, pelo menos entre a infncia e o incio da idade
adulta (Rees, Palmer, 1970; Harnqvist, 1968; Wechsler, 1958; Matarazzo,
1972). Em vrios estudos longitudinais se verificou, desde idades bastante
precoces, uma relativa estabilidade nas medidas tradicionais do Ql,
nomeadamente j a partir dos 18/24 meses de idade (Bayley, 1949;
Bradway, Robinson, 1961).
No nvel da validade, podemos afirmar que os coeficientes de
validade emprica e os parmetros apreciativos da validade de conceito
ou de construto ajustam-se tambm aos objetivos da avaliao psicol-
gica prosseguidos em cada teste. Os testes de inteligncia so ainda hoje
medidas preditivas do sucesso do indivduo na escola, no trabalho ou na
vida social. No dispomos, pelo menos at o presente, de substitutos
adequados para os testes de inteligncia quando o objetivo da avaliao
psicolgica se situa no conhecimento do nvel e capacidade de funciona-
mento mental ou na predio do seu desempenho posterior. Claro est
que, retomando algumas das crticas feitas aos testes, podemos estar aqui
a tomar informao redundante. Por um lado, porque so tomados certos
indicadores e no outros do sucesso e do fracasso em termos escolares
e profissionais. Por outro, previsvel que os resultados nos testes se
correlacionem com os desempenhos escolares na medida em que as
tarefas apresentadas nos testes so similares s aprendizagens e ativi-
dades curriculares (Detterman, 1979). Isto no impede o valor informativo
do teste e dos resultados obtidos em termos de diagnstico e de previso,
mesmo que aceitemos quo bom seria se tambm o teste permitisse uma
informao prescritiva, ou seja, dar informaes relevantes para orientar
a educao, o ensino e a aprendizagem (Perlman, Kaufman, 1990).
Os comentrios produzidos em relao fidelidade e validade dos
resultados nos testes no retiram a pertinncia das crticas feitas ao
mtodo dos testes, nem tampouco podem significar que tudo est bem
como est ou que tudo, desde que relativizado, fica resolvido. Vrios pro-
blemas subsistem na prtica. A generalizao de resultados de amostras
para subgrupos ou destes para os indivduos singulares oferece particula-
res dificuldades, mesmo do ponto de vista deontolgico. Por tudo isto,
importa melhorar a qualidade dos instrumentos, cuidar do seu uso e
precisar a interpretao dos seus resultados. Julgamos que as crticas
jogam a um importante papel pelo impacto que podem causar nos cons-
trutores e nos aplicadores dos testes.
Apesar das crticas, os testes permanecem apreciados e utilizados;
no sendo perfeitos, oferecem no entanto maiores garantias e validade s
decises que se no existissem ou comparativamente a outras fontes
alternativas de informao. Por exemplo, quando em alguns estados
americanos os testes de inteligncia foram substitudos por testes mais
ligados ao rendimento da criana, uma maior percentagem de crianas
provenientes das minorias tnicas continuaram a ser encaminhadas para
os centros de educao especial (Vane, Motta, 1990). Informao acumu-
lada em relao ao Ql ou a outras medidas do desempenho cognitivo
atestam que quem melhor realiza tais provas tambm obtm melhor ren-
dimento noutros contextos de vida (Carroll, Horn, 1981).
Concomitantemente s crticas e defesa dos testes, podemos
tambm colocar o interesse com o estudo das diferenas individuais. Por
norma, um e outro aspecto andam juntos quando se referem s vantagens
e s desvantagens da sua considerao na Psicologia. Mais uma vez
parece-nos ser interessante para a prtica psicolgica o estudo das
diferenas individuais. Para alm dos aspectos comparativos da
decorrentes, e que nalgumas situaes da prtica psicolgica so
decisivos, mesmo nas relaes de ajuda e de educao, o conhecimento
de tais diferenas podem significar maior individualizao. Atenda-se, por
exemplo, ao paradigma aptitude and treatment interactions (ATI) e s suas
aplicaes no contexto escolar (Cronbach, Snow, 1977). Claro est que
pretendemos aqui interligar "diferenas individuais" ao "esforo de
individualizao", o que nem sempre ter ocorrido. A este propsito
podemos referir alguns desenvolvimentos na avaliao da inteligncia
decorrentes da aplicao dos conceitos de "zona de desenvolvimento
proximal" (Vygotsky, 1978) e de "potencial de aprendizagem" (Feuerstein,
1979). O que est aqui em causa sobretudo uma perspectiva dinmica
de avaliao, onde o avaliador interage, questiona, dirige e instrui o
desempenho da criana, acreditando-se que, desta forma, se fica a
conhecer melhor o seu funcionamento cognitivo e a discrepncia entre a
sua capacidade desenvolvida e a sua capacidade latente.
Este "esforo de individualizao" tambm decisivo numa avali-
ao psicolgica, quando bem feita. A questo da falta de ateno ao
indivduo e ao seu contexto no testing decisiva na avaliao psicolgica,
cabendo ao profissional zelar pela sua superao. A questo da "validade
ecolgica" pode melhor ser atendida se o psiclogo considera situaes-
problema como fonte dos testes. Tambm particularizando no caso da
avaliao da inteligncia, esta no pode ser reduzida aplicao e
escorizao de um teste. Alis, por mais perfeito que seja o teste, ou
mesmo que se melhore a sua fidelidade e validade, certo que isso no
torna o seu uso mais automtico. O seu valor sempre instrumental, e
como o nome indica tudo depende da competncia de quem o usa.
Esse algum deve ser melhor que os testes que usa (Kaufman, 1982, p. 13).
Na avaliao psicolgica, a preciso do instrumento no dispensa
a finura da intuio (Zazzo et al., 1978). O tomar apenas os testes ou seus
resultados, por maior objetividade que detenham, no s insuficiente
como pode induzir-nos a erros. A par dos testes, importa considerar
informao relativa a conhecimentos, atitudes e aptides, por outras
palavras, uma avaliao geral da competncia (Sundberg, Snowden,
Reynolds, 1978). Como refere Zazzo e colaboradores, " preciso abando-
nar a idia de que um processo se pode tornar to preciso que possa ser
confiado ao primeiro que surja; todo o processo cientfico no mais que
um instrumento que exige utilizao por uma mo inteligente" (Zazzo et
al., 1978, p.156). Isto tem sido, alis, designado por intelligent testing
(Kaufman, 1982; Wesman, 1968), se quisermos o uso inteligente dos testes
de inteligncia. As deficincias dos testes no colocam em causa a sua
utilizao, contudo obrigam-nos a consider-las quer na interpretao
dos valores recolhidos quer na busca de informao complementar
atravs de outros meios. Talvez por isso se justifique, e cada vez mais, a
formao dos psiclogos na rea da avaliao.

REFERNCIAS BIBLIOGRFICAS

ALMEIDA. L.S. Teorias da inteligncia. Porto: Ed. Jornal de Psicologia, 1088.


ANASTASI, A. Evolving concepts of test validation. Annual Review of Psychology, v.37, p.
1-15, 1986.
---------------- . Psychological testing. New York: Macmillan, 1988.
BARROS. A.M.. ALMEIDA, L.S. Dimenses scio-cognitivas do desempenho escolar. In:
ALMEIDA. L.S. (Ed.). Cognio e aprendizagem escolar. Porto: Associao dos Psic-
logos Portugueses, 1991.
BAYLEY, N. Consistency and variability in the growth of intelligence from birth to eighteen
years. Journal of Genetic Psychology, Provincetown (MA), v.75, p.165-196, 1949.
BINET. A.. SIMON, T. Mthodes nouvelles pour le dignostic du niveau intellectuel des anor-
maux. L'Anne Psychologique, Paris, v.ll, p.191-244, 1905.
BRADWAY. K.P., ROBINSON. N.M. Significant IQ changes in twenty-five years: afollow-up.
Journal of Educational Psychology. Washington. DC, v.49, p.278-281, 1961.
CARROLL. J.B., HORN, J.L. On the scientific basis of ability testing. American Psychologist,
Washington, D.C., v.36, p.1012-1020, 1981.
CATTELL. R.B. Abilities, their structure, growth, and action. Boston (MA): Houghton Mifflin,
1971.
---------------- . Cattell culture fair intelligence tests. Champaign (IL): Institute for Personality and
Ability Testing, 1973.
CECI, S.J. On intelligence... more or less: a bioecological treatise on intellectual development.
Englewood Cliffs (NJ): Prentice-Hall, 1990.
CRONBACH. L.J. Review of the BITCH Test Eighth Mental Measurements Yearbook. Highland
Park (NJ): Gryphon, 1978. v.1.
CRONBACH, L.J.. SNOW. R.E. Aptitudes and instructional methods-, an handbook for re-
search on interactions. New York: Irvington, 1977.
CRUZ. OR, ALMEIDA. L.S.. RIBEIRO, I.S. Avaliao psicolgica e utilizao dos testes em
Portugal: comportamentos e atitudes dos psiclogos. In: ALMEIDA, L.S., RIBEIRO, I.S.
(Eds.). Avaliao psicolgica: formas e contextos. Braga: Associao dos Psiclogos
Portugueses, 1993.
DETTERMAN, D.K. A job half done: the road to intelligence testing in the year 2000. In:
STERNBERG. R.J., DETTERMAN, D.K. (Eds.). Human intelligence. Norwood (NJ): Ablex,
1979.
EELS. K. et al. Intelligence and cultural differences. Chicago (IL): Univ. Chicago Press, 1951.
EYSENCK. H.J. A model for intelligence. New York: Springer, 1982.
FEUERSTEIN, R. The dynamic assessment of retarded performers, the learning potential
assessment device, theory, instruments, and techniques. Baltimore (MD): Univ. Park
Press. 1979.
GUILFORD, J.P. Cognitive psychology's ambiguities: some suggested remedies. Psychological
Review, Washington, D.C., v.89, p.4-59, 1982.
------------------. Three faces of intellect. American Psychologist. Washington, D.C., v. 14. p.469-
479. 1959.
HARNQVIST, K. Relative changes in intelligence from 13 to 18. Scandinavian Journal of Psychology,
Stockholm, v.9, p.50-82, 1968.
HERNSTEIN, R. IQ. Atlantic-Monthly, Boston (MA), p.43-64, Sept. 1971.
HORN. J.L. Trends in the measurement of intelligence. In: STERNBERG, R. J., DETTERMAN, D.K.
(Eds.). Human intelligence. Norwood (NJ): Ablex, 1979.
JACKSON, D.A. Multidimensional aptitude battery (MAB): manual. Port Huron (Ml): Research
Psychologists Press, 1984.
JACKSON, G. On the report of the ad hoc committee on educational uses of tests with disadvantaged
students. American Psychologist. Washington, D.C.. v.30. p.88-92. 1975.
JENSEN, A.R. Bias in mental tests. New York: Free Press, 1980.
------------------. How much can we boost IQ and scholastic achievement? Harvard Educational
Review, Cambridge (MA), v.39, p.1-123. 1969.
------------------. Straight talk about mental tests. London: Methuen, 1981.
JONES, R., WILDERSON, F. Mainstreaming and the minority child: an overview of issues and a
perspective. In: JONES, R. (Ed.). Mainstreaming and the minority child. Reston (VA): Council for
Exceptional Children, 1976.
KAUFMAN, A.S. Psicometria razonada con el WISC-R. Mxico: Manual Moderno, 1982.
LABOV, W. The logic of nonstandard English. In: WILLIAMS, F. (Ed.). Language and poverty. Chicago
(IL): Markham. 1970.
LINDEMANN, J.E., MATARAZZO, J.D. Assessment of adult intelligence. In: GOLDSTEIN, G,
HERSEN. M. (Eds.). Handbook of psychological assessment. New York: Pergamon, 1990.
MATARAZZO, J.D. Wechsler's measurement and appraisal of adult intelligence. Baltimore (MD):
Williams and Wilkins, 1972.
MATARAZZO, J.D. WIENS. A.N. Black intelligence test of cultural homogeneity and Wechsler adult
intelligence scale scores of black and white police applicants. Journal of Applied Psychology,
Washington, D.C., v.62, p.57-63, 1977.
MERCER, J.R. Labeling the mentally retarded. Berkeley (CA): Univ. California Press, 1973.
------------------ . Theoretical constructs of adaptive behavior: movement from a medical to a
social-ecological perspective. In: COULTER, W.A., MORROW, H.W. (Eds.). Adaptive behavior,
concepts and measurements. Orlando (FL): Grune and Stratton, 1978.
MERCER, J.R., LEWIS, J.R. System of multicultural pluralistic assessment (SOMPA). San Antonio
(TX): Psychological Corporation, 1978.
MURPHY, K.R., DAVIDSHOFER, CO. Psychological testing-, principles and applications. [S.I.]:
Prentice-Hall. 1988.
OAKLAND, T.. HU, S. The top 10 tests used with children and youth worldwide. Bulletin of the
International Test Commission, v.19, n.l, p.99-120, 1992.
PERLMAN. M.D.. KAUFMAN. A.S. Assessment of child intelligence. In: GOLDSTEIN, G HERSEN, M.
(Eds.), Handbook of psychological assessment. New York: Pergamon, 1990.
PINTNER, R. Intelligence testing. New York: Henry Holt, 1923.
RAVEN, J.C. Manual for Raven's progressive matrices and Mill Hill vocabulary scales. London:
H. K. Lewis, 1981.

------------------ . Standardization of progressive matrices. British Journal of Medical Psychology,


Leicester, v.19, p.137-150, 1941.
RAVEN, J.C., COURT, J.H., RAVEN, J. Manual for Raven's progressive matrices and scales:
standard progressive matrices. London: H. K. Lewis, 1985.

REES, A.H., PALMER, F.H. Factors related to change in mental test performance. Developmental
Psychology Monographs, v.3, n.2, 1970.

RESCHLY, D.J. Aptitude tests in educational classification and placement. In: GOLDSTEIN, G.,
HERSEN, M. (Eds.). Handbook of psychological assessment. New York: Pergamon, 1990.
------------------ . Evaluation of the effects of SOMPA Measures on classification of students as
mildly retarded. American Journal on Mental Deficiency, v.86, p.16-20, 1981.
RESNICK, LB. The future of IQ testing in education. In: STERNBERG. R.J., DETTERMAN. D.K.
(Eds.). Human intelligence. Norwood (NJ): Ablex, 1979.

ROAZZI, A., SPINILLO. A.G., ALMEIDA, L.S. Definio e avaliao da inteligncia: limites e
perspectivas. In: ALMEIDA, L.S. (Ed.). Cognio e aprendizagem escolar. Porto:
Associao dos Psiclogos Portugueses, 1991.
ROSENTHAL. R.. JACOBSON. L. Pygmalion in the classroom. New York: Holt, Rinehart and
Wiston, 1968.

SATTLER, J.M. Age effects on Wechsler adult intelligence scale-revised tests. Journal of
Consulting and Clinical Psychology. Washington. D.C.. v.SO, p.785-786. 1982.
------------------ . Assessment of children. San Diego (CA): Jerome M. Sattler. 1988.
SPEARMAN, C. The abilities of man. New York: Macmillan, 1927.

STERNBERG, R.J. Beyond IO: a triarchic theory of human intelligence. Cambridge: Cambridge
University Press, 1985.

------------------ . Death, taxes, and bad intelligence tests. Intelligence, Norwood (NJ), v. 15, p.257-
269. 1991.

SUNDBERG, N.D., SNOWDEN, L.R., REYNOLDS, W.M. Toward assessment of personal


competence and incompetence in life situations. Annual Review of Psychology, v.29, p.179-
221.1978.
TERMAN, L.M. The measurement of intelligence. Boston (MA): Houghton Mifflin, 1916.

TERMAN, L.M., MERRILL, M.A. Stanford-Binet intelligence sca/e.3.ed.rev. Boston (MA):


Houghton Mifflin, 1960.

------------------ . Stanford-Binet intelligence scale. Boston (MA): Houghton Mifflin, 1973.

THORNDIKE, R.L, HAGEN, E.P., SATTLER, J.M. Stanford-Binet intelligence scale. 4.ed. Chigago
(IL): Riverside, 1986.

THURSTONE, L.L Primary mental abilities. Chicago (IL): Univ. Chicago Press, 1938.

TYLER, L.E. Individuality, human possibilities and personal choice in the psychological de-
velopment of men and women. San Francisco (CA): Jossey-Bass, 1981.

VANE. J.R.. MOTTA. R.W. Group intelligence tests. In: GOLDSTEIN, G., HERSEN, M. (Eds.).
Handbook of psychological assessment. New York: Pergamon, 1990.
VERNON, P.E. The structure of human abilities. London: Methuen, 1965.

VYGOTSKY. L.S. Mind in society, the development of higher psychological process. Cambridge
(MA): Harvard University Press, 1978.

WECHSLER, D. Cognitive, conative, and non-intellective intelligence. American Psychologist,


Washington, D.C., v. 15, p.78-83, 1950.

------------------ . The measurement and appraisal of adult intelligence. Baltimore (MD): Williams
and Wilkins, 1958.
------------------ . The measurement of adult intelligence scale. Baltimore (MD): Williams and
Wilkins, 1939 e 1944.

------------------ . Wechsler adult intelligence scale-revised. New York: Psychological Corporation,


1981.
. Wechsler intelligence scale for children-revised. New York: Psychological Corpora
tion. 1974.

WEISS, D.J.. DAVIDSON, M.L Test theory and methods. Annual Review ofPsychology.*.32, p.629-
658, 1981.
WESMAN, AG. Intelligenttesting. American Psychologist, Washington, D.C., v.36. p. 112-113, 1968.
WIGDOR, A.K.. GARNER, W.R. Ability testing: uses, consequences, and controversies.
Washington, D.C.: National Academy Press, 1982.

WILLIAMS, R.L The BITCH test. St. Louis (MO): Black Studies Program. Washington University,
1972.

------------------ . Danger: testing and dehumanizing the black child. Clinical Child Psychology
Newsletter, v.9, p.5-6, 1970.

------------------ . The problem of match and mismatch in testing black children. In: MILLER, L.
(Ed.). The testing of black students: a symposium. Englewood Cliffs (NJ): Prentice-Hall, 1974.
ZAZZO. R., GILLY M.. VERBA-RAD. M. Nouvelle chelle mtrique de l'intelligence. Paris: Armand
Colin, 1966.

------------------ . Nova escala mtrica da inteligencia. Lisboa: Livros Horizonte, 1978. v.1.
CAPITULO 9

LA MEDICIN DE LA ORGANIZACIN LOGICA


DEL PENSAMIENTO
Alfredo O. Lpez Alonso
Universidad del Salvador
Buenos Aires. Argentina

uestra intencin de medir la organizacin lgica del pensamiento


puede remontarse al ao 1979 cuando desarrollamos por primera
vez el Test de Coherencia de Razonamiento, al que
abreviadamente designaremos TCR. En aquellos momentos no ramos
todava conscientes ni siquiera sospechbamos de que con ese
instrumento, creado expresamente para medir lo que su misma
denominacin indica la coherencia bamos a poder evaluar ms
adelante un aspecto ms amplio y complejo del pensamiento, como es
su organizacin lgica.
Estbamos recin adentrndonos en nuestras investigaciones sobre
procesos cognitivos e inferenciales, y hasta entonces el TCR era slo un
mtodo de exploracin. Tenamos una idea an incompleta de lo que el
test poda medir. Pero, si bien no estaba an dentro de nuestras especu-
laciones la idea de medir la organizacin lgica del pensamiento, sta fue
una consecuencia directa y necesaria de los resultados que luego
obtuvimos con ese instrumento.
Se dio de algn modo un ejemplo de lo que suele llamarse seren-
dipity, pues un recurso metodolgico como un test generalmente
producto de una teora previamente elaborada sirvi inesperadamente
no slo para ampliar esa teora de base, sino tambin para generar una
nueva teora sobre un tpico prcticamente desconocido.
En sntesis, el TCR fue el factor de unin y generacin entre una
teora previa sobre procesos de razonamiento y una teora consecuente
sobre la organizacin lgica del pensamiento.
Antes de pasar a detallar qu clase de instrumento es en s el TCR,
qu resultados brind y qu otros aspectos del pensamiento permiti
explorar objetivo de este trabajo vamos a referirnos al contexto y fines

El autor agradece profundamente a la Profesora Mara Herminia del Rey y a la Analista


Programadora Viviana Nancy Agnoli, ambas de la Universidad del Salvador, por su valiosa
e insustituible colaboracin en los aspectos tcnicos informtico-computacionales.
tericos dentro de los cuales se cre y desarroll contexto y fines que
lo ligan ineludiblemente al estudio del pensamiento y la lgica.

RELACIONES ENTRE LOGICA. PENSAMIENTO Y PSICOLOGIA

La capacidad lgica de la mente humana ha sido siempre un tema


de gran atraccin y discusin por el gran poder de racionalidad que
involucra y pone en juego.
Todo lo concerniente a esa capacidad despierta inmediatemente
preguntas sobre qu es la lgica, qu es el pensamiento y cules son las
relaciones entre una y otro. Y si a ello agregamos el supuesto de que
existe una organizacin lgica natural del pensamiento, entonces se nos
presenta el problema aun ms complejo de cmo probar y definir esa
organizacin y qu importancia reviste para cualquier actividad humana.
Las relaciones entre lgica y pensamiento son en cierto sentido
paralelas a las de teora y realidad; ambas estn involucradas en toda
argumentacin humana tendiente a servir de fundamento a una estrategia
probada de accin, toma de decisin o solucin exitosa de problemas. De
all, que en un nivel profundo de anlisis esas relaciones adquieran un
carcter crucial.
En un libro clsico de enseanza de la lgica, Francisco Romero y
Eugenio Pucciarelli (1947) sostenan que ineludiblemente toda inteligencia
dotada de una capacidad terica tiene que sentirse atrada por la lgica,
y vean a sta como una manera en que el pensamiento y la inteligencia
pueden comprenderse mejor a s mismos. Aducan asimismo que los
principios lgicos siempre han remitido a las leyes del pensar y del
pensamiento una asociacin que se torna mucho ms fuerte y explcita
a partir de Boole (1847, 1854), un profesor de matemticas ingls conside-
rado el fundador de la lgica simblica.
Boole desarroll el lgebra de la lgica y del clculo de clases como
categoras esenciales de los procesos humanos de razonamiento y
entendimiento. El primero de sus libros, The Mathematical Analysis of Logic
(de 1847), estuvo dedicado a un anlisis matemtico de la lgica y al
clculo del razonamiento deductivo, y el segundo libro, An Investigation of
the Laws of Thought (de 1854), estuvo destinado a investigar las leyes del
pensamiento sobre las cuales l consideraba se fundaban las teoras
matemticas de la lgica y la probabilidad.
Con el programa de Boole se inicia un cambio revolucionario en la
lgica y se aclaran mejor las relaciones entre sta y el pensamiento. Para
Boole la lgica es un sistema formal, un clculo capaz de recibir distintas
interpretaciones y cuya validez depende tan slo de las leyes de combina-
cin de sus smbolos, cualquiera sea la interpretacin que les demos. Su
propsito era investigar las leyes del pensamiento y formalizarlas como
tales. Inadvertidamente, ste era un propsito sumamente ambicioso que
luego dio lugar a ciertas confusiones e interpretaciones contrapuestas
sobre el tema, dado que algunos objetaron que Boole haba confundido la
lgica con las leyes del pensamiento, en tanto que otros entendieron que
intentaba separarlas y aclarar su relacin.
Uno de los investigadores actuales sobre el tema, Del Val (1977)
quin suscribe en favor de la segunda interpretacin, ha sostenido que
"Boole fue, de hecho, capaz de separar la lgica de la psicologa y de la
epistemologa, cosa que no haban hecho sus antecesores" (Del Val,
1977, p.20).
De nuestra parte, entendemos que no es apropiado confundir o
identificar la lgica con las leyes del pensamiento, porque si bien aqulla
surge como una formalizacin abstracta y explcita de las operaciones y
procesos inferenciales de ste, nunca llega a abarcarlo en todos sus
aspectos ni en toda su profundidad. Desde nuestro punto de vista, el
pensamiento es siempre mucho ms de lo que puede ser una lgica
producto de aqul, ya que sta slo har explcitos unos pocos de los
mltiples y complejos procesos inferenciales implcitos del pensamiento y,
por ello, dar solamente un "mapa somero" del mismo. De ah que
consideramos que el programa de Boole, aunque revolucionario e
innovador para la lgica y su relacin con el pensamiento, fue sumamente
ambicioso por la amplitud y complejidad de los procesos que intentaba
formalizar y sintetizar.
La lgica es una disciplina que vaca al pensamiento de sus
contenidos y los estudia en cuanto a sus formas y a la generalidad de las
mismas. Hace explcitas ciertas relaciones a fin de sustentar las razones
necesarias y/o suficientes que deben esgrimirse para aceptar o rechazar
concluyentemente la verdad o falsedad de unos argumentos las conse-
cuencias a partir de la verdad o falsedad de otros las premisas. La
lgica, entonces, surge como una reflexin explcita sobre el proceso de
pensar, a efectos de abstraer y generalizar algunas de sus formas y
principios regulatorios, y justificar las conclusiones que se extraigan a
travs de los mismos, pero slo a partir de su forma y valor de verdad, no
de su contenido.
No obstante, la lgica no es una disciplina simple. Existe una lgica
general que constituye la doctrina fundamental de toda lgica, y lgicas
parciales y especializadas. Por ejemplo, junto a la lgica formal y asertiva
de los valores de verdad existen tambin las lgicas modales a ambas
hemos de referirnos luego. Hay tambin una metalgica, desde que la
lgica se constituye y se fundamenta recursivamente sobre niveles
progresivos de abstraccin y formalizacin y el ms elevado de esos
niveles el metalgico provee los principios fundamentales y reglas
formales de todo lenguaje lgico. De este modo, la lgica se constituye
como ciencia, desligndose del pensamiento y de sus ataduras lingsticas
y psicolgicas, como tambin de sus bases ontolgicas, filosficas o
metafsicas, segn se vea.
Si bien la lgica es un producto exclusivo del pensamiento, llega un
punto en el que se independiza de ste, y se convierte en una instancia
crtica, normativa, correctiva y evaluativa del mismo dentro, por
supuesto, de ciertos lmites y condiciones previamente estipuladas. Vista
de este modo, estimamos que la lgica cumple con un principio definido
por Wundt (1886, 1889) como principio de heterognesls de los fines,
segn el cual un proceso, producto de un sistema, se independiza de ste
(en este caso sera la lgica respecto al pensamiento) y despus pasa a
constituirse en un factor externo de determinacin y control del sistema
original.
Aunque bajo otra denominacin, este principio fue tambin adoptado
por Vaihinger, filsofo positivista-idealista y bilogo pragmtico, quin
escribi hacia 1876-1877 una obra denominada La Filosofa del Como S
en la cual explica cmo el conocimiento surge a base de una necesidad y
utilidad biolgica de adaptacin del individuo al medio, y pasa luego a
independizarse de la misma y a trascenderla.
De este modo, podemos esbozar como esquema a primera vista,
que la lgica, aunque surgida del pensamiento, se separa necesariamente
de ste como un producto explcito del mismo y pasa a regularlo externa-
mente, como un conjunto independiente de principios normativos y de
reglas de formacin, transformacin y control.
Tambin se separa as la lgica de la psicologa. Si bien la psicolo-
ga se encarga de los procesos de pensamiento en cuanto tales, la lgica
contribuye con la misma dando las formas, leyes y reglas de formacin, y
sintaxis, como condiciones generales para interpretar y evaluar esos
procesos y sus productos.
La lgica contribuye as como una disciplina que puede establecer
y evaluar la validez y correcin formal y la eficiencia de esos procesos,
pero sin explicarlos como tales. Por el contrario, su explicacin como
procesos le corresponde a la psicologa.
Las leyes de la lgica constituyen entonces principios reguladores
atemporales y de validez universal; atemporaldad y universalidad que
prueban de algn modo su independencia del pensamiento y de la
psicologa, ya que stos no gozan de esas mismas prerrogativas.
En sntesis, al pensamiento la lgica slo lo justifica y valida formalmente
en su correccin; en tanto que, la psicologia no lo valida pero lo explica como
proceso, sea corredo o errneo.
La reflexin sobre el pensamiento comenz tempranamente entre los
filsofos de la antigedad. En primer lugar, Scrates dio un mtodo de
autorreflexin, la "mayutica", que nos permite darnos cuenta y hacer explcitos
contenidos implcitos y no advertidos de nuestro pensamiento, que al hacerlos
explcitos nos hacen reconocer nuestros errores y contradicciones.
Luego, Platn dio una doctrina de las ideas como entidades separadas
de la realidad sensible y una primera interpretacin del conocimiento a priori
independiente de la experiencia. En tercer lugar, Aristteles nos dio una doctrina
explcita del razonamiento basada en su forma y en su valor de verdad, pero
separada de su contenido o significado material; as como separ "materia" y
"forma" en la constitucin de nuestros conceptos. Con esto se pas del
pensamiento a la lgica.
Aunque Aristteles utiliz el trmino "lgica" slo como adjetivo, la primer
sistematizacin de la lgica le pertenece, segn trabajos reunidos bajo el
nombre de Organon. El ncleo de su doctrina fue el "silogismo", trmino griego
que en distintas acepciones significa "clculo, cuenta, recapacitacin, raciocinio,
argumento demostrativo", en suma, "razonamiento" en sus aspectos ms
explcitos y autorreflexivos.
La lgica para Aristteles fue bsicamente instrumental, un mtodo para
separar el pensamiento vlido del falaz y de este modo sustentar la veracidad
de un nuevo conocimiento sobre la veracidad de nuestro conocimiento anterior.
Para ello utiliz ciertas formas y expresiones del lenguaje las proposiciones
categricas en las cuales hizo explcitas la funcin de tres trminos (sujeto-
medio-predicado), ligados mediante la cpula (es - son) y trminos que denotan
la extensin del "sujeto", como "todos", "algunos", "ninguno" si bien, en el
siglo XIX, Bentham (1827) y Hamilton (1859) propusieron incluir expresiones de
cuantificacin para el trmino "predicado", ello no prosper.
Las formas de los juicios categricos son: "Todos los A son B" (universal
afirmativa), "Ningn A es B" (universal negativa), "Algn A es B" (particular
afirmativa), y "Algn A no es B" (particular negativa), las que se representan con
los smbolos: A, E, I, O, respectivamente. De esta cudruple categorizacin
aristotlica, luego se deriv un cuadro de oposiciones, en el que se determinan
ciertas compatibilidades e incompatibilidades entre esos cuatro juicios
categricos, segn sean contrarios o subcontrarios, contradictorios o
subalternos entre s. A partir de ese cuadro de oposiciones se definen tambin
distintas formas de inferencias inmediatas a las que apelaremos despus.
Esto viene a colacin de que la lgica, al tomar los aspectos
formales, universales y atemporales, de los objetos del pensamiento,
procura establecer demostrativamente el carcter necesario, implicatorio,
compatible, contingente, excluyente o contradictorio, de las conclusiones
que extrae de sus propios argumentos iniciales o premisas.
No obstante y como ya lo anticipramos, hay lgicas especializadas
que pueden tomar aspectos no tan puramente formales y asertivos de los
objetos del pensamiento, como la "modalidad", la "necesidad", el "modo de
ser", etc.. En tal sentido, por ejemplo, Georg Henrik Von Wright (1970) ha
opuesto una "lgica modal" a la "lgica de la verdad" a la que nos hemos
estado refiriendo preferentemente. Von Wright arguye que las lgicas
modales hacen referencia a otros aspectos de las cosas distintas de la
verdad, como su necesariedad, su posibilidad o imposibilidad, su
contingencia (modos alticos), su verificacin, refutacin o indecisin
(modos epistmicos), su obligacin, permiso o autorizacin, su prohibicin
o su indiferencia en tal sentido (modos denticos), o bien su carcter
universal (todos) o de existencia, inexistencia o vacuidad (algunos,
ninguno) modos existenciales.
La importancia de incluir, o tener al menos en cuenta, algunos de
estos aspectos de la lgica modal viene al caso desde que desde un
punto de vista no slo lgico, sino tambin psicolgico el modo en que
est expresado un argumento, o bien los aspectos espontneos y modales
de una proposicin, pueden alterar fundamentalmente la capacidad de los
sujetos para comprenderlos y darles un significado unvoco y apropiado,
y tambin para resolverlos de una manera lgicamente correcta. Por
ejemplo, las proposiciones categricas antes enunciadas de Aristteles,
incluyen trminos como "todos", "algunos", "ninguno" que afectan a la
extensin y existencia de los conceptos, y, por ende, su comprensin
cabal. Creemos que a travs de estos trminos se vinculan aspectos de la
lgica asertivo-formal de la verdad con aspectos de una lgica modal, lo
que implica que los primeros no estn totalmente exentos de los problemas
de interpretacin de los segundos. Este ha sido un aspecto clave tenido en
cuenta en nuestro criterio exploratorio y evaluativo de la organizacin
lgica del pensamiento a travs del TCR.
Von Wright (1970) afirmaba que aunque los conceptos modales se
distinguen de los conceptos de verdad, los dos dominios de categoras no
estn del todo separados lgicamente, ya que estn ligados, por lo
menos, por una relacin asimtrica. Esta es: "si una proposicin es
verdadera entonces es posible ". Su conversa no es vlida, ya que no
todas las proposiciones posibles son verdaderas.
Si la existencia y la extensin de los trminos de clase que
integran las premisas de un razonamiento constituyen un factor modal que
se suma a la afirmacin y/o negacin de los mismos para alterar las
transformaciones de la cpula (es - son), entonces conviene ensayar
distintas formulaciones a las ya dadas por la lgica clsica de
predicados y silogismos. Este es un aspecto al que volveremos ms
tarde cuando nos refiramos a las caractersticas formales del instrumento
de evaluacin lgica (el TCR) que expondremos en la prxima seccin en
sus aspectos lgicos y psicomtricos.
La lgica de clases y su lgebra dadas por Boole y De Morgan fue
continuada por Schroder (1890) y luego ampliada y sistematizada por
Whitehead y Russell (1910) junto con la lgica de predicados, silogismos
y funciones proposicionales. Paralelamente, la lgica fue analizada desde
distintas perspectivas: por el empirismo (Hume, Stuart Mill), el criticismo
(Kant), el formalismo (Peano, Hilbert), el enfoque gnoseolgico-metodolgico
(Sigwart, Wundt), el logicismo (Zermelo, Dedekind, Frege, Russell y
Whitehead), el intuicionismo (Brouwer) y el fenomenologismo lgico
(Husserl, Pfnder). Tambin por "el empirismo lgico" (Wittgenstein,
Carnap, Reichenbach) que puso el acento en el lenguaje y la verificacin,
y en la induccin y la probabilidad (Keynes).
Una variante ms la constituy el "psicologismo lgico", como el
sustentado por ejemplo por Lipps (1893), quin sostena que la lgica se
apoya en lo psicolgico y depende exclusivamente de esto. Esta posicin
ha sido criticada como una forma de reduccionismo psicologista y total
relativismo, que desconoce la independencia de la lgica y de los principios
bsicos de la misma, como el de "identidad", "no-contradicin" y "tercero
excluido"; los que, si bien tienen una dimensin psicolgica, son tambin
principios ontolgicos, ideales, metalgicos y gnoseolgicos, separada-
mente de aqulla.
La lgica ha sido vista tambin como "ciencia normativa", sobre todo
desde Kant (1800) y desde Herbart (1808,1813); es decir, como ciencia que
prescribe formas y leyes del pensamiento. Este enfoque puede incurrir en
el sesgo de sobrevalorar la lgica sobre el pensamiento, desconociendo
el hecho fundamental de que la lgica, aunque norme y valide las formas
y transformaciones del pensamiento, ste es siempre un proceso viviente,
mucho ms complejo que aqulla e indudablemente la desborda.
Si bien las relaciones entre lgica y pensamiento han sido aborda-
das por filsofos, lgicos y psiclogos, an no estn del todo claras y se
estima que la coincidencia o base comn que pueda haber entre los
mismos, proviene, ms que nada, de los principios ontolgicos formales
(de identidad, no-contradiccin y tercero excluido) que fueron interpreta-
dos por el kantismo como principios trascendentes regulativos de la razn.
Estos principios formales ontolgicos son base de los principios lgicos y
gnoseolgicos homnimos, y sus distintos niveles no deben ser confundi-
dos entre s. Asimismo, Leibniz, uno de los principales filsofos del
racionalismo, haba ya sostenido que nuestro razonamiento se apoya en
dos grandes principios fundamentales: el de "no-contradiccin" y el de
"razn suficiente" como argumento de causalidad.
Por su parte, los psiclogos como algo se adelant no han
estudiado la lgica tanto como disciplina en s, sino ms bien como medio
para ser contrastado con el pensamiento y estudiar de este modo el grado
en que los sujetos razonantes se entiende razonantes naturales no
entrenados en lgica son capaces de alcanzar espontneamente o
autnomamente los principios y estructuras formales de la lgica sin an
conocerlas. Si esta coincidencia se da, ello no slo refuerza la universa-
lidad de la lgica, sino tambin la racionalidad inherente del pensamiento
humano y su natural organizacin lgica de base, aunque esto pueda
suponer de algn modo un cierto petitio principii, a pesar de su indepen-
dencia.
Pero an as, a los psiclogos no slo les ha importado establecer
hasta qu punto el pensamiento humano es Isomrfico con la lgica, sino
tambin, la medida en que no lo es, y se han preguntado, entonces, por
qu desviaciones o fallas de la racionalidad ha de explicarse esa no-
isomorfa; o bien, en ltima instancia, esa posible o eventual irracionalidad
de la mente humana.
Para ello, tanto en un caso como en el otro, la lgica ha sido el
referente y el juez ineludible y supremo. En tal sentido, la racionalidad o
irracionalidad, como la logicidad y la ilogicidad del pensamiento humano,
han sido y siguen siendo objeto de gran debate para la Psicologa
Cognitiva, lo que veremos en la seccin siguiente.

EL PROBLEMA DE LA LOGICA DEL PENSAMIENTO


DESDE EL PUNTO DE VISTA DE LA PSICOLOGIA COGNITIVA

El pensamiento puede verse como un complejo proceso de repre-


sentaciones que pueden ser lgicamente consistentes o contradictorias;
pero para adquirir status de conocimiento, esas representaciones, adems
de coherentes, deben ser un reflejo fiel y adecuado de la realidad. Esto
involucra un problema epistmico en el cual no profundizaremos.
Las propiedades, posibilidades y fundamentacin del conocimiento
han sido tema clsico de la Gnoseologia o Teora del Conocimiento, y
parten de una relacin bsica entre sujeto cognoscente y objeto conocido.
Esta cuestin es tambin hoy tema de las Ciencias Cognitivas, entre las
cuales se encuentran la Psicologa Cognitiva, la Psicolinguistica, la
Inteligencia Artificial, la Neurociencia, etc. Pero, como ya dijramos,
aunque el conocimiento dependa de esa adecuacin sujeto-objeto, la
lgica prescinde de ella y slo abstrae su forma, con lo cual el estudio del
conocimiento no se completa. Por ello, la teora del conocimiento y la
Psicologa Cognitiva han debido aunar los aspectos puramente formales
y los aspectos de contenido, como significado, conceptualizacin e
inferencia, buscando una explicacin ms comprehensiva.
Dentro de las investigaciones psicognoseolgicas del pensamiento
ocupan un lugar destacado las investigaciones en psicologa del razona-
miento. Halpern (1990) define al razonamiento como el proceso basado en
reglas que deciden lgicamente lo que tenemos que creer o aceptar
concluyentemente. De este modo el razonamiento es el rea de estudio de
la Psicologa Cognitiva que liga, a modo de puente, la lgica y el pensa-
miento.
En el estudio del razonamiento, se ha partido generalmente de la
divisin clsica entre razonamiento inductivo y razonamiento deductivo. En
el caso del razonamiento deductivo, las premisas o argumentos que
tomamos como punto de partida suelen ser generalizaciones o, por lo
menos, enunciados de una extensin mayor que la de la conclusin,
abarcando o incluyendo a stas en sus implicaciones. Estas generaliza-
ciones suelen ser creencias sobre la naturaleza del mundo de las cuales
extraemos instancias particulares como conclusin. El razonamiento
deductivo tiene adems el poder de contar con reglas de decisin (reglas
de la lgica deductiva) por las cuales se puede demostrar la verdad de las
conclusiones a partir de la verdad de las premisas, siempre que el
razomaniento responda a una forma lgicamente vlida.
Por el contrario, en el razonamiento inductivo las convicciones o
creencias que tomamos como premisas o puntos de partida suelen ser
hechos que hemos observado y verificado, de modo tal que a partir de
ellos (un nmero finito y limitado de hechos) pretendemos extraer una
conclusin, cuya extensin y nivel de generalidad es siempre mayor que
la de las proposiciones que expresan aquellos hechos. Esta es la razn
bsica por la cual no podemos demostrar la verdad de las conclusiones a
partir de la verdad de las premisas cuando usamos razonamientos inducti-
vos. Es decir, stos no son demostrativos.
En la prctica diaria, cuando las personas razonan no lo hacen de
una manera que es pura o exclusivamente deductiva o inductiva, sino
emplean alternativa e intercambiablemente ambos tipos de inferencia
adems de otras. Sin embargo, resulta generalmente ms verosmil
suponer que es el razonamiento de tipo deductivo el que mejor refleja el
grado de organizacin lgica del pensamiento, ms de lo que permitira
hacerlo un razonamiento de tipo inductivo o probable, aunque stos son
tambin un reflejo de esa organizacin. Esta diferencia puede atribuirse al
carcter concluyente, demostrativo, no-contingente y necesariamente
no-contradictorio de las conclusiones de un razonamiento deductivo.
Uno de los problemas que ms preocup a los psiclogos cognitivos
que estudiaban las relaciones entre lgica, conocimiento y pensamiento,
fue el de la consistencia o coherencia interna de sus procesos esto
significa su necesaria no-contradiccin. En tal sentido, algunas contribu-
ciones tempranas de autores de la Psicologa Cognitiva social, como
Feldman y otros (1966) y Abelson y otros (1968), dieron cuenta de que la
consistencia del pensamiento constitua un elemento bsico para explicar
la organizacin del mismo. En la misma lnea, Wyer (1974), al revisar
distintos sistemas psicosociales de organizacin cognitiva, lleg a la
conclusin de que todas las formulaciones tericas sobre la manera en que
dichos sistemas estn estructurados, inferidos o interrelacionados, parten
del comn suspuesto de que los sujetos organizan sus conceptos, argumen-
tos y creencias, de un modo internamente consistente o no-contradictorio.
Tambin hay factores que ligan la consistencia interna con los senti-
mientos. En tal sentido, Festinger (1957) y Heider (1958) hallaron que la
falta de consistencia en el orden cognitivo produce un estado displacentero
en el orden emocional, el que atribuyen a una necesidad natural de los
sujetos a eliminar sus inconsistencias o contradicciones internas. De este
modo la consistencia puede verse tambin como una forma de equilibrio
a ser logrado entre sus procesos intelectuales y emocionales.
En un contexto terico vinculado, McGuire (1960), por un lado, y el
mismo Wyer (1974) por el otro, han dado una explicacin alternativa de la
consistencia cognitiva y su logro. Ambos han hecho especial referencia a
un efecto organizacional, denominado "efecto socrtico", segn el cual los
sujetos tienden a incrementar espontneamente su consistencia interna a
medida que van tomando conciencia de sus contradicciones y al constras-
tar sus distintas convicciones y creencias en plazos relativamente breves
de tiempo. Wyer destaca especialmente este efecto de timing para explicar
procesos cognitivos de cambio y organizacin ms amplios y complejos.
Asimismo, McGuire, quien ha formulado una teora psicosocial de la orga-
nizacin cognitiva, no slo toma aspectos puramente formales o lgicos de
la misma, sino tambin destaca similaridades y diferencias entre principios
lgicos, tomados como paradigma o modelos de razonamiento, y la con-
ducta real, vital, de procesamiento de la informacin que llevan a cabo los
sujetos permanentemente. En tal sentido McGuire ha tratado de comparar
el "razonamiento formal" con el "pensamiento deseado" (wishful thinking)
en relacin con procesos de cambio de actitudes y un estado de "armona
interna" que los seres humanos necesitan mantener a modo de equilibrio,
entre sus sistemas de accin, creencia y pensamiento.
A su vez, Abelson y Rosenberg (1968) siguiendo la misma lnea de
investigaciones en consistencia cognitiva, y partiendo del aspecto dual,
lgico y psicolgico a la vez, de esta problemtica, han acuado el
concepto de "psico-lgica" para explicar el equilibrio interno en el cambio
y organizacin de actitudes y para describir cmo obran factores lgicos
y extralgicos de equilibrio interno en la conducta social de los individuos.
Consecuente con estos argumentos, el mismo MacGuire distingui, en la
dinmica de la conducta y de las representaciones psicosociales, la
intereaccin existente entre una consistencia lgica y otra psicolgica,
admitiendo que sta ltima, si bien es fuertemente demandante, no es tan
estricta, precisa, ni estable como la primera. Finalmente, en la misma lnea
psicosocial, Wyer concluy que las cogniciones y el procesamiento infe-
rencial de la informacin tiende a organizarse de acuerdo con ciertas leyes
que deben ser exploradas y expresadas formalmente a fin de explicar y
justificar su consistencia interna.
De estos autores se extrae la conclusin de que en la dinmica
actitudinal e Inferencial de los seres humanos, como asimismo en sus
argumentos, decisiones y accin razonada, existe una pugna e interaccin
permanente entre argumentos lgico-formales y necesidades extralgicas
y/o psicolgicas. An ms, ciertos autores como Lord y otros (1979), Kassin
(1979) y Wason (1966-1968) han descripto ciertos efectos diferenciales, en
el sentido de que los sujetos parecen ser ms sensibles y consecuentes
con la lgica, segn sta tienda a confirmar, ms que a desconfirmar, sus
actuales creencias y expectativas; en tanto, que tienden a racionalizar o
distorsionar confirmatoriamente la informacin cuando resulta lgicamente
refutatoria de las mismas.
Otros autores, como Lindzey y Aronson (1969) han sostenido que las
personas, en ltima instancia, se comportan de una manera a travs de la
cual procuran elevar al mximo la consistencia dentro de su sistema
lgico-cognitivo, y entre ste y su conducta actitudinal, pblica y abierta.
Si bien la consistencia lgica-psicolgica de la que hablan estos
autores no es la misma consistencia interna lgico-formal del pensamiento
que estamos investigando, ambas se ligan entre s y hallan un comn
denominador a travs de la idea de isomorfismo entre lgica y razona-
miento natural o social.
Los argumentos esbozados por dichos investigadores psicosociales
sugieren una idea importante para sustentar nuestra tesis fundamental del
isomorfismo: la idea de que los aspectos racionales (lgicos) e irracionales
(ilgicos) del pensamiento interactan entre s procurando alcanzar el nivel
ms alto de consistencia interna (o el nmero ms bajo de autocontradic-
ciones) antes de eludir la "indeseada refutacin" o de aceptar la "deseada
confirmacin".
Estas cuestiones han generado una prolongada controversia entre
dos corrientes principales y antagnicas de la teora psicolgica del
razonamiento a las que cabe referirnos sumariamente: una, que sustenta
aprioristicamente la logicidad y racionalidad esencial de la mente humana;
y otra que supone una suerte de ilogicidad o irracionalidad sistemtica.
Esta controversia y su posible solucin estn ntimamente ligadas a los
objetivos del TCR (Lpez Alonso, 1990, 1991).
En torno a esa cuestin y en relacin con el rea especfica del
razonamiento silogstico, Mayer y Revlin (1978) han destacado tres lneas
bsicas de investigacin: a) una lnea destinada a indagar la naturaleza de
los procesos inferenciales lnea en la cual nos insertamos; b) una lnea
que implementa los silogismos a modo de estndar diagnstico contra el
cual comparar la ejecucin de diferentes grupos en relacin a nivel
intelectual por ejemplo Guilford (1959), Thurstone (1938), Frandsen y
Holder (1969) o bien en relacin a diagnstico clnico-diferencial por
ejemplo, Feather (1965), Gottesman y Chapman (1960), Von Domarus
(1944) y, finalmente, c) una lnea de estudios que adopta el silogismo en
su sentido lgico clsico como modelo de pensamiento, lnea dentro de la
cual incluye a Boole (1854).
En la lnea de investigacin a la que estimamos pertenecer la
lnea a) el acento se ha puesto tanto en la codificacin de los materiales
inferenciales por parte del sujeto como en las reglas de inferencia que
emplea o pueden utilizarse como contraste o comparacin. En esta lnea,
por ejemplo, se insertan los trabajos de Rimoldi (1955, 1984) en los que
compara la "tctica de resolucin de problemas" empleada por un sujeto
con una "tctica ideal" sustentada en la lgica y en el empleo lgico de la
informacin. Pero dentro de esta lnea siempre ha sido una preocupacin
fundamental la determinacin y contrastacin de los factores lgicos, por
un lado, y psicolgicos o extralgicos, por el otro, los que inducen a
cambios significativos, a variabilidad y a un rendimiento diferencial en la
capacidad y organizacin lgica de los sujetos.
De cuestiones emanadas de esta lnea de investigaciones, surgi la
discusin sobre la racionalidad o irracionalidad del pensamiento, segn la
forma en que los sujetos seleccionan, construyen, representan o comparan
sus materiales inferenciales y resuelven sus problemas. Dentro de esta
lnea estn quienes dan mayor importancia a la comprensin cabal de esos
materiales por parte del sujeto, como tambin a su habilidad para
almacenarla y recuperarla organizacionalmente en el momento oportuno.
Esta es una lnea que puede ser incluida dentro del enfoque que sustenta
la racionalidad bsica lgica del entendimiento humano. Dentro de
esta lnea se encuentran autores como Richter (1957), Chapman y
Chapman (1959), Henle (1962,1978), Smedslund (1970), Ceraso y Provitera
(1971), Erickson (1974, 1978), Revlin (1975), Dickstein (1976), etc.
Paralelamente, se encuentra en la misma lnea el enfoque opuesto
al anterior, aqul que supone la existencia de ciertas "formas" de inferencia
que son errneas o carentes de racionalidad, pero que se reiteran de
manera sistemtica en la conducta humana de resolucin de problemas.
Esta tendencia ha intentado explicar, por ejemplo, los errores o fallas en la
resolucin de problemas silogsticos y de probabilidad subjetiva, por cuenta
de factores extralgicos o sesgos heursticos sistemticos y no-racionales.
Dentro de esta lnea se enrolan autores como Woodworth y Sells (1935),
Sells (1936), Morgan y Morton (1944), Frase (1966), Lefford (1946), Wasori
(1984), Evans (1983), Pollard (1982), Johnson-Laird (1983, 1990), Tversky
y Kahneman (1974) y otros.
A pesar del antagonismo de las dos lneas arriba mencionadas,
ambas abocadas al estudio de los procesos inferenciales de problemas
lgicos, creemos que el estudio de dichos procesos, desde la perspectiva
del Isomorfismo entre lgica y razonamiento y desde el grado en que
se da diferencialmente en el sujeto tal como pretendemos lograrlo
mediante el empleo del TCR , permite dirimir esa cuestin bsica entre
racionalidad-logicidad e irracionalidad-ilogicidad. Confiamos en que la
medicin del isomorfismo mencionado, adems de dar un ndice vlido y
gradual de la organizacin lgica del pensamiento, constituye un recurso
apropiado para superar y trascender dicha disyuntiva. Esta problemtica
y su relacin con el TCR puede verse en Lpez Alonso 1988, 1990, 1991.
All el TCR est dirigido a estudiar la capacidad natural diferencial
del razonamiento deductivo del ser humano, contrastando las premisas y
conclusiones de un razonador no-entrenado, con las conclusiones que
pueden extraerse de esas mismas premisas cuando se aplican las reglas
y principios de la lgica de conjuntos y hallando, de este modo, el grado
de isomorfismo entre razonamiento y lgica.
En los razonamientos deductivos, la manera en que los sujetos
formulan o codifican sus premisas incide directamente en la correccin o
no-contradiccin de las conclusiones. Este argumento ha sido sostenido
por Mary Henle (1962, 1978) y la gente que ha seguido su lnea de trabajo,
y ha sido experimentalmente probado por el autor y sus colaboradores
usando el TCR (Lpez Alonso, 1991, 1992; Ricardi, 1992; Lpez Alonso y
Ricardi, 1993). Por tal motivo, hemos adoptado el criterio de tipificar y
computar los errores de contradiccin en relacin con la estructura de
premisas como criterio diferencial para evaluar la organizacin lgica del
pensamiento.
Con dicho instrumento, el razonamiento deductivo producto de una
larga cadena de inferencias hechas por el sujeto, y que careciera
totalmente de errores de contradiccin, estara reflejando un excelente
nivel de organizacin lgica del pensamiento de dicho sujeto. Contraria-
mente, en la medida en que haya un nmero mayor y creciente de errores
de ese tipo, ello estara reflejando un grado progresivo de menor organiza-
cin hasta llegar a un punto de desorganizacin o incoherencia total.
A propsito de lo que venimos exponiendo, Halpern (1990) ha
sostenido que en el razonamiento cotidiano uno de los requisitos que la
gente espera ver satisfecho para su aceptacin (sea deductivo, inductivo
o una mezcla de ambos) es que las premisas, adems de verosmiles, les
resulten consistentes. Esto es importante porque son justamente las
premisas las que van a sustentar las conclusiones de todo razonamiento
y de toda toma de decisiones o soluciones de problemas, y lo que queda
a posteriori es slo la consistencia o coherencia que las conclusiones o
decisiones deben guardar con las mismas. Estas consideraciones no slo
reflejan la importancia del rol de las premisas en el razonamiento y en la
toma de decisiones, sino tambin la importancia de la consistencia interna
de todo proceso inferencial en relacin con aqullas.
Pero otro punto de importancia que se desprende de lo anterior es
evaluar hasta qu punto la gente es capaz de preveer o detectar con
suficiente anticipacin el riesgo de cometer contradicciones en el
desarrollo de su propio pensamiento. Esta capacidad de prevencin o
anticipacin no slo es tomada como un signo de organizacin lgica del
pensamiento, sino tambin como un requisito de importancia fundamental
para la eficiencia y confiabilidad del pensamiento en general y del
razonamiento en particular, tanto en sus aspectos prcticos de aplicacin
cotidiana que eviten el error u otros riesgos, como en sus aspectos
formales, ms abstractos y generales.
Con todas estas consideraciones y antecedentes tericos referidos
al contexto lgica/pensamiento-razonamiento/psicologa en torno a la
coherencia o consistencia interna, pasamos a ver en detalle los aspectos
tcnicos, lgicos y psicomtricos del instrumento en cuestin el TCR.

METODO

Descripcin de la tcnica (TCR), de su hoja de respuesta y primeras


definiciones lgico-conjuntisticas
El instrumento con el cual se ha intentado medir directamente la
coherencia interna de razonamiento o su no-contradiccin, e indirecta-
mente la organizacin lgica, implcita, del pensamiento, es el antes
aludido Test de Coherencia de Razonamiento (TCR). El TCR fue diseado
por primera vez por el autor en 1979. En ese momento se definieron dos
formas y subformas (Formas la, Ib, Ha, lib) que fueron descriptas por Lpez
Alonso (1981, 1988) y por Orsi (1988).
El TCR consiste de dos partes. Estas dos partes son claramente
presentadas en la hoja de respuetas del TCR, un ejemplo de la cual es
dada en la Figura 9-1. Como all puede apreciarse, en la primera parte, se
le da al sujeto una lista de cuatro trminos o atributos relacionares entre
s, con una breve y concisa definicin. Estos cuatro atributos son intercam-
biables y segn cules sean los que se adopten, se define con ellos la
forma del test. Cualquiera sea la forma, esos cuatro atributos se represen-
tan con las letras A, B, C y D. Por ejemplo, la forma I (subformas a,b) se
construy con los atributos Respetable (A), Honorable (B), Admirable
(C), y Venerable (D), como trminos de valoracin tica y social de las
personas a ser relacionados entre s. La forma II (subformas a,b) se
construy con los atributos Americano (continental) (A), Argentino (B),
Europeo (C), e Ingls (D) dados como lugares de nacimiento de las
personas pas o continente. A modo de ejemplo, en la Figura 9-1 se da
un modelo de la hoja de respuesta de la Forma Ila del TCR.

Forma II a

Coherencia: Significa que dos afirmaciones son compatibles o no-contradictorias.


PRIMERA PARTE: Estime los siguientes porcentajes de acuerdo con su criterio (entre Oy 100)

- De toda la poblacin mundial, qu porcentaje es AMERICANA .................. .60. ......... %


- De toda la poblacin mundial, qu porcentaje es ARGENTINA .................. .55.......... %
- De toda la poblacin mundial, que porcentaje es EUROPEA .................. 30. ......... %
- De toda la poblacin mundial, que porcentaje es INGLESA .................. 25.......... %

Le agradeceremos que complete los siguientes datos:

Fig. 9-1 Hoja de respuestas (Test de Coherencia).

Cualquiera sea la forma, en la primera parte del test se le pide al


sujeto que estime subjetivamente entre 0% y 100% el porcentaje en que con-
sidera existe cada uno de esos cuatro atributos en su universo de discurso.
Estos porcentajes se representan como %A - ...%, %B = ...%, %C = ...%,
%D =...%. Estos cuatro porcentajes son considerados las premisas exten-
sionales del TCR. Estas premisas expresan la idea que el sujeto tiene
sobre la extensin o proporcin que cada atributo cubre sobre el universo
y su existencia o no-existencia; en este ltimo caso se considera al
atributo como conjunto o clase vaca.
Por esta razn, los porcentajes %A, %B, %C y %D deben ser
dados entre 0% y 100% y no tienen por qu sumar 100% todos ellos, sino
pueden sumar menos, igual o ms que 100%. Este es el porcentaje o
extensin del universo. Si alguno de ellos es igual a 100% entonces el
atributo correpondiente es tomado como igual al conjunto universal (U);
y si, por el contrario, alguno de ellos es igual a 0% entonces el atributo
correspondiente es tomado como igual al conjunto vaco (0). Estas cotas
universales tienen efecto para la evaluacin de la coherencia interna del
test, ya que si a dos atributos les fueron dados porcentajes que entre ellos
suman ms del 100%, entonces no pueden mantener entre s una relacin
de exclusin en la segunda parte del test porque no pueden exceder la cota

Fig. 9-1 (cont.) ____________________________________________________________


SEGUNDA PARTE
UNA PERSONA ............ .(A)........ TIENE NO PUEDE
Preg.
No. (atributo sustentado) QUE SER PUEDE SER (b)
(atrib. interrog.)
SER
1 Una persona AMERICANA X AMERICANA
2 Una persona AMERICANA X ARGENTINA
3 Una persona AMERICANA X EUROPEA
4 Una persona AMERICANA X INGLESA
5 Una persona ARGENTINA X AMERICANA
6 Una persona ARGENTINA X ARGENTINA
7 Una persona ARGENTINA X EUROPEA
8 Una persona ARGENTINA X INGLESA
9 Una persona EUROPEA X AMERICANA
10 Una persona EUROPEA X ARGENTINA
11 Una persona EUROPEA X EUROPEA
12 Una persona EUROPEA X INGLESA
13 Una persona INGLESA X AMERICANA
14 Una persona INGLESA X ARGENTINA
15 Una persona INGLESA X EUROPEA
16 Una persona INGLESA X INGLESA

17 Una persona AMERICANA X NO-AMERICANA


18 Una persona AMERICANA X NO-ARGENTINA
19 Una persona AMERICANA X NO-EUROPEA
20 Una persona AMERICANA X NO-INGLESA
21 Una persona ARGENTINA X NO-AMERICANA
22 Una persona ARGENTINA X NO-ARGENTINA
23 Una persona ARGENTINA X NO-EUROPEA
24 Una persona ARGENTINA X NO-INGLESA
25 Una persona EUROPEA X NO-AMERICANA
26 Una persona EUROPEA X NO-ARGENTINA
27 Una persona EUROPEA X NO-EUROPEA
28 Una persona EUROPEA X NO-INGLESA
29 Una persona INGLESA X NO-AMERICANA
30 Una persona INGLESA X NO-ARGENTINA
31 Una persona INGLESA X NO-EUROPEA
32 Una persona INGLESA X NO-INGLESA

(continua)
Fig. 9-1 (cont.)

SEGUNDA PARTE (cont.)


Preg. UNA PERSONA ........ (A) TIENE NO PUEDE
No. (atributo sustentado)
QUE SER PUEDE SER ( B)
(atrib. nterrog.)
SER
33 Una persona NO-AMERICANA X AMERICANA
34 Una persona NO-AMERICANA X ARGENTINA
35 Una persona NO-AMERICANA X EUROPEA
36 Una persona NO-AMERICANA X INGLESA
37 Una persona NO-ARGENTINA X AMERICANA
38 Una persona NO-ARGENTINA X ARGENTINA
39 Una persona NO-ARGENTINA X EUROPEA
40 Una persona NO-ARGENTINA X INGLESA
41 Una persona NO-EUROPEA X AMERICANA
42 Una persona NO-EUROPEA X ARGENTINA
43 Una persona NO-EUROPEA X EUROPEA
44 Una persona NO-EUROPEA X INGLESA
45 Una persona NO-INGLESA X AMERICANA
46 Una persona NO-INGLESA X ARGENTINA
47 Una persona NO-INGLESA X EUROPEA
4 Una persona NO-INGLESA X INGLESA
49 Una persona NO-AMERICANA X NO-AMERICANA
50 Una persona NO-AMERICANA X NO-ARGENTINA
51 Una persona NO-AMERICANA X NO-EUROPEA
52 Una persona NO-AMERICANA X NO-INGLESA
53 Una persona NO-ARGENTINA X NO-AMERICANA
54 Una persona NO-ARGENTINA X NO-ARGENTINA
55 Una persona NO-ARGENTINA X NO-EUROPEA
56 Una persona NO-ARGENTINA X NO-INGLESA
57 Una persona NO-EUROPEA X NO-AMERICANA
58 Una persona NO-EUROPEA X NO-ARGENTINA
59 Una persona NO-EUROPEA X NO-EUROPEA
60 Una persona NO-EUROPEA X NO-INGLESA
61 Una persona NO-INGLESA X NO-AMERICANA
62 Una persona NO-INGLESA X NO-ARGENTINA
63 Una persona NO-INGLESA X NO-EUROPEA
64 Una persona NO-INGLESA X NO-INGLESA

universal. Esta restriccin est destinada a asegurar la coherencia o


consistencia interna entre la extensin y la existencia de los cuatro
atributos y las relaciones que guardan entre s.
A tal efecto, en la segunda parte del test, se le presenta al sujeto una
lista de 64 preguntas, en cada una de las cuales debe establecer optativa-
mente una relacin entre cada par posible de los cuatro atributos, segn
stos son alternados como antecedente o consecuente de la relacin (es
decir: como primer trmino o segundo trmino del par), y segn van siendo
afirmados o negados alternativamente. Las negaciones o complementos
de A, B, C y D, se representan como -A, -B, -C y -D, respectivamente.
Las respuestas que los sujetos deben dar a cada uno de los items
del test (64 de la segunda parte) consisten en tres posibles relaciones, una
de las cuales deben optar poner entre los trminos de cada par de atri-
butos. Estas relaciones son: 1) tiene que ser, 2) puede ser, y 3) no puede
ser. Aunque dichas relaciones estn expresadas de este modo en la hoja
de respuesta, a los efectos de una notacin abreviada se representan con
los smbolos 1, P y 0, respectivamente. En la hoja de respuestas, el sujeto
opta por una de estas tres relaciones marcando una x en la columna
correspondiente a una de ellas (al efecto, ver Figura 9-1) y en la lnea
correspondiente al par de atributos relacionados.
A los efectos de ejemplificar la notacin abreviada de las respuestas
del sujeto, si ste ha optado por las relaciones "Americano puede ser
Argentino" y "Argentino tiene que ser Americano" como atributos A y B,
entonces dichas expresiones se notan "APB"y "BlA", respectivamente. De
la misma forma, "Americano no puede ser Europeo" se nota "AOC".

Fundamentos lgico-cognitivos del TCR


Las relaciones "tiene que ser", "puede ser" y "no puede ser" las
hemos incluido en el TCR como modalidades de la cpula (es, son). Estas
modalidades se han arbitrado a los efectos de restarle a la cpula la
ambigedad que reviste en las expresiones silogsticas clsicas sobre
todo en las correspondientes a los enunciados categoriales aristotlicos
antes vistos, en donde la comprensin de la cpula est ambiguamente
ligada a los trminos cuantitativos "todos", "algunos", "ninguno"; por
ejemplo, el enunciado universal "Todos los A son B" no excluye la
posibilidad de "Algn A es B", y viceversa, dado que dichas proposiciones,
en la lgica clsica, son superimplicante y subimplicante, respectivamente,
entre s (Stebbing, 1965).
La antes aludida Henle (1978) destac esta ambigedad en la
expresin clsica de la cpula, como un factor perturbador en la compren-
sin correcta de las premisas o del alcance de sus trminos. Otros autores
como Ceraso y Provitera (1971), que siguieron esas prevenciones de
Henle, desarrollaron tcnicas silogsticas que modificaban las expresiones
clsicas en favor de una menor ambigedad, y lograron mediante ello que
los sujetos alcanzaran mejores niveles de rendimiento lgico. Ello fue
atribudo a que, mediante esas modificaciones "desambiguantes", los suje-
tos alcanzaran una mejor comprensin lgica de las relaciones implcitas
en las premisas. Nuestras expresiones modales de la cpula, entonces,
antes vistas (representadas por 1, P 0), nos han permitido obtener una
mayor comprensin de esas relaciones sin ambigedad y de una manera
ms sencilla, por tratarse de expresiones usuales del lenguaje comn.
Antes invocamos a ciertos postulados de la lgica modal de Von
Wright y entre ellos aludimos a principios modales de necesariedad, de
posibilidad y de imposibilidad. Justamente, estos tres principios modales
que afectan a la cpula, se hacen efectivos en las expresiones "tiene que
ser" (necesariedad), "puede ser" (posibilidad) y "no puede ser" (imposibili-
dad). Como antes dijramos, la combinacin de principios de una lgica
asertiva y de la verdad con principios de una lgica modal como los
invocados, parecen afinar o aguzar mucho mejor el sentido y comprensin
lgica de la cpula en relacin con su uso y alcance real, reduciendo, de
este modo, el riesgo o margen de error y ambigedad en su rol relacionan-
te de trminos.
De igual manera, la expresin "A tiene que ser B" "AIB" debe
entenderse extrictamente como "Todo A es B" a la manera de la lgica
proposicional, o bien como "A est incluido en B" en lgica de clases o de
conjuntos. Pero a diferencia de la expresin clsica, la expresin "Todo A
es B", AlB, no es ac compatible ni superimplicante de "Algn A es B".
Por la misma razn, la relacin dada en la expresim "A puede ser B" debe
entenderse, desprovista de ambigedad, como "Algn A, pero no todos,
son B", o "Algn A es B y algn A no es B", proposicionalmente; o como "A
tiene interseccin no-vaca con B, sin estar incluida en B", en lgica de
conjuntos. Esto hace a las relaciones "tiene que ser" y "puede ser" incom-
patibles entre s, y portanto inambiguas e inconfundibles. Finalmente, del
mismo modo, "A no puede ser B" "AOB" debe entenderse como equiva-
lente a "Ningn A es B" o a "A excluido de B", interseccin AB vaca,
respectivamente. Esta relacin tambin es incompatible con las dos
anteriores y con "Algn A no es B", lo cual las hace no-ambiguas entre s.
Nuestra tesis fundamental aqu, es que el pensamiento, para
hacerse explcito, puede crear y aplicar distintas expresiones lgico-
formales para representar un mismo sistema de relaciones de la realidad,
pero para que esto sea vlido debe haber coherencia, transformabilidad,
no-ambigedad y plena diferenciacin entre las condiciones especficas
de definicin de una expresin lgico-formal a otra.
Para cada par de atributos, entonces, el sujeto debe optar por una
de esas tres relaciones modales sealadas (1, P 0), marcando una cruz
en una de ellas para cada item en la columna correspondiente. Para una
mejor ilustracin, la hoja de respuesta dada en Figura 9-1 se presenta con
los porcentajes y marcas que un sujeto supuesto ha contestado en la
primera y segunda parte del test.
En el ejemplo de la Figura 9-1 vemos que el "atributo antecedente"
(o primer trmino del par) se presenta fijo para "atributos consecuentes"
variables. Esto corresponde a la subforma "a" de la forma II del TCR. La
subforma "b" (o forma lib) supone los mismos atributos pero con "antece-
dentes variables" y "consecuente fijo". Estas dos subformas "a" y "b" se
distinguen para cualquier forma del test y para detectar el posible efecto
que pueda tener la variacin, o no, del antecedente (o del consecuente) en
la coherencia de razonamiento.
Al contestar las primeras doce relaciones entre pares de atributos A,
B, C y D, en la segunda parte del test, el sujeto est formulando las premi-
sas relacinales. Estas premisas estn constituidas por las relaciones
modales 1, P 0 que el sujeto marc (o interpuso) optativamente entre los
siguientes pares de atributos: A.B, A.C, A.D, B.A, B.C, B.D, C.A, CB, CD,
D.A, D.B y D.C (en la subforma "a"). De cada uno de los seis pares combi-
nados de atributos que pueden construirse a partir de los cuatro atributos
originales A, B, C y D es decir, a partir de los seis pares combinados AB,
AC, AD, BC, BD y CD se desprende una serie de ocho relaciones
modales, segn que los atributos de cada par vayan siendo alternados
como antecedente/consecuente de una relacin modal, o bien afirmados
o negados. Por ejemplo, a partir del par combinado AB se desprende la
siguiente serie de ocho trminos:

donde r representa genricamente a una de las tres relaciones modales i,


P 0; y donde -A y -B son las negaciones o complementos de A y B,
respectivamente.
Del mismo modo que hemos desplegado esta serie para el par AB,
se pueden desplegar seis series semejantes para los restantes pares
combinados; es decir, adems de AB, para los pares AC, AD, BC, BD y
CD. Estas seis series dan lugar a 4 items de la segunda parte del test. Si
a stos sumamos las relaciones r que el sujeto debe dar a cada atributo
consigo mismo, ya afirmado o negado, se llega entonces al total de 64
items de la segunda parte. Sumados los items de la primera y segunda
parte, el TCR queda constituido por 68 items o respuestas consecutivas
dadas por el sujeto.
Todo ese conjunto de 68 items constituye en s una red lgica,
dentro de una trama o sistema de relaciones inferenciales. La serie AB
arriba desplegada es una serie de inferencias inmediatas. A partir de
Stebbing (1965) las hemos calificado como las formas inferenciales: original
o directa (ArB), conversa (BrA), obversa (Ar-B), conversa obvertida (Br-A),
inversa obvertida (-ArB), contrapuesta (-BrA), inversa (-Ar-B) y contra-
puesta obvertida (-Br-A). Estas ocho inferencias inmediatas estn lgica-
mente entrelazadas entre s, dando lugar a dependencia lgica dentro
de la serle. Desde ya, esto debe ocurrir tambin dentro de cada una de las
seis series antes mencionadas; pero, dado que estas seis series estn
inferencialmente entrelazadas entre s, ello da lugar a una dependencia
lgica entre series, que debe agregarse a la "dependencia dentro de cada
serie" antes invocada, para lograr la coherencia total del sistema. Tanto la
dependencia lgica "dentro" como la "entre" las seis series nos dan una
idea de la complejidad y extensin del compromiso lgico que supone para
el sujeto el sistema total de inferencias dado por los 68 items del TCR.
Por otra parte, para una nica serie de un par de atributos
digamos AB existen 14 distintas series lgicamente posibles, segn la
relacin que va de A a B sea AlB, AOB APB, y segn A B sean iguales
o distintos de U (Universo) y de 0 (vaco). En la Tabla 9-1 se dan estas 14
posibles series AB internamente consistentes. En la columna de la
izquierda se dan las igualdades o diferencias entre A, B y las cotas
universales U y 0; luego en la columna del medio, se dan las tres posibles
relaciones r de A a B como primera premisa relacionai; finalmente en la
tercera columna se dan los restantes siete trminos de la serie (2. a 8.
trminos) consistentes con lo dado en las columnas primera y del medio
de dicha tabla. En la columna del medio las relaciones r ( 1,0, P) se dan en
trminos de las relaciones de conjunto caracterizadas por Erickson (1974)
en el estudio de razonamiento silogstico. Estas relaciones son:
Id. - Identidad entre A y B (A = B)
Sb. - Subconjunto (A incluida en B)
Sp. - Superconjunto (A incluye a B)
Ov. - Solapado (overlap) (A y B se solapan pero no se incluyen)
Ex. - Exclusin (A y B se excluyen mutuamente)
(Sp.) - A Superconjunto cuando B = 0 (conjunto vaco)
Estas mismas 14 series lgicamente posibles pueden darse para los
restantes pares AC, AD, BC, BD y CD. Erickson es un investigador del
razonamiento deductivo que, en tal sentido, ha seguido supuestos similares
a los de Henle.
Sobre la base de todas estas definiciones y compromisos lgicos
dados como requisitos para la evaluacin del TCR, consideramos probada
su pertinencia y validez como instrumento para evaluar y medir la
coherencia y organizacin lgica del pensamiento, sobre la base de la
isomorfa entre lgica y razonamiento del sujeto.
En tal sentido, la medida de esa coherencia y organizacin va a
depender, y va a estar validada al mismo tiempo, por ese grado de iso-
morfismo. La isomorfa entre la estructura inferencial, secuencial, de las
respuestas dadas por el sujeto y la estructura inferencial que se desprende
de aplicar principios y reglas lgicas a partir de premisas consistentes
dadas por el propio sujeto no puede ser aleatoria ni inatinente.
Como ya hemos sugerido, para medir ese isomorfismo hemos
adoptado el criterio de contar los errores de contradiccin cometidos por
el sujeto a lo largo del TCR. Esos errores de contradiccin surgen de
aquellos items en los que la relacin r dada por el sujeto no corresponde
con la que debe ser de acuerdo con los principios y reglas lgicas. Estos
Tabla 9-1 Consistencia dentro de la Serie (AB)
Igualdad/Diferencia Relaciones de conjunto Series (AB) posibles consistentes
entre A, B, U, y 0 dadas por Erickson (desde el 2 o al 8.0 trmino)

Primera premisa
relacionai
(A1B) (AOB) (APB)

Id. Sp. (B1A)(A0-B)(B0-A)(-A1B)(-B1A)(-A1-B)(-B1-A)


Sb. (Sp) Sp. (BOA) (A1 -B) (B1 -A) (-A1B) (-B1 A) (-A0-B) (-B1 -A)
Sb. Ov. (BPA) (AO-B) (BP-A) (-A1B) (-B1 A) (-A0-B) (-B1 -A)
Id. (Sp-) (B1A)(A1-B)(B1-A)(-A1B)(-B1A)(-A1-B)(-B0-A) (B1
Sb, Ex. A) (A1 -B) (B1 -A) (-A0B) (-BOA) (-A1 -B) (-B1 -A)
Id. Ex. (B1A)(A1-B)(B1-A)(-A0B)(-BPA)(-A1-B)(-BP-A)
Sb. (B1A)(AP-B)(B0-A)(-A1B)(-B1A)(-A1-B)(-B0-A)
(BOA) (A1 -B) (B1 -A) (-APB) (-BOA) (-AP-B) (-B1 -A)
(B1 A)(A0-B) (BO-A) (-A0B) (-BOA) (-A1 -B) (-B1 -A)
(BPA) (AO-B) (BP-A) (-APB) (-BOA) (-AP-B) (-B1 -A) (B1
A) (AP-B) (BO-A) (-A0B) (-BPA) (-A1 B) (-BP-A)
(BPA)(AP-B)(BP-A)(-APB)(-BPA)(-AP-B)(-BP-A)
(B0A)(A1 -B) (B1 -A) (-APB) (-BPA) (-AP-B) (-BP-A)
(B0A)(A1-B)(B1-A)(-A1B)(-B1A)(-A0-B)(-B0-A)

Id. =identidad, Sb. =subconjunto, Sp. = superconjunlo, Ov. =Iraslapamiento (overlap), Ex. =exclusin entre conjuntos. Las rela-
ciones Sp. entre parntesis pueden dar lugar a controversia con respecto a Ex.; ellas respuenden al criterio del autor que se ha
basado en (B1 A). Esta ambigedad surge del conjunto vacio cuando se lo emplea como trmino consecuente de las relaciones R.

principios y reglas parten de las definiciones preposicionales y de con-


juntos que antes viramos en relacin con las relaciones tiene que ser ( 1 ),
puede ser (P) y no puede ser (0).
Los errores de contradiccin en el TCR son en realidad autocontra-
dicciones que el sujeto comete con sus propias premisas, lo que destaca
ms su carcter interno y de organizacin del pensamiento. En trabajos
anteriores (Lpez Alonso, 1988; Ricardi, 1989) hemos probado que los
sujetos cometen menos errores de contradiccin cuando son ellos mismos
los que eligen sus premisas que cuando se las impone el experimentador
"desde afuera". Esta diferencia hablara ya de por s a favor de un factor
interno de autoconsistencia o autocoherenca, que podra resumirse como
que: "todo sujeto tiende a ser ms coherente consigo mismo que con el
resto del mundo". S bien, esto puede entenderse a primera vista como un
principio un tanto obvio o trivial, su importancia es fundamental: primero,
porque diferencia una medida de la coherencia interna del sujeto de una
externa, y, segundo, porque por otros resultados obtenidos parece ser que
la coherencia interna es un prerrequisito y condicin indispensable para el
logro de la coherencia externa o con el mundo (Lpez Alonso, 1991c, 1992;
Ricardi, 1993a; Lpez Alonso, Ricardi, 1993).
Los fundamentos lgicos del TCR sern completados en las
secciones siguientes referidas a su procedimiento de evaluacin y su
evaluacin mediante diagrama rectangular.
Procedimiento de evaluacin del TCR hoja de evaluacin
Una vez que el sujeto ha completado los items del TCR sus respuestas
son volcadas a una hoja de evaluacin. Un modelo de esta hoja se da en la
Figura 9-2.

PREMISAS EXTENSIONALES

Diagrama Rectangular
( + ) A ( + ) U
A-B-C-D -A-B-C-
(+) (-) B D
AB-C-D -AB-C-D
(-) (-) (-) (+) c
A-BC-D ABC-D -ABC-D -A-BC-D
(-) (-) (-) ( + ) D
A-BCD ABCD -ABCD -A-BCD
(-) (-) (-) -A-B-CD
A-B-CD AB-CD -AB-CD

Fig. 9-2 Hoja de evaluacin.


En la parte de arriba de la hoja de evaluacin pueden observarse
cuatro matrices de 4x4, subdenominadas matrices I, II, III, IV, en las cuales
cada hilera y cada columna corresponden respectivamente a los atributos
A, B, C, D; o bien a sus negaciones: -A, -B, -C, -D. En todas estas
matrices las hileras corresponden al "atributo antecedente" o primer
trmino de cada par, en tanto que las columnas siempre corresponden a
los "atributos consecuentes" o segundo trmino del par.
Las celdas de las matrices estn destinadas al registro de las
relaciones modales r que ligan a los correspondientes atributos el que
define a la hilera y el que define a la columna de las cuales la celda es
interseccin. Por ejemplo, si un sujeto en la hoja de respuesta respondi
"Una persona Americana puede ser Argentina" (es decir, marc x en la
columna "puede ser" entre los atributos Americano y Argentino), esto se
transcribe brevemente como APB y se registra P en la celda interseccin
de la hilera A y la columna B. Asimismo, si este sujeto luego responde "Una
persona Argentina tiene que ser Americana", o B1A, entonces se coloca
1 en la celda interseccin de la hilera B y la columna A.
Las celdas estn subdivididas por una lnea de puntos en una parte
superior y una inferior. En la parte superior se anota la relacin r que el
sujeto dio al par de atributos correspondientes. La parte de abajo, en
cambio, est destinada al evaluador, para que ste anote all la relacin r
que corresponde de acuerdo con principios lgicos. Si ambas r coinciden
habr somorfa entre la estructura de las relaciones del sujeto y las de la
lgica; pero si no coinciden se marcar un determinado error de
contradiccin.
En la matriz I se anotan las relaciones r dadas a los pares de
atributos afirmados; por ejemplo ArB y BrA. En esta matriz van las infe-
rencias originales y conversas. En la matriz II van las relaciones entre
antecedente-afirmado y consecuente-negado; por ejemplo, Ar-B y Br-A.
Siguiendo a Stebbing, en esta matriz van las inferencias obversas y
conversas obvertidas. En la matriz III van las relaciones antecedente-
negado/consecuente-afirmado por ejemplo, -ArB y -BrA y corres-
ponde a las inferencias inversa obvertida y contrapuesta. Y finalmente, en
la matriz IV van las relaciones antecente y consecuente ambos negados
por ejemplo, -Ar-B, -Br-A correspondiendo a las inferencias inversa
y contrapuesta invertida.
En cada una de estas matrices, la diagonal que va desde el ngulo
superior-izquierdo al ngulo inferior-derecho contiene las relaciones que
pueden establecerse entre afirmaciones y/o negaciones de un mismo
atributo. As, por ejemplo, en la matriz I est la relacin entre A y A (AIA),
etc.; en la matriz II, la relacin entre A y -A (AO-A), etc.; en la matriz III, -
A y A (-A0A), etc.; y en la matriz IV, la relacin entre -A y -A (-Al-A), etc.
Las relaciones de las diagonales de las matrices I y IV son de
identidad positiva y de identidad negativa, respectivamente, y se les da
la relacin 1 (tiene que ser). Las relaciones de las diagonales de las
matrices II y III registran relaciones bsicas de no-contradiccin y de
tercero excluido, y se les da la relacin 0 (no puede ser).
A la izquierda de la matriz I, se anotan los porcentajes correspon-
dientes a las premisas extensionales %A, %B, %C y %D. Estos valores
controlan que las premisas relacinales no sean contradictorias con las
premisas extensionales y las cotas universales del sistema. En caso de
que exista alguna contradiccin entre ambos tipos de premisas por
ejemplo: que el sujeto haya contestado %A = 50% y %B = 60%, y que
despus pretenda establecer las relaciones B1A (B incluido en A) o bien
AOB (A y B excluidos entre s) las mismas se computan como errores
extensionales, dado que constituyen incompatibilidades con las premisas
extensionales. Las premisas relacinales, adems de deber ser compati-
bles con las extensionales, deben ser compatibles entre s, y asimismo
todas las restantes relaciones r en el test deben ser compatibles con
ambos tipos de premisas.
Por debajo de las cuatro matrices antes vistas, se da un diagrama
rectangular (inspirado en diagramas de Venn) a travs del cual se logra
un mapa de la estructura de relaciones modales correspondientes a
las premisas relacinales compatibles dadas por el sujeto. Con este
mapa el evaluador decide la compatibilidad que las premisas relacinales
deben guardar con las premisas extensionales y luego las relacinales
entre s, como as tambin la compatibilidad que las restantes respuestas
del test deben guardar con todas las premisas.
A los efectos de ilustrar el procedimiento, en la hoja de evaluacin
de la Figura 9-2 se vuelcan los datos anotados en la hoja de respuesta de
la Figura 9-1.

Evaluacin mediante el diagrama rectangular


La evaluacin del TCR se realiza completamente a travs del
diagrama rectangular que aparece en el ngulo inferior izquierdo de la
Figura 9-2. Este diagrama aparece subdividido en 16 espacios como
consecuencia de superponer en el mismo rectngulos correspondientes a
los atributos A, B, C y D. De este modo, el rectngulo mayor corresponde
al conjunto universal (U), y los rectngulos menores superpuestos corres-
ponden a dichos cuatro atributos. Para reconocer en el grfico cul es cada
uno de esos rectngulos, se han colocado las letras identificatorias corres-
pondientes (U, A, B, C y D) en los ngulos superior-derecho de cada uno.
A los efectos de la evaluacin, el evaluador debe llenar los 16
espacios con signos + y -. El signo + indica que un espacio o interseccin
es no-vaco; en tanto que el signo - indica que el espacio es vaco. La
distribucin de estos signos en los 16 espacios del diagrama depende
exclusivamente de las relaciones que el sujeto dio a las doce premisas
relacinales. Los signos +/- varan segn la relacin r que el sujeto
estableci entre dos atributos.
Para una mejor ejemplificacin de las reglas con que se asignan los
signos +/-, se dan en la Figura 9-3 diagramas de Venn explicativos. En
ellos, se da la distribucin de signos +/- para las relaciones 1, P y 0 entre
los atributos A y B, cuando A es antecedente y B consecuente. Los cuatro
casos que all se plantean deben entenderse como reglas lgicas de
evaluacin segn que el atributo antecedente (en este caso A) sea igual o
distinto de vaco. El signo ? que aparece en el espacio de B, fuera de A, es
para ser llenado por la conversa BrA. Con estas reglas bsicas se llena
todo el conjunto de 16 espacios del diagrama rectangular, siguiendo el
siguiente criterio: Cada vez que una relacin r obliga a poner en un
espacio un signo +/- distinto del que ya haba sido puesto por otra
relacin r anterior, esta discrepancia indica que estamos frente a una
contradiccin. En tanto los signos coincidan habr coherencia o
compatibilidad y tambin Isomorfismo lgica/razonamiento del sujeto.

En el caso en que A = 0

a) Diagrama de Venn correspondiente a (AIB)

En el caso en que A

b) Diagrama de Venn correspondiente a (AIB)

c) Diagrama de Venn correspondiente a (AOB)

d) Diagrama de Venn correspondiente a (APB)

Fig. 9-3 Diagramas de Venn.


Cmo se establece el puntaje del sujeto en el TCR
El puntaje que un sujeto obtiene en el TCR se basa en el cmputo
de respuestas errneas (o contradicciones) y no en el de respuestas
correctas. De este modo, un sujeto que obtiene 0 puntos en el test es un
sujeto de coherencia perfecta, y si su puntaje aumenta, ello ser un
indicador de un grado progresivo de incoherencia de razonamiento o de
insuficiencia de su organizacin lgica del pensamiento.
El cifrar el puntaje sobre la base de los errores y no en las respues-
tas correctas tiene una serie de ventajas. La primera de ellas es la
posibilidad de diferenciar distintos tipos de errores y una segunda es
analizarlos en profundidad posteriormente, segn un anlisis de items
correspondientes. Otra ventaja sera detectar las posibles falencias
estructurales del razonamiento del sujeto en sus puntos precisos de
fracaso inferencial.
Pero el aspecto ms importante por el cul conviene centrar el
cmputo ms en los errores que en las respuestas correctas, es que esto
le permite al investigador pasar de un enfoque evaluativo estrecho y
superficial, basado en la respuesta (modelo estmulo-respuesta) a un
enfoque ms amplio y profundo basado en los procesos inferenciales
puestos en juego a lo largo del test (modelo estmulo-proceso inferencial
ntraorgansmico-repuesta). De este modo, esto permite estudiar las
causales de incoherencia y de desorganizacin lgica del pensamiento.
Esto se ha logrado en trabajos sucesivos (Lpez Alonso, 1988, 1991a,
1991b, 1992; Orsi, 1988; Ricardi, 1989, 1993a, 1993b) y se continuar.
El puntaje del test se basa entonces en el cmputo de errores de
contradiccin cometidos por el sujeto, los cuales son discriminados segn
los siguientes tipos:
Contradicciones con las premisas extensionales
Se trata de aquellas relaciones r que entran en contradiccin con los
porcentajes %A, %B, %C y %D. Se computa la cantidad de errores de
este tipo.
Contradicciones con las premisas relacinales
Son las relaciones r que entran en contradiccin con otras relaciones
r previamente dadas o correspondientes a las premisas relacinales.
Tambin se computa separadamente la cantidad de errores de este tipo.
Transgresiones al principio bsico de identidad
Se trata de aquellas relaciones r incompatibles entre dos afirmacio-
nes o dos negaciones de un mismo atributo. Este tipo de error aparece en
las diagonales antes sealadas de las matrices I y IV. Se distinguen dos
subtipos: 1) Transgresiones a la identidad positiva ( ld.+) son los
errores de contestar, por ejemplo, AOA APA, en lugar de AIA, que es la
identidad. Estos errores slo aparecen en la matriz I y se computan como
tales; 2) Transgresiones a la identidad negativa ( Id.-) son los errores
de contestar, por ejemplo, -AO-A -AP-A en lugar de -Al-A , que es la
identidad de un atributo definido por lo negativo. Este tipo de identidad es
importante distinguirlo, porque se ha dado como error significativo en cier-
tos tipos de cuadros o perturbaciones psiquitricas (Lpez Alonso, 1988).
Estos errores slo aparecen en la matriz IV y se computan como tales.
Transgresiones a principios bsicos de no-contradiccin y tercero excluido
Se trata de aquellas relaciones r incompatibles dadas entre la afir-
macin y la negacin de un mismo atributo. Por ejemplo, contestar Al-A
AP-A, en la diagonal de la matriz II; o -AIA -APA en la de la matriz III,
en lugar de AO-A -AOA, respectivamente. Estos errores pueden compu-
tarse conjunta o separadamente, pues ambos transgreden una nocin
bsica de no-contradiccin y de tercero excluido, segn se vea, y son un
ndice indudable de desorganizacin lgica.
Items del TCR no respondidos
Se trata de las relaciones r que el sujeto ha dejado en blanco. Estas
no-respuestas se consideran como una forma de fracaso en el logro de la
coherencia total, aunque no constituyan en s algn tipo de contradiccin.
Por tal razn, se computan como tales, separadamente.
Puntaje total de errores
Bajo este ttulo se da la suma total de errores o fracasos dados en
los cinco puntos anteriores. Esta suma total es un reflejo del rendimiento
global del sujeto en coherencia de razonamiento.
El cmputo de estos seis puntos se da en el ngulo inferior-derecho
de la Figura 9-2 y con el mismo culmina y se sintetiza el proceso de
evaluacin llevado a cabo en esa hoja. Recurdese que cuanto ms alto
es el puntaje o nmero de errores, mayor es el ndice de incoherencia y
desorganizacin lgica del pensamiento. Luego, para un anlisis cualitativo
tambin importa tener en cuenta el tipo de error, su ubicacin dentro de la
cadena inferencial y el tipo de inferencia inmediata (segn Stebbing) que
supone.

Formas del TCR desarrolladas hasta el presente


Como puede apreciarse a travs de la lectura de los puntos
anteriores, el TCR tiene un esquema bsico que parte de un conjunto de
atributos y que puede variarse indefinidamente segn cules sean los
atributos que se tomen y cul es el rea de aplicacin o investigacin
cientfica.
Ya hemos hecho referencia a las Formas I y II del test y a sus subformas
a y b correspondientes. Recordemos que la Forma I estaba compuesta por los
atributos "Respetable", "Honorable", "Admirable" y "Venerable", que son formas
incluidas de valoracin social y cultural. Recordemos tambin que la Forma II
estaba constituida a partir de los atributos "Americano", "Argentino", "Europeo" e
"Ingls", que pueden interpretarse como nacionalidades o lugares de nacimiento.
A estas dos formas ya referidas, se le agregaron posteriormente las
siguientes formas:
Forma III constituida por los atributos "Americano" (continental),
"Argentino", "Hispanoparlante" y "Angloparlante". Esta forma se caracteriza por
combinar dos atributos de la Forma II con otros dos atributos lingsticos, dando
lugar a una estructura relacionai distinta.
Forma IV desarrollada para nios en colaboracin con la Lio Nora
Ricardi. Los atributos constitutivos fueron: "Los animales", "Los gatos", "Las
flores" y "Las rosas", y se presentaban en forma textual y en forma grfica
simultneamente, a efectos de facilitar la comprensin de los nios. Esta forma
fue ideada especialmente para ser comparada con pruebas de desarrollo
intelectual de Piaget, tanto en nios normales, como diferencia-damente en
nios oyentes y en nios sordos (Ricardi, 1989, 1993b) repectivamente.
Forma V constituye una ampliacin metodolgica e instrumental
significativa del TCR, pues consiste en extender la evaluacin de la coherencia
inferencial desde el conjunto bsico de cuatro atributos a un conjunto de
atributos mucho mayor. Por ejemplo, el primer modelo de la Forma V se
constituy sobre los cuatro atributos bsicos, que en este caso estuvieron
referidos a posturas y categoras de valor como: "Idealista", "Realista",
"Materialista" y "Escptico". Adems de establecerse las relaciones r entre estos
cuatro atributos y su correspondiente diagrama rectangular, se establecieron las
relaciones r que guardaban esas cuatro posturas de valor con cada uno de los
trminos de una lista de 36 actividades u ocupaciones humanas. Entre stas
estaban, por ejemplo: "sacerdote", "cientfico", "poltico", "prostituta", "juez",
"narcotraficante", "mdico", "educador", "travesti", "economista", "banquero",
"drogadicto", "asistente social", "psiclogo", "abogado", "predicador", "legista",
"filntropo", etc.
Esta nueva forma pemti establecer un mapa para cada una de esas
actividades o profesiones segn su compatibilidad o incompatibilidad con las
relaciones del diagrama rectangular que refleja las posturas axiolgicas del
respondente y dando el grado de "idealismo", "realismo", "materialismo" y
"escepticismo" que corresponda a cada una de esas 36 actividades. Slo a
modo de breve referencia, diremos que el mapa de "sacerdote" se constituy
con mayor frecuencia y consistencia sobre las
intersecciones de los atributos "idealista" y "realista"; mientras que el de
"narcotraficante" se constituy con igual definicin sobre las intersecciones
de "materialista" y "escptico". De este modo, tomando estos dos ejemplos
contrapuestos, puede establecerse y ampliarse indefinidamente el mapa
inferencial que liga a distintos atributos a travs de distintas categoras
conceptuales importantes, y a distintos niveles de significacin. Dichos
mapas constituyen en s una estructura de relaciones inferenciales entre
conceptos que permiten explorar, justamente, procesos de formacin de
conceptos, de categorizacin, definicin y aprendizaje. Las posibilidades
de exploracin, de este modo, se tornan ilimitadas, dado que slo depende
de cambiar el conjunto de trminos o atributos que se desee estudiar. Una
de las aplicaciones posibles que se est planeando para un futuro
esperemos no muy lejano, es la de utilizar esta forma para establecer
el grado de consistencia o no-contradiccin entre y dentro distintos
sistemas expertos referidos a reas comparables de conocimiento, donde
a veces la no-consistencia o contradiccin mutua entre y dentro de los
sistemas expertos haya creado gran desconcierto. Obviamente, esta
aplicacin supone crear formas del TCR especializadas y ajustadas a cada
sistema experto.
Por ltimo, otra forma que se proyecta es una en la cul se
combinan percepcin visual de la realidad, organizacin perceptual,
memoria operativa, coherencia de razonamiento y organizacin lgica del
pensamiento.

CONCLUSIONES

Hemos reservado para esta ltima seccin las consideraciones


relativas a las normas psicomtricas del TCR y a algunos de los resultados
obtenidos con dicho instrumento.
Respecto de las normativas psicomtricas esperadas de todo instru-
mento de medicin, en especial a las propiedades de confiabilidad, validez,
sensibilidad y generabilidad que deben satisfacer dichos instrumentos,
cabe decir lo siguiente:
La primer propiedad que hemos atendido y entendemos
satisfecho es la de validez. Creemos que por sus fundamentos lgicos, el
TCR tiene de por s una validez de contenido y de constructo asegurada
en esa disciplina. Secundariamente y un poco contrariamente a lo habi-
tualmente esperado, hemos puesto atencin en la confiabilidad.
Nuestro criterio extemo ha sido en realidad el de la isomorfa entre
los procesos de razonamiento del sujeto y la lgica, y entendemos con esto
asegurada la validez de la prueba sobre la base de que esa isomorfa no
es un producto aleatorio, sino lgico-organizacional de la mente. La
posibilidad de que esa isomorfa o coincidencia estructural entre dos
sistemas independientes (lgica-pensamiento) ambos tan complejos, se
produzca al azar es totalmente impensable. Las posibilidades aleatorias de
llenar al azar slo la segunda parte de la hoja de respuestas es de 3 a la
64. Por otra parte, llama la atencin la habitual frecuencia (30%) con que
jvenes sin instruccin lgica son capaces de responder el TCR sin ningn
error de contradiccin, la que es mucho ms alta cuando se trata de uno
a cinco errores solamente. Todo esto ha garantizado de algn modo no
slo la validez del instrumento, sino la existencia de una organizacin
lgica natural en la mente humana (Lpez Alonso, 1990, 1991a) y ste es
uno de los resultados ms importantes.
Implcitamente, nuestro criterio de validez se ha sustentado tambin
en el principio wundtiano de heterognesis de los fines, dado que, adap-
tando nuestra interpretacin del mismo, la lgica se instrumenta como una
disciplina independiente del pensamiento, aunque se haya originado a
partir de ste. En tal sentido, si la lgica no fuera independiente del
pensamiento o si no supusiramos dicho principio, y no fuera, por tanto, un
sistema regulativo y evaluativo del mismo independiente, entonces no
podramos adoptar la lgica como "criterio externo" para fundamentar
sobre el mismo nuestro criterio de validez.
Volviendo a la confiabilidad, como antes dijramos, la hemos dejado
en un plano secundario. Con esto hemos seguido un criterio que ha sido
destacado por Sechrest (1989). Este autor ha objetado crticamente a
aqullos que, sin pensarlo, suponen que una medida no puede ser vlida
sin ser previamente confiable. Para ello, Sechrest se ha basado en el
criterio de seguridad y generalizacin, previos al de confiabilidad, tal como
ha sido sustentado por Cronbach y otros (1972), y tambin se ha basado
en ejemplos crticos propios y de Harrell (1981) respecto de la estabilidad
y seguridad de las medidas de confiabilidad.
Segn estos autores, si bien la confiabilidad es usualmente interpre-
tada como un coeficiente que indica el grado de estabilidad o no-variabilidad
aleatoria de una medicin, puede no diferenciar suficientemente entre la
estabilididad/variabilidad del instrumento y la estabilidad/variabilidad del
objeto o sujeto medido. Para evitar este riesgo, debemos contar con un
suficiente criterio de validez previo.
Si tenemos asegurado un criterio de validez tal, se atenuar esa
insuficiencia de la confiabilidad frente a la complejidad de factores del
proceso medido. En tal sentido, la confiabilidad no ocultar riesgo o error
alguno de estimacin y/o evaluacin por variabilidad no discriminada.
Sechrest atribuye tambin a falta de comprensin del problema de la
generalizacin visto por Cronbach y colaboradores y a la confusin
derivada de distintos conceptos de confiabilidad, como una fuente posible
de graves errores en la fundamentacin de la medicin. Siguiendo este
criterio, hemos preferido, entonces, asegurar previamente un suficiente
criterio de validez sustentado en el isomorfismo entre la lgica deductiva
de clases y/o de conjuntos y el razonamiento natural o no entrenado
lgicamente de los sujetos.
No obstante, hemos obtenido medidas de confiabilidad "test-retest"
y "formas paralelas" bastante satisfactorias correlaciones iguales a 0,95
y 0,89, respectivamente.
Respecto a la sensibilidad y generabilidad del TCR, cabe decir que
stas dependen del mismo factor internolgico-organizacional que se
pretende medir. Lpez Alonso (1992), Ricardi (1993a) y Lpez Alonso y
Ricardi (1993) constataron, en los resultados del TCR tomado a muestras
de estudiantes secundarios, de sujetos psiquitricos y controles, que la
sensibilidad bsica del instrumento y el grado de organizacin lgica del
pensamiento estn fuertemente asociados y dependen de la estructura de
relaciones r que los sujetos han dado como premisas relacinales.
Asimismo, respecto a la generalidad, constataron en los mismos
trabajos que sta aumenta cuando la estructura de relaciones r que el
sujeto confiere a las premisas se adecan mucho ms a las relaciones
existentes en la realidad. Los autores mencionados diferenciaron para una
misma forma del TCR (Forma II) 40 estructuras diferentes de relaciones de
premisas. Una sola de esas estructuras acapar la mayor frecuencia o
adhesin por parte de los sujetos; esta estructura fue la que ms unvoca-
mente reflej la estructura de relaciones de la realidad y la que dio el
promedio ms bajo de errores de contradiccin (3,90 errores para 176
sujetos), comparada con estructuras unipersonales que distorsionaban las
relaciones de la realidad y donde el nmero de errores ascendi a 57 sobre
64 tems (para un nico sujeto).
Como vemos, el TCR refleja su sensibilidad atravs del distinto tipo
de estructura relacional de premisas dada por los sujetos, y refleja su
generalidad a travs del grado en que dicha estructura se ajusta de la
forma ms adecuada y unvoca a la estructura de relaciones existentes en
la realidad, y no la distorsiona. Con estos resultados se comprueba cmo
el TCR satisface y pone de relieve la importancia de la diferenciacin antes
invocada de que todo sujeto tiene dos formas de coherencia: una, interna,
consigo mismo, y otra, externa, con el mundo y la realidad donde la
primera importa para el logro de la segunda, pues la primera representa a
su organizacin lgica interna.
Respecto a su fundamentacin epistemolgica, el TCR es una
tcnica coincidente con los principios y estructuras cognitivas fundamenta-
les de la "lgica operatoria" de Piaget (1977), ya sea en lo que hace a los
aspectos de extensin y comprehensin de las estructuras formales jerrqui-
cas operativas de agrupamiento, grupo y/o reticulado, como a sus aspectos de
conservacin, coordinacin, reversibilidad y equilibrio del sistema. Y coincide
tambin con Piaget en el criterio de considerar que la capacidad de resolucin
de las contradicciones se halla en el nivel ms alto y avanzado del desarrollo
intelectivo.

Queda una ltima cuestin: Hemos supuesto a la lgica como


independiente del pensamiento, pero hasta qu punto el grado de isomorfismo
entre ambos es una medida cabal de la organizacin del pensamiento y de su
dinmica?
Ya hemos dicho que el pensamiento es un proceso vital y abierto, y por lo
tanto expuesto permanentemente a nuevos conflictos cognitivos y
contradicciones, lo cual lo hace cambiante, sujeto a error, incertidumbre e
inestabilidad. Esto es producto de su intercambio dinmico con la realidad y
depende de las representaciones, intencionalidad, objetivos y expectativas del
sujeto pensante. En otro trabajo (Lpez Alonso, 1990, 1991a) nos referimos a
esta caracterstica del pensamiento como sistema abierto y necesitado de un
permanente equilibrio entre redundancia y entropa de la mente.

Cuando iniciamos nuestro proyecto de medir la organizacin lgica del


pensamiento a travs del TCR, no partimos de la idea de que el pensamiento
tuviera que ser una organizacin lgica perfecta e infalible. Una organizacin tal
nos estara hablando de un sistema cerrado y autosuficiente, cuando, en
realidad, el pensamiento es todo lo contrario: un sistema abierto, falible y
perfectible, permanentemente expuesto a error e incertidumbre. Si el
pensamiento no fuera as, no sera ni pertenecera a un sistema viviente.

Pero entonces, dentro de ese contexto qu sentido tiene medir la


organizacin lgica del pensamiento a travs de su isomorfismo con la lgica
una ciencia formal, de "artefactos formales congelados", atemporal e
inamovible?

Nuestra respuesta es: El isomorfismo, en realidad, est midiendo la


coherencia y la fuerza lgica del pensamiento hasta un cierto estndard o nivel
de alcance y realizacin representado por una cierta lgica, y no ms all de
sta. La lgica slo se encarga de dar y marcar ese nivel. Es como una "regla"
con la que se mide el crecimiento organizacional del pensamiento y slo nos
dice que el pensamiento ha llegado "por lo menos hasta ac" en su
organizacin, pero esa "regla" no es esa organizacin ni la explica. El
pensamiento puede crecer en su complejidad mucho ms all de lo que esa
"regla" o lgica puede medir, pues el pensamiento es un proceso vital,
inferencialmente progresivo y sin lmites un generador ilimitado de
significaciones, conceptos y formas.
REFERENCIAS BIBLIOGRFICAS

ABELSON, R.P. ARONSON, E., MCGUIRE, W.J.. NEWCOMB, T.M., ROSENBERG, M.J..
TANNEMBAUM, P.H. (Eds.)- Theories of cognitive consistency, a source-book. Chicago (IL): Rand-
McNally, 1968.
BENTHAM, J. Outline on a new system of logic. [S.I.: s.n.], 1827.
BOOLE, G. An investigation of the laws of thought. London: Macmillan, 1854.
--------------- .The mathematical analysis of logic. Cambridge (MA): MacMillan, Barclay and
MacMillan, 1847.
--------------- . The mathematical analysis of logic. Oxford: Basil Blackwell, 1948,1951.
BROUWER, L.E.J. Intuitionism and formalism. Bulletin of the American Mathematical Society, V.20,
p.81-96, 1913.
CERASO, J., PROVITERA. A. Sources of error in syllogistic reasoning. Cognitive Psychology. V.2,
p.400-410. 1971.
CHAPMAN. L.J., CHAPMAN, J.P. Atmosphery effect re-examined. Journal of Experimental Psychology
Washington, D.C.. v.58, p.220-226,1959.
CRONBACH. L.J., GLESER, G.C., RAJARATNAM, N.. NANDA. H. The dependability of behavioral
measure, theory of generalizability for scores and profiles. New York: Wiley, 1972.
DEL VAL, J.A. (Comp.). Investigaciones sobre lgica y psicologa. Madrid: Alianza Universidad, 1977.
DICKSTEIN, L.S. Differential difficulty of categorical syllogisms. Bulletin of the Psychonomic Society.
V.8, p.330-332. 1976.
ERICKSON. J.R. Research on syllogistic reasoning. In: REVLIN, R., MAYER, RE. (Eds.). Human
reasoning. Washington, DC: Winston, 1978.
--------------- . A set analysis theory of behavior in formal syllogistic reasoning tasks. In: SOLSO,
R.L. (Ed.). Theory of cognitive psychology, the Loyola Symposium. Potomac: Erlbaum. 1974.
EVANS, J.S.B.T. Selective processes in reasoning. In: EVANS, J.S.B.T. (Ed.). Thinking and reasoning,
psychological approaches. London: Routledge and Kegan. 1983.
FEATHER, NT. Acceptance and rejection of arguments in relation to attitude strength, critical ability,
and intolerance of incosistency. Journal of Abnormal and Social Psychology, v.69, p. 127-136,1965.
FELDMAN, S. (Ed.). Cognitive consistency, motivational antecedents and behavioral consequents. New
York: Academic Press, 1966.
FESTINGER, L A theory of cognitive dissonance. Stanford (CA): Stanford University Press, 1957.
FRANDSEN, A.N., HOLDER. J.R. Spatial visualization in solving complex verbal problems. Journal of
Psychology. Provincetown (MA), v.73, p.229-233, 1969.
FRASE, L.T. Belief, incongruity, and syllogistic reasoning. Psychology Reports, v. 18, p.982, 1966.
GOTTESMAN, L. CHAPMAN, L.J. Syllogistic reasoning errors in schizophrenia. Journal of Consulting
Psychology, v.24, p.250-255, 1960.
GUILFORD. J.P. Three faces of intellect. American Psychologist. Washington. D.C., v.14,
p.469-479, 1959.
HALPERN. J. Reasoning. In: EYSENCK. M.W. (Ed.). The Blackwell dictionary of cognitive
psychology. Oxford: Basil Blackwell. 1990.
HAMILTON, W. Lectures on metaphysics and logic. [S.I.: s.n.J, 1859.
HARRELL. W.A. The effects of alcohol use and offender remorsefulness on sentency decisions.
Journal of Applied Social Psychology. Silver Spring (MD). v. 11, p.83-91, 1981.
HEIDER, F. The psychology of interpersonal relations. New York: Wiley. 1958.
HENLE. M. Foreword. In: REVLIN, R., MAYER. R.E. (Eds.). Human reasoning. Washington,
D.C.: Winston. 1978.
. ------------ . On the relation between logic and thinking. Psychological Review. Washington.
D.C.. V.69, p.366-378, 1962.
HERBART, J.F. Hauptpunkte derlogik. [S.I.: s.n). 1808.
---------- . Lehrbuch zur einleitung in die philosophie. [S.I.: s.n.]. 1813.
JOHNSON-LAIRD, P.N. Mental models. Cambridge (MA): Harvard University Press. 1983.
------------- . El ordenador y la mente: introduccin a la ciencia cognitiva. Barcelona: Paids,
1990.
KAHNEMAN, D.. SLOVIC, P.. TVERSKY, A. (Eds.). Judgment under uncertainty: heuristics
and biases. Cambridge: Cambrigde University Press, 1983.
KANT, I. Logik. [S.I.: s.n.|. 1800. (Redactado por Jsche sobre apuntes de clase de Kant).
KASSIN, S.M. Base rates and prediction: the role of sample size. Personality and Social
Psychology Bulletin. Beverly Hills (CA). v.5, p.210-213, 1979.
LEFFORD, A. The influence of emotional subject matter on logical reasoning. Journal of
General Psychology. Provincetown (MA), v.34. p. 127-151, 1946.
LINDZEY. G ARONSON, E. (Eds.). The handbook of social psychology. 2.ed. Reading
(MA): Addison Wesley, 1969. v.3: The individual in the social context.
LIPPS, T. Grundzuge derlogik. [S.I.: s.n|. 1893.
LOPEZ ALONSO. A.O. Test de coherencia. Publicacin CIIPME. Buenos Aires, v.65. 1981.
------------- . Razonamiento humano: un test para su consistencia interna. Revista Signos
Universitarios. Buenos Aires, v.7, n.13 (Especial: Psicologa), 1988.
------------- . Razonamiento humano: distintos niveles de insight estructura y organizacin lgica
subyacente (versin ampliada). Cuadernos Pinero, Buenos Aires, n.16, 1990.
------------- . Razonamiento humano: distintos niveles de insight, estructura y organizacin lgica
subyacente. Revista de Psicologa General y Aplicada. Madrid, v. 44, n.2, p.221-230,199 la.
------------- . Haca una teora sistmico-ciberntica de la organizacin cognitiva de la mente y
del origen de la conciencia. Revista Signos Universitarios. Buenos Aires, v.10, n.19
(Especial: Miscelnea I), 1991b.
--------------. Incidencia de la codificacin de las premisas en el logro de un razonamiento
coherente. Revista Interdisciplinata, Buenos Aires, v.10 n.2, p. 137-167, 1991c.
--------------. Relational structures of premisses as determinant of reasoning coherence and
thought logical organization. Brussels, 1992. Trabajo presentado en el 25th. International
Congress of Psychology, Blgica, julio 1992.
LOPEZ ALONSO, A.O., RICARDI, N.C. La organizacin lgica del razonamiento en relacin con
categoras de diagnstico psiquitrico. Revista IRICE, Rosario, 1993.

LORD, C.R., ROSS, L, LEPPER, M.R. Biased assimilation and attitude polarization: effects of
prior theories on subsequently considered evidence. Journal of Personality and Social
Psychology, Washington, D.C., v.37, p.2098-2109, 1979.

MAYER, N.E., REVLIN, R. An information processing framework for research on human


reasoning. In: REVLIN, R., MAYER, R.E. (Eds.). Human reasoning. Washington, D.C.:
Winston, 1978.

McGUIRE, W.J. Cognitive consistency and attitude change. Journal of Abnormal and Social
Psychology, v.60, p.345-353,1960.

--------------- .A syllogistic analysis of cognitive relationships. In: ROSENBERG, M.J. .HOVLAND,


G.I., McGUIRE, W.J., ABELSON, R.P., BREHM, J.W. (Eds.). Attitude organization and change.
New Haven: Yale University Press, 1960.
MORGAN, J.J., MORTON, J.T. The distortion of syllogistic reasoning produced by personal
convictions. Journal of Social Psychology, Provincetown (MA), v. 13, p. 180-184, 1944.

ORSI, A.N. Coherencia de razonamiento y diferencias individuales: un estudio de sus carac-


tersticas e interdependencias. Revista Signos Universitarios, Buenos Aires, v.7, n.13
(Especial: Psicologa), 1988.

PIAGET, J. Ensayo de lgica operatoria. Buenos Aires: Guadalupe, 1977.


POLLARD, P. Human reasoning: some possible effects of availability. Cognition, Amsterdan,
V.12, p.65-96, 1982.

REVLIN, R. Two models of syllogistic reasoning: feature selection and conversion. Journal of
Verbal Behavior,w.l4, p.180-195, 1975.

RICARDI, N.C. Estudio evolutivo del pensamiento y su covariacin con la consistencia interna
del razonamiento en nios sordos y oyentes. Revista del Instituto de Investigaciones
Educativas. Buenos Aires, v.15, n.67/68, oct. 1989.

--------------- . La consistencia interna de razonamiento y su relacin con distintas dimensiones


de la personalidad, en sujetos con y sin antecedentes psiquitricos. Buenos Aires: Instituto
de Investigaciones Psicolgicas de la Universidad del Salvador, 1992. (Serie Documenta
Laboris).

--------------- . Construccin de premisas y coherencia de razonamiento. IRICE-URN-CONICET,


Rosario, n.6, mar. 1993a.

---------------- . Niveles diferenciales de rendimiento lgico en nios oyentes y sordos. Interdiscipli-


naria, Buenos Aires, v.ll, n.2. 1993b.

RICHTER, M. The theoretical interpretation of errors in syllogistic reasoning. Journal of Psy-


chology, Provincetown (MA), v.43, p.341-344, 1957.

RIMOLDI, H.J.A. Problems of thinking about thinking: language, and logical structure in problem
processing. In: FROELICH, W., SMITH, G., DRAGUNS, J., HENTSCHEL, U. (Eds.).
Psychological processes in cognition and personality. Washington, D.C.: Hemisphere, 1984.

. A technique for the study of problem solving. Educational and Psychological Measure
ment, Durham (NC), v.15, n.4, p.450-461, 1955.

ROMERO, F., PUCCIARELLI, E. Lgica. Buenos Aires: Espasa-Calpe, 1947.


SCHRODER. Vorlesungen uber die algebra dr logik. [S.I: s.n.], 1890.
SECHREST, L. Metodo de investigacin, fiabilidad y validez. In: BELLACK, AS., HERSEN, M. (Eds).
Mtodos de investigacin en psicologa clnica. Bilbao: Descle de Brouwer, 1989.
SELLS, SB. The atmosphere effect: an experimental study of reasoning. Archives of Psychology, V.29,
p.3-72, 1936.

SMEDSLUND, J. Circular relation between understanding and logic. Scandinavian Journal of


Psychology, Stockholm, v.ll, p.217-219, 1970.
STEBBING, L.S. Introduccin a la lgica moderna. Mxico: Fondo de Cultura Econmica, 1965.
THURSTONE, L.L. Primary mental abilities. Psychometric Monograph, Chicago (IL): n.l, 1938.
TVERSKY. A.. KAHNEMAN, D. Judgment under uncertainty: heuristics and biases. Science,
Washington, D.C., v.185, n.4157,p.U24-1131, 1974.

VAIHINGER. H. La filosofia del corno si. [S.I.: s.n.], 1878-1879.

VON DOMARUS, E. The specific laws of logic in schizophrenia. In: KASAMIN, J.S. (Ed.). Language
and thought in schizophrenia. Berkeley: University of California Press, 1944.

VON WRIGHT, G.H. Ensayo de lgica modal. Buenos Aires: S. Rueda, 1970.
WASON, P.C. Problem solving and reasoning. British Medical Bulletin. Cognitive Psychology,
Edinburgh, v.3, p.206-210,1971.
--------------- . Realismo y racionalidad en la tarea de seleccin. In: CARRETERO, M., GARCIA
MADRUGA, J.A. (Comps.). Lecturas en psicologa del pensamiento. [S.l.]: Alianza Psicologa,
1984.

----------------. Reasoning. In: FOSS. B. (Ed.). New horizons in psychology. London: Penguin, 1966.
--------------- . Self contradictions. In: JOHNSON-LAIRD, P.N., WASON, P.C. (Eds.). Thinking:
readings in cognitive science. Cambrigde: Cambridge University Press, 1977.
WHITEHEAD, A.N., RUSSELL, B. Principia mathematica. Cambrigde: Cambridge University Press,
1910.
WOODWORTH, R.S., SELLS, S.B. An atmosphere effect in normal syllogistic reasoning. Journal of
Experimental Psychology, v.18, p.451-460, 1935.

WUNDT, W. Ethik. [S.I.: s.n], 1886.

--------------- . System dr philosophie. [S.I.: s.n.], 1889.


WYER JR., R.S. Cognitive organization and change: an information processing approach. Potomac:
Erlbaum, 1974.
CAPTULO 10

OBSERVAO DO COMPORTAMENTO

Ceclia Guarnieri Batista


Centro de Estudos e Pesquisas Prof. Dr. Gabriel Porto (CEPRE)
Faculdade de Cincias Mdicas da UNICAMP

presente captulo aborda os fundamentos tericos e as diretrizes


metodolgicas para a realizao de estudos de observao do
comportamento. Exclui a pesquisa baseada em entrevistas e na
anlise de relatos verbais e de falas; exclui tambm a pesquisa relacio-
nada aplicao de testes e de escalas de desenvolvimento.
Observao definida por Reber (1985), no The Penguin Diction-
ary of Psychology, com trs acepes: 1) Em um sentido genrico,
qualquer forma de exame de eventos, comportamentos, fenmenos, etc.
2) Por extenso, qualquer dado individual, escore, valor, etc, que
represente um evento, comportamento ou fenmeno. O autor comenta
que o termo "observao" muitas vezes usado em oposio a "expe-
rimento", favorecendo a distino entre a pesquisa com manipulao de
variveis independentes e a pesquisa que utiliza observao naturalstica.
Lembra, entretanto, o argumento de muitos de que tal diferenciao
desnecessria, uma vez que um experimento meramente uma forma de
fazer observao. 3) Um comentrio casual ou informal a respeito de, ou
uma interpretao do que foi observado.
Observao naturalstica definida, no mesmo dicionrio, como
a coleta de dados atravs de cuidadosa observao de eventos em seu
ambiente natural. E mtodos observacionais so definidos como
quaisquer dos procedimentos e tcnicas utilizados em pesquisa no-
experimental para favorecer a observao precisa de eventos.
Este trabalho se concentra nos "mtodos observacionais", utilizados
especialmente em situao de "observao naturalstica" do comporta-
mento humano, de acordo com as definies acima.

ESTUDOS OBSERVACIONAIS NO BRASIL ANOS 70

Um dos impulsos para a realizao de pesquisa em Psicologia no


Brasil foi a criao dos cursos de ps-graduaco na rea, destacando-se
entre os primeiros os do Instituto de Psicologia da Universidade de Sao
Paulo, que se iniciaram, em 1970, com a autorizao dos cursos de
mestrado nas reas de concentrao em Psicologia Experimental e
Psicologia Escolar.
Muitos dos primeiros estudos em observao do comportamento
constituram-se nas teses de doutorado de alguns dos professores orien-
tadores desses cursos, notadamente da rea de Psicologia Experimental.
Vrios desses trabalhos consistiram em estudos etolgicos do comporta-
mento animal (Cunha, 1967, Carvalho, 1972 e Ribeiro, 1972, estudando
formiga sava Atta sexdens rubropiloser, Forel e Ades, 1972, estudando
a aranha Arigiope argentata). Outras teses foram desenvolvidas na rea
da anlise do comportamento (Witter, 1969, sobre discriminao em pr-
escolares; Kerbauy, 1972, sobre autocontrl do comportamento alimen-
tar; Mejias, 1973, sobre modificao do comportamento escolar). Foram
tambm realizados estudos sobre a interao me-criana, por docentes
da USP-Ribeiro (Rossetti-Ferreira, 1967, em Londres; Marturano, 1972,
na USP; Alves, 1973, na ento Faculdade de Filosofia, Cincias e Letras
de Ribeiro Preto; Stella, 1974, em Londres). Destaque-se, ainda, o
estudo sobre interao me-beb, de Sollitto (1972) na PUC-SP. Os
alunos de ps-graduaco receberam a influncia desses docentes e,
tambm, de outros professores ligados anlise do comportamento
(Carolina M. Bori, Maria Amlia Matos, Margarida Windholz e Thereza P.
Lemos Mettel, esta ltima inicialmente atuando na USP-Ribeiro e
posteriormente na UnB). Dessa forma, as abordagens tericas que mais
influenciaram a realizao de estudos observacionais no perodo foram
a etologia e a anlise do comportamento, que sero examinadas a seguir.

Influncias tericas e conceituais


Etologia
A etologia pode ser caracterizada como uma perspectiva biolgica
de estudo do comportamento. Originria da Zoologia, inicialmente
caracterizou-se como uma cincia do comportamento animal. Isso levou
o etlogo, de acordo com as consideraes de Carvalho (1978), a olhar
o comportamento como um aspecto da Biologia do animal e a formular a
respeito do comportamento o mesmo tipo de questes que formularia a
respeito dos rgos do corpo. Isso significa que o etlogo considera que
o comportamento fruto da evoluo, foi criado pela seleo natural, pela
presso seletiva do ambiente onde a espcie evoluiu e ao qual
adaptada. A autora considera que esse ponto de vista traz duas
conseqncias metodolgicas principais.
A primeira conseqncia se refere s questes a serem formuladas
sobre o comportamento (ou sobre qualquer evento biolgico) a partir
dessa perspectiva, ou seja, as questes sobre o porqu causai, ontoge-
ntico, funcional e evolucionrio (ou filogentico). Segundo Carvalho
(1978), a pergunta causai se refere aos determinantes da ocorrncia de
um evento comportamental no indivduo. A questo ontogentica se reporta
origem do comportamento no indivduo; j a questo funcional liga-se
funo que o comportamento tem para a espcie, considerando-se a an-
lise em relao ao ambiente evolucionrio do animal. Por fim, o porqu
filogentico refere-se ao modo pelo qual a evoluo criou, na espcie, os
mecanismos responsveis pela emisso do comportamento no indivduo.
Os mtodos empregados para responder a essas questes, de
acordo com Cunha, que se baseia em Lorenz, so, basicamente, a obser-
vao e a comparao. Para Cunha (1983), a observao o nico mtodo
realmente indispensvel, mas o emprego da comparao que tem
permitido a inter-relao das quatro reas caractersticas de inves-
tigao, referentes s questes mencionadas. Ele fundamenta essa
afirmao com o seguinte argumento: de um lado, o estudo da causao
do comportamento deve geralmente comear pelo levantamento do
etograma de uma espcie, ou seja, "o conhecimento pormenorizado de
seus comportamentos tpicos em pelo menos certas fases do ciclo
biolgico, traduzido numa categorizao e descrio com um carter
morfolgico" e, de outro lado, o estudo da filognese do comportamento
geralmente envolve o estudo comparativo de duas ou mais espcies que,
por outros critrios, como os morfolgicos, se apresentam aparentadas.
Quando se inicia o estudo filogentico, freqentemente se verifica a
necessidade dos conhecimentos providos pelo etograma, que torna o
investigador mais preparado para reconhecer caractersticas similares ou
diferentes entre espcies. E essa relao de semelhana ou diferena leva
busca de uma explicao em termos de seleo natural ou de fatores de
condicionamento ou treino ocorridos ao longo da vida do animal. Assim,
Cunha apresenta uma viso de investigao das quatro questes, que se
baseia no mtodo de observao e que integrada pelo mtodo de
comparao.
Voltando s colocaes de Carvalho sobre conseqncias metodo-
lgicas da perspectiva biolgica que caracteriza a etologia, essa autora
considera que a segunda conseqncia metodolgica a nfase no
organismo. Para Carvalho (1978), cada espcie tem sua prpria histria
evolucionara, e cada aspecto de seu comportamento ou estrutura se torna
compreensvel luz dessa histria. Isso resulta em tornar extremamente
importante considerar qual o organismo que est em jogo ao se analisar
o comportamento.
A etologia dedicou-se, inicialmente, ao estudo do comportamento
de diferentes animais (insetos, peixes, aves, mamferos, notadamente
primatas). Os estudos do comportamento humano passaram a aumentar
a partir dos anos 70 (Hutt e Hutt, 1974, original de 1970; Blurton Jones, 1972;
McGrew, 1972). Estes estudos tm nfase descritiva, trazem em geral
relaes extensas de categorias de comportamentos definidos morfologi-
camente, utilizam como medidas a freqncia de ocorrncia, a durao e
a intensidade, e buscam efetuar anlise de seqncia de categorias.
Em nosso meio, Cunha (1974) ministrou por vrios anos um curso de
observao do comportamento animal de orientao etolgica, formalizando
uma srie de aspectos referentes elaborao de definies de comporta-
mento. Comportamento entendido como um fenmeno biolgico, "consti-
tudo de estados orgnicos, posturas e movimentos cuja forma e orga-
nizao no podem ser atribudas diretamente a energias externas ao
sistema orgnico, que os exibiria como uma manifestao de sua irrita
bilidade e modificabilidade" (Cunha, 1975, p.264). Os estados orgnicos
so "revelados por aspectos funcionais tais como temperatura, cor, rigidez,
etc, de uma estrutura orgnica ou suas partes"; as posturas so definidas
como "disposies espaciais estacionarias de partes do organismo umas
em relao a outras"; e os movimentos, como "mudanas de posio
espacial de uma ou mais partes do organismo em relao a outras, toma-
das como referncia" (id. ibid., p.265).

Anlise do comportamento aplicada


A anlise do comportamento aplicada teve suas bases definidas ao
final dos anos 60 e foi derivada da anlise experimental do comportamento,
que aborda a relao comportamento-ambiente corno em constante altera-
o recproca, conforme se depreende da afirmao de Skinner (1975, p.1)
de que "os homens agem sobre o mundo e o transformam e por sua vez
so transformados pelas conseqncias de suas aes". As unidades de
estudo so constitudas por classes de estmulo, definidas atravs de seus
efeitos no comportamento, e por classes de respostas, definidas por suas
conseqncias no ambiente (Catania, 1973). As relaes entre esses
eventos so explicitadas na contingncia de reforamento: segundo
Skinner (1975, p. 12), "uma formulao das interaes entre um organismo
e o seu meio ambiente, para ser adequada, deve sempre especificar trs
coisas: 1) a ocasio na qual ocorreu a resposta, 2) a prpria resposta, e 3)
as conseqncias reforadoras. As relaes entre elas constituem as
contingncias de reforamento". A estratgia metodolgica da anlise
experimental do comportamento explicitada por Sidman (1960) como
estando baseada no estudo de alteraes na freqncia acumulada de
uma resposta ao longo do tempo, identificando-se a influncia da intro-
duo de variveis sobre uma linha de base estvel. Dessa forma, a
anlise experimental do comportamento enfatiza a importncia do estudo
das mudanas no comportamento medida em que ocorrem, em contra-
posio a outras abordagens experimentais que se limitam medio
anterior e posterior realizao da interveno experimental.
A anlise do comportamento aplicada foi delimitada por Baer, Wolf
e Risley (1968, p.91) corno "o processo de aplicar princpios de comporta-
mento, algumas vzes em experincia, para a melhoria de comportamen-
tos especficos, e de avaliar simultaneamente se as mudanas observadas
poderiam ser atribudas ao processo de aplicao e, em caso positivo,
a que partes do processo". Assim, a anlise aplicada est dirigida para o
exame de comportamentos que so socialmente relevantes, ao invs de
serem convenientes para estudo. Segundo esses autores, o estudo deve
ser aplicado, comportamental e analtico; alm disso, deve ser tec-
nolgico, conceitualmente sistemtico e efetivo, devendo, ainda,
demonstrar alguma generalidade.
Quanto metodologia de coleta de dados, Bijou, Peterson e Ault
(1968, p. 175) propem "um mtodo para integrar os campos de estudo
descritivo e experimental a nvel dos dados e dos conceitos empricos".
Eles consideram que essa integrao possvel se for utilizada como dado
bsico a freqncia de ocorrncia de eventos ambientais e comportamen-
tais, sendo que a informao sobre as relaes funcionais entre eventos
s podero ser fornecidas por estudos experimentais. Os autores
estabelecem procedimentos para a conduo de estudos descritivos de
campo, incluindo as seguintes consideraes: a) Especificao da
situao em que o estudo conduzido segundo os autores, a situa-
o deve ser definida em termos do ambiente fsico e social e dos eventos
observveis que ocorrem no mesmo, buscando-se o mnimo de variaes
na mesma ao longo do estudo, b) Definio de eventos comportamen-
tais e ambientais em termos observveis os autores consideram que
a seleo de eventos comportamentais e ambientais deve ser derivada de
estudos preliminares, a partir dos quais se constri um cdigo observacio-
nal, consistindo de itens definidos e de seus smbolos. Os eventos
comportamentais devero ser registrados em sua freqncia real ou em
termos de sua ocorrncia ou no ocorrncia a intervalos de tempo
prefixados. Eventos ambientais podem se referir a objetos, descritos em
termos de suas caractersticas fsicas; a eventos biolgicos, difceis de
medir em situaes de campo; e a eventos sociais, definveis do mesmo
modo que definem eventos comportamentais, e) Mensurao da
fidedignidade do observador os autores apresentam a frmula para
clculo do acordo entre observadores (acordos/acordos + desacordos) e
propem procedimentos para evitar a ocorrncia de desacordos, d)
Procedimentos para coleta, anlise e interpretao de dados os
autores sugerem que a coleta de dados seja realizada a intervalos
regulares, que a anlise consista na transformao dos dados de modo a
facilitar a visualizao das relaes entre eventos e que a interpretao se
limite a conceitos empricos e relaes consistentes com as observaes
e anlises efetuadas. Eles consideram que, em um estudo descritivo de
campo, as interpretaes geralmente consistem em uma comparao do
que foi descoberto na situao com outros dados obtidos sob condies
funcionalmente semelhantes.

Diretrizes metodolgicas
Como decorrncia das proposies tericas da etologia e da anlise
do comportamento aplicada, foi desenvolvida uma srie de diretrizes
metodolgicas para a realizao de estudos observacionais, que sero
descritas a seguir. Antes, porm, importante lembrar a questo da
seletividade. Segundo Hinde (1966), a seleo na observao inevitvel:
a descrio e a classificao envolvem rejeio de dados e seleo de
critrios. Sempre se corre o perigo de rejeitar os dados essenciais e utilizar
unidades de anlise irrelevantes. No entanto, a rejeio insuficiente de
dados pode levar a um conjunto de detalhes confusos e desviar a ateno
dos aspectos essenciais do problema. Para Hinde (1973), o grau de
seleo depende do problema estudado e do fato de que a preciso do
registro diminui medida que aumenta o nmero de respostas a registrar.

Delimitao de unidades e definio de categorias de comportamento


Hinde (1973) lembra que o comportamento se apresenta numa
complexa sucesso de eventos no tempo: preciso dividi-lo em unidades
para possibilitar sua descrio e classificao. As unidades devem ser
delimitadas a partir de pontos de transio, ou seja, de fenmenos que se
distinguem, por sua forma ou por seus resultados, do fenmeno
imediatamente precedente (Cunha, 1975). A diviso do comportamento em
unidades, a partir de mudanas em sua forma (descrio fsica ou
morfolgica), tem sido enfatizada pelos etlogos (Blurton Jones, 1972;
Cunha, 1976). Na diviso do comportamento pelos seus resultados
(descrio pela conseqncia ou funcional), separa-se o contnuo da ao
cada vez que o comportamento produz um efeito particular sobre o meio.
Hinde (1966) aponta duas vantagens bsicas da definio funcional: a) uma
breve descrio pode cobrir um grande nmero de padres motores
variveis; b) esse tipo de descrio chama a ateno para caractersticas
essenciais do comportamento, que podem no aparecer em descries
pela forma, tais como a orientao com respeito ao ambiente ou a
qualidade de responder a estmulos externos. Apesar de alguns etlogos
ressaltarem a importncia da definio pela forma, outros afirmam que
ambos os tipos de definio podem ser usados e mesmo combinados num
catlogo (Hinde, 1973; Hutt e Hutt, 1974). Segundo Hinde (1973), a prefe-
rncia depende da natureza do comportamento em questo, bem como do
objetivo da pesquisa. Danna e Matos (1982) consideram que definies
morfolgicas so mais adequadas quando o comportamento no produz
mudanas perceptveis no ambiente externo, como o caso, por exemplo,
de mudanas de expresso facial e de postura. Consideram, ainda, que
tais definies so necessrias quando se pretende estudar o funciona-
mento de determinada parte do corpo e quando se visa ao treinamento,
como no caso da habilitao de pessoas com deficincia fsica. J as
definies funcionais so suficientes quando a observao visa seleo
ou avaliao de pessoas e preferveis quando os aspectos morfolgicos
consistirem basicamente de movimentos de difcil identificao e obser-
vao, como, por exemplo, as vocalizaes.
Uma vez dividido o fluxo de eventos comportamentais em uni-
dades, preciso agrup-los em categorias, de acordo com as proprieda-
des comuns que os caracterizam, e em seguida defini-los. Apresentam-se,
a seguir, algumas regras para a definio de categorias de comporta-
mento:
a) A definio deve indicar aquelas propriedades que distinguem
uma categoria comportamental de outras categorias. Deve especificar
uma ou mais regras gerais que explicitem essas propriedades, demar-
cando os limites do que deve ser includo naquela categoria ou excludo
da mesma (Michael, 1975).
b) A definio deve ser objetiva, referindo-se a comportamentos
observveis to explicitamente quanto possvel (Michael, 1975). No
deve conter inferncia, interpretao ou finalismo (Cunha, 1974).
c) A definio deve ser clara, evitando-se a linguagem ambgua
(Michael, 1975). Diz-se que um termo ambguo quando tem dois signi-
ficados distintos e o contexto no esclarece qual dos dois est sendo
utilizado (Copi, 1974).
d) A definio no deve ser circular, ou seja, o termo a ser definido,
ou um sinnimo dele, no pode figurar no grupo de elocues destina-
das a esclarecer o significado desse termo (Copi, 1974).
e) A definio deve apontar um referencial de comparao quando
utilizar um adjetivo sem significado absoluto, tal como largo, alto,
pequeno, etc.
f) A definio pode incluir alguns exemplos, especialmente de in-
cluses e excluses difceis de julgar (Michael, 1975).
g) A definio deve especificar o critrio para delimitao de unida-
des, de modo a permitir a contagem.
Uma vez definida a categoria comportamental, deve-se atribuir-lhe
um nome que, para Cunha ( 1976), deve evocar a definio da categoria em
termos de observveis, reduzindo a possibilidade de se atribuir categoria
outros significados que no aqueles que determinaram sua criao. O
autor considera ser interessante atribuir um nome a uma categoria j
definida, pois desse modo podemos nos referir a ela sem precisar repetir
sua definio.
Elaborao do catlogo de categorias de comportamento
O termo "categoria de comportamento", como foi visto anteriormente,
designa o conjunto de unidades comportamentais agrupadas de acordo
com propriedades comuns. E o termo "catlogo" ser empregado para
designar o conjunto de categorias empregadas num determinado estudo.
Em um catlogo se procura descrever, de modo completo e sistemtico,
o repertrio comportamental dos sujeitos observados, no que se refere ao
objetivo do estudo em questo. Pode tambm ser includa no catlogo a
relao de circunstncias em que as categorias so observadas.
Discutem-se, a seguir, alguns problemas e princpios de categori-
zao e de elaborao de um catlogo.
Uma categoria do catlogo no deve ser excessivamente ampla,
incluindo sob a mesma denominao um conjunto de eventos cuja unici-
dade ainda no se demonstrou. Uma crtica inadequao metodolgica
do uso de tais categorias ("variveis resumidoras"), no estudo da interao
me-criana, foi feita por Marturano (1972). Ao se agruparem diferentes
eventos sob a mesma categoria, deve-se perguntar se se trata de uma
espcie de comportamento ou de mais de uma espcie. Em relao a esse
problema, Altmann (1965) sugere separ-los quando em dvida, pois mais
tarde sempre se poder juntar duas categorias em uma s, mas no se
poder separar o que se juntou precocemente.
Certos cuidados durante a categorizao justificam-se por suas
implicaes para posterior anlise de dados. Slater (1973), ao discutir
anlise de dados, apresenta como exigncias: a) que as categorias sejam
mutuamente exclusivas, e b) que o observador esteja preparado para tratar
todos os membros de uma dada categoria como equivalentes.
Um catlogo deve, tambm, permitir diferentes nveis de anlise do
fenmeno, do mais molecular ao mais molar. Uma forma de atender a essa
exigncia elabor-lo em termos de categorias mais amplas e de subca-
tegorias que as compem. Os dados so coletados com base nas
subcategorias, mas podem tambm ser agrupados nas categorias mais
amplas, de modo a se ter uma viso de conjunto do fenmeno.
A habilidade na elaborao de categorias depende muito da expe-
rincia prvia do pesquisador, tanto no que se refere ao treino anterior em
observao como na sua experincia especfica com os comportamentos
sob anlise. Uma vez elaboradas as categorias, interessante que ele as
discuta com outros pesquisadores experientes. Dois critrios objetivos
foram propostos por Richards e Bernal (1972), para testar a adequao das
categoras: a) Fidedignidade e validade diferentes pesquisadores
tendem a desenvolver categorias idnticas ou semelhantes, e uma
descrio da categoria permitir que outro observador a registre e obtenha
um alto grau de concordncia; b) Utilidade na anlise a ocorrncia da
categoria deve estar correlacionada com outros eventos ou mostrar distin-
es entre grupos pr-selecionados de sujeitos.
Muitas vezes, ao se elaborar um catlogo, agrupa-se uma srie de
eventos considerados pouco relevantes sob uma categoria residual ou
indiferenciada. Weick (1968) lembra que preciso evitar, entretanto, que
um nmero significativo de eventos incida nessa categoria, pois nesse
caso o sistema de classificao se tornaria difcil de interpretar.
Um exemplo de catlogo de comportamentos fundamentado no
critrio morfolgico o de Vieira (1975). A autora observou pessoas em
diferentes situaes e elaborou um catlogo com 146 itens, incluindo
unidades anatmicas (por exemplo, "ris", "plpebra") e de comportamento
(por exemplo, "abrir os olhos", "punho cerrado"), tomando como referencial
o prprio corpo e sua posio no espao, num trabalho diretamente
derivado das proposies de Cunha (1974, 1975, 1976).
Um outro exemplo o catlogo elaborado por Batista (1978, 1980),
a partir da observao de pais e filhos pr-escolares em situao de
refeio. O catlogo consta de 123 verbos definidos e de uma relao de
termos da orao que devem ser registrados quando da utilizao de cada
um desses verbos (por exemplo: quando for empregado o verbo "abaixar",
indicar sujeito, objeto direto e adjunto adverbial que descreve at onde o
objeto foi abaixado). Cada definio est redigida sob a forma de uma
contingncia de trs termos condio, resposta, produto. As relaes
entre verbos definidos e definidores est representada em diagramas de
rvore, o que favorece a autocorreo de cada definio e do catlogo
como um todo, dificultando a ocorrncia de categorias que no sejam
mutuamente exclusivas. Esse estudo representa um exemplo da influncia
dupla de etologia e da anlise do comportamento: elabora-se um extenso
catlogo de comportamentos, como nos estudos etolgicos, ao mesmo
tempo que se formulam definies predominantemente funcionais.
Analisando-se o trabalho em retrospectiva, verifica-se que o catlogo teve
generalidade, tendo sido utilizado por outros autores em outras situaes.
Entretanto, considera-se que a abordagem situao que se pretendia
estudar poderia ter sido feita com a definio prvia de objetivos mais
especficos e menos exploratrios. Considera-se, agora, de duvidosa
utilidade a elaborao de catlogos genricos de comportamentos, sem
que estejam pautados pelo mesmo enfoque terico que leva elaborao
de etogramas.

Descrio das circunstncias em que os comportamentos ocorrem


Ao apresentar princpios de categorizao e anlise do comporta-
mento dentro de uma perspectiva etolgica, Cunha (1976) fala sobre a
necessidade de especificao e descrio das circunstncias em que
ocorre o comportamento, e afirma que elas podem ser encontradas entre
os aspectos do ambiente, do organismo e de seu comportamento.
Para ele, entre os aspectos do ambiente, interessam especialmente as
mudanas no ambiente imediato do organismo que se correlacionam com
seu comportamento. Entre os aspectos do organismo, incluem-se sua
espcie, o estgio de desenvolvimento em que se encontra, a condio
presente de seus vrios rgos, a postura do animal como um todo ou de
alguma de suas partes, mudanas que podem estar ocorrendo no interior
do organismo em virtude de ter sido exposto a determinadas circunstncias
ambientais no passado. E entre os aspectos do comportamento, podem
ser mencionados os comportamentos concomitantes ao comportamento
observado, os comportamentos que o precedem imediatamente e os
comportamentos passados do animal diante de situaes similares ou
mesmo diferentes da observada (Cunha, 1976).
No estudo observacional realizado em situao natural s possvel
estudar diretamente as circunstncias que se referem a ambiente,
organismo e comportamento, na medida em que puderem ser observadas
sem o auxlio de instrumentos ou de contato fsico com o organismo
estudado. Atravs de entrevista podem-se obter alguns outros dados, tais
como: idade; condio fsica passada e presente; condio de privao
alimentar, de atividade e de sono; histria de influncia ambiental, como,
por exemplo, separao prematura dos pais, o fato de ter sido submetido
a tratamentos referentes sade fsica e mental, escolaridade, nvel scio-
econmico, etc.
A questo da identificao das circunstncias do comportamento
tambm relevante para a anlise do comportamento. Ao propor uma
anlise funcional do comportamento em 1953, Skinner (1967) enfatiza as
condies externas das quais o comportamento funo e os experi-
mentos realizados segundo o paradigma operante envolvem a manipu-
lao de estmulos apresentados em estreita contigidade temporal com
a resposta. Por outro lado, Staddon (1973) afirma que no se justifica a
tentativa de explicar o comportamento, limitando-se a apontar como
causas apenas estmulos temporalmente contguos. O autor considera
que um comportamento poder ter muitas causas, e que todas ou quase
todas podero estar no passado. possvel que estejam ligadas umas
s outras e ao resultado final atravs de mecanismos de imensa
complexidade. O que falta superar as dificuldades no estudo dessas
influncias.
Um estudo observacional ter limitaes na identificao de todos
os eventos ambientais que possivelmente estejam influindo no comporta-
mento. importante lembrar que a identificao de eventos temporalmente
contguos ao comportamento e a descrio do contexto ambiental,
sugerindo testes experimentais, se constituem solues parciais para a
questo.
Escolha da tcnica de registro
Os autores ligados anlise do comportamento aplicada definiram
uma srie de tcnicas de registro que permitissem a coleta de dados
relativas a classes de respostas predefinidas, sua quantificao e repre-
sentao grfica. Hall, um autor clssico na rea, distingue as seguintes
tcnicas de mensurao: registro automtico, mensurao direta de
produtos permanentes e registro de observao. O registro automtico
envolve o uso de instrumentos nos quais "a resposta do organismo aciona
um dispositivo eltrico ou mecnico que, por sua vez, registra automatica-
mente cada resposta" (Hall, 1973, p.2). O autor destaca como vantagens de
seu uso a preciso e a facilidade de traduo do resultado em termos
numricos e como desvantagens aspectos ligados a custo e manuteno,
bem como falta de flexibilidade ou de capacidade de registrar muitos
comportamentos especficos de interesse do pesquisador. A mensurao
direta de produtos permanentes envolve a anlise de resultados do
comportamento (por exemplo, respostas escritas a tarefas acadmicas,
blocos empilhados, etc), sendo destacadas como vantagem a preciso e
a possibilidade de quantificao. J o registro de observao ocorre
quando "um observador humano v um comportamento e o registra na
forma como ocorre" (id. ibid., p.3). O autor destaca os seguintes tipos de
registro: contnuo, de evento, de durao, de intervalo, amostragem de
tempo e placheck, descritos a seguir:
registro contnuo: caracterizado como aquele em que "o obser-
vador tenta escrever tudo o que est ocorrendo" (id. ibid, p.3), com a
vantagem de possibilitar a incluso de muitas classes de comporta-
mento e a desvantagem de tomar muito tempo do observador, segundo
o autor.
registro de evento: envolve a "contagem da freqncia de eventos
na medida em que estes ocorrem" (id. ibid., p.3-4), atravs de marcas
no papel ou contadores de pulso, sendo indicado como vantagem o fato
de no interferir muito nas tarefas em andamento.
registro de durao: envolve o registro da "durao de determina-
do comportamento durante um dado perodo de observao" (id. ibid.,
p.4), geralmente atravs de cronmetro.
registro de intervalo: para esse tipo de registro, "cada sesso de
observao dividida em perodos de tempo iguais. O observador re-
gistra ento a ocorrncia do comportamento durante esses intervalos"
(id. ibid., p.4). Assim, para cada intervalo, feita uma marca correspon-
dente ocorrncia do comportamento, tenha sido ele de curta ou longa
durao ou tenha ocorrido uma ou mais vezes. Essas questes em geral
so resolvidas delimitando-se intervalos bastante pequenos, em torno
de 10 a 15 segundos. O autor aponta como vantagens o fato de a tcnica
dar indicao tanto da freqncia quanto da durao do comportamento
observado, podendo-se registrar simultaneamente mais de um tipo de
comportamento. Aponta como desvantagem a exigncia da ateno
ininterrupta do observador.
placheck: de Planned Activity Check, envolve a contagem, a
intervalos predeterminados, do total de indivduos que esto desem-
penhando o comportamento alvo e do total de indivduos presentes,
exprimindo-se o resultado em porcentagem.
Hall (1973) considera que os registros de observao em geral no
so to precisos quanto os obtidos com instrumentos automticos, mas
que so vantajosos para utilizao em situaes de aplicao de modifi-
cao de comportamento, como a escola e o lar.
Uma reviso mais recente de tcnicas de registro foi realizada por
Fagundes (1981), em que o autor d exemplos detalhados da aplicao de
cada tcnica e introduz algumas tcnicas mistas, alm das tradicionalmen-
te utilizadas.
Embora autores norte-americanos da rea de anlise do comporta-
mento aplicada considerem que a tcnica de registro contnuo s til nas
fases preliminares do estudo, esta tem sido bastante utilizada no Brasil
como tcnica bsica de coleta de dados. Os primeiros estudos da
interao me-criana so um exemplo disso. Sollitto (1972) estudou a
interao me-nen durante o banho: as respostas verbais da me e do
nen foram registradas pelo gravador, e as respostas motoras foram
anotadas por escrito, de modo contnuo, separadas por intervalos de 10
segundos. A gravao foi transcrita e elaborou-se um protocolo de cada
sesso de observao, unindo-se o registro das respostas motoras da
me e do nen s transcries das respostas verbais de ambos (do beb,
atravs de transcrio fontica). A anlise de dados envolveu o cmputo
de freqncias de respostas e a elaborao de grficos de freqncia
acumulada das mesmas. Marturano (1972) estudou a interao me-
criana de trs anos em trs condies que envolviam a realizao de uma
tarefa refeio em casa, refeio no laboratrio e resoluo de quebra-
cabeas em laboratrio e utilizou tcnica de registro e transcrio de
dados semelhante de Sollitto (1972). A anlise de dados consistiu no
computo de freqncias e na anlise de seqncia, esta envolvendo a
tabulao das unidades verbais em matrizes de seqncias, anlise
probabilistica das seqncias observadas e anlise probabilistica dos
padres de seqncia.
Esses estudos ilustram o emprego da tcnica de registro cursivo
como base para a realizao de anlise quantitativa. Tem sido apontado
como vantagem da utilizao dessa tcnica o fato de se evitar a seleo
prvia de variveis, como seria o caso se fosse adotado um catlogo de
categorias, bem como de preservar a seqncia dos eventos observados.
Por outro lado, h alguns cuidados a serem tomados. Altmann (1974), ao
discutir diferentes tcnicas de amostragem para estudo do comportamento
social, com enfoque predominante em colnias de primatas, d o nome de
"amostragem ad libitum" situao em que o observador "registra tanto
quanto consegue" ou aquilo que mais prontamente observvel no
comportamento social de um grupo. Ela aponta algumas dificuldades
dessa forma de trabalho segundo ela, diferentes comportamentos de
diferentes sujeitos no tm a mesma probabilidade de serem registrados.
Alm disso, mesmo que a probabilidade de registro se mantivesse a
mesma, em muitas ocasies o observador veria mais eventos do que
conseguiria registrar e, na ausncia de critrios sistemticos de seleo,
suas preferncias pessoais governariam a escolha. A "amostragem ad
libitum" no totalmente equivalente tcnica de registro cursivo, e, nos
estudos de interao acima citados, houve um cuidado das autoras na
padronizao das condies de registro e da linguagem a ser utilizada,
antes da realizao da coleta de dados. Fica, entretanto, a recomendao:
h necessidade de algumas definies sobre sujeitos e situaes de
registro, bem como de padronizao da linguagem, antes da realizao de
uma coleta de dados empregando registro cursivo, principalmente se vai
se efetuar uma anlise quantitativa dos dados.
Ainda sobre a tcnica de registro cursivo, urna srie de orientaes
sobre como realiz-lo so apresentadas em Danna e Matos (1982). E, no
que se refere elaborao de listas de assinalar (check-sheets), Hinde
(1973) apresenta uma srie de sugestes e discute as vantagens e des-
vantagens de sua adoo.

Anlise quantitativa de dados


A anlise quantitativa mais elementar envolve contagens de
freqncia, geralmente convertidas em freqncia relativa ou porcenta-
gem. Autores ligados anlise do comportamento tm proposto preferen-
cialmente a representao dos dados em grficos, que permitem visualizar
alteraes de freqncia ao longo do tempo e envolvem um mnimo de
manipulao estatstica dos dados.
Com relao etologia, Slater (1973) afirma que a anlise de
seqncia tem sido muito enfatizada por etlogos, especialmente os
interessados na causao do comportamento. Em geral, eles consideram
que a ocorrncia de dois padres de comportamento em proximidade
temporal indica que eles compartilham alguns fatores causais, ou porque
ambos os comportamentos dependem de um estado corporal particular (a
presena de um hormnio, por exemplo), ou porque eles podem ocorrer
como resposta ao mesmo estmulo externo ou a estmulos externos
relacionados. O autor destaca que a anlise de seqncia no pode fazer
a distino entre essas possibilidades, mas pode indicar de forma objetiva
os agrupamentos em que os comportamentos ocorrem e assim definir as
relaes que precisam ser explicadas. O autor distingue mtodos de
anlise de seqncias de comportamento intraindividual do estudo de
seqncias de comportamento em situao de interao social.
Quanto aos mtodos de anlise de seqncia intraindividual, Slater
(1973) distingue dois tipos: a) anlise de freqncias de transio de
probabilidades condicionais e b) comparao com um modelo randmico.
Quanto ao primeiro, o autor afirma que o tipo mais simples de seqncia
de eventos a seqncia determinista, embora a maioria das seqncias
de comportamento sejam probabilsticas e no deterministas. Seqncias
probabilsticas bastante precisas so usualmente designadas como
"respostas encadeadas". Nesses casos, a probabilidade de um evento
particular to marcantemente alterada pela natureza do evento imediata-
mente precedente que um diagrama de fluxo indicando as freqncias com
que ocorrem as diferentes transies prove uma boa impresso da
organizao do comportamento (por exemplo, as seqncias de cortejo em
vertebrados inferiores). Quando as seqncias no so to ordenadas,
pode-se incluir apenas as transies que tm alta probabilidade de
ocorrncia (probabilidade condicional da ocorrncia de B, dado que A
acabou de ocorrer). O autor afirma que esse tipo de anlise s til
quando a seqncia forte e os diferentes comportamentos considerados
ocorrem com freqncias semelhantes.
O segundo mtodo de anlise de seqncia intraindividual,
comparao com um modelo randmico, envolve as cadeias de Markov.
"Uma seqncia de comportamento pode ser descrita como uma cadeia
de Markov se as probabilidades de diferentes atos dependerem apenas do
ato imediatamente precedente e no de nenhum ato anterior" (Slater, 1973,
p.135). Tal seqncia ser referida como uma cadeia de Markov de l8
ordem, sendo que "uma cadeia de Markov de r ordem aquela em que
um evento especfico afetado significativamente pelos r eventos prece-
dentes" (id. ibid., p. 135). Grande parte das anlises de seqncia do
comportamento envolvem a identificao de dependncias de 1 ordem, a
partir da comparao da matriz de freqncias de transio observadas
com as freqncias esperadas, caso os atos fossem independentes um do
outro. O autor apresenta uma srie de estratgias e cuidados a serem
tomados para a aplicao desse tipo de anlise. Como mtodos alternati-
vos, menciona a correlao e a anlise fatorial e alerta para o fato de que
no se sabe claramente o que representam as variveis hipotticas
extradas por esse ltimo mtodo.
Todas as consideraes feitas at o momento por Slater (1973)
referem-se s seqncias de comportamento intraindividual que ocorrem
em contextos em que se supe que o mundo externo permanea relati-
vamente imutvel. Isso diferente do estudo de seqncias de comporta-
mento em situao de interao social, que tem um objetivo primrio
diferente: demonstrar que o comportamento de um animal afetado pelo
de outros e obter evidncia do papel de diferentes padres de comporta-
mento na comunicao. Uma dificuldade apontada para essa anlise o
fato de que os dados podem no ser estacionarios, uma vez que muitos
comportamentos interessantes na comunicao so aqueles cuja probabi-
lidade muda medida que a interao prossegue. Uma outra dificuldade
que o comportamento de um animal em situao social depende, em
parte, da seqncia de atos que ele j apresentou, bem como do compor-
tamento de outros. O modelo de anlise de interao entre A e B deveria
levar em conta, segundo o autor, seqncia de comportamentos de A,
seqncia de comportamentos de B, seqncia de comportamentos de A
dirigidos a B e de B dirigidos a A, levando-se em conta que os eventos
imediatamente antecedentes no so os nicos a afetar um determinado
comportamento (Slater, 1973).
Verifica-se, assim, que o estudo de seqncias de comportamento
em situao de interao social demanda uma ateno especial, seja em
termos da prpria abordagem ao fenmeno, seja em termos da anlise quan-
titativa do mesmo. Alguns progressos recentes em relao anlise
quantitativa de dados so apresentados por Van Hoof (1982), Sato (1987)
e Lopes, Bueno e Barnabe (1992).

Avaliao da fidedignidade
O conceito de fidedignidade, de acordo com a teoria clssica dos
testes, apresentado por Johnson e Bolstad (1973, p.26) como "a
consistncia com que um teste mede um dado atributo ou fornece um
escore consistente em uma dada dimenso", sendo que "a exigncia
clssica de fidedignidade envolve a consistncia no instrumento de medida
ao longo do tempo (fidedignidade no teste-reteste) ou ao longo de
conjuntos de itens respondidos na mesma ocasio (fidedignidade split-
half)" (id. ibid., p.10). O autor discute a aplicao do conceito aos estudos
observacionais em anlise do comportamento aplicada e argumenta que
o clculo do acordo entre observadores no deve se constituir a nica
forma de aferir a fidedignidade desses estudos.
Weick (1968) cita Medley e Mitzel, que sugerem trs tipos de
fidedignidade, calculados atravs de diferentes ndices: acordo entre
observadores (diferentes observadores observando ao mesmo tempo),
estabilidade (o mesmo observador observando em ocasies diferentes) e
fidedignidade (observadores diferentes observando em ocasies diferen-
tes). A medida de acordo entre observadores, mais comumente utilizada,
privilegia a intersubjetividade, enquanto as demais privilegiam a replicabili
dade. O autor tambm cita Dunnette, que argumenta que h vrias fontes
de erros quando se faz observao, e que o tipo de fidedignidade
necessria para avaliar ou compensar cada um desses erros diferente.
Os tipos de erros mencionados so: a) amostragem inadequada de con-
tedo, quando observadores diferentes colhem amostras de apenas alguns
elementos de um comportamento complexo e essas amostras consistem de
elementos diferentes; b) tendncias de respostas ao acaso, que provm
de definies imprecisas de categorias ou de compreenso inadequada da
categoria por parte do observador, que o levam freqentemente ao uso de
definies intuitivas informais, mais variveis que as formalmente definidas;
c) mudanas no ambiente e d) mudanas na pessoa que est sendo
observada, duas alteraes que podem ocorrer ao longo do perodo de
observao. Dadas essas vrias fontes de erro, Weick (1968) sugere que a
fidedignidade seja medida de vrios modos. Num estudo ideal de obser-
vao, seriam feitas quatro comparaes: 1) as classificaes de duas
pessoas observando o mesmo evento seriam correlacionadas, prevenindo
erros de mudanas na pessoa e no ambiente; 2) as classificaes de um
mesmo observador observando um evento semelhante em duas ocasies
diferentes seriam comparadas, evitando-se erro de amostragem de
contedo; 3) depois seria correlacionado o acordo de dois observadores
observando um evento em duas ocasies diferentes, medida vulnervel s
quatro fontes de erro, da qual se pode esperar a fidedignidade mais baixa
dentre as quatro comparaes; 4) finalmente, as observaes de um nico
observador observando um nico evento seriam comparadas s outras
correlaes, em uma verificao da consistncia interna do observador. O
autor considera que possvel apenas aproximar-se deste ideal de
avaliao da fidedignidade, priorizando-se o acordo entre observadores em
relao a um nico evento. Tendo em vista as atuais possibilidades de
gravao em vdeo, considera-se que seria bastante vivel adaptar essas
propostas para avaliao da fidedignidade tanto durante o treino de
observadores como no teste de categorias de comportamento.
Uma reviso das variveis que podem afetar o ndice de concor-
dncia foi realizada por Batista (1977). No que se refere ao acordo entre
observadores quando utilizada a tcnica de registro cursivo, Batista e
Matos (1984) discutem a questo e sugerem definies e medidas aplic-
veis a essa tcnica de registro.
Batista (1985) analisa as diferenas de abordagem questo da
fidedignidade por autores ligados etologia e anlise do comportamento
e conclui que o pesquisador deve adequar a avaliao de fidedignidade s
caractersticas especficas de seu projeto de trabalho. A autora faz
algumas sugestes especficas:
a) Estudos preliminares que visem caracterizao de um fen-
meno podem se beneficiar mais de discusses informais entre pesqui-
sadores do que de testes formais de fidedignidade.
b) Estudos em que um nico observador efetua todos os registros
de comportamento podem ter avaliaes de fidedignidade de vrias
formas, entre as quais 1) a aferio da estabilidade do observador
atravs de verificao de seu desempenho no registro de um mesmo
vdeo em duas situaes diferentes e 2) a comparao de seu desem-
penho com o de um pesquisador experiente que tenha tido contato
prvio com as definies das categorias apenas por escrito.
c) Estudos em que diferentes observadores participem da coleta de
dados tero que contar necessariamente com um sistema de aferio
da preciso de cada um desses observadores. Um alto ndice de
acordo, no entanto, no indicar necessariamente a adequao do
sistema de categorias utilizado, uma vez que estes podero estar
reagindo a uma definio implcita da categoria.
d) O teste das definies de categorias poder ser realizado, em
parte, atravs da anlise dos desacordos constatados para categorias
especficas.
No que se refere fidedignidade, o importante reter o significado
mais amplo do termo e estabelecer formas de aferi-la que sejam compat-
veis com os objetivos de cada estudo.

ESTUDOS OBSERVACIONAIS NO BRASIL ANOS 80 E 90

Ao longo dos anos 80 e 90, foram criados vrios centros de formao


de pesquisadores no Pas. Novas perspectivas tericas vieram se juntar s
j existentes, norteando a realizao de estudos observacionais. Esses
estudos tm sido apresentados e discutidos em reunies cientficas,
destacando-se a Reunio Anual da SBPC Sociedade Brasileira para o
Progresso da Cincia e a Reunio Anual da Sociedade Brasileira de
Psicologia (sucessora da Sociedade de Psicologia de Ribeiro Preto), e
publicados em revista como Psicologia, Psicologia: Teoria e Pesquisa,
Boletim de Psicologia e outras. Entre as publicaes figuram tambm dois
livros didticos sobre utilizao de metodologia observacional (Fagundes,
1981; Danna, Matos, 1982), um livro com uma coletnea de estudos de
observao da interao professor-aluno (Morais, 1980) e um relato de
pesquisa sobre apego, combinando observao direta do comportamento
em situao planejada e dados obtidos atravs de entrevistas e visitas
domiciliares (Rossetti-Ferreira, 1986).
Em um workshop sobre questes metodolgicas no estudo da
interao humana, um grupo de autoras (Alves, Carvalho, Marturano,
Mettel, Rossetti-Ferreira, 1987) apresentaram os resultados de um
levantamento dos estudos utilizando metodologia observacional ao longo
de quinze anos (levantamento dos resumos de pesquisas apresentadas
Sociedade de Psicologia de Ribeiro Preto entre 1971 e 1986). Verificaram
que houve um aumento gradual no total de trabalhos e que esse aumento
ficou mais visvel a partir de 1980. Nas primeiras reunies houve um
predomnio de estudos com animais e, ao longo do tempo, verificou-se um
aumento e diversificao de estudos do comportamento humano. Atcnica
de registro mais utilizada foi a de registro contnuo (50%), seguida pelo de
categorias (23,9%) e de check-list{l0,2%). Os recursos mais utilizados para
registro foram papel e lpis (4,9%), seguidos de gravador (23,9%) e
videocassete (15,9 %).
Nesse workshop foram discutidas vrias questes. A primeira delas
referiu-se ao conceito de interao, encarada como algo que ocorre entre
os sujeitos, de forma que a linguagem adequada descrio do comporta-
mento de indivduos no adequada ao estudo da interao entre eles.
Quanto aos mtodos de coleta de dados, enfatizou-se a necessidade de
definio e explicitao dos objetivos dos projetos, pois deles estariam
realmente dependendo todas as escolhas posteriores. Quanto ao uso de
hipteses, entendidas como construto, conceituao do fenmeno,
considerou-se que, no Brasil, os pesquisadores nem sempre estabelecem
explicitamente o nexo entre sua hiptese e o recorte que vo fazer do
processo de interao. Lembrou-se, ainda, que o pesquisador deve estar
alerta para o fato de que esse recorte ocorre tanto na coleta como na
anlise de dados. Constatou-se uma tendncia na pesquisa da interao
caracterizada por: a) um deslocamento do enfoque molecular na direo
do enfoque molar; b) uma nfase crescente no contexto onde a interao
se processa; c) o desenvolvimento de formas de recorte, a partir do recorte
antecedente-conseqente, na direo de unidades mais amplas, como
episdio. Para alguns participantes do workshop, uma das questes
centrais referiu-se sistematizao das observaes, de forma a poder
transformar seu produto em teoria ou generalizar os dados obtidos (Alves,
Carvalho, Marturano, Mettel, Rossetti-Ferreira, 1987, com redao de Alves
e Marturano).
Preocupao semelhante com o direcionamento da coleta e anlise
de dados foi manifestada por Prado, criticando um certo tipo de estudo
observacional, para ela inadequadamente denominado "etolgico", que
partiria da afirmao de que a Psicologia uma cincia emprica, que deve
comear com fatos objetivos, ou seja, sobre os quais deve haver acordo
intersubjetivo, e que o acesso a eles se d pela observao. A autora
apresenta sua concepo de "fato objetivo" como "aquele que dito numa
determinada linguagem, construda para dar conta das relaes supostas
pela teoria" (Prado, 1988, p.411), argumentando que eventos observados
s tm sentido quando compreendidos no contexto de uma teoria. A autora
se pergunta, a seguir, sobre qual seria o ponto de partida de uma
observao que se propusesse no ser guiada por nenhuma teoria. E
considera que tal empreendimento no seria possvel, que o "dado puro"
uma iluso, e que todo pesquisador se baseia em uma "verso de
mundo", seja ela cientfica ou no e tenha sido explicitada ou no.
Uma conscincia crescente da necessidade de vinculao da coleta
de dados a quadros de referncia tericos levou os pesquisadores a apri-
morarem a vinculao de seus estudos aos modelos tericos existentes ou
a buscarem modelos tericos alternativos. Essas buscas so apresentadas
a seguir.

O estudo da interao social: consideraes tericas e metodolgicas


Grande parte dos estudos recentes de observao tm sido reali-
zados em situao de interao social, abordando a interao me-
criana (Dessen, Mettel, 1984; Linhares, Marturano, 1984a, 1984b;
Rossetti-Ferreira, 1986; Lyra, 1988; Ramos Cerqueira, 1988a, 1988b;
Batista, 1989), a interao professor-aluno (Machado, 1979; Morais, 1980,
1987; Duran, 1981, 1987; Marturano, Bertoldo, Camelo, 1982; Marturano,
1984, 1986, 1987; Marturano, Maimoni, 1989; Linhares, 1988; Gil-Ceneviva,
1985; Gil, 1990, 1991), as interaes entre crianas (Bussab, 1988;
Oliveira, 1988a, 1988b; Vieira, 1988a, 1988b; Pedrosa, 1989; Carvalho,
Beraldo, 1989; Carvalho, 1991, 1992; Pedrosa, Carvalho, 1991; Pedrosa,
1992), o comportamento pr-social nas interaes criana-criana e
adulto-criana (Branco, Mettel, 1984; Branco, 1989, 1991; Bastos,
Carvalho, 1991; Bussab, 1991; Carvalho, 1991b; Melo, Branco, 1992) e
Interaes em atendimento peditrico (Crepaldi, Zannon, 1989;
Coutinho, Zannon, 1991).
Esses estudos, e muitos outros, tm levado reflexo sobre
fundamentao terica e propostas metodolgicas na pesquisa da
interao social. Sero apresentados no presente item, bem como nos
itens seguintes, alguns dos desenvolvimentos recentes na rea.

O conceito de interao social, segundo Carvalho


Carvalho considera que interao o que ocorre entre indivduos.
Para essa autora, "a essncia do conceito de interao o de influncia
ou regulao recproca, ou seja: cada um, ou a ao de cada um,
diferente, pelo fato de se dar com o outro, do que seria isoladamente (e/ou
com um terceiro?); no se explica pelo que cada um (ou faz), mas por
seus efeitos recprocos. evidente, portanto, que, segundo esse conceito,
a interao social no o observvel. O que se observa so os comporta-
mentos/aes/estados dos indivduos (ou eventos) em interao. Interao
um estado ou processo (hipotetizado) de regulao recproca, inferido a
partir do comportamento dos interagentes" (Carvalho, 1988, p.512).
A autora discute que, para alguns autores, o termo interao s deve
ser usado quando o sujeito alvo responde ao comportamento do sujeito
iniciador, pois, caso contrrio, no h evidncia de que ocorreu interao
(efeito de um sobre o outro). A autora considera que, nesse caso,
necessrio definir um intervalo temporal dentro do qual a ocorrncia de
uma resposta ainda ser tomada como critrio para se falar em interao,
sendo que a durao desse intervalo arbitrria e, na maioria dos estudos,
bastante curta. Sua crtica adoo desse critrio de que ele reflete a
suposio de que o processo de regulao sempre ocorre de forma imedi-
ata ou instantnea, o que considera pouco provvel. Para ela, a contingn-
cia temporal entre respostas no o nico nem o principal indicador de
ocorrncia de regulao mtua e pode nem mesmo ser um indicador
necessrio. Um outro argumento da autora contra o uso desse critrio
(contato reciprocado como unidade mnima para a anlise da interao)
o de que est implcita em sua adoo a hiptese de que a regulao entre
os parceiros se processa basicamente atravs de efeitos mtuos de seus
comportamentos. Cita outras formas de regulao que podem ser hipo-
tetizadas: a identidade do parceiro, suas caractersticas fsicas, etc. Para
ela, a ausncia de respostas explcitas no significa necessariamente
inexistncia de interao, entendida no sentido terico como processo de
regulao. Concluindo, a autora afirma que est implcita nessa discusso
a necessidade de estabelecer distines entre dois usos do termo
"interao": como categoria terica e como categoria descritiva, sendo que,
nesse ltimo caso, qualquer critrio de definio arbitrrio e igualmente
aceitvel, desde que bem explicitado, tendo, porm, implicaes para a
compreenso terica do fenmeno abordado.

O estudo dos relacionamentos interpessoais, segundo Hinde


Hinde prope a criao de uma cincia dos relacionamentos
interpessoais. O autor afirma que "estudos dos relacionamentos interpes-
soais devem levar em conta no apenas o fenmeno em nveis de
complexidade crescente (respectivamente, comportamento social,
interaes sociais e relacionamentos sociais), cada um com aspectos
comportamentais e afetivo-cognitivos, mas tambm dois tipos de dialtica:
de um lado, a dialtica que se estabelece entre relacionamentos sociais e
as personalidades dos indivduos participantes, e, de outro, a dialtica
entre esses relacionamentos e as vrias influncias sociais que determi-
nam sua natureza" (Hinde, 1981, p.4). Cada um desses aspectos ser
analisado a seguir.
No que se refere aos diferentes nveis de anlise do fenmeno, o
autor considera como interao a ocorrncia de uma ou mais trocas do
tipo: A faz x para B e B faz y em retorno para A. O termo relacionamento
reservado para casos em que uma interao afetada por interaes
passadas ou pode afetar interaes futuras. A descrio dos aspectos
comportamentais de uma interao deve especificar seu contedo (o que
os participantes esto fazendo) e a qualidade da interao (incluindo
aspectos relacionais como sincronia, existncia de objetivo comum, etc).
J a descrio dos aspectos comportamentais de um relacionamento
deve abranger tanto o contedo e a qualidade das interaes componen-
tes como, tambm, a freqncia absoluta e relativa e a distribuio no
tempo dessas interaes. Assim, observam-se propriedades emergentes
medida que se progride nos nveis de anlise, principalmente do nvel
das interaes para os dos "relacionamentos".
Alm dos aspectos comportamentais de interaes e relacionamen-
tos, Hinde considera que devem ser abordados seus aspectos cognitivos
e afetivos, baseando-se no argumento de que muitas vezes o que ocorreu
numa interao menos importante do que aquilo que os participantes
pensam que ocorreu, como eles pensam ter se sentido e como o parceiro
foi percebido. Para o autor, o curso futuro do relacionamento depende das
avaliaes que os indivduos fazem das interaes e relaes de que
participam, em seus aspectos comportamentais, cognitivos e afetivos.
Quanto aos aspectos dialticos, Hinde menciona em primeiro lugar
o fato de que relacionamentos influenciam os indivduos e que a personali-
dade desses indivduos influencia os relacionamentos em que eles se
inserem, criticando o fato de que a Psicologia tem devotado muito mais
esforos ao estudo dos aspectos individuais da personalidade do que ao
estudo dos relacionamentos. O segundo tipo de dialtica surge do fato de
que cada relacionamento existe em um ambiente social, o que destaca
dois aspectos: por um lado, ambos os participantes de um relacionamento
influenciam e so influenciados pelo relacionamento em foco; de outro
lado, esse relacionamento afetado pelas normas da cultura em que eles
vivem, ao mesmo tempo em que essas normas so alteradas ao longo do
tempo pelos relacionamentos didicos e pelos de ordem mais elevada que
constituem a sociedade. Assim, necessrio levar em conta esses dois
tipos de dialtica: entre personalidade e relacionamento, bem como entre
relacionamentos e sociedade.

Tipos de recorte do fluxo interativo, segundo Marturano


Entre as solues para um estudo da interao social que levem em
conta a complexidade dos eventos envolvidos est a distino entre tipos
de recorte do fluxo Interativo, apresentada por Marturano (1987). Ao
discutir estudos de interao professor-aluno, a autora examina quatro
formas de recorte do fluxo interativo, que representam niveis progressiva-
mente mais altos de complexidade e que so aplicveis a outros tipos de
interao, alm da interao professor-aluno.
O primeiro procedimento o que apreende comportamentos
isolados da professora e do aluno, permitindo levantamentos de fre-
qncia e limitado a estudos correlacionis.
O segundo refere-se transio entre comportamentos da
professora e do aluno. Segundo a autora, as posies relativas das
respostas no fluxo temporal so tomadas como referncia para a cons-
truo de matrizes de dupla entrada, tendo como antecedentes ora os
comportamentos do aluno, ora os do professor. Podem-se obter, assim,
informaes de mbito limitado sobre relaes de reciprocidade e controle.
O terceiro procedimento prope a diviso do fluxo interativo em
episdios, ou seja, segmentos delimitados por condies observveis de
incio, desenvolvimento e trmino. Alm das anlises realizadas pelo se-
gundo tipo de procedimento, possvel tambm investigar separadamente
as iniciativas do aluno e do professor. A autora destaca que esse recorte
permite a derivao de indicadores quantitativos de reciprocidade e con-
trole, bem como de centralidade e assimetria na organizao do grupo.
A quarta modalidade de recorte localiza as relaes entre epis-
dios adjacentes, levando em conta diferentes possibilidades de transio,
superposio ou interseo entre episdios, permitindo conceber a sala de
aula como grupo centralizado na professora e no apenas como conjunto
de episdios didicos isolados, como o caso do terceiro tipo de recorte.
Uma representao esquemtica dos quatro tipos de recorte, bas-
tante elucidativa, apresentada no texto original (Marturano, 1987).

Categoras intra e inte/individuis na anlise de interaes, segundo Carvalho


Carvalho (1988) considera que, se a interao um evento que
ocorre entre indivduos, conforme discutido anteriormente, esta no
poderia ser adequadamente descrita com base em categorias referentes
ao comportamento de um dos parceiros, definidas independentemente do
comportamento do outro. O tipo de categoria adequado seria aquele cuja
definio envolvesse a considerao de ambos os parceiros e/ou de
relaes entre seus comportamentos.
A autora faz a distino entre sistemas de categorias baseadas
numa dimenso estrutural da interao, dos baseados nos contedos.
Entre as ligadas dimenso estrutural, esto as que se fundam em
relaes de qualquer tipo entre os comportamentos dos parceiros, por
exemplo, relaes de semelhana, relaes temporais, etc; esse o caso
de categorias como "interao complementar", "interao simtrica", etc.
J entre as categorias baseadas no "contedo", a autora menciona
exemplos que considera claramente interindividuais, como "imitao",
"brinquedo paralelo", "cooperao", bem como outros em que nem sempre
claro se a categoria se refere ao comportamento de um indivduo emissor
ou se depende da considerao de dois ou mais parceiros, como o caso
de "agresso", "ajuda", etc.

Sistemas de categorias para anlise do comportamento verbal,


segundo Marturano
Marturano (1988) tece consideraes sobre a lgica do sistema de
categorias, aplicada anlise do comportamento verbal. Afirma que, na
abordagem do comportamento verbal atravs de sistemas de categorias,
surgem dificuldades na elaborao e na utilizao do instrumento, que
dizem respeito principalmente aos requisitos de excluso mtua e
coerncia de critrios. Em relao ao primeiro requisito (ou seja, a
necessidade de que as categorias sejam mutuamente exclusivas), a autora
afirma que, algumas vezes, na prtica, a incluso de um segmento de fala
em uma ou outra categoria muito mais uma questo de deciso do
categorizador que uma decorrncia lgica das respectivas definies. E
com relao ao segundo requisito (ou seja, de que haja coerncia na
utilizao dos critrios de categorizao), considera que as distores
decorrem em geral de duas ordens de problema: a) categorias distintas
so definidas a partir de critrios diferentes; b) na aplicao do instrumen-
to, utilizam-se pistas adicionais no previstas nas definies e decorrentes
do conhecimento prvio do categorizador como usurio da linguagem.
A autora apresenta uma concepo do comportamento verbal como
"multidimensional, integrado a um sistema de comportamento mais amplo
e constituindo ele prprio uma cadeia de eventos interdependentes"
(Marturano, 1988, p.518). Para dar conta de toda essa complexidade, ela
sugere que se tomem os seguintes cuidados, quando diferentes dimenses
do comportamento verbal forem tratadas em um nico sistema de
categorias: a) explicitar as dimenses cuja incluso na anlise o problema
de pesquisa requer; b) explicitar os critrios para identificao de variaes
em cada dimenso; c) incluir em todas as definies de categorias a
referncia ao status de cada dimenso e os respectivos indicadores, de
acordo com os critrios previamente estabelecidos.
Como alternativa, sugere a utilizao de sistemas mltiplos, ou seja,
um sistema de categorias independentes para cada dimenso focalizada.
Nesse caso, so feitas vrias leituras dos dados, e cada unidade de
verbalizao recebe tantas classificaes quantas sejam as dimenses
estudadas. A autora apresenta como uma das vantagens do procedimento
de sistemas mltiplos o fato de permitir uma resoluo qualitativa mais
diferenciada no tratamento dos dados, uma vez que podem fornecer,
atravs da anlise de dependncia, configuraes formadas pela asso-
ciao significativa entre categorias de diferentes sistemas; dessa forma,
as relaes entre dimenses so extradas empiricamente dos dados. A
autora aponta o trabalho de Ramos (1979) como um exemplo da realizao
da proposta de leituras mltiplas do comportamento verbal.

A construo de Unidades de Anlise Comportamental (UAC) para o


estudo do comportamento pr-social, segundo Branco e Mettel
Branco (1989) e Branco e Mettel (1989a, 1989b), visando ao estudo
do comportamento pr-social, realizaram gravaes em vdeo e vrios
outros tipos de registro em uma sala de maternal, com crianas cuja idade
estava em torno de cinco anos. Branco (1989) relata que, para transcrio
do vdeo, deu preferncia transcrio exclusiva dos episdios considera-
dos relevantes, ao invs da transcrio detalhada da fita toda. Para tanto,
o mesmo trecho da fita era observado repetidamente, at que fossem
identificados os episdios que pareciam apresentar alguma relao com
interaes criana-criana e definidos os critrios de identificao desses
episdios.
Em seguida, os episdios foram decompostos em unidades de
anlise, compreendendo trs elementos bsicos: um segmento do com-
portamento da professora, uma situao antecedente especificando a
natureza da relao entre as crianas com quem a professora interagiu e
uma situao conseqente especificando a ocorrncia ou no de altera-
es referentes relao criana-criana descrita como antecedente.
Cada unidade devia referir-se a um nico padro criana-criana,
excetuando-se aquelas que representassem verbalizaes da professora
que no definiam um padro criana-criana especfico. Dessa forma,
cada um dos padres criana-criana que se relacionavam no episdio ao
comportamento da professora geraram uma Unidade de Anlise Compor-
tamental (UAC). Uma vez determinadas as UAC, passou-se sua clas-
sificao atravs do desenvolvimento de dois sistemas de categorias
articulados, relacionando aes da professora aos diversos padres
criana-criana. "Cada UAC , portanto, composta por uma categoria
correspondente ao da professora e outra ao padro criana-criana
ao qual ela faz referncia ou sobre o qual ela atua" (Branco, 1989, p.78). As
aes da professora, num total de 14, foram categorizadas em trs classes:
estabelecimento, supresso e verbalizao de regras, sempre referentes
a algum tipo de categoria de relacionamento criana-criana. E as 4
categorias especficas do relacionamento criana-criana foram classifica-
das em quatro tipos diferentes: ateno ao colega, interaes sintnicas,
interaes no-sintnicas e competio planejada. Alm disso, as UAC
foram identificadas em cada uma das 12 categorias relativas s atividades
desenvolvidas na sala de aula. Das 488 UAC registradas, 419 foram contin-
gentes ocorrncia de algum tipo de relacionamento criana-criana,
sendo que, destas, 76% relacionaram-se ao estabelecimento, 17%
supresso e 7% verbalizao de regras relacionadas aos diferentes
padres criana-criana. Verificou-se, tambm, que a situao de roda foi
o principal contexto para a observao de UAC.

Um exemplo de anlise funcional da interao professor-aluno,


segundo Gil
Gil (1990, 1991) estudou as relaes entre o desempenho de uma
professora de primeira srie do primeiro grau e o desempenho de seus
alunos, durante a realizao de uma rotina de sala de aula, composta por
seqncias comportamentais simples e curtas (por exemplo: seqncias
rtmicas de batidas de palma ou de lpis na mesa, seqncias de movi-
mentos corporais, etc.). Levando em conta que deveriam ocorrer ajus-
tamentos recprocos e contnuos nos repertrios da professora e dos
alunos, a autora buscou trabalhar tambm com estados transicionais, alm
das classes de desempenho e sua freqncia. Nesse sentido, "as defini-
es das classes foram amplas e/ou provisionais, isto , foram classes
funcionais que mudavam medida que suas funes, estabelecendo-se,
ensejavam novas funes. Assim, a necessidade de trabalhar com fluxos
de desempenho da professora e do aluno gerou a necessidade de regis-
trarem-se produtos especficos destes fluxos. Estes, algumas vezes,
seriam mudanas no ambiente fsico do outro, mas, mais freqentemente,
seriam mudanas no prprio repertrio estudado, vistas no s como uma
classe, mas como uma srie de comportamentos literalmente seriados"
(Gil, 1991, p.315).
A autora lembra que para fazer uma anlise funcional dos desempe-
nhos da professora e dos alunos deveria medir o efeito de um evento
sobre o outro. Dessa forma, estabeleceu recortes nos momentos em que
produtos especficos puderam ser identificados. No fluxo de desempenho
dos alunos, foram considerados produtos os exemplos de desempenhos
recorrentes, posteriores aos desempenhos recorrentes da professora. E no
da professora, foram considerados produtos os exemplos recorrentes de
seu desempenho, posteriores aos desempenhos recorrentes dos alunos.
A autora considera que os limites dessa recorrncia apresentaram-se
como um problema tanto emprico quanto conceptual.
A coleta de dados foi realizada atravs de gravaes em vdeo e dos
registros transcritos, levando-se em conta as emisses vocais da
professora e dos alunos e parmetros no-verbais de seus desempenhos.
Examinando-se a transcrio dos dados, foi selecionada para anlise uma
das rotinas de sala de aula, caracterizada pelo fato de os alunos reprodu-
zirem de maneira formal e/ou literal modelos sonoros e/ou gestuais
apresentados pela professora, denominando-se essa rotina de "seqn-
cia". A autora listou e descreveu as ocorrncias das seqncias, cada uma
das quais sendo considerada um episdio.
Foi preenchido, a seguir, um protocolo, contendo descrio dos
desempenhos da professora e dos alunos durante as ocorrncias da rotina
(seqncia) e durante as situaes imediatamente anteriores e posteriores
a estas ocorrncias. Indicou-se, ainda, a natureza das atividades desen-
volvidas em classe antes e depois das seqncias. A anlise desses
protocolos permitiu identificar: a) quatro classes ou tipos de seqncias
(seqncia rtmica de sons e movimentos, seqncia de palavras ou frases
e movimentos, seqncia de instrues e movimentos, seqncia de
movimentos); b) trs classes de atividades em sala (organizao da classe,
ensino-aprendizagem de requisitos para leitura e escrita, ensino-
aprendizagem de leitura/escrita); c) duas classes de participao dos
alunos (cumprir tarefa, disperso); d) seis classes para classificao do
tipo de barulho produzido pelos alunos (falas isoladas, falas em unssono,
burburinho, gritaria, riso e silncio). As classes apresentadas nos itens b,
e e d foram utilizadas para analisar as situaes anteriores e posteriores
apresentao das seqncias.
Foi analisada a freqncia de ocorrncia das seqncias e sua rela-
o com as atividades de classe anteriores e posteriores, considerando-se
relaes de dependncia atravs de probabilidades condicionais. Essa
anlise indicou relaes de dependncia entre as aes da professora e
as dos alunos (por exemplo: uma "seqncia rtmica de sons e movimen-
tos" (SMR) tinha o efeito de reduzir totalmente "riso" e "gritaria" e de
reduzir acentuadamente "burburinho"; tinha, tambm, o efeito de produzir
um aumento de "cumprir tarefa" e uma reduo de "disperso". Por sua
vez, os antecedentes de rudo de classe mais freqentes das seqncias
SMR eram "burburinho", "gritaria" e "riso", e nunca "silncio", "falas
isoladas" ou "falas em unssono". Dessa forma, os dados analisados
indicam "que o desempenho da professora e dos alunos so mtua e fina-
mente modulados" (Gil, 1991, p.318).

A perspectiva sociointeracionlsta-construtivista
de estudo do desenvolvimento
Trata-se de uma perspectiva que aborda a situao de interao
social como constitutiva dos sujeitos. Enfoca o dilogo como troca nego-
ciada constitutiva dos sujeitos e da prpria troca (Lyra, 1988). Baseia-se,
em parte, em formulaes referentes aquisio da linguagem (Lemos,
1981), em que a autora considera que as situaes de interao so um
espao para a construo de relaes semnticas, morfolgicas e
sintticas pela criana. Ela prope uma continuidade entre o perodo pr-
verbal e o verbal na aquisio da linguagem e sugere que a criana deve
passar pelo processo de inserir-se numa estrutura didica com um
interlocutor para construir uma representao de si mesma e do outro
como interlocutores. Considera que sua proposio semelhante de
Vygotsky, citado por ela, de que as atividades da criana adquirem
significado em um sistema de relacionamento social, na medida em que o
caminho que vai do objeto para a criana e da criana para o objeto passa
pela relao com outra pessoa.
Dentro desse enfoque, Lyra e colaboradores (Lyra, 1988,1991; Lyra,
Galindo, Cipriano, 1990; Lyra, Cabral, Pantoja, 1991) tm desenvolvido um
programa de pesquisa das interaes entre me e beb, realizando
registros longitudinais em vdeo em situao natural. Tm sido analisadas
como atividades partilhadas as interaes "face a face" e as interaes
"me-objeto-beb". Nas interaes "face a face", tm sido estudadas a
produo vocal e o sorriso. Ao discutir aspectos referentes transcrio e
anlise de dados em vdeo, Lyra (1991) afirma a necessidade de uma
"filiao profunda" entre a posio terico-epistemolgica do pesquisador
e a metodologia de transcrio e anlise de dados a ser adotada.
Esclarece alguns pontos acerca de sua concepo de estudo, destacando-
se: a) a necessidade de explorao de registros longitudinais; b) uma
concepo de causalidade como transformaes e construes bidirecio-
nais e interdependentes; c) o enfoque em ambos os sujeitos bem como na
interao entre eles; d) a viso da diade como unidade de anlise
indissocivel. Nesse sentido, prope como soluo metodolgica para uma
primeira fase do programa de pesquisa a descrio e anlise de momentos
identificados como qualitativamente diferentes dos anteriores e posteriores,
"procurando relacionar as transformaes e construes identificadas
compreenso do dinamismo existente na histria da diade, ou seja, aos
processos de troca negociada entre os parceiros, chamados de processos
dialgicos" (Lyra, 1991, p.294). Decorre da a necessidade do registro
longitudinal em vdeo, cuja transcrio e anlise so efetuadas a partir de
critrios derivados dessas concepes.
A partir dessa anlise, de cunho qualitativo, a autora relata o
destaque de um elemento presente nas organizaes face a face: as
trocas vocais, que ensejaram uma segunda fase de seu programa de
pesquisa, incluindo uma verificao quantitativa das modificaes
identificadas na produo vocal do beb. Reafirma, entretanto, que sua
posio terica v a quantidade como filiada qualidade, sendo que a
compreenso do processo de transformao e construo continuam a
depender de uma anlise qualitativa.
Outro exemplo de trabalho nessa perspectiva o de Oliveira (1988a),
que realizou um estudo longitudinal em uma creche pblica, usando a
noo de "jogo de papis" como foco da anlise dos dados, registrados em
vdeo. A anlise das transcries foi realizada com base na seleo de
trechos em que se evidenciava a construo de enredos de diferentes
papis construdos pelas crianas no grupo e no faz-de-conta. A anlise
mostrou a construo coletiva da brincadeira e uma crescente diferen-
ciao de papis. A autora tem analisado tambm situaes de interao
adulto-criana em creches e pr-escolas. Ela discute o conceito de papel
na anlise do processo interacional, retomando postulados da Psicologia
sociointeracionista de base dialtica do incio do sculo, e prope um
enfoque processual que concebe a interao "como constituindo os
sujeitos e no como influncias, mesmo que recprocas, entre sujeitos j
constitudos" (Oliveira, 1992).
Ainda um outro exemplo de pesquisa abordando a interao entre
crianas como um processo de construo mtua o trabalho de Pedrosa
(1989), que fez gravaes em vdeo na creche, em situao de recreao
livre. A autora apresenta seus dados na forma de descrio de onze
episdios, indicando para cada um: a) o nome do episdio; b) dados sobre
a data, horrio, durao, crianas envolvidas; c) descrio da situao
(presente e imediatamente anterior); d) resumo do episdio e descrio
detalhada do mesmo. A anlise dos dados evidencia: a) a ocorrncia de
brincadeira compartilhada em grupo, sem a sugesto do adulto, em
crianas desde menos de dois anos de idade; b) o levantamento de
hipteses sobre processos de regulao, tais como o "arranjo" da
brincadeira, ajustamentos rtmicos e posturais, regras, etc. Discutindo
questes referentes transcrio e anlise de registro em vdeo, Pedrosa
e Carvalho (1991, p.285) definem episdio interativo como "um segmento
de registro onde aparecem seqncias interativas claras e conspicuas ou
trechos do registro em que se pode circunscrever um grupo de crianas a
partir do arranjo que formam e/ou da atividade que realizam" e consideram
que o recorte em episdios corresponde a uma primeira forma de seleo
dos dados que parece til para perseguir a estrutura interacional do grupo.
Afirmam que o incio de um episdio pode ser delimitado por um fato a
partir do qual se articula uma seqncia interativa (por exemplo: uma
criana pega um apito e comea a sopr-lo) ou o episdio pode emergir
de uma situao em que vrios elementos se combinam e se constituem
em uma seqncia, s vezes s reconhecida a posteriori, e cujo incio
algumas vezes arbitrado, o mesmo ocorrendo para a delimitao do
trmino de um episdio.
Os episdios so a seguir divididos em momentos, com critrios
bastante flexveis. Em alguns casos, segue-se a composio social do
grupo; em outros, a configurao da seqncia em curso, seguindo pistas
como o contedo da brincadeira, a distribuio espacial, etc. As autoras
ressaltam que essa proposta de recorte decorre de sua concepo de
interao, concebida como "um processo de influncias recprocas entre
os parceiros" (id. ibid., p.286), admitindo que a estruturao desses arranjos
envolve processos de regulao entre as crianas.
As autoras destacam dois tipos de transcrio do episdio: um que
privilegia uma seqncia de interao identificada e descreve o comporta-
mento das outras crianas que tambm esto em cena, apenas se estiver
diretamente relacionado quela seqncia nesse caso, o interesse
seguir a trama interacional especfica; j o outro tipo de transcrio procura
incluir tanto as seqncias interacionais quanto informar sobre todos os
comportamentos das crianas que aparecem em cena, com um foco de
ateno mais abrangente, usado quando se deseja comentar as regu-
laes recprocas entre as crianas presentes num registro.
Quanto ao nvel de detalhamento na transcrio do episdio,
Pedrosa e Carvalho propem como regra: o comportamento das crianas
dever ser transcrito em detalhes apenas se essa descrio for esclarece-
dora para a compreenso do que se deseja demonstrar. Com base nesta
regra, s se descreve, por exemplo, a postura da criana em suas mincias
morfolgicas quando esta for o alvo de interesse do trabalho (por exemplo:
uma inclinao de tronco da criana pode interessar quando for seguida
de movimento semelhante por outra criana).
As autoras sugerem, ainda, o registro de impresses provocadas no
pesquisador pelas aes das crianas, distinguindo-as dos fatos observa-
dos, dando um "tom" situao e favorecendo a compreenso do episdio.
A anlise qualitativa proposta a partir de perguntas que levam ao
exame e ao reexame dos episdios e sua relao com as formulaes
tericas subjacentes.
Assim, dentro da perspectiva sociointeracionista-construtivista, tm
sido exploradas novas formas de anlise e tratamento de dados, decorren-
tes das formulaes tericas adotadas pelos pesquisadores da rea.

A perspectiva ecolgica de estudo dos arranjos ambientais


A perspectiva ecolgica de anlise vem se delineando dentro da
Psicologia ambiental que, segundo Campos de Carvalho (1988, p.305), "se
prope a estudar as relaes entre ambiente e comportamento humano,
enfatizando a influncia do ambiente fsico no comportamento. Pela
abordagem ecolgica, todo e qualquer contexto ambiental visto como um
sistema de inter-relaes, ou de interdependncia, entre os vrios compo-
nentes fsicos e humanos que participam daquele contexto. Somente para
efeito de estudo e anlise que se abstrai deste sistema dinmico um
componente; mas ele s pode ser compreendido em relao quela situa-
o da qual foi extrado. Cada componente tanto causa como efeito
ele atua sobre os outros componentes assim como esses atuam sobre ele".
Dentro dessa perspectiva, a autora realizou estudos em duas
creches que atendem crianas de nvel scio-econmico baixo, na regio
de Ribeiro Preto, replicando estudos de Legendre sobre arranjos espa-
ciais em creches.
Legendre, citado pela autora, observou trs tipos de arranjos espa-
ciais em creches: a) Arranjo espacial semi-aberto caracterizado pela
presena de zonas circunscritas (ZC), que so reas delimitadas pelo
menos em trs lados por barreiras formadas por elementos do mobilirio,
parede, desnvel do solo, etc. As crianas em geral ocupam as ZC, ficando
afastadas do adulto, porm com fcil acesso a ele, inclusive visual;
observa-se, nesse caso, um favorecimento da ocorrncia de interaes
afiliativas entre crianas e um tipo de interao menos freqente e mais
intenso com o adulto (ou seja, evocando mais respostas deste), b) Arranjo
espacial aberto caracterizado pela ausncia de ZC, geralmente
havendo um espao central vazio. Neste arranjo, decrescem as interaes
entre crianas, as quais tendem a permanecer prximas ao adulto, embora
com pouca interao com ele. c) Arranjo fechado caracterizado pela
presena de ZC, porm havendo barreiras fsicas (por exemplo, um mvel
alto) dividindo a sala em duas ou mais reas. Assim, as barreiras fsicas
impedem uma fcil viso do adulto, embora permitam a circulao das
crianas pela sala. Neste arranjo, as crianas tendem a permanecer em
volta do adulto, ocorrendo pouca interao entre as crianas.
Campos de Carvalho (1988, 1990) replicou esse estudo em duas
creches, caracterizadas por uma proporo relativamente grande de
crianas por adulto, geralmente em espaos vazios e com pouca disponi-
bilidade de objetos. Uma vez que este tipo de ambiente no favorece a
interao criana-adulto, nem a interao entre crianas com idade inferior
a trs anos, buscou-se verificar de que forma condies ambientais
favorveis agiriam como suportes ou mediadores na interao entre
crianas pequenas. Nesse estudo, foi feita uma transformao do arranjo
espacial aberto para semi-aberto, na rea utilizada pelas crianas da
creche para atividades livres. Os dados foram coletados nesses perodos,
por duas cmaras fotogrficas, que funcionavam automaticamente e em
conjunto a cada 30 segundos, anotando-se, posteriormente, a posio de
cada criana e da pajem em cada foto. Os dados obtidos foram na mesma
direo dos de Legendre: a estruturao do espao propiciou oportunida-
des de contato entre as crianas, permitindo, ao mesmo tempo, que o
adulto estivesse mais atento ao grupo de crianas. Esses aspectos foram
aproveitados no projeto de interveno, realizado pela autora aps a coleta
dos dados desta pesquisa.
Estudos posteriores, utilizando gravao em vdeo, tm permitido a
identificao de diferenas no comportamento das crianas, quando se
compara o que ocorre na rea em torno da pajem com o que ocorre nas
zonas circunscritas, dando prosseguimento a essa linha de trabalho
(Rubiano, 1990, 1991; Chaguri, Rubiano, Silva, Rossetti-Ferreira, 1991).

O estudo dos movimentos expressivos


Nos primeiros estudos observacionais, era freqente a orientao
para que o observador se ativesse aos elementos observveis e definveis
em termos fsicos, evitando-se inferncias e impresses subjetivas. Em
certos casos, essas recomendaes levaram a uma deturpao, no sentido
de se evitar a abordagem a certos elementos sutis do comportamento, tais
como expresses faciais de curta durao e difceis de definir (como, por
exemplo, uma expresso de nojo rapidamente substituda por uma
expresso mais neutra), posturas corporais que produzem impresso de
dominao ou submisso, verbalizaes interpretveis como "irnicas",
etc. Entretanto uma rea de pesquisa designada por comunicao no-
verbal (Scherer, Ekman, 1982; Corraze, 1982), que tem abordado a face, o
olhar, a voz (entonao, ritmo, etc), a postura, o movimento corporal, o
olfato e o tato como meios de comunicao. So empregados dois mto-
dos bsicos de investigao: o estudo atravs dos julgamentos e o
estudo atravs dos constituintes. Corraze (1982, p.69) descreve esses
mtodos no contexto do estudo das expresses faciais. Ele diz que "partir
dos julgamentos consiste em apoiar-se em mltiplas expresses faciais
que se apresentem a observadores e em procurar saber se, entre eles, h
concordncia quanto sua significao afetiva. A face ento considerada
corno um estmulo suscetvel de produzir uma resposta, um julgamento, em
observadores". O autor considera que o estudo pelos julgamentos pode
nos dizer que a informao est ali, mas no nos pode dizer que compor-
tamentos da face levam a essa informao precisa. J o estudo pelos
constituintes tenta identificar os componentes da face que correspondem
produo de determinadas emoes nos sujeitos que fizeram os
julgamentos. Esses dois mtodos so extensivos ao estudo de outros
aspectos da comunicao no-verbal, alm das expresses faciais.
Um estudo de julgamento de expresses faciais foi realizado por
Silva (1987a), utilizando estudantes universitrios como sujeitos. O autor
verificou que os julgamentos das expresses faciais, mostradas atravs da
projeo de diapositivos, apresentavam fidedignidade intra-sujeito, entre
grupos e intercultural. O autor tambm apresentou evidncias de que os
erros cometidos nos julgamentos de expresses faciais de emoes no
eram aleatrios, sendo os erros dos brasileiros praticamente idnticos aos
cometidos pelos sujeitos americanos.
Silva (1987b) destaca trs questes principais que tm norteado a
maioria das pesquisas sobre expresses faciais de emoes. A primeira
diz respeito existncia de expresses faciais caractersticas dos dife-
rentes estados emocionais, a segunda, universalidade dessas expres-
ses, e a terceira, aos sinais faciais tpicos de cada uma dessas ex-
presses. O autor considera que as trs questes foram respondidas
positivamente, a partir das pesquisas realizadas pelas equipes de Paul
Ekman e de Carroll Izard. Considera, tambm, que restam vrias questes
a serem melhor investigadas, entre as quais se incluem as seguintes: a)
que emoes possuem expresses faciais mais claramente reconhecveis?
b) como distinguir as expresses faciais referentes a emoes genunas
daquelas que aparecem devido mentira facial ou devido a outros
motivos? c) como so os padres temporais das expresses faciais de
emoes? d) qual a unidade "natural" de julgamento? (a emoo do outro,
em que condies, ou qualidades mais permanentes de quem sente tal
emoo?) e) em uma situao "natural", como a pessoa julga expresses
faciais de emoo? f) qual a proeminncia das expresses faciais de
emoes em relao a outras informaes, sobre emoes ou no, pre-
sentes em uma dada situao sob avaliao? O autor considera que os
estudos a serem propostos por estas questes provavelmente iro
envolver outras estratgias de pesquisa, alm da anlise de expresses
faciais em fotografias.
As expresses faciais tambm tm sido utilizadas como indicadores
de paladar e olfato em recm-nascidos, em estudos da ontogense da
quimiorrecepo (Bergamasco, 1991; Bergamasco, Lima, Krusnaukas,
1991; Bergamasco, 1992). O procedimento de registro consiste em filmar
em vdeo as respostas de recm-nascidos antes, durante e aps a apre-
sentao de cada estmulo, gustativo ou olfativo. O material obtido tra-
balhado por observadores no informados sobre o estmulo apresentado
ao beb, atravs de uma ou mais das seguintes formas: levantamento de
categorias, anlise temporal da resposta e avaliao por juizes. Os dados
obtidos tm permitido a identificao de respostas diferenciadas e caracte-
rsticas para diferentes tipos de estmulo.
Um outro tipo de estudo que tem sido realizado o do sorriso, em
seus aspectos morfolgicos e motivacionais (Fagundes, 1978; Otta, Sarra,
1988), como reao do beb a diferentes estmulos (Obara, Akamine,
Pedrazzoli Neto, Bonilha, Bortoletto, Otta, 1990) e como influncia na
percepo de pessoas, quando se variam as caractersticas do sujeito e do
modelo (Delevati, Lira, Csar, Pires, Otta, 1992).
Atravs destes e de muitos outros estudos, a rea de estudo dos
movimentos expressivos tem permitido a identificao e anlise de muitos
dos elementos sutis que levam formao de impresses subjetivas ao
longo das relaes interpessoais.

A pesquisa participante e a observao antropolgica


A pesquisa participante tem sido proposta por socilogos, antrop-
logos e educadores, como um meio de superar a dicotomia e o distan-
ciamento entre "sujeito" e "objeto" de pesquisa, de forma que pessoas,
anteriormente "objetos de pesquisa", passem a ser "o sujeito, tanto do ato
de conhecer de que tm sido o objeto, quanto do trabalho de transfor-
mar o conhecimento e o mundo que os transformaram em objetos" (Bran-
do, 1981, p.11).
Thiollent (1984) estabelece uma distino segundo a qual a "pes-
quisa participante" preocupa-se principalmente com o papel do investiga-
dor dentro da situao investigada, enquanto a "pesquisa-ao" uma
modalidade de "pesquisa participante" centrada em projetos de ao social
ou de resoluo de problemas coletivos. O autor afirma que a "pesquisa
participante" tem sido concebida como uma tcnica de "observao partici-
pante", elaborada no contexto da pesquisa antropolgica ou etnogrfica.
Segundo ele, "trata-se de estabelecer uma adequada participao dos
pesquisadores dentro dos grupos observados de modo a reduzir a estra-
nheza recproca. Os pesquisadores so levados a compartilhar, pelo
menos superficialmente, os papis e os hbitos dos grupos observados
para estarem em condio de observar fatos, situaes e comportamentos
que no ocorreriam ou que seriam alterados na presena de estranhos"
(Thiollent, 1984, p.83).
A observao "antropolgica" tem sido considerada por alguns
autores como uma alternativa recomendvel para o estudo de diferentes
situaes sociais. o caso, por exemplo, de Delamont, que critica o uso
de sistemas de categoras preestabelecidas, como, por exemplo, o FIAC
(Flanders Interaction Analysis Categories), para o estudo da interao
professor-aluno (Delamont, Hamilton, 1981; Patto, 1981). Delamont e
Hamilton (1981) consideram que a anlise antropolgica se vale de uma
abordagem mais etnogrfica do que "psicomtrica" e de uma estrutura
conceptual que considera a educao em termos socioculturais mais
amplos. Metodologicamente, esses estudos baseiam-se na observao
participante, que abrange a presena de um ou mais observadores durante
longos perodos, numa nica sala de aula ou num pequeno nmero delas.
Durante esse tempo, o etnlogo tambm conversa com os participantes,
referidos como "informantes", ao invs de "sujeitos". Ele pode conduzir
entrevistas formais e tambm aplicar questionrios. Esses autores
consideram que o "antroplogo" tem um quadro de referncia holstico, e
que no procura manipular, controlar ou eliminar variveis. Sua seleo de
dados se faz atravs da concentrao da ateno em aspectos emergen-
tes, e no atravs de categorias preestabelecidas.
Patto (1981) comenta um artigo de Delamont, em que esta autora
estabelece comparao entre dados coletados atravs do FIAC com dados
obtidos atravs de uma observao antropolgica, conforme acima des-
crita. Para um caso em que duas professoras de Latim eram semelhantes
em relao a algumas categorias de Flanders e diferentes em outras, a
autora utilizou observaes no-estruturadas e entrevistas formais e
informais com as alunas. Para a estruturao dos dados de observao,
a autora selecionou alguns temas unificadores, que emergiram das entre-
vistas com as alunas e das prprias observaes e anotaes de campo.
Entre os temas que se destacaram, incluem-se: o ambiente fsico criado
pelas professoras (caracterizado, principalmente, pelas anotaes de
campo), a aparncia pessoal das professoras (atravs de conversas infor-
mais com as alunas), as opinies das alunas sobre as professoras (por
meio de entrevistas formais com as alunas) e trechos de dilogos ocorridos
durante a aula (atravs de anotaes detalhadas tomadas em sala de
aula). A partir desses dados e de consideraes sobre a natureza da
matria ensinada, a autora conseguiu entender vrias das diferenas entre
as duas professoras acima referidas, enquanto o sistema de categorias
preestabelecidas apenas constatou algumas delas.
No mesmo texto, Patto cita outro estudo, de Walker e Adelman, que
aborda a complexidade dos significados comunicativos em sala de aula,
que aparecem nas relaes informais que se estabelecem entre o pro-
fessor e os alunos, em especial nas piadas e brincadeiras que se do em
determinados momentos. Para tanto, foi necessrio reconstituir a histria
da turma, inserindo os dilogos em seu contexto espacial e temporal mais
amplo. Entre as tcnicas de observao utilizadas por esses autores,
incluram-se: filmagem e gravao das aulas, observaes intensivas
durante perodos curtos e longos de tempo, acompanhadas de anotaes,
consultas s notas dos professores, seus planos de aula, entrevistas com
os professores e com os alunos. Patto considera que a percepo do
significado das comunicaes nesse estudo foi possibilitada principalmente
pela pesquisa participante de longa durao, bem como pelas entrevistas
informais com professores e alunos. A autora afirma que o uso da obser-
vao antropolgica pode enriquecer a compreenso das relaes entre
professor e alunos na sala de aula.
O presente texto assemelha-se mais a um "menu de opes" do
que a "manual de instrues". Relata a evoluo dos estudos observacio-
nais em nosso meio, a partir dos trabalhos iniciais influenciados pela
anlise do comportamento e pela etologia animal, e apresenta alguns dos
desenvolvimentos recentes na rea, na expectativa de que o aprimora-
mento dos mtodos observacionais, utilizados em conjugao com outros
mtodos de investigao em Psicologia, contribuam para a melhor
compreenso do ser humano, especialmente em sua dimenso social.

REFERNCIAS BIBLIOGRFICAS

ADES, C. A teia e a caa da aranha Argiope argentata. So Paulo, 1972. Tese (Doutorado)
Faculdade de Filosofia. Letras e Cincias Humanas, USP.
ALTMANN, J. Observational study of behavior: sampling methods. Behaviour, v.49, p.227-267,
1974.
ALTMANN, S.A. Sociobiology of rhesus monkeys: the stochastics of social communication.
Journal of Theoretical Biology, London, v.8, p.490-522, 1965.
ALVES, Z.M.B.A. Anlise da interao me-criana: um estudo longitudinal (dos dois ao seis
meses) da evoluo de seqncias de interao. Ribeiro Preto, 1973. Tese (Doutorado)
Faculdade de Filosofia, Cincias e Letras, USP.
ALVES, Z.M.B.A., CARVALHO, A.M.A., MARTURANO, EM., METTEL. T.P.L. ROSSETTI-
FERREIRA, M.C. Questes metodolgicas no estudo da interao humana. In: REUNIO
ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 17, 1987. Anais...
Ribeiro Preto, 1987. p.531-541.
BAER, D.M., WOLF, M.M., RISLEY, T. Some current dimensions of applied behavior analysis.
Journal of Applied Behavior Analysis, Lawrence (KS), v.1, n.l, p.91-97, 1968.
BASTOS, M.F., CARVALHO, A.M.A. Empatia entre crianas. In: REUNIO ANUAL DASOCI-
EDADE DE PSICOLOGIA DE RIBEIRO PRETO, 21,1991. Anais... Comportamento pro-
social: questes filogenticas e ontogenticas. Ribeiro Preto, 1991. p.l 14-116.
BATISTA CG. Catlogo de comportamentos motores observados durante uma situao de
refeio. So Paulo, 1978. Dissertao (Mestrado) Instituto de Psicologia, USP.
--------------. Concordncia e fidedignidade na observao. Psicologia, v.3, n.2, p.39-49,1977.
--------------. Elaborao de um catlogo de comportamentos motores observados na interao
entre pais e filhos. Psicologia, v.6, n.3, p.47-81, 1980.
--------------. Mes e crianas brincando: um estudo de influncias recprocas. So Paulo, 1989.
Tese (Doutorado) Instituto de Psicologia, USP.
BATISTA, CG. Objetivos da avaliao da fidedignidade em estudos observacionais. Psicolo-
gia: Teoria e Pesquisa, v.1, n.3. p.205-214, 1985.
BATISTA. CG., MATOS, MA. O acordo entre observadores em situao de registro cursivo:
definies e medidas. Psicologia, v.10, n.3, p.57-69, 1984.
BERGAMASCO, N.H.P. Expresses faciais de recm-nascidos em resposta a estmulos
gustativos e olfativos. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RI-
BEIRO PRETO. 21. 1991. Anais... Transcrio e anlise de registro em vdeo. Ribeiro
Preto. 1991.p.291-292.
. . Percepo de estmulos qumicos em recm-nascidos: discriminao e prefe
rncias. In: REUNIO ANUAL DASOCIEDADE BRASILEIRA DE PSICOLOGIA, 22.1992.
Resumos de comunicaes cientificas..., n.336.1. [S.I.], 1992.
BERGAMASCO, N.H.P, LIMA, A., KRUSNAUKAS, I. Valor de comunicao das respostas
faciais de recm-nascidos. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRO PRETO, 21, 1991. Resumos..., n.211. Ribeiro Preto, 1991.
BIJOU, S.W., PETERSON, R.F., AULT, M.H. A method to Integrate descriptive and empirical
field studies at the level of data and empirical concepts. Journal of Applied Behavior
Analysis. Lawrence (KS), v.1, n.2, p.175-191. 1968.
BLURTON JONES, N. (Org.). Ethological studies of child behavior. Cambridge: Cambridge
University Press, 1972.
BRANCO, A.U. Ontogense e promoo do comportamento pr-social. In: REUNIO ANUAL
DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 21.1991. Anais... Comporta-
mento pr-social: questes filogenticas e ontogenticas. Ribeiro Preto, 1991. p.110-113.
. Socializao na pr-escola: o papel da professora e da organizao das ativida
des no desenvolvimento das interaes sociais entre as crianas. So Paulo, 1989. Tese
(Doutorado) Instituto de Psicologia, USP.
BRANCO, A.U., METTEL, T.P.L Comportamento pr-social: um estudo com pr-escolares.
Psicologia, v.10, n.1. p.43-61, 1984.
-------------- . A interao professora-alunos na pr-escola: uma metodologia de anlise. In:
REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 19,1989.
Resumos..., n. 222. Ribeiro Preto, 1989a.
. Socializao na pr-escola: fatores interativos e ambientais relacionados s intera
es criana-criana. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRO PRETO, 19,1989. Resumos..., n. 231. Ribeiro Preto, 1989b.
BRANDO, CR. Pesquisar-participar. In: BRANDO, CR. (Org.). Pesquisa participante. So
Paulo: Brasiliense. 1981.
BUSSAB, V.S.R. Comportamento pr-social: questes filogenticas. In: REUNIO ANUAL
DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 21.1991. Anais... Comporta-
mento pr-social: questes filogenticas e ontogenticas. Ribeiro Preto, 1991. p.197-209.
-------------- . Processos de ritualizao: aspectos filogenticos e ontogenticos. In: REUNIO
ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 18,1998. Resumos...,
n. 132. Ribeiro Preto, 1988.
CAMPOS DE CARVALHO, M.l. Arranjo espacial e distribuio de crianas de 2-3 anos pela
rea de atividades livres em creche. So Paulo, 1990. Tese (Doutorado) Instituto de
Psicologia, USP.
CAMPOS DE CARVALHO, M.l. Organizao espacial da rea de atividades livres em cre-
ches. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO,
18, 1988. Anais... Condies ambientais na educao do indivduo especial. Ribeiro
Preto, 1988. p.305-310.
CARVALHO, A.M.A. Abordagem etolgica: desenvolvimento, socializao. So Paulo, 1978.
Apostila utilizada no curso de Ps-Graduao do Departamento de Psicologia Expe-
rimental. Instituto de Psicologia, USP.
-------------- . Algumas reflexes sobre o uso da categoria "interao social". In: REUNIO
ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 18, 1988. Anais...
Avanos recentes em Psicologia do desenvolvimento. Ribeiro Preto, 1988. p.511-515.
-------------- . Alguns dados sobre a diviso de trabalho entre obreiras de Atta sexdens rubropi-
losa, Forel, 1908 (Hymenoptera-Formicidae), em colnias iniciais, mantidas em labo-
ratrio. So Paulo, 1972. Tese (Doutorado) Faculdade de Filosofia, Letras e Cincias
Humanas, USP.
-------------- . Critrios para a descrio e anlise de relaes interindividuais: reviso crtica e
anlise emprica. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO
PRETO, 21,1991. Resumos..., n. 202. Ribeiro Preto, 1991a.
-------------- . Questes conceituais. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA
DE RIBEIRO PRETO, 21, 1991. Anais... Comportamento pr-social: questes filoge-
nticas e ontogenticas. Ribeiro Preto, 1991b. p.104-106.
. Relaes interpessoais: o nvel de recorte. In: REUNIO DA SOCIEDADE BRA
SILEIRA DE PSICOLOGIA, 22. 1992. Resumos de comunicaes cientficas..., n.342.2.
[S.I.], 1992.
CARVALHO, A.M.A., BERALDO, K.E.A. Interao criana-criana: ressurgimento de uma
rea de pesquisa e suas perspectivas. Cadernos de Pesquisa, So Paulo, v.71, p.55-61,
1989.
CATANIA, A.C. The nature of learning. In: NEVIN, J.A., REYNOLDS, G.S. (Orgs.). The study
of behavior. Glenview: Scott, Foresman and Co, 1973.
CHAGURI, AC, RUBIANO, M.R.B., SILVA JR., V., ROSSETTI-FERREIRA, M.C. A organi-
zao de crianas em creches com diferentes enfoques pedaggicos. In: REUNIO
ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 21,1991. Resumos...,
n.205. Ribeiro Preto, 1991.
COPI, I.M. Introduo lgica. Trad. por lvaro Cabral. So Paulo: Mestre Jou, 1974.
CORRAZE, J. As comunicaes no-verbais. Trad. por Roberto C. Lacerda. Rio de Janeiro:
Zahar, 1982.
COUTINHO. S.M.G.. ZANNON, C.M.L.C. Estudo exploratrio de interaes sociais em setor
de emergncia peditrica. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRO PRETO, 21, 1991. Resumos.... n. 88. Ribeiro Preto, 1991.
CREPALDI, M.A., ZANNON, C.M.LC. Hospitalizao infantil: estudo da interao equipe
famlia em unidade peditrica. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA
DE RIBEIRO PRETO, 19, 1989. Resumos..., n. 40. Ribeiro Preto, 1989.
CUNHA, W.H.A. Acerca de um curso ps-graduado destinado ao treino da observao
cientfica no domnio das cincias do comportamento. Cincia e Cultura, So Paulo, v.27,
p.846-853, 1974.
CUNHA, W.H.A. Alguns princpios de categorizao, descrio e anlise do comportamento.
Cincia e Cultura, So Paulo, v.28, p.15-24, 1976.
------------- . O estudo etolgico do comportamento animal. Cincia e Cultura. So Paulo, v.27
p.262-268, 1975.
------------- . Explorao no mundo psicolgico das formigas: uma investigao de algumas
modificaes de comportamento. So Paulo, 1967. Tese (Doutorado) Faculdade de
Filosofia, Letras e Cincias Humanas, USP.
------------- . Introduo ao desenvolvimento histrico e aos princpios bsicos da etologia.
Palestra apresentada no I Encontro de Etologia. Jaboticabal, 1983.
DANNA, M.F., MATOS, M.A. Ensinando observao: uma introduo. So Paulo: Edicon,
1982.
DELAMONT, S., HAMILTON, D.A. A pesquisa em sala de aula: uma crtica e uma nova
abordagem. In: PATTO, M.H.S. (Org.) Introduo Psicologia Escolar. Sao Paulo: TA.
Queiroz, 1981.
DELEVATI, N.M., LIRA, B.B.P., CSAR, O.P., PIRES, S.G., OTTA, E. Influncia do sorriso na
percepo de pessoas em funo de caractersticas do sujeito e do modelo. In: REUNIO
ANUAL DA SOCIEDADE BRASILEIRA DE PSICOLOGIA, 22,1992. Resumos de comu-
nicaes cientficas..., n.30. [S.I.], 1992.
DESSEN, M.A.S.O, METTEL, T.P.L. Interao pais-primognito quando da chegada de uma
segunda criana na famlia - um estudo de caso. Psicologia, v.10, n.2, p.27-39, 1984.
DURAN, A.P. O estudo da interao professor-aluno no Brasil: algumas tendncias, algumas
questes. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO
PRETO, 17,1987. Anais... Perspectivas para estudo da relao professor-aluno. Ribeiro
Preto, 1987. p.77-85.
. Padres de comunicao oral e compreenso da comunicao escrita na universi
dade: estudos no Nordeste. So Paulo, 1981. Tese (Doutorado) Instituto de Psicologia,
USP.
FAGUNDES, A.J.F.M. Definio e anlise da resposta de sorrir em situao de leitura de
textos humorsticos. Psicologia, v.4, n.3, p.53-108, 1978.
------------- . Descrio e registro de comportamento. So Paulo: Edicon, 1981.
GIL-CENEVIVA, M.S.A. Interao professor-aluno: estudo descritivo das perguntas dos
alunos em uma sala de aula de primeira srie do Primeiro Grau. Joo Pessoa, 1985.
Dissertao (Mestrado) Universidade Federal da Paraba.
GIL, M.S.C.A. Anlise funcional da interao professor-aluno: um exerccio de identificao
de controles recprocos. So Paulo, 1990. Tese (Doutorado) Instituto de Psicologia,
USP.
. Anlise funcional da interao professor-aluno: In: REUNIO ANUAL DA SOCIE
DADE DE PSICOLOGIA DE RIBEIRO PRETO, 21,1991. Anais... Ciclo de estudos em
anlise do comportamento IV: novos problemas e novas solues. Ribeiro Preto, 1991.
p.315-321.
HALL, R.V. Manipulao de comportamento - parte 1: modificao de comportamento. Trad.
por Waldir Bettoi. So Paulo: EPU: EDUSP. 1973.
HINDE, R.A. Animal behaviors synthesis of ethology and comparative psychology. New York:
McGraw-Hill, 1966.
HINDE. R.A. The bases of a science of interpersonal relationships. In: DUCK, S., GILMOUR, R.
(Eds.). Personal relationships. Londres: Academic Press, 1981. v.1.
----------------. On the design of check-sheets. Primates, Aichi, v.14, p.393-406. 1973.
HUIT, S.J., HUTT, C. Observao direta e medida do comportamento. Trad. por Carolina M. Bori.
Sao Paulo: EPU: EDUSP, 1974.
JOHNSON, S.M., BOLSTAD, OD. Methodological issues in naturaliste observation: some
problems and solutions for field research. In: HAMERLYNCK, LA., HANDY, L.C., MADH, E.J.
(Eds.). Behavior change-, methology, concepts and practice. [S.I.]: Research Press, 1973.
KERBAUY, R.R. Autocontrl: manipulao de condies do comportamento alimentar. So
Paulo, 1972. Tese (Doutorado) Faculdade de Filosofia, Letras e Cincias Humanas, USP.
LEMOS, C. de. Interactional processes in the child's construction of language. In: DEUTSCH, W.
(Ed.). The child's construction of language. Londres: Academic Press, 1981.

LI NHARES, M.B.M. Interao professora-aluno em uma classe de 1a. srie com substituio de
professoras. So Paulo, 1988. Tese (Doutorado) Instituto de Psicologia, USP.

LINHARES, M.B.M., MARTURANO, E.M. Um mtodo de observao e anlise das estratgias


maternas de ensino. Psicologia, v.10, n.l, p.l 1-25, 1984a.
---------------- . Contedos verbais maternos em diferentes situaes de ensino de resoluo de
problemas. Psicologia, v.10, n.3, p.41-55, 1984b.

LOPES, M.F., BUENO, J.L.O., BARNABE. "OBS": uma ferramenta para anlise seqencial e de
freqncia e durao de varias categorias comportamentais. In: REUNIO ANUAL DA
SOCIEDADE BRASILEIRA DE PSICOLOGIA, 22, 1992. Resumos de comunicaes
cientficas, n.233. [S.I.], 1992.

LYRA, M.C. Transformaes e construes do observador e dos dados na anlise de interaes


me-beb. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 21,
1991. Anais... Transcrio e anlise de registro em vdeo. Ribeiro Preto, 1991. p.293-297.

---------------- . Transformao e construo na interao social: a diade me-beb. So Paulo,


1988. Tese (Doutorado) Instituto de Psicologia, USP.

LYRA, M.C., GALINDO, W.C.M., CIPRIANO, A.M. A mediao construda "face-a-face" na diade
me-beb: a produo vocal e o sorriso. In: REUNIO ANUAL DA SOCIEDADE DE
PSICOLOGIA DE RIBEIRO PRETO,20,1990. Resumos..., n.16. Ribeiro Preto, 1990.

LYRA. M.O. CABRAL, EA, PANTOJA, A.P.F. A produo vocal do beb: diferenciao das
interaes "me-objeto-beb". In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRO PRETO, 21,1991. Resumos..., n.214. Ribeiro Preto, 1991.

MACHADO, V.L.S. Interao verbal professor-aluno, influncia de disciplinas, de expectativas


do professor, da autopercepo do aluno e suas relaes com rendimento acadmico de
escolares de terceira srie. So Paulo, 1979. Tese (Doutorado) Instituto de Psicologia,
USP.

MARTURANO, E.M. Anlise de componentes da interao professor-aluno. Cadernos de Anlise


do Comportamento, v.6, p.15-24,1984.

----------------. Estudo da interao verbal criana-me. Sao Paulo, 1972. Tese (Doutorado)
Faculdade de Filosofia, Letras e Cincias Humanas, USP.
MARTURANO, E.M. Interao professor-aluno: desafios pesquisa. In: REUNIO ANUAL DA
SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 22,1987. Anais... Perspectivas para
estudo da relao professor-aluno. Ribeiro Preto, 1987. p.86-90.
---------. A lgica do sistema de categorias e a anlise do comportamento verbal. In: REU
NIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 18, 1988.
Anais... Avanos recentes em Psicologia do desenvolvimento. Ribeiro Preto, 1988. p.517-
520.
-------------. Relao entre o julgamento da professora e o comportamento dos alunos estudo
de um caso. Psicologia, v.12, n.3, p.47-58, 1986.

MARTURANO, EM., BERTOLDO, A.A., CAMELO, A.L.P. Estudo descritivo do intercmbio verbal
em sala de aula atravs da anlise de contingncia uma contribuio metodolgica.
Psicologia, v.8, n.3, p.19-36, 1982.

MARTURANO, E.M., MAIMONI, E.H. Comportamento da professora frente a alunos com


dificuldade de aprendizagem. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRO PRETO, 19, 1989. Resumos..., n.218. Ribeiro Preto, 1989.
McGREW, W.O An ethological study of children's behaviour. New York: Academic Press, 1972.
MEJIAS, N.P. Modificao de comportamento em situao escolar. So Paulo, 1973. Tese
(Doutorado) Faculdade de Filosofia, Letras e Cincias Humanas, USP.
MELO, CS., BPiANCO, A.U. Adaptao pr-escola: anlise das negociaes adulto-criana. In:
REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 22, 1992.
Resumo das comunicaes cientficas, n. 136. Ribeiro Preto, 1992.

MICHAEL, J. Characteristics of a good definition. Washington, DC, 1975. Apostila para distri-
buio interna na American University.

MORAIS, G.S. (Org.). Pesquisa e realidade no ensino de primeiro grau. So Paulo: Cortez, 1980.
--------------- . Pesquisas sobre interao professor-aluno e interveno na escola. In: REUNIO
ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 17, 1987. Anais...
Perspectivas para estudo da relao professor-aluno. Ribeiro Preto, 1987. p.94-98.

OBARA, CS.. AKAMINE, C, PEDRAZZOLI NETO. M BONILHA, R.S.A., BORTOLETTO, A.C.C.,


OTTA, E. Sorriso em bebs: reao face humana e a vrios tipos de degradaes deste
estmulo. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO. 20.
1990. Resumos..., n.125. Ribeiro Preto, 1990.

OLIVEIRA, Z.M.R. Jogo de papis-, uma perspectiva para anlise do desenvolvimento humano.
So Paulo, 1988a. Tese (Doutorado) Instituto de Psicologia, USP.

--------------- . Anlise de interaes criana-criana a partir da perspectiva de jogo de papis. In:


REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 18,1988.
Resumos..., n.133. Ribeiro Preto. 1988b.
--------------- . Conceito de papel na anlise do processo interacional. In: REUNIO ANUAL DA
SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 22. 1992. Resumos de comunicaes
cientficas, n.342.3. Ribeiro Preto, 1992.

OTTA, E., SARRA, S. Uma anlise motivacional do sorriso e do riso. In: REUNIO ANUAL DA
SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 18. 1988. Resumos..., n. 131. Ribeiro
Preto, 1988.
PATTO. M.H.S. A observao antropolgica na interao professor-aluno: resumo de uma
proposta. In: PATTO. M.H.S. (Org.). Introduo Psicologia Escolar. So Paulo: TA.
Queiroz, 1981.
PEDROSA. M.I.P.C. Interao criana-criana: um lugar de construo do sujeito. So Paulo,
1989. Tese (Doutorado) Instituto de Psicologia, USP.
PEDROSA. M.I.P.C, CARVALHO, A.M.A. Anlise qualitativa de interao entre crianas como
processo de construo mtua. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA
DE RIBEIRO PRETO, 21, 1991. Anais... Transcrio e anlise de registro em vdeo.
Ribeiro Preto, 1991. p.285-290.
PEDROSA, G.B. Relaes entre crianas pequenas de mesma idade: algumas caractersticas
da dinmica das dades. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRO PRETO, 22,1992. Resumos de comunicaes cientficas, n.146. Ribeiro Preto.
1992.
PRADO, L.E.S. Fato e significado. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA
DE RIBEIRO PRETO, 18, 1988. Anais... A questo da subjetividade em Psicologia. Ri-
beiro Preto, 1988. p.411-417.
RAMOS, A.T.A. Estudo descritivo das relaes contingenciais no intercmbio verbal de
criana com retardo no desenvolvimento da fala, com a professora e a me, em situao
natural. So Paulo, 1979. Dissertao (Mestrado) Instituto de Psicologia, USP.
RAMOS CERQUEIRA, A.T.A. Anlise de relaes de contingncia do repertrio verbal de
mes e crianas num contexto Interativo. In: REUNIO ANUAL DA SOCIEDADE DE
PSICOLOGIA DE RIBEIRO PRETO, 18,1988. Resumos.... n. 196. Ribeiro Preto. 1988a.
. Estudo descritivo do repertrio verbal de mes e crianas de baixo nvel scio-
econmico num contexto interativo. In: REUNIO ANUAL DA SOCIEDADE DE PSICO
LOGIA DE RIBEIRO PRETO, 18, 1988. Resumos..., n.197. Ribeiro Preto, 1988b.
REBER, A.S. The Penguin dictionary of Psychology. London: Penguin, 1985.
RIBEIRO, F.L. Um estudo sobre o comportamento da fmea durante a fecundao da colnia
em Atta sexdens rubropilosa, Porei, 1908 (Hymenoptera-Formicidae). So Paulo, 1972.
Tese (Doutorado) Faculdade de Filosofia. Letras e Cincias Humanas, USP.
RICHARDS, M.P.M., BERNAL, J. An observational study of mother-infant interaction. In:
JONES, Blurton (Ed.). Ethological studies of child behaviour. Cambridge: Cambridge
University Press, 1972.
RODRIGUES, M.A.C. Psicologia infantil: a independncia da criana pr-escolar. So Paulo:
Edicon, 1985.
ROSSETTI-FERREIRA. M.C. Development of a method for the study of mother-child inter-
action during meal-time. Londres, 1967. Tese (Doutorado).
--------------. Me e criana - separao e reencontro: observao em situao de grupo. So
Paulo: Edicon, 1986.
RUBIANO, M.R.B. Ocorrncia de atividades ldicas e compartilhadas em diferentes "settings".
In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 21,
1991. Anais... Transcrio e anlise de registro em vdeo. Ribeiro Preto, 1991. p.281-284.
------------- . Suportes ambientais e organizao social de crianas em creches. So Paulo, 1990.
Tese (Doutorado) Instituto de Psicologia, USP.
SATO, T. Classificao numrica do comportamento I - a construo de matrizes mtricas.
Psicologia, v.13, n.l, p.55-64, 1987.
SCHERER, K-, EKMAN, P. (Orgs.)- Handbook of methods in nonverbal behavior research.
Cambridge: Maison des Sciences de l'Homme: Cambridge University Press, 1982.
SIDMAN, M. Tactics of scientific research: evaluating experimental data in Psychology. New
York: Basic Books, 1960.
SILVA, A.A. Julgamento de expresses faciais de emoes: fidedignidade, erros mais fre-
qentes e treinamento. So Paulo, 1987a. Tese (Doutorado) Instituto de Psicologia,
USP.
-------------- . Expresses faciais de emoes: algumas questes centrais que ainda no foram
pesquisadas ou foram pesquisadas de uma forma insatisfatria. In: REUNIO ANUAL DA
SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 17,1987. Anais... Pesquisas que
visam emoes. Ribeiro Preto, 1987b. p. 123-129.
SKINNER, B.F. Cincia e comportamento humano. Trad. por Joo Cludio Todorov e Rodol-
pho Azzi. Braslia: Ed. UnB, 1967.
-------------- . Contingncias do reforo. Trad. por Rachel Moreno. In: OS PENSADORES. So
Paulo: Abril Cultural, 1975. v.51.
-------------- . Verbal behavior. Englewood Cliffs (NJ): Prentice-Hall, 1957.
SLATER, P.J.B. Describing sequences of behavior. In: BATESON, P.P.G., KLOPFER. P.H.
(Eds.). Perspectives in ethology. Londres: Plenun Press, 1973.
SOLLITTO, N.A. Observao da interao me-nen em uma situao natural. So Paulo,
1972. Tese (Doutorado) PUC-SP.
STADDON, J.E.R. On the notion of cause, with applications to behaviorism. Behaviorism,
Reno (NV), v.1, p.25-63,1973.
STELLA, E.M. A field-descriptive and experimental study of verbal behavior in one year old
children. Londres, 1974. Tese (Doutorado).
THIOLLENT. M. Notas para o debate sobre pesquisa- ao. In: BRANDO, CR. (Org.).
Repensando a pesquisa participante. So Paulo: Brasiliense, 1984.
VAN HOOF, J.A.R.A.M. Categories and sequences of behavior: methods of description and
analysis. In: SHERER, K.R., EKMAN, P. (Eds.). Handbook of methods in nonverbal
behavior research. Cambridge: Maison des Sciences de l'Homme: Cambridge University
Press, 1982.
VIEIRA, T. Estudo observacional sobre modalidades de aes representativas em brinquedo
de faz-de-conta. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEI-
RO PRETO, 18, 1988. Resumos..., n.128. Ribeiro Preto. 1988a.
------------- . Brinquedo de faz-de-conta: um estudo sobre interesse de crianas em objetos.
In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 18,
1988. Resumos..., n.129. Ribeiro Preto, 1988b.
VIEIRA, T.A.M. Elaborao de um catlogo de categorias de comportamento: uma contri
buio para o estudo etologico do homem. So Paulo, 1975. Dissertao (Mestrado)
Instituto de Psicologia, USP.
WEICK, KE. Systematic observation methods. In: LINDZEY, G, ARONSON, E. (Eds.). The
handbook of sodai psychology. New York: Addison Wesley, 1968. v.2.
WITTER, G.P. Discriminao de forma oposio: conhecimento da contingncia de reforo.
So Paulo, 1969. Tese (Doutorado) Faculdade de Filosofia, Letras e Cincias Huma-
nas, USP.
CAPTULO 11

A MEDIDA DA CRIATIVIDADE

Eunice M. L Soriano de Alencar


Instituto de Psicologia
Universidade de Braslia

interesse da Psicologia pelo estudo da criatividade e pela


natureza e condies que favorecem a expresso do talento
criativo relativamente recente. Ele ocorreu a partir da dcada
de 50, fruto de vrios fatores como das contribuies de
psiclogos da linha humanista, tais como Rogers (1954) e Maslow
(1959). Estes apontaram para o potencial humano, para a auto-
realizao, abordando as condies que facilitam a expresso da
criatividade e destacando a sade mental como a fonte dos impulsos
criativos. Os humanistas concebem ainda a criatividade como resultando
de uma interao mutuamente benfica entre a pessoa e o ambiente.
Rogers considera, por exemplo, a autonomia humana e a resistncia ao
controle social excessivo como condies necessrias atividade
criativa. Por outro lado, necessrio tambm que a sociedade possibilite
pessoa liberdade de escolha e ao, reconhecendo e estimulando o
potencial criador do indivduo.
Um outro fator que tambm contribuiu para deslanchar o interesse
dos psiclogos por esta rea foi o discurso de Guilford, quando assumiu
a presidncia da Associao Americana de Psicologia, em 1950. Nesta
ocasio, Guilford chamou a ateno para o descaso pela pesquisa sobre
criatividade por parte dos psiclogos norte-americanos, destacando, por
exemplo, que dos 121.000 ttulos relacionados no Psychological Abstracts
at aquela data apenas 186 tinham alguma relao com criatividade.
Neste seu discurso, Guilford lembrou a importncia social da criatividade,
especialmente na busca de novas solues para os problemas enfrenta-
dos pela humanidade, e apontou para a necessidade de um estudo
sistemtico de seus mltiplos aspectos (Guilford, 1950).
A partir daquele momento, diferentes componentes da criatividade,
como o processo criativo, o produto criativo, a pessoa criativa e o ambi-
ente que favorece a criatividade, passaram a ser objeto de inmeras
pesquisas, sob enfoques tericos os mais diversos. Entre outros aspectos,
tm sido objeto de investigao as habilidades cognitivas que caracterizam
o pensamento criativo; a histria biogrfica, experincias antecedentes e
traos de personalidade de indivduos que se destacam por sua produo
criativa; as caractersticas do contexto social que favorecem a expresso
da criatividade e o efeito de diferentes tcnicas e programas de treina-
mento de criatividade e de resoluo criativa de problemas.
Paralelamente aos estudos realizados sobre as diferentes di-
menses da criatividade, uma enorme variedade de definies surgiu na
literatura. Nove anos aps o discurso de Guilford chamando a ateno dos
psiclogos para a necessidade de pesquisa na rea, Taylor (1959) encon-
trou, por exemplo, mais de cem definies distintas de criatividade,
definies estas muitas vezes conflitantes e dando nfase a aspectos
diversos. Isto certamente se deve ao fato de que criatividade, como
inteligncia, constitui-se um construto complexo e difuso que envolve
muitas dimenses e facetas.
De especial interesse tem sido tambm o desenvolvimento de medi-
das para avaliar a criatividade, tema este que ser examinado no presente
captulo, onde sero abordadas as diferentes modalidades de medida e
questes relativas validade, fidedignidade e condies de aplicao dos
instrumentos disponveis.

AS DIFERENTES MODALIDADES DE MEDIDAS DE CRIATIVIDADE

Uma anlise da literatura relativa aos instrumentos de medida de


criatividade sugere que muitos e muitos instrumentos foram construdos a
partir da dcada de 50 no apenas nos Estados Unidos, mas tambm em
alguns pases europeus, como Itlia, Sucia e Alemanha (para uma
descrio de alguns dos instrumentos publicados em pases europeus,
veja Urban, 1990).
Uma reviso crtica de mais de 100 distintas medidas de criatividade
foram feitas em anos recentes por Hocevar e Bachelor (1989), que, aps
examinarem os instrumentos disponveis, classificaram-nos em vrias
categorias, como as especificadas a seguir:
testes de pensamento divergente;
inventrios de atitudes e interesses;
inventrios de personalidade;
inventrios biogrficos;
nomeao por professores, pares e supervisores;
julgamento de produto;
auto-registro de atividades;
realizaes criativas.
Alm destas, Hocevar e Bachelor incluem ainda o estudo de pes-
soas eminentes, o que, no entender da autora do presente captulo, no se
constitui um tipo de medida, uma vez que, nestes estudos, distintas moda-
lidades de medidas, incluindo desde testes de pensamento criativo e
inventrios biogrficos at entrevista clnica, tm sido utilizadas.
Dentre estas diversas modalidades, a que tem sido mais usada em
pesquisas na rea de criatividade so os testes de pensamento divergente
(s vezes, denominados de pensamento criativo). Observa-se que os pri-
meiros testes desta natureza foram desenvolvidos por Guilford durante a
dcada de 40, quando realizava estudos na rea de inteligncia. Estes
estudos culminaram com a construo de um modelo terico da intelign-
cia humana, a que denominou Estrutura do Intelecto, que inclui 120 habili-
dades distintas, e que foi inicialmente descrito em um artigo publicado por
ele em 1959 (Guilford, 1959)' e posteriormente em livro sobre a natureza da
inteligncia (Guilford, 1967).
Dentre as distintas operaes intelectuais propostas por Guilford e
includas neste modelo, destaca-se o pensamento divergente. Este diz
respeito produo de inmeras respostas alternativas para uma questo
e contrasta com o pensamento convergente, onde se exige do sujeito
apenas uma nica resposta.
Uma das contribuies mais significativas que tm sido atribudas a
Guilford diz respeito aos vrios testes propostos por ele para medir as
diferentes habilidades relacionadas ao pensamento divergente e a outras
habilidades que tambm contribuem para a criatividade. Nota-se que
Guilford levantou a hiptese de que subjacente criatividade estariam pelo
menos oito habilidades primrias, vrias delas relacionadas a este tipo de
pensamento, como: fluencia (habilidade de gerar um grande nmero de
idias ou respostas para um dado problema); flexibilidade (esta implica
mudanas, seja no significado, na interpretao ou no uso de algo, na
estratgia de se fazer uma dada tarefa ou, ainda, na direo de pensa-
mento); originalidade (estudada atravs da apresentao de respostas
incomuns ou remotas), sendo o critrio de raridade estatstica utilizado
para se determinar o grau de originalidade da resposta em uma dada
populao); elaborao (habilidade em acrescentar uma variedade de
detalhes a uma informao, produto ou esquema); redefinio, que implica
transformaes, revises ou outras modalidades de mudanas na infor-
mao; sensibilidade para problemas, que se traduz por uma habilidade
em ver defeitos, deficincias em uma situao onde usualmente no se
percebem problemas.
Guilford destaca tambm que, apesar das habilidades de pensa-
mento divergente serem aquelas que mais diretamente esto envolvidas
no pensamento criativo, todos os tipos de habilidades representadas na

* Publicado no Brasil em A Descoberta do Talento, de Wolfle (1971).


estrutura do Intelecto podem contribuir para a produo criativa em algum
ponto do processo.
Exemplos de testes propostos por Guilford para examinar algumas
habilidades do pensamento criativo so:
Fluencia Associativa: pede-se ao sujeito para escrever vrias
sentenas de quatro palavras, devendo cada palavra comear com as
seguintes letras: K_________ u ________ y _________ i_________
(mantiveram-se aqui as originais do teste em ingls).
Usos Alternativos: pede-se ao sujeito para relacionar possveis usos
para um objeto especfico, como, por exemplo, para um jornal.
Conseqncias: o sujeito deve relacionar conseqncias para um
dado evento hipottico. Exemplo: o que aconteceria se as pessoas no
precisassem mais dormir.
Usos Inusitados: solicita-se ao sujeito para nomear o maior nmero
possvel de usos inusitados para um objeto comum, como um tijolo.
Uma outra bateria de testes de pensamento divergente largamente
utilizada em pesquisas no s nos Estados Unidos, mas tambm em
pases europeus e no Brasil, so os Testes Torrance de Pensamento
Criativo (Torrance, 1966, 1974). Esta bateria inclu uma parte verbal
composta de sete testes e outra figurativa composta de trs testes, com
duas formas distintas, e visa avaliar quatro habilidades criativas: afluncia,
a flexibilidade, a originalidade e a elaborao.
Um exemplo de um teste de natureza verbal da Bateria Torrance
consiste na apresentao de um quadro com um desenho, solicitando-se
ao examinando para escrever o maior nmero possvel de perguntas sobre
o que est acontecendo na figura. Em um outro teste verbal, pede-se ao
sujeito para sugerir modificaes para um brinquedo, de tal forma a torn-
lo mais atraente e interessante para as crianas. Entre os testes de
natureza figurativa, h o de figuras incompletas, onde se solicita ao sujeito
para completar linhas apresentadas, formando figuras ou objetos distintos.
Um outro exemplo de teste de natureza figurativa denomina-se Crculos.
Neste, 36 crculos idnticos so apresentados, e o sujeito instrudo a
fazer desenhos diferentes com cada um dos crculos.
Para se pontuar a fluencia, conta-se o nmero de respostas
relevantes dadas em cada teste. A flexibilidade avaliada pelo nmero
de diferentes categorias em que as respostas podem ser classificadas. A
originalidade pontuada com base em um levantamento prvio da fre-
qncia de respostas dadas a cada um dos testes, recebendo as respostas
apresentadas por 2% a 4% um ponto, e aquelas dadas por menos de 2%,
dois pontos no recebem pontuao em originalidade as demais res-
postas (aquelas dadas por 5% ou mais da populao). J a elaborao
pontuada pelo nmero de detalhes presentes em cada resposta.
Nas instrues, enfatizado que o sujeito dever fazer figuras ou
objetos que ningum ainda pensou, solicitando-se ainda para que d
nomes ou ttulos para cada um dos desenhos realizados.
Embora os testes de pensamento divergente sejam aqueles mais
utilizados em pesquisas na rea e mais discutidos pela literatura relativa
medida de criatividade, outras modalidades de instrumentos foram
tambm desenvolvidos com vista a avaliar traos psicolgicos, de
personalidade, motivacionais, biogrficos e de interesses, que usualmente
caracterizam pessoas mais criativas. Os inventrios de atitudes e
interesses se enquadram nesta categoria. Um exemplo seria o de alguns
instrumentos desenvolvidos por Davis e Rimm (1982) e Rimm, Davis e Bien
1982). Estes so o GIFT (Group Inventory for Finding Creative Talent),
GIFF I e II (Group Inventory for Finding Interests) e o PRIDE (Preschool
Interest Description).
Alguns exemplos de itens presentes nestes instrumentos:
Eu tenho um bom senso de humor; eu tenho uma grande variedade de
hobbies-, eu gosto de escrever histrias; eu gosto de tentar novas
abordagens para resolver um problema, etc. Estes so respondidos em
uma escala de cinco pontos, que incluem "no", "em pequena ex-
tenso", "medianamente", "acima da mdia" e "definitivamente".
Vrios outros instrumentos voltados para a identificao de atitudes
e interesses foram desenvolvidos nos Estados Unidos e tm sido tambm
citados em pesquisas realizadas na rea. O que se observa, entretanto,
examinando os seus itens, que alguns deles parecem avaliar tambm
traos de personalidade, como autoconfiana (exemplo de um item desta
natureza: eu tenho confiana em minha habilidade intelectual) e curiosi-
dade (eu sou muito curioso).
Uma terceira categoria de medida de criatividade presente na
literatura so os inventrios de personalidade. Segundo Hocevar e
Bachelor (1989), estes inventrios tm sido sobretudo utilizados por
aqueles pesquisadores que caracterizam a criatividade como um conjunto
de fatores de personalidade mais do que de traos cognitivos. Uma
variedade de itens so includos nestes instrumentos, com vista a
identificar a extenso em que o sujeito apresentaria traos que se
associam criatividade, como autonomia, autoconfiana, iniciativa,
perseverana, espontaneidade, sensibilidade emocional, etc.
Nota-se que tambm Torrance, mais conhecido por seus testes de
pensamento criativo, desenvolveu um instrumento What kind of person are
you? (Torrance, Khatena, 1970), que se enquadra na categoria de teste de
personalidade. Neste instrumento, os sujeitos selecionam adjetivos para
se autodescrever, em um formato de escolha forada. Os autores
consideram que os indivduos mais criativos tendem a se descrever, por
exemplo, como mais altrustas do que corteses, como uma pessoa de
iniciativa mais do que como obediente, identificando-se aqueles mais
criativos a partir de suas respostas.
Inventrios biogrficos, incluindo uma vasta variedade de itens
relativos a hobbies, interesses, atividades durante a infncia, produo
criativa nos primeiros anos, histria educacional e histria familiar, so
tambm relacionados na literatura norte-americana, onde inmeros
instrumentos j foram desenvolvidos com este fim. Segundo Amabile
(1983), a maioria destes instrumentos foram originalmente desenvolvidos
em uma base intuitiva e refinados atravs detestes com amostras distintas
de indivduos considerados mais e menos criativos.
Uma quinta categoria de medida descrita por Hocevar e Bachelor
( 1989) a avaliao da criatividade por professores, colegas ou superviso-
res. Especialmente em pesquisas realizadas no contexto educacional, tem
sido freqente solicitar a professores para informar a respeito do nvel de
criatividade de seus alunos. Um dos instrumentos desenvolvidos para tal
fim e j utilizado em pesquisas pela autora do presente captulo (Alencar,
1974b, 1985) foi proposta por Torrance (1966) e denomina-se Teacher's
Evaluation of Creativity Sheet. Neste instrumento, o professor recebe
instrues para relacionar os cinco alunos mais fluentes e os cinco menos
fluentes de sua classe, os cinco mais flexveis e os cinco menos flexveis,
os cinco mais originais e os cinco menos originais, bem como os cinco
melhores em elaborar idias e aqueles cinco menos capazes de realizar
tal elaborao. No instrumento, feito um esclarecimento sobre o signi-
ficado de fluencia, flexibilidade, originalidade e elaborao.
Torrance desenvolveu este instrumento com base em pesquisas
anteriores (Torrance, 1962,1963) onde observou que os professores eram
capazes de avaliar as habilidades criativas dos estudantes, desde que
recebessem descries adequadas do comportamento criativo. Em alguns
de seus estudos, os alunos considerados pelos professores como mais
fluentes, flexveis, originais e mais competentes em elaborao e aqueles
nomeados como menos fluentes, flexveis, originais e com menor compe-
tncia de elaborao diferiam entre si em resultados nos Testes Torrance
de Pensamento Criativo. Entretanto, tanto Alencar (1974b) como Rush,
Denny e Ives (1967) observaram pouca concordncia entre a indicao por
parte de professores e resultados em testes de pensamento criativo.
Supervisores imediatos e parceiros tm sido tambm solicitados a
avaliar a criatividade, especialmente em pesquisas realizadas em ambiente
organizacional. Alguns estudos utilizando tal modalidade so descritos por
Hocevar e Bachelor (1989), como, por exemplo, os desenvolvidos por
Calvin Taylor e colaboradores, atravs de checklists elaborados por estes
autores.
Uma outra maneira de se avaliar a criatividade seria atravs de
julgamento de produto. Esta modalidade envolve o uso de juizes que,
utilizando-se de critrios predeterminados, avaliam o grau de criatividade
de um dado produto. Uma pesquisadora que vem utilizando e defendendo
o uso de tal modalidade Amabile (1983), que realizou uma srie de
estudos onde uma anlise objetiva do produto era feita, buscando-se
quantificar a extenso em que o mesmo era criativo. Nestes estudos, uma
srie de dimenses acompanhadas de uma definio descritiva de cada
uma delas era dada aos juizes, tendo a autora observado em seus estudos
altos ndices de fidedignidade entre juizes.
Amabile considera tambm importante, no uso deste procedimento,
que uma srie de requisitos sejam obedecidos, como os especificados a
seguir: 1) os juizes devem ser escolhidos dentre pessoas que tenham
experincia no domnio em questo, embora o nvel de experincia varie
de juiz para juiz; 2) necessrio que os juizes escolhidos estejam de
acordo com os critrios relativos ao que seria uma resposta criativa; 3)
necessrio que os juizes faam sua avaliao independentemente um do
outro; 4) os juizes devem avaliar os produtos um em relao ao outro nas
dimenses consideradas e no avali-los considerando-se um padro
absoluto para o produto em um dado domnio. A autora considera ainda
que o critrio mais importante para este procedimento de avaliao que
os julgamentos sejam fidedignos.

QUESTES RELATIVAS FIDEDIGNIDADE, VALIDADE E CONDIES DE APLICAO


DOS INSTRUMENTOS DE MEDIDA DE CRIATIVIDADE

O interesse crescente pelo estudo da criatividade observado nesta


segunda metade de sculo contribuiu de uma maneira significativa para o
desenvolvimento da rea dos testes psicolgicos. Isto porque uma vasta
diversidade de instrumentos visando medir as diferentes dimenses da
criatividade foram construdos e vm sendo utilizados pelos estudiosos da
rea, embora sejam os testes de pensamento divergente aqueles mais
freqentemente usados tanto no contexto educacional como em pesquisas
de natureza psicolgica e educacional (Michael, Wright, 1989). Entretanto,
quando se examina o progresso da pesquisa na rea de avaliao deste
construto nos ltimos 20 anos, comparando-se, por exemplo, a literatura
mais recente (Treffinger, 1987; Brown, 1989; Hocevar, Bachelor, 1989;
Michael, Wright, 1989; Cooper, 1991) com alguns artigos escritos em
dcadas anteriores, como o de Crockenberg (1972) e o de Petrosko (1978),
constata-se facilmente que muitas dificuldades ainda persistem e muitos
dos problemas fundamentais ainda no foram resolvidos.
Algumas destas dificuldades se devem ao fato de que a proliferao
de pesquisas em criatividade e de instrumentos de medida no foi acom-
panhada de avanos significativos na fundamentao terica ou na orga-
nizao de um corpo sistemtico de conhecimento emprico, como observa
Greeno (1989). Este autor aponta, por exemplo, que a pesquisa com
relao ao pensamento criativo progrediu pouco se comparada com os
rpidos progressos observados no estudo das estruturas cognitivas.
Ainda com relao aos testes de criatividade, Treffinger (1987)
destaca que, embora haja um nmero muito grande de testes que se
dizem "medidas" da criatividade, estes diferem entre si em inmeros
aspectos, uma vez que espelham as crenas e preconceitos de seus
organizadores com relao natureza da criatividade. Este autor vai alm
e lembra que, "infelizmente, a base terica de tais instrumentos no
freqentemente suficiente para permitir testes sistemticos de predies
diferenciais" (id. ibid., p.105).
Inmeros foram tambm os autores que examinaram os dados
relativos fidedignidade e validade dos distintos instrumentos, como
Anastasi (1988), Petrosko (1978), Tannenbaum (1983), Treffinger (1987),
Michael e Wright (1989) e Cooper (1991), apontando para resultados
inconsistentes nas pesquisas realizadas, para as dificuldades na seleo
de critrios (por exemplo, na escolha de indicadores externos de compor-
tamentos criativos), lembrando ainda a necessidade de uma maior ateno
questo da medida por parte daqueles que pesquisam criatividade.
Vrios aspectos tm sido tambm examinados com relao fidedignidade
e validade, como os especificados a seguir. Nota-se, entretanto, atravs
de uma anlise da literatura, que so sobretudo os testes de pensamento
criativo que tm sido tradicionalmente considerados, no fazendo a maioria
dos autores meno s demais modalidades de medidas de criatividade,
como as examinadas por Hocevar e Bachelor (1989). Estes, como desta-
cado anteriormente, organizaram uma taxonoma das medidas disponveis,
classificando-as nas diferentes categorias descritas em pginas anteriores.

Fidedignidade
Nas vrias medidas de criatividade disponveis na literatura, sobre-
tudo nas que dizem respeito aos testes de pensamento divergente, as trs
distintas formas de se estimar fidedignidade tm sido encontradas. Tanto
a abordagem teste-reteste ou seja, a correlao entre a mesma forma
de um teste aplicado em diferentes momentos, como formas alternativas
ou paralelas de um mesmo instrumento como a abordagem de consis-
tncia interna tm sido empregadas para estimar a fidedignidade.
Entretanto, segundo Michael e Wright (1989), dependendo da modalidade
de medida de criatividade, um ou outro tipo de abordagem seria mais
adequado. Segundo estes autores, no caso de medidas de pensamento
divergente, por exemplo, o uso de formas alternativas seria mais adequa-
do, ao passo que, no caso de qualquer tipo de avaliao que envolva
observao, que o que ocorre, por exemplo, quando se utilizam juizes
para avaliar a criatividade de produtos, as abordagens de consistncia
interna so as mais apropriadas.
Como discutido anteriormente por Fleith e Alencar (no prelo), a
fidedignidade nas medidas de criatividade pode ser afetada principalmente
pela heterogeneidade do domnio amostrado, ou seja, pela ausncia de um
universo claramente definido a respeito de criatividade, do qual os itens
dos instrumentos so retirados, pela amostragem de contedo, pela subje-
tividade do avaliador e pelos fatores motivacionais (tanto do avaliador
quanto do avaliado) presentes na situao de avaliao.
Algumas das dificuldades encontradas com relao fidedignidade
devem-se ao fato de que h dados sobre pessoas criativas que sugerem
variaes substanciais da mesma em diferentes perodos em sua produo
criativa. Ademais, fatores motivacionais e mesmo do contexto podem afetar
o desempenho do sujeito em um teste, e isto naturalmente vai refletir em
alguns ndices de fidedignidade da medida. Apesar destes aspectos, no
caso do Teste Torrance de Pensamento Criativo, que o mais utilizado em
pesquisa, h diversos estudos no manual do mesmo (Torrance, 1966,1974)
indicando coeficientes de fidedignidade teste-reteste acima de 0,50 para
as diferentes medidas. Em um de seus estudos apresentados no manual,
com uma amostra de estudantes universitrios, Torrance obteve coeficien-
tes variando de 0,68 a 0,85 para os vrios testes de sua bateria em um
intervalo de trs meses. Os estudos revistos por Torrance indicam ainda
coeficientes de fidedignidade mais altos para adultos do que para crianas
e maiores nas medidas de fluencia e flexibilidade dos testes verbais. Em
um estudo realizado pela autora (Alencar, (1974a), em uma amostra de 159
sujeitos de 4 e 5a sries, obtiveram-se coeficientes variando de 0,01 a 0,56
para 12 medidas de criatividade dos Testes Torrance de Pensamento
Criativo em um intervalo de quatro meses, bem mais baixos, portanto, do
que os coeficientes citados na literatura.

Validade
Vrios so os autores que examinaram, no contexto da avaliao da
criatividade, algumas questes relativas validade. Esta, como se sabe,
o aspecto mais importante a ser considerado, e est ancorada, segundo
Wolf (apud Michael, Wright, 1989), em trs questes, a saber: a) o que o
teste supe medir; b) o que o escore derivado da aplicao de um teste
significa; c) como o escore de um indivduo em uma medida se relaciona
com outros fatos observveis relativos ao indivduo.
Com relao validade de critrio, que inclui tanto a validade con-
corrente como a preditiva, o grande desafio tem sido a identificao de
medidas de critrio relevantes e que sejam plenamente satisfatrias. No
caso da validade concorrente, esta tem sido, muitas vezes, levantada atravs
da comparao de resultados de testes com avaliaes feitas por profes-
sores e colegas, que, como vimos anteriormente, muitas vzes apresenta
dificuldades. Por outro lado, com relao validade preditiva, especial-
mente no caso da Bateria Torrance, inmeros estudos tm apontado para
correlaes significativas observadas entre resultados de testes obtidos em
um dado momento e o registro de atividades criativas por parte dos
mesmos sujeitos cinco ou mais anos aps. Este aspecto foi examinado por
Treffinger para os Testes Torrance de Pensamento Criativo, tendo este
autor observado correlaes positivas e significativas entre resultados nos
testes e critrios de realizaes criativas em estudos envolvendo perodos
que variaram de 9 meses a 22 anos (Treffinger, 1985).
Examinando a validade de critrio de testes de criatividade, Michael
e Wright (1989) lembram alguns fatores que podem afetar a interpretao
de um coeficiente de validade, s vezes adversamente. Estes autores
lembram, por exemplo, a necessidade de que o observador ou avaliador
de comportamentos criativos se previna contra o uso que, s vezes,
consciente ou inconscientemente, faz de informaes obtidas atravs da
administrao prvia de testes, no momento em que estiver fazendo um
julgamento do desempenho do sujeito em algumas medidas do critrio.
Ademais, segundo estes autores, o grau de fidedignidade, tanto do preditor
mas especialmente da medida de critrio, um elemento potencialmente
atenuante da magnitude do coeficiente de validade. Na maior parte das
circunstncias, a fidedignidade da medida de critrio tende a ser mais
baixa do que aquela associada com o teste. Caso a varivel de critrio ou
teste no for estvel e consistente, isto certamente vai afetar o grau de
correlao entre as medidas.
Com relao validade de construto, tem sido lembrado que um dos
requisitos para o seu estabelecimento a validade convergente, ou seja,
a demonstrao de que a medida selecionada de um dado comportamento
se relacione com outras medidas do mesmo construto e com outras
variveis relativas ao critrio, que tenham uma relao com o construto.
Um segundo requisito se refere validade discriminativa, demonstrando
que a medida selecionada independente de variveis de outros
construios teoricamente distintos (Michael, Wright, 1989).
Um dos aspectos que tm sido discutidos com relao validade de
construto diz respeito ao fato de que uma vez que a criatividade engloba
um conjunto complexo de construios interrelacionados, um dos grandes
desafios reside na operacionalizao de construios tericos claros que
constituam o fundamento do comportamento criativo.
Vrias evidncias de validade de construto tm sido apontadas para
alguns dos instrumentos disponveis na rea, especialmente para a Bateria
Torrance. Entretanto, h necessidade de mais pesquisas no caso da vasta
maioria de instrumentos disponveis para que os padres de qualidade
apontados pela psicometria sejam atendidos.
Quanto validade de contedo, o grande desafio para os construto-
res de testes atender s exigncias de que o contedo do instrumento
efetivamente abranja uma amostra representativa do domnio em questo.
Este desafio foi inclusive apontado por Torrance (1974, p.21), no manual do
seu teste, quando afirma:
"Uma vez que a pessoa pode se comportar criativamente em um nmero
quase infinito de maneiras, na opinio do autor seria ridculo tentar desenvolver
uma bateria compreensiva de testes de pensamento criativo que constitusse
uma amostra de qualquer tipo de universo de habilidades de pensamento
criativo. O autor no acredita que algum possa atualmente especificar o nmero
e amplitude de testes necessrios para dar uma avaliao completa ou mesmo
adequada das potencialidades de uma pessoa para o comportamento criativo."

Tal fato justifica a crtica comumente feita aos testes de criatividade


de que estes avaliam apenas uma amplitude muito limitada de habilidades,
sendo, portanto, inadequado considerar o desempenho em um teste
qualquer da rea como indicador geral de criatividade. Por outro lado,
nota-se que este um problema que temos observado com freqncia na
literatura, uma vez que comum rotular como testes de criatividade
algumas medidas que so essencialmente medidas de algumas poucas
habilidades cognitivas tradicionalmente relacionadas ao pensamento
criativo, como fluencia, flexibilidade e originalidade. O mesmo acontece em
alguns instrumentos que pretendem avaliar traos de personalidade que
parecem favorecer a expresso do potencial criador. O que ocorre que
certamente distintos pesquisadores estejam estudando fenmenos bem
diferentes dependendo das medidas por eles selecionadas.
No nosso entender, o pesquisador da rea deve estar sempre atento
para o fato de que o construto criatividade multidimensional e muito mais
complexo, no devendo confundir criatividade com o que est sendo
medido por estes instrumentos. Como bem lembram Hocevar e Bachelor,
habilidades relativas ao pensamento divergente, atitudes, interesses,
caractersticas de personalidade podem ser melhor descritas como
correlatos do comportamento criativo, no devendo jamais ser consideradas
como medidas de criatividade. Consideramos este aspecto sobretudo
importante, uma vez que a natureza dos itens ou tarefas includos nos
testes de pensamento criativo, por exemplo, como nos Testes Torrance de
Pensamento Criativo, no conduzem a respostas criativas de alto nvel,
havendo ainda a questo do limite de tempo para cada item ou tarefa (de
5 a 10 minutos, dependendo da tarefa), o que um fator que tambm no
pode ser deixado de lado, considerando que quantidade de respostas
algo enfatizado nas instrues.

Condies de aplicao
Com relao a este aspecto, especialmente Michael e Wright (1989)
lembram a necessidade de controle de alguns fatores, como os especifica-
dos a seguir: a) tempo disponvel para o examinando responder ou para
o observador fazer o seu julgamento; b) nvel de dificuldade das palavras
e maneira de apresentar as instrues, incluindo nmero comparvel de
exemplos ilustrativos para todos os que iro responder ao instrumento; c)
controle de fatores que poderiam distrair a ateno do sujeito, como
barulho, iluminao inadequada, clareza das instrues e ilustraes
contidas no instrumento e at mesmo a seqncia e nmero de testes
administrados.
Com relao a este ltimo aspecto, a autora deste captulo tem
observado, por exemplo, que no caso da Bateria Torrance, a aplicao de
toda a parte verbal mostra-se bastante cansativa, no s para crianas
mas at mesmo para adultos. Isto faz com que muitos sujeitos no dem
o nmero de respostas que poderiam, especialmente nos ltimos testes.
Treffinger (1987) fez uma reviso de vrios estudos sobre o efeito de
condies de aplicao e clima predominantes durante a mesma no
desempenho em testes de criatividade. Estes estudos mostram que os
resultados nestes testes so afetados pelos procedimentos utilizados
durante a administrao dos instrumentos. Por esta razo, necessrio
uma orientao segura e mesmo um treinamento para aqueles que vo
aplicar testes, no sentido de se assegurar condies adequadas e compa-
rveis em todas as aplicaes.
A nossa experincia tem mostrado tambm que um cuidado especial
deve ter o pesquisador no uso de testes de criatividade, quando a
aplicao grupai e no individual. Sobretudo no caso da utilizao de
testes de pensamento criativo para crianas e adolescentes e para sujeitos
de status scio-econmico baixo, o fator motivacional afeta em muito o
desempenho nos testes e, em grupo, difcil de se controlar esta
varivel. O prprio Torrance, autor do teste mais utilizado de pensamento
criativo, lembra que a maneira como o seu teste aplicado afeta os
resultados. Segundo ele, at o momento em que aplicado (final de
semestre, por exemplo) exerce efeito no desempenho, tendo Torrance
constatado que alunos, ao final do semestre, no saam to bem neste
instrumento como anteriormente, mesmo aps um treinamento de criati-
vidade e com alta motivao (Torrance, 1988).
Uma anlise do estado da arte em medidas de criatividade nos leva,
pois, a concluir que estamos ainda em um estgio bem preliminar de
domnio de conhecimento nesta rea, com muitas conquistas a serem feitas
para que possamos clarificar muitas das questes a respeito de medidas
de criatividade, que no foram ainda respondidas ou o foram de maneira
incompleta ou inadequada. Como lembra Petrosko (1978), o grande desafio
de se medir criatividade reside no paradoxo de se tentar construir uma
maneira padronizada de se capturar algo que foge padronizao.
REFERENCIAS BIBLIOGRFICAS

ALENCAR. E.M.L.S. A study of creativity training in elementary grades in Brazilian schools.


Lafayette (IN), 1974a. Tese (Doutorado) Purdue University.
. Avaliao da criatividade de alunos por professores. Interamerican Journal of Psy
chology, Los Angeles (CA), v.8, n.3/4, p.219-224. 1974b.
--------------- . The identification of the creative gifted by trained and untrained elementary-school
teachers. In: WORLD CONFERENCE ON GIFTED AND TALENTED CHILDREN, 6,1985.
Anais.... p.57.
AMABILE, TM. The social psychology of creativity. New York: Springer-Verlag, 1983.
ANASTASI.A. Psychological testing. New York: Macmillan. 1988.
BROWN, R.T. Creativity: What are we to measure? In: GLOVER. J.A.. RONNING, R.R.,
REYNOLDS. C.R. (Eds.). Handbook of creativity. New York: Plenum Press, 1989.
COOPER, E. A critique of six measures for assessing creativity. Journal of Creative Behavior,
Buffalo (NY). V.25. n.3. p.194-204. 1991.
CROCKENBERG. S.B. Creativity tests: a boon or boondoggle for education? Review of
Educational Research, v.42. n.l, p.27-45, 1972.
DAVIS, G.A., RIMM. S.G. Groups Inventory for Finding Interests (GIFFI I and II): instruments for
identifying creative potential in the junior and senior high school. Journal of Creative
Behavior. Buffalo (NY), v.16. n.l, p.50-57, 1981.
FLEITH. D.S., ALENCAR, E.M.L.S. Medidas de criatividade. Psicologia: Teoria e Pesquisa.
Braslia, [1955]. No prelo.
GREENO, J.G. A perspective in thinking. American Psychologist Washington, D.C., v.44, n.2,
p.134-141, 1989.
GUILFORD. J.P. Creativity. American Psychologist, Washington. D.C., v.5. p.444-454, 1950.
----------------. 77ie nature of human intelligence. New York: McGraw-Hill, 1967.
HOCEVAR, D., BACHELOR, P. A taxonomy and critique of measurements used in the study of
creativity. In: GLOVER. J.A.. RONNING. R.R.. REYNOLDS. C.R. (Eds). Handbook of creativity.
New York: Plenum Press. 1989.
MASLOW, AH. Creativity in self-actualizing people. In: ANDERSON. H.H. (Ed.). Creativity and its
cultivation. New York: Harper, 1959.
MICHAEL, W.B., WRIGHT, C.R. Psychometric issues in the assessment of creativity. In:
GLOVER, J.A.. RONNING, R.R.. REYNOLDS, C.R. (Eds.). Handbook of creativity. New York:
Plenum Press, 1989.
PETROSKO, J.M. Measuring creativity in elementary school: the current state of the art. Journal
of Creative Behavior. Buffalo (NY), v.12. n.2. p.109-119, 1978.
RIMM. S., DAVIS. G.A.. BIEN. Y. Identifying creativity: a characteristics approach. Gifted Child
Quarterly, Williamsville (NY), v.26. n.4, p.165-171. 1982.
ROGERS, C.R. Toward a theory of creativity. In: VERNON, P.E. (Ed.). Creativity. Harmonds-
worth: Penguin, 1982. Original de Rogers de 1954.
RUSH, R.R., DENNY, D.A., IVES. S. Fostering creativity in the 6th grade and its effect on
achievement. Journal of Experimental Education. Washington, D.C., v.36, p.80-86, 1967.
TANNEMBAUM, A.J. Gifted children. Psychological and educational perspectives. New York:
Macmillan, 1983.
TAYLOR, LA. The nature of the creative process. In: SMITH, P. (Ed.). Creativity, an examination of
the creative process. New York: Hartings House, 1959.
TORRANCE, E.P. Guiding creative talent. Englewood Cliffs (NJ): Prentice-Hall, 1962.
--------------- . Education and the creative potential. Minnesota: University of Minnesota Research
Bureau, 1963.

. Torrance tests of creative thinking: norms- technical manual. Princeton (NJ): Person
nel Press, 1966.
--------------- . Torrance tests of creative thinking: norms and technical manual. Bensenville (II):
Scholastic Testing Service, 1974.
--------------- . The nature of creativity as manifest in its testing. In: STERNBERG, R.J. (Ed.). The
nature of creativity, contemporary psychological perspectives. Cambridge: Cambridge
University Press, 1988.
TORRANCE, E.P., KHATENA, J. What kind of person are you? Gifted Child Quarterly, Williams-
ville (NY), V.14, p.71-76, 1970.

TREFFINGER, D.J. Research on creativity assessment. In: ISAKSEN, S.G. (Ed.). Frontiers of
creativity research: beyond the basics. Buffalo (NY): Bearly. 1987.

URBAN, K.K. Recent trends in creativity research and theory. Western Europe, v.1.n.O, p.99-
113,1990.

WOLFLE, D. A descoberta do talento. Rio de Janeiro: Lidador, 1971.


CAPTULO 12

ESTRATEGIAS E MEDIDAS
EM ANLISE DE CONTEDO
Edson A. de Souza Filho
Universidade Estadual do Norte Fluminense, Campos, RJ

odemos dizer que vrias modalidades de anlise de contedo vm


sendo utilizadas por pesquisadores e profissionais de mais de uma
especialidade em cincias humanas, entre os quais, psiclogos e
socilogos. Ou seja, todas as vezes que dados simblicos, verbais
ou no, so utilizados para estabelecer inferncia sistemtica, seja a
respeito de um processo mental, seja sobre uma contingncia
comportamental, estamos diante de uma anlise de contedo. Contudo,
desde seu aparecimento acadmico nos anos 20 (Bardin, 1977),
diferentes disciplinas e respectivas correntes tericas tm preferido
desenvolver, de acordo com necessidades intelectuais ou culturais, suas
prprias definies e tcnicas correspondentes. No mbito deste captulo,
nossa inteno apresentar algumas das definies, posturas e
tcnicas mais empregadas neste campo, sobretudo, por psiclogos e
psicossocilogos.
Embora alguns psiclogos eminentes tenham reconhecido esta
tcnica, o fato de que a experimentao e a quantificao tenham pas-
sado a ocupar um lugar privilegiado em termos de estratgias e critrios
gerais de pesquisa acabou diminuindo sua presena em alguns manuais
e revistas mais respeitados a partir dos anos 70. Contudo, defendemos
a posio de que a anlise de contedo (A.C.) constitui-se necessidade
permanente, tanto como facilitadora de inovao em cincias humanas
quanto como complementao da administrao da prova.
Assim, para Cartwright (1974), "uma das habilidades bsicas exigi-
das de um psiclogo social analisar material simblico ou 'qualitativo'.
Parte considervel da pesquisa sociopsicolgica consiste em classificar
e interpretar produtos verbais e outros smbolos de indivduos ou grupo
de pessoas". Ou seja, ainda que a construo de uma teoria psicolgica
e/ou psicossocial no possa ser suficientemente apoiada em procedimen-
tos de tipo classificatrio, necessariamente ela deve ter seus enunciados
baseados em boas descries de elementos de realidade simblica, a
serem organizados em tipologias e princpios de ordem mais geral, cada
vez mais sistemticos, antes de qualquer veleidade experimental. Con-
tudo, outro aspecto levantado por Cartwright parece-nos relevante.
Refere-se ao fato de que os fenmenos tratados por disciplinas de cien-
cias humanas so mediados ou, mesmo, estreitamente vinculados s
dimenses simblica e verbal, tornando necessrio um adequado trabalho
dos mesmos em instrumentos e procedimentos adotados. Um certo
reconhecimento do problema pode ser observado atravs da crescente
valorizao do trabalho intercultural, obrigando pesquisadores a desen-
volver estratgias de validao em que o qualitativo ou culturalmente
particular s superado por meio de um ir e vir incessante entre con-
ceitos descritivos ou operatrios e conceitos explicativos mais gerais. No
quadro de pases onde falta uma experincia cientfica mais consolidada
em cincias humanas, o perigo de adoo de modelos construdos a
partir de problemticas e realidades estranhas ainda maior, pois eles
comeam sua formao a partir de modelos tericos oriundos de
realidades no diretamente acessveis, apesar da riqueza de detalhes de
muitos relatrios. De todo jeito, em termos empricos, a universalidade de
teorias e modelos s poder ser contestada a partir de uma reviso de
fatos novos que so construdos, via de regra, atravs de um contato do
pesquisador ou profissional com uma realidade particular, a qual, aps
ser filtrada e reconstituda em seus elementos, torna possvel o novo
conhecimento. Sabemos que os pesquisadores relutam em apresentar
relatrios em que mtodos considerados menos rigorosos foram usados,
prejudicando a aprendizagem de produo de conhecimento novo.
Mais recentemente vm sendo levantadas questes relativas ao
mtodo de coleta de dados, no sentido de impor problemticas de
pesquisa construdas pelo pesquisador atravs de instrumentos usados,
alm de estilo e postura adotados. Assim, uma psicloga social italiana
que havia realizado mais de um levantamento com escalas de atitudes a
respeito do doente mental na Itlia, constatando uma crescente
favorabilidade atitudinal entre faixas etrias medida em que aumentava
a idade, surpreendeu-se ao verificar que os mesmos adultos que eram
favorveis ao doente mental j no o eram atravs de desenhos livres
sobre o mesmo tipo de pessoa (De Rosa, 1987). De modo que no basta
que os instrumentos sejam validados em termos semnticos, mas saber
se eles so capazes de mapear a totalidade do campo de subjetividade
do sujeito que se pretende observar o que exige uma forma de
abordagem inicial mais aberta, bem como a necessidade de A.C. antes
da elaborao de instrumentos mais estruturados.
Entretanto, preciso lembrar que as principais tcnicas e procedi-
mentos em A.C. foram criados sombra de alguma teoria psicolgica
e/ou psicossocial preexistente. Nesse sentido, cada uma das grandes
correntes intelectuais psicolgicas e sociais modernas contribuiu de
algum modo para o desenvolvimento de A.C, assim como acabou esta-
belecendo limites que foram sendo enfrentados paulatinamente por outras
correntes, resultando em um campo aparentemente heterclito, mas bas-
tante frtil de instrumentos de trabalho. Assim, tivemos analistas de
contedo de orientao comportamental cujas contribuies maiores foram
no sentido de descrever os aspectos manifestos de verbalizao, oral ou
escrita, visando, em grande parte, predio de comportamentos em
relao a realidades ambientais especficas. Poderamos lembrar os
trabalhos sobre comunicao de mensagem poltica, feitos por Lasswell e
colaboradores (1949), culminando com os de Berelson nos anos 50 (1952,
1954), que apresentam uma sntese da tcnica em vrias aplicaes. Tais
trabalhos adotaram, via de regra, uma concepo segundo a qual o texto
deve ser recortado, em sua totalidade, em molculas relacionadas a con-
tingncias reais ou simblicas. Os aspectos cognitivos, discursivos ou
epistemolgicos do sujeito sendo, obviamente, deixados de lado, de acordo
com a posio comportamental daquela poca que preconizava nfase
menor no esclarecimento da complexidade da funo simblica, tanto
individual quanto social. Os resultados obtidos a partir desse procedimento
foram relatrios que descrevem com alto nvel de objetividade repertrios
comportamentais, sobre os quais nos deteremos mais adiante.
Posteriormente, psiclogos inspirados pelas correntes gestaltistas,
desenvolvidas em torno da noo de consistncia cognitiva, como Osgood,
se esforaram por criar e aperfeioar tcnicas que, em ltima anlise,
permitissem fazer inferncias de processos mentais individuais. A
concepo dessa corrente a de que possumos estruturas e elementos
de cognio cuja anlise s pode ser feita em conjuntos de partes inter-
relacionadas. A anlise de contingncias do autor mencionado uma das
mais conhecidas no campo. Mas outros autores, seguindo orientao que,
segundo Piaget, poderia ser considerada estruturalista, desenvolveram, na
mesma poca, procedimentos de A.C. similares, ainda que com objetivos
diferentes. Tratava-se de inventariar conjuntos de smbolos e significados,
significantes e suportes materiais (re)produzidos por sujeitos em diferentes
circunstncias. Tal procedimento procurou trabalhar de modo objetivo,
incorporando, portanto, o rigor descritivo realizado pelo campo comporta-
mental, acrescentando um interesse por aspectos de significao do
contedo de comunicao, sobretudo da cognio e/ou estruturas cultu-
rais, suas metas gerais mais importantes. Neste ltimo aspecto, sabemos
que houve tendncia de esse grupo considerar o fenmeno do conheci-
mento enquanto tratamento de informao que, se implicou abertura maior
comparativamente s correntes comportamentais e gestaltistas iniciais,
tendeu, igualmente, de um lado, a esvaziar o aspecto social do mesmo e,
de outro, a ignorar os aspectos criativos ou considerados mais complexos
da funo simblica.
Um terceiro momento da A.C. poderia ser caracterizado por uma
maior preocupao com os aspectos discursivos e criativos da produo
de contedos, o que fez com que seus procedimentos de trabalhos adota-
dos se caracterizassem por uma maior abertura, no sentido de considerar
o texto de modo mais completo, incluindo a anlise de outras dimenses
da produo de linguagem, psicolgicas, psicossociais e/ou sociais. Tal
concepo de A.C. tendeu a realizar trabalhos sem partir de sistemas
simblicos apriorsticos, preferindo observar o fenmeno como se apre-
senta em situaes sociais naturais. Como exemplo, poderamos lembrar
a tcnica de entrevista no-diretiva que, ao fazer uma crtica tendncia
tradicional de algumas abordagens clnicas no sentido de interpretar a fala
do entrevistado segundo um modelo preexistente, propunha um modo mais
aberto de tratar o contedo de comunicao, particularmente freqente
entre profissionais que adotam modelos tericos da personalidade como
a Psicanlise. Tratava-se de fortalecer a autonomia da pessoa a partir de
integrao de dimenses da personalidade desconhecidas ou evitadas,
sistematicamente, como vivncias de afetos e significados organizados
pela prpria pessoa, o terapeuta devendo adotar uma postura mais de
"espelho" do que intrprete da realidade pessoal do paciente segundo tal
ou qual posio. Procedimento semelhante foi adotado pelo uso de
videoteipes no trabalho de Wicklund e Duval (1972), com a tcnica de
aumento da auto-objetividade de si, na qual o sujeito se observa atravs
de videoteipes e de anlise oferecida por psicoterapeuta. Em Psicologa
Social, a abordagem de representaes sociais adota A.C. aberta para
observar o conhecimento informal em relao a objetos especficos. Neste
ltimo caso, o analista no s procura inferir elementos de contedo
isolados e combinados, como se faria em qualquer anlise de comporta-
mento e estrutural, mas, igualmente, considera-os como expresso da
autonomia cognoscitiva do sujeito, que tambm procura transformar a
realidade social e natural. Para tanto, foi necessrio um tratamento de
aspectos formais do discurso como seqncia da fala, seu grau de
concretude/abstrao, assim como sua insero em dinmicas histricas
mais amplas, etc.
Os trs momentos principais de A.C, brevemente lembrados,
caracterizam-se por procedimentos que, curiosamente, foram sendo
incorporados de forma gradativa, medida que surgiram historicamente,
conforme pretendemos tratar na prxima seo.

CONCEPES E MTODOS EM A.C.

Conforme dissemos, houve um contnuo aproveitamento dos avan-


os realizados em cada uma das tcnicas e concepes metodolgicas em
A.C. Contudo, tal afirmao no implica dizer que os trs tipos de A.C.
mencionados foram sendo abandonados no transcorrer da histria, uma
vez que eles continuaram e continuam sendo empregados por profissio-
nais e cientistas com relativa autonomia, conforme exporemos a seguir.
Em termos de concepo, seria muito leviano considerar o primeiro
momento de A.C. como apenas comportamental, mas devemos admitir que
foram seguidores de tal sistema terico-metodolgico que levaram s
ltimas conseqncias, sobretudo em termos metodolgicos, as principais
contribuies realizadas no que hoje se convencionou chamar de anlise
categorial (Bardin, 1977). De todo jeito, no nossa inteno no contexto
deste captulo apresentar ou discutir as relaes existentes entre os tipos
de tcnica de A.C. e seu parentesco com tal ou qual modelo terico espe-
cfico, o que seria uma tarefa mais apropriada para um historiador do
campo. Nosso objetivo mais prtico, e visa, basicamente, traar a
especificidade da tcnica em face das demais em termos de "inspirao"
terica, acompanhadas por exemplos de trabalhos de diferentes autores.
Entre as principais contribuies para a A.C. categorial poderamos
identificar, de modo geral, uma concepo de que o dado simblico
importante para a produo de um certo conjunto de fenmenos, indivi-
duais ou sociais, o qual usado como elemento descritivo do conheci-
mento objetivo do profissional ou pesquisador. Ou seja, a reduo
categorial nesse tipo de procedimento no quer saber das implicaes do
simblico enquanto racionalidade ou interao social, mas, unicamente,
inclu-las em sua atividade de conhecimento como um epifenmeno cuja
realidade se inscreve em funes ou determinaes de outra ordem.
Nesse caso, existem duas estratgias gerais de trabalho. A primeira
consiste em observar o simblico a partir de um sistema categorial
previamente montado pelo analista, podendo ser derivado de um sistema
terico que se pretende validar ou operacionalizar a respeito de um
fenmeno a ser descrito a partir de observao de incidncia freqencial
de contedos em diferentes sujeitos e condies, enquanto a segunda, por
sua vez, caracteriza-se pela busca de categorias a partir da observao
da realidade, constituindo-se, portanto, explorao de um determinado
conjunto de fenmenos para a construo de um novo conhecimento.
Em termos de constituio de dados, ambas as estratgias men-
cionadas costumam sistematizar a observao a partir de procedimentos
tais como uso de questionrios estandardizados ou de material simblico
produzidos em condies similares ou diferenciadas. Assim, so muito
variadas as possibilidades de utilizao desta tcnica, dependendo muito
da inventividade do pesquisador em saber adapt-la s circunstncias da
realidade que pretende circunscrever e organizar. No caso de anlise
categorial aprioristica, temos alguns exemplos clssicos em cincias
humanas. Durkheim (1951), em seu estudo sobre as causas sociais do
suicdio, usou os atestados de bito de pessoas que haviam se suicidado
na Frana durante um certo perodo da histria. Como os atestados de
bito naquele pas costumavam apresentar um pequeno histrico biogr-
fico do sujeito, ele pde apoiar sua hiptese de que havia crescimento de
taxas de suicdio nos momentos de desintegrao social, como crise
poltica, divrcio, desemprego, o que designou como um estado social de
anomia. Outro estudo conhecido o de McClelland (1953), interessado em
observar o papel do motivo para realizao entre culturas. Ele analisou
estrias contadas para crianas de povos que conseguiram atingir um
certo grau de realizao e pde sustentar sua hiptese. No laboratrio,
Moscovici (1967) pretendia comparar diferentes condies de produo e
comunicao simblica em termos de situao espacial, tais como situao
face a face, lado a lado, um de costas para o outro e separado fisicamente,
mas no oralmente. Ele pde constatar, por meio de A.C., que, formalmen-
te, o vocabulrio e outras caractersticas da linguagem eram modificados
pelas referidas condies.
Nos trs estudos acima lembrados, os diferentes autores haviam
partido de hipteses bsicas, as quais, por sua vez, haviam fornecido
categorias simblicas descritivas para analisar o material constitudo,
gerando freqncia a respeito dos contedos que enfocavam. No caso do
estudo de Durkheim mencionado, o contedo foi a presena e ausncia de
eventos comportamentais e mentais, que eram categorizados segundo os
tipos de suicdio egoistico, altruistico ou anmico. A partir de estudo
estatstico e demogrfico correlacionai, ele pde avaliar a referida hiptese.
Note-se que o dado simblico aqui se reduziu informao de um evento
vivido pelo sujeito observado atravs de sua certido, sem constituir um
estudo do simblico em si, mental ou interativo, como o prprio Durkheim
props mais tarde em seu trabalho sobre as formas elementares da vida
religiosa. J no estudo de McClelland, temos o uso de A.C. em que o
prprio material simblico tem papel de varivel independente inferida, no
caso de estrias e inscries que sups terem produzido motivo para a
realizao em indivduos e grupos pertencentes atais culturas. Por ltimo,
o trabalho de Moscovici, um caso raro de utilizao de A.C. em delinea-
mento experimental, temos o simblico analisado enquanto tipos de
respostas em seu aspecto expressivo e formal em relao a diferentes
variveis ou condies fsico-espaciais no processo de comunicao.
Conforme dissemos acima, as tcnicas de A.C. da primeira fase
poderiam ser caracterizadas pelo uso limitado do texto e por uma menor
preocupao em sua insero em termos mentais e sociais mais amplos.
Eventualmente, como o caso de algumas anlises feitas durante a
Segunda Guerra Mundial, o sujeito produtor do texto podia ser um pas
inteiro, mas era tratado como um indivduo, sobre o qual interessava fazer
uma inferncia para descobrir suas intenes ou probabilidade de uma
ao futura. Entre os vrios autores que mais contriburam a partir dessa
concepo, destacamos Lazarsfeld(1948), Lasswell (1949), Berelson, (1952,
1954) e Katz ( 1960). As maiores contribuies deste grupo de autores foram
no sentido de lanar as bases de uma tcnica em termos de procedimento
objetivo e sistemtico, o que foi adotado pela maioria dos principais
especialistas que surgiram posteriormente (Holsti, 1969; Bardin, 1977/1992;
Mucchielli, 1979; Krippendorff, 1980; Weber, 1980; Ghiglione, Blanchet,
1991). De todo jeito, podemos dizer que a nfase na objetividade segundo
esta concepo de A.C. fez com que a anlise se limitasse ao aspecto
manifesto e incontroverso da realidade simblica, tal como palavras,
deixando de lado, por exemplo, seu aspecto conotativo, singular, entre
outros. Os trabalhos mais conhecidos dessa concepo tambm se nota-
bilizaram por preocupao em estabelecer inferncia a partir do emprego
de freqncias. Ou seja, a idia subjacente que, quanto mais freqente
ou presente um dado significado em material analisado, maior sua relao
com uma certa realidade psicolgica e/ou social.
Com o advento das teorias de consistncia cognitiva e o estrutura-
lismo, preocupadas no mais em investigar as partes do fenmeno cogni-
tivo e social, mas em suas relaes e processos, surgiu outra concepo
e mtodo de A.C.. Agora, tratava-se de levar em considerao a combi-
nao entre os elementos simblicos contidos na linguagem para observar
invariantes associados ou dissociados por indivduos particulares ou uma
comunidade cultural e lingstica. Um trabalho desta tendncia de A.C.
o estudo de Osgood (1959) sobre a Anlise de Avaliao de Assero, cujo
objetivo principal inferir atitudes a partir de textos, incluindo o aspecto
avaliativo das significaes em termos de direo e intensidade. Assim,
uma vez reunidos os objetos de atitudes presentes no texto, so inventa-
riados os termos avaliadores comuns, considerados como relativamente
estveis e partilhados na cultura, os quais so ligados aos objetos de
atitudes por conectores verbais, que indicam a intensidade da conexo
entre objetos e avaliao. Poderamos tomar como exemplo a seguinte
frase obtida em pesquisa que realizamos entre moradores da cidade de
Braslia (Souza Filho, 1990/1991):
"Eu gosto da cidade de Braslia, mas acho que seus moradores
so frios e pouco amistosos."
Objetos de atitude: cidade de Braslia, moradores.
Avaliadores comuns: gostar, frios, amistosos.
Conectores verbais: muito, so, pouco.
Osgood partiu do pressuposto de que a maioria dos avaliadores e
conectores so facilmente identificveis por serem regulares e comuns
numa dada cultura, cabendo ao analista levantar tais elementos para
conhecer seus invariantes subjetivos, suas estruturas simblicas. De modo
que linguagem e atitudes so aqui consideradas, sobretudo, em seu
aspecto motivacional e coletivo, sem levar em conta sua funo social
particular enquanto ao visando metas. Destarte, os avaliadores so
codificados enquanto direo e grau de associao/dissociao com os
objetivos, em termos de favorabilidade/desfavorabildade e respectiva
intensidade, classificvel em escala bipolar que varia de +3 a -3. Assim, no
exemplo em foco, "gostar" e "amistosos" so avaliadores favorveis, e
"frios", desfavorvel; "muito" e "so" so conectores de intensidade
mxima, e "pouco", intermediria.
Ou seja, os estudos das relaes entre contedos no esto apenas
interessados na freqncia de significaes expressa atravs de temas,
mas na presena/ausncia simultnea entre os mesmos. Para tanto, a
fragmentao das unidades de registro ser acompanhada por recortes de
unidades de contexto maiores, no interior das quais observam-se as
relaes em cada conjunto de palavras, tal como Osgood (1959) props em
sua anlise de co-ocorrncia quando o texto contnuo (fala de um
sujeito) ou um documento separado (exemplar de um jornal dirio, uma
entrevista numa srie delas), etc, para, em seguida, registrar-se em uma
matriz de contingncia as medidas significativas estatisticamente em
termos de associao e dissociao, as quais so interpretadas como
representando relaes mentais. Ainda que se possa utilizar tal tcnica
com outros propsitos intelectuais, fica a dvida quanto natureza do
fenmeno, se uma associao meramente formal de um lxico mais
prenhe ou mecanismo inconsciente individual, cabendo ao pesquisador
bem informado, portanto, isolar as explicaes que possam competir com
a que ele pretende demonstrar uma correlao ou nexo causal mais forte.
Caberia ainda mencionar que, na obra de Osgood, voltada para o
papel do significado em termos psicolgicos, duas preocupaes bsicas
se manifestaram: uma, de desenvolver instrumentos relativamente flexveis
para abarcar um campo semntico mais amplo, como a Anlise de
Avaliao de Atitudes a partir de textos ou a tcnica de Anlise de
Contingncia entre significados, brevemente apresentadas, e outra, mais
fechada, cujo propsito buscar universais semnticos para a vivncia
subjetiva individual em diferentes culturas (Osgood et al., 1957).
No mbito da semiologia e da Psicossociologia do conhecimento,
vale destacar o trabalho de Barthes, que, embora inicialmente preocupado
com o fenmeno simblico enquanto produo de histria (1972), dedicou-
se longamente ao estudo de estruturas transistricas, como seu livro sobre
o sistema da moda (1967). At certo ponto, algumas preocupaes conti-
das neste modelo de A.C. reaparecero posteriormente, tais como um maior
cuidado com as complexidades internas da vida simblica, bem como o
papel da singularidade discursiva.
A partir dos anos 60, comeam a surgir algumas tendncias de A.C.
que se caracterizam, de um lado, por uma maior sistemtica, no sentido de
buscar recortar o texto incluindo o contexto como condio de produo
simblica e, de outro lado, por uma maior abertura em relao ao reper-
trio, encarando-o no apenas em sua dimenso funcional ou estrutural,
mas enquanto expresso de uma subjetividade particular, situada social e
historicamente. Tal ser a postura adotada por Moscovici (1961/1976) em
seu trabalho sobre representaes sociais, e por Fishbein e Ajzen (1975),
sobre atitudes, crenas e comportamentos, apesar de algumas diferenas
de nfase entre ambas as teorias.
Como se sabe, os trabalhos acima referem-se a contribuies
realizadas segundo a perspectiva psicossocial. Considera-se, hoje, que,
apesar de existir enorme acmulo de informaes sobre a vida simblica
oriundas da Psicologia e da Sociologia e, particularmente, da Sociologia do
Conhecimento, tais abordagens terico-metodolgicas so insuficientes,
isoladamente, para a compreenso de fenmenos em questo (Souza
Filho, 1990). Da a necessidade de novos modos de trabalho, articulando
em modelos tericos mais de uma dimenso de condio de produo
simblica. No caso do modelo de Moscovici, a preocupao bsica saber
como diferentes grupos elaboram o conhecimento social informal. H,
portanto, dois eixos principais de trabalho: de um lado, trata-se de
considerar os critrios sociais e/ou grupais usados e, de outro lado, em
conexo com o primeiro eixo, os aspectos plsticos ou objetais emprega-
dos. Por critrios sociais, entende-se normas, ideologias, crenas e mitos
de ordem mais conceituais, que serviram de critrios de orientao para
pensar e simbolizar, e, por aspectos plsticos, de ordem mais imagstica
e concreta, aquelas dimenses do objeto selecionadas bem como a
organizao ou forma dada ao mesmo, podendo ser espacial, hierrquica
ou outra. O produto simblico final, a representao social, seria a
combinao dos dois eixos mencionados, podendo variar tanto quantos
grupos existem sobre a face da Terra. Da a necessidade de A.C. para a
observao de tal fenmeno, podendo, obviamente, ser seguida por
levantamentos que operacionalizem tais variveis simblicas e plsticas
em variveis numricas (Doise, 1992).
Na mesma tendncia de combinar as dimenses sociais e psicolgi-
cas, agora para entender as atitudes, crenas e comportamentos indivi-
duais, est o modelo de Fishbein e Ajzen, exposto em outra parte deste
livro. Para prever o comportamento de um indivduo ou grupo, os autores
em foco propem circunscrever, entre outros, 1) o objeto de atitudes e
crenas, 2) os personagens, reais ou imaginrios, que esto influenciando
a manuteno de crenas e atitudes e 3) a inteno de comportamento em
relao ao objeto. Tais objetivos faro com que, para cada estudo de
atitude e crena, se faa um instrumento especfico, exigindo, entre outras
coisas, o que se denomina levantamento de atitudes e crenas, que nada
mais que uma A.C. combinada s dimenses sociais, ainda que esses
autores no se refiram tcnica usada nestes termos.
Outras concepes de A.C. foram elaboradas, notadamente aquelas
correntes que se denominam como anlise de discurso. Entretanto, no
caberia no espao deste captulo apresent-las de modo mais exaustivo.
Uma peculiaridade comum a esses trabalhos, que, at certo ponto, difere
da A.C. mais corrente, a inteno de levar em conta muitas dimenses
do fenmeno simblico, forando a operar com unidades de anlise maiores
que a frase, s vezes prejudicando a operacionalizao e quantificao de
dados. Mesmo assim, Potter e Wetherell (1987) conseguiram incluir con-
texto social e cognitivo em seus estudos de discurso com bastante acurcia,
baseando-se em conhecimentos oriundos da Psicologia e Etnometodologia.
Outras abordagens, ainda, do grande nfase Lingstica, Sociologia ou
Histria, tais como as de Pcheux (1966) e Maingueneau (1987), entre
outros.

DIFERENTES ETAPAS DEA.C.

Em relao estratgia de observao que pretende analisar o


material simblico a partir do dado bruto ou anlise exploratria, ela
poderia ser organizada, segundo Bardin (1977/1992), em seis etapas
sucessivas: pr-anlise, codificao, categorizao, tratamento de dados,
inferncia e interpretao.
A pr-anlise refere-se quela fase em que o analista, diante de
uma certa problemtica psicolgica ou psicossocial, comea a intuir quais
seriam os possveis parmetros e/ou variveis importantes para a
existncia da mesma, passveis de serem observados a partir do dado
simblico manifesto. Trata-se de operacionalizar, de modo sistemtico, um
procedimento de anlise. Para tanto, preciso partir de algumas evidn-
cias preliminares que facilitaro a escolha do material a ser usado e a
formulao de hipteses ou objetivos de anlise. Como ilustrao, pode-
ramos pensar na situao de um profissional de Psicologia que se depara
com a "coincidncia" de que pessoas que tm dificuldade de expressar
hostilidade ou crtica em relao a figuras que representam autoridade ou
posio superior apresentam, igualmente, tendncia de manifestar agres-
so em relao a minorias. Uma possibilidade de anlise seria formar dois
grupos com nveis diferentes de hostilidade em relao a minorias e
submet-los a uma mesma lista de perguntas relativas a todas as suas
possveis experincias subjetivas com autoridades durante a infncia. O
passo seguinte seria encontrar formas ou indcios de experincias infantis
de ausncia de crtica e bloqueio de expresso de hostilidade em relao
a autoridades, assim como de agresso em relao a sujeitos minoritrios.
Um questionrio com perguntas abertas poderia ser preparado de modo
a obter tais ndices, como foi feito no estudo coordenado por Adorno (1950).
Em estudo que realizamos sobre a revista Sabrina (Souza Filho, no
prelo), partimos da idia de que ela exercia, principalmente para leitores
femininos, funo de realizao, no plano da fantasia, de desejos sexuais.
Para observarmos a revista de modo sistemtico, fizemos uma amostra-
gem a partir do conjunto de publicaes existentes at ento e comeamos
a analisar todas as descries relativas aos personagens principais, em
torno dos quais girava a trama das estrias. Em seguida, solicitamos a
grupos de sujeitos de sexo feminino e masculino que lessem as mesmas
publicaes previamente analisadas e pedimos que relatassem o contedo
da leitura, confirmando nossas expectativas.
Assim, uma vez definido o universo sobre o qual se vai trabalhar,
precisamos constituir uma amostra do material a ser analisado. Algumas
regras bsicas para a obteno do material so:
1) Exaustividade, segundo a qual todas as partes do mesmo devem
ser includas para evitar seletividade.
2) Representatividade, ou seja, a regra de levar em conta a distri-
buio de todas as respectivas partes constituidoras do universo em
relao ao qual se pretende generalizar. No exemplo citado, pretendamos
saber se a revista tinha apresentado alguma modificao no tratamento de
assuntos analisados ao longo do tempo, necessitando, portanto, de se
fazer um sorteio de publicaes entre cada perodo histrico de sua
existncia, o que permitiria, alm disso, diminuir a quantidade de material
a ser analisado, sem prejudicar a exaustividade e representatividade
pretendidas.
3) Homogeneidade, a exigncia de que a escolha do material
definida explicitamente, sem incluir heterogeneidades que no sejam
controlveis por meio de amostragem, tanto em termos de condio de
produo quanto do tipo de material ou populao.
4) Pertinncia, refere-se obrigatoriedade de que o material sobre
o qual se trabalha seja adequado para a verificao da hiptese ou
realizao do objetivo. Em ltima anlise, o grau de adequabilidade do
material dado pela possibilidade de que ele oferea boa conjugao
entre a "leitura" do mesmo por parte do analista e o contedo observvel,
revelando algo at ento imprevisto ou facilitando a obteno dos objetivos
pretendidos. Alguns acreditam mais na capacidade heurstica da prpria
teoria ou conceito, outros, mais no dado novo. No caso de A.C. explorat-
ria, h amplas possibilidades de descobertas, pois se descreve de modo
ordenado a partir de criao de categorias inicialmente "descritivas",
podendo tornar-se, posteriormente, elementos para a construo de um
novo conhecimento, de modo que o trabalho de escolha do material a ser
analisado muitas vezes acompanha a codificao e categorizao.
Em termos de codificao, a tarefa poderia ser resumida na escolha
do tipo de recorte ou unidade de registro do dado simblico, que inclui a
definio de categorias e a quantificao dos mesmos, se for o caso.
Os recortes mais usados em A.C. so o tema, em geral afirmaes
sobre um assunto feitas por meio de palavras, frases ou perodos inteiros,
os quais aparecem em um texto atravs de idias nucleares. Psiclogos
e psicossocilogos trabalham com o tema para fazer inferncias a respeito
de atitudes, crenas, representaes sociais, valores, ideologias, estados
emocionais, entre outros.
A palavra em seu aspecto formal, tais como verbo, substantivo,
advrbio ou adjetivo, pode ser outra unidade de registro usada para inferir
estados mentais ou epistemologia. O estudo de Osgood e Walker (1959)
sobre o estilo expressivo de cartas de suicidas mostrou que caractersticas
formais, como o grau de estereotipia (repetio, pobreza lexical), desorga-
nizao (erros, rupturas) e conflito (formas verbais complexas, ambivaln-
cia), estavam relacionadas ao estado motivacional do sujeito. Eles
compararam cartas de indivduos suicidas que realmente haviam tentado
se suicidar com as escritas por um grupo de sujeitos solicitados a imaginar
uma carta de despedida antes de se suicidarem.
O objeto ou referente pode ser, de modo geral, qualquer entidade,
humana ou no, imaginria ou real, sobre a qual construdo um texto a
ser analisado. Nesse sentido, no caso do estudo sobre atitudes, represen-
taes sociais, entre outros, importante recortar o texto em torno desses
elementos.
O prprio documento pode se tornar uma unidade de registro
quando ele tomado globalmente em relao a certa caracterstica sim-
blica. O estudo de Chombart de Lauwe (1979) sobre imagens da infncia
empregou tal procedimento.
Alm de unidades de registro, alguns analistas situam os contedos
em relao a unidades de contexto para seu melhor esclarecimento.
Assim, o contexto aqui pode ser qualquer aspecto do texto ou extra-texto
que participa indiretamente do processo ou fenmeno que se pretende
inferir. No caso de linguagem oral como a obtida em entrevista aberta, as
expresses faciais e corporais so cruciais para a total descodificao de
mensagem, conforme mostraram os trabalhos da escola de Palo Alto sobre
a comunicao paradoxal. Em termos de texto, o trabalho de Osgood
sobre contingncia entre contedos, j mencionado, usou como unidade
de contexto partes do texto total, tais como cada certo nmero de palavras,
dentro de cujos limites as regularidades simblicas so analisadas. No
estudo que realizamos sobre personagens de revista de romance, separa-
mos situaes onde cada personagem aparecia sozinho ou acompanhado
do parceiro.
Entre as formas de quantificao adotadas em A.C., as mais comuns
so: presena (ou ausncia) de um contedo em conjuntos ou partes de
um material e freqncia, que pode ser em termos absolutos ou pondera-
dos se o analista considera que os contedos no tm o mesmo valor.
Assim, como j dissemos, o raciocnio que sustenta o uso de freqncia
o de que quanto mais regular ou maior a quantidade de presena, maior
sua relao com determinada populao ou condio de produo. Con-
tudo, suponhamos que alguma pessoa seja mais prolixa que outra, explici-
tando em maior quantidade um certo smbolo ou contedo; nesse caso,
seria preciso encontrar um modo de ponderar esse resultado atribuindo-
lhe um peso menor.
Em termos verbais, algumas palavras e expresses comunicam
intensidade variada de contedo; assim, quando se pretende aferir
contedos associados por uma pessoa sua identidade psicossocial,
temos frases do tipo: 1) "sempre sou brasileiro"; 2) "s vezes me sinto
brasileiro"; e 3) "j esqueci meu passado no Brasil". Poderamos coligir
todos os estratos anteriores sob a denominao geral de formas de
expressar identidade nacional, contudo, assim perderamos a dimenso
intensidade que est explicitamente afirmada nas mesmas.
Outra forma de quantificar uma dimenso de contedo importante
a direo. J nos primeiros estudos sobre atitudes, esta dimenso
recebeu tratamento instrumental em termos de distinguir a orientao em
relao a objetos que tendemos a agir, pensar ou sentir de modo desfavo-
rvel, neutro ou favorvel. Vrios instrumentos de Psicologia em cujo
construto aparecem contedos subjetivos, como os de personalidade,
autoconceito, diferencial semntico, entre outros, trabalham com direes
bipolarizadas, utilizando escalas de vrios graus de intensidade. Assim, na
construo de instrumentos para medir intensidade, necessrio saber
quais so as formas de expressar os contedos opostos, mais facilmente
compreensveis nas respectivas populaes e culturas.
A ordem de apario de contedo pode constituir um elemento
informativo importante para a A.C. Por exemplo, no estudo do fluxo verbal
atravs de associao livre, parece que os primeiros termos associados
referem-se s dimenses partilhadas socialmente, tais como esteretipos,
que facilitam a comunicao, passando, paulatinamente, para aqueles
contedos mais pessoais. No estudo de D'Unrug (1974) a respeito da
seqncia na produo do discurso, ela chama a ateno para os ritmos,
progresses e rupturas de contedos para uma compreenso mais
completa de uma entrevista.
Ainda outra maneira de organizar quantitativamente a A.C. a
dimenso espao-tempo, que pode ser entendida como o modo de distri-
buio e de localizao dos contedos entre si dentro do texto. Ou seja, as
dimenses espao-tempo referem-se aos aspectos grficos e de lay-out
(tamanho, superfcie do texto, tipografia), bem como ao tempo que se
gasta para falar sobre um assunto, por exemplo. Outro modo de tratar a
dimenso espao j mencionada a co-ocorrncia dentro de contexto
delimitado de contedos, podendo ser associados ou dissociados, con-
forme o caso. Este tipo de anlise complementa as demais, uma vez que
a freqncia pode no revelar que em determinados momentos ou lugares
no se fala sobre um assunto ou de uma certa maneira.
Ao escolher uma estratgia de codificao e quantificao, o analista
delimita suas possibilidades de fazer inferncias, as quais podero se
basear, primordialmente, em seu aspecto lgico e/ou estatstico. Sabemos
que a maioria das estratgias de codificao e quantificao anteriormente
mencionadas referem-se a variveis dicotmicas ou, no mximo, hierr-
quicas, impedindo tratamento quantitativo mais sofisticado, como o usado
nos testes multivariados. Tal condio, ao invs de ser considerada uma
desvantagem para a A.C., deve ser entendida, por um lado, como um de-
safio e, por outro, como uma necessidade para o tratamento adequado do
dado simblico.
Em termos lgicos, a categorizao uma atividade de classificao
de conjuntos de elementos diferenciados segundo caractersticas simb-
licas intrnsecas ou extrnsecas, podendo ser definidas atravs de
analogias genricas, em aspectos mais concretos e mais abstratos.
Dependendo da condio de produo que o analista pretende focalizar
em sua A.C., ele usar uma dimenso ou conjunto delas. O valor da
categorizao reside precisamente na quantidade de informao que ela
capaz de dar conta a respeito de um fenmeno, mecanismo ou processo
existente. No se trata apenas de generalizar, mas tambm de oferecer
uma nova leitura da realidade com o mximo de objetividade possvel.
Para tanto, no existem receitas prontas, mas a necessidade de adotar
uma postura paradoxal, que inclua a modstia da observao meticulosa
do detalhe e a imaginao generalizadora dos conjuntos sintticos.
Enquanto conhecimento, a categorizao atividade rotineira de
qualquer ser humano; contudo, a categorizao em A.C. sistemtica se
caracteriza pela observao de algumas regras adotadas por vrios
especialistas:
1) A excluso mtua exigncia de que cada elemento do con-
junto analisado seja classificado a partir de categorias especficas,
impedindo a ambigidade e/ou superposio entre as dimenses da
realidade. Suponhamos que quisssemos saber as atitudes de brasileiros
a respeito de outros pases. Atravs de um questionrio com perguntas
abertas, poderamos classificar as respostas em termos de dimenso:
uma dimenso relacionada a esferas da vida ou temas; outra seria a
postura global do sujeito em relao a estas esferas, podendo ser favo-
rvel, desfavorvel ou indiferente. Assim, teramos duas dimenses sendo
analisadas a partir do mesmo material, constituindo sistemas categoriais
separados. De todo jeito, a excluso depende de outra regra que trata da
especificidade de cada sistema categorial.
2) A homogeneidade refere-se expectativa de que a categori-
zao parta de um sistema nico de definio e de dimenso da realidade.
Assim, os vrios elementos classificados devem ter uma relao entre si,
mesmo que seja por oposio ou complementao. Tal sistema deve,
nesse sentido, recobrir a totalidade de casos particulares existentes no conjunto
de material a ser observado, eliminando o mnimo possvel os dados
considerados impertinentes ou inclassificveis, comumente designados pelo
termo "outros". De modo que um sistema homogneo elegante deveria ser
capaz de, globalmente, incluir, sem prejuzo, todas as particularidades possveis
em um conjunto de dados, reunidos em funo de uma dimenso da realidade
de cada vez.
3) A pertinncia diz respeito exigncia de que a anlise empre-
endida, em termos de material descrito e categorias definidas, corresponda
problemtica de pesquisa e/ou de hipteses levantadas. Na atividade de
pesquisa ou no exerccio profissional, trata-se, em geral, de encontrar aqueles
ndices simblicos que esto associados ou relacionados realidade que se
pretende conhecer ou modificar. A pertinncia da categorizao avaliada a
partir da sua capacidade de solar aqueles elementos ou conjunto deles em face
de outros existentes que melhor explicam ou modificam os fenmenos e
processos em foco.
4) A objetividade regra segundo a qual a categorizao deve prover
aquelas informaes para a classificao do material suficientes para que outro
analista independente possa obter os mesmos resultados em pelo menos 70%
do material analisado. Contudo, para se garantir a objetividade, o princpio
bsico, em termos de procedimento, criar categorias operacionalizveis, ou
seja, passveis de serem observadas empricamente de modo manifesto.
Sabemos que tal critrio foi inicialmente proposto porcomportamentalistas e,
posteriormente, por cognitivistas, que tenderam, via de regra, a reduzir a vida
simblica esfera do comportamento ou ao processo mental individual ou
interindividual, preocupando-se mais com o tratamento de informaes. Alm
disso, a fragmentao de fenmenos mais complexos obedeceu tambm a
razes pragmticas, no sentido de medir com rapidez comportamentos para
atingir objetivos diversos. Contudo, no se pode negar que a objetividade um
dos critrios mais importantes, cabendo aos interessados em forjar um trabalho
de A.C. mais abrangente da vida humana e social elaborar categorias mais
vlidas de modo o mais objetivo possvel, desde que tal objetividade pretendida
no bloqueie a necessidade de dar conta da realidade. Nesse sentido, antes de
apresentarmos alguns exemplos de categorizao, gostaramos de enfatizar que
o uso de categorizao deve obedecer ao critrio de mincia a ser
complementado pela criao de tipologias e metassistemas categoriais, que
incluam aspectos descritivos mais isolados num nvel de abstrao mais
elevado e/ou que facilitem aformulao de uma teoria mais compreensvel que,
necessariamente, articule mais de uma dimenso da vida simblica. A ttulo de
exemplo, poderamos lembrar o trabalho de Piaget sobre o desenvolvimento
cognitivo, no qual ele soube descrever, atravs de ndices simblicos explcitos,
as caractersticas de cada estgio do mesmo, articulados num metassistema
nico, que foi, posteriormente,
testado com sucesso em vrias populaes do mundo. Se ele tivesse sim-
plesmente levantado partes isoladas do fenmeno que estudava, como
presena ou ausncia de imagens, smbolos e operaes em diferentes
fases do desenvolvimento humano, sua teoria no existiria.
Na tabela 12-1 apresentamos alguns sistemas categoriais obtidos
atravs de A.C., os quais foram selecionados em funo de utilizarem
alguns tipos de tratamento quantitativo.

Tabela 12-1 Temas sobre o morador de Braslia (porcentagens)


Temas Favorveis Neutros Desfavorveis
Pessoal 17,96 2,68 7,50
Interpessoal 7,23 - 19,22
Cultura/Educacional 3,75 2,94 13,67
Social/Trabalho 1,87 1,07 6,70
Outros 5,36 - -
Total 36,17 6,69 47,09

Na Tabela 12-1 temos os resultados de uma A.C. de representaes


sociais sobre o morador de Braslia, segundo moradores da mesma
cidade. Do ponto de vista da anlise categorial, foram criados temas para
organizar o material obtido atravs de entrevista aberta, assim como
atitudes veiculadas atravs de significados que os temas apresentavam.
Pode-se aplicar um teste de qui-quadrado ou de contingncia para
verificar a significancia das freqncias para os temas e atitudes. Note-se
a significativa concentrao do tema Interpessoal desfavorvel, consti-
tuindo-se objeto de pesquisas posteriores.
A Tabela 12-2, a seguir, mostra alguns resultados de um estudo de
A.C. para comparar, em termos de freqncia, as dimenses psicossociais
mais importantes para a difuso da AIDS entre vrios grupos sexuais.
Partimos da impresso de que homossexuais masculinos e heterossexuais
femininos poderiam ser afetados por uma concepo da interao afetivo-
sexual predominantemente heteronmica. Ou seja, estes grupos tenderiam
a levar mais em conta as demandas e opinies do parceiro do que as deles
mesmos. Para tanto, elaboramos um questionrio que continha perguntas
relativas ao uso do preservativo e a alguns aspectos considerados impor-
tantes na interao e aplicamos s respectivas populaes. Os resultados
da aplicao de teste Mann-Whitman nos permitiram confirmar a supo-
sio referida apenas para o grupo homossexual masculino estudado
(Souza Filho, 1992).
Tabela 12-2 Motivos para no usar preservativo
Motivo Local 1 Local 2 Masculino Feminino
Acha sem eficcia 0,61 0,36 0,42 0,31
Difcil aquisio 0,68 *0,27 0,28 0,28
Desnecessrio 0,88 *1,72 1,78 1,64
Diminui prazer 0,81 *1,52 2,03 *1,10
Por ser incmodo 0,91 1,37 1,75 1,10
Pedido do parceiro 1,10 0,64 0,53 0,75

* Diferenas significativas a p < 0,05.

Em estudo correlacionai (Souza Filho, 1988), partiu-se da suposio


de que estudantes universitrios brasileiros em pases desenvolvidos
tenderiam a apresentar alguns tipos principais de auto-representao, os
quais se organizariam em torno dos contedos simblicos seguintes:
identificao com o Brasil (Ml): "passei ater um sentimento de
nacionalidade", "continuo brasileiro";
identificao com o pas-anfitrio (M2): "sinto-me mais germ-
nico", "continuo admirando alguns dos seus valores (...)";
mudana acadmico-profisslonal (M3): "(adquiri) rapidez na
realizao de tarefas", "formao universitria mais slida", "conheci-
mento tcnico";
mudana de ordem geral (M4): "dividir tarefa com a mulher".
"viso ampliada do mundo";
mudana scio-profissional (M5): "desejo de realizar algum
trabalho social", "integr-lo na realidade e na histria da Amrica
Latina";
mudana individual (M6): "tornei-me mais frio", "mais esperto",
"autoconfiante".
Outros contedos relevantes para o mesmo estudo foram:
incerteza de reconhecimento no Brasil (Ia): "ainda no tenho
local de trabalho quando voltar ao Brasil", "terei que lutar muito para
impor minhas novas idias ao meu Departamento";
incerteza de reconhecimento no pas-anfitrio (lb): "h quatro
anos ouo o meu orientador dizer que o que eu fao ruim, sem
interesse, etc", "estou sendo tratado um pouco como pessoa inferior";
incerteza de validade de estudos no exterior (le): "tecnologia
inadequada s nossas condies", "vim para c para servir de mo-de-
obra (...)";
engajamento em melhorar a situao do Brasil como um todo
(E): "o que relevante pessoalmente pode no ser relevante para o
pas como um todo", "brasileiro ajudando o Brasil a procurar um
caminho prprio";
atitudes em relao ao pas-anfitrio (AP);
atitudes em relao ao Brasil (AB).

Tabela 12-3 Auto-representaes, incertezas e atitudes de estudantes


brasileiros em pases desenvolvidos (entre parnteses, a significancia)
Ml M2 M3 M4 MS M6 E
Ml

M6
o

Ia

Ib

le

AP

AB

Assim, o cruzamento de elementos de contedo permitiu que se


constatasse a existncia de uma tipologia ou maneiras de enfrentar e de
se orientar em face da problemtica de ser-brasileiro-estudante-em-pas-
desenvolvido, apesar de os quocentes de Pearson terem sido relativa-
mente baixos, podendo ser testada, posteriormente, atravs de outro
instrumento. Mesmo assim, a Tabela-3, acima, indica que a auto-repre-
sentao de identificao com o Brasil tendeu a estar associada
incerteza de validade de estudos no exterior e mudana scio-
profissional, enquanto esta, por sua vez, se associou atitude favorvel
em relao ao Brasil. J mudana acadmico-proflssional se associou
mais mudana individual e, esta ltima, incerteza de reconhecimen-
to no Brasil. Alm disso, identificao com o pas-anfitrio tendeu a se
associar incerteza de reconhecimento no pas-anfitrio, e esta, a
engajamento em melhorar a situao do Brasil.
Em termos de estratgia, diferentes descries e tratamentos de
dados ora apresentados indicam formas de fazer inferncia a partir de
A.C., as quais podem ser interpretadas de acordo com os objetivos e
hipteses do analista.

CONCLUSES E PERSPECTIVAS

O princpio geral que orienta o trabalho de A.C. a necessidade de


se dispor de tcnicas adequadas para lidar com o fenmeno simblico
humano, de modo sistemtico e objetivo. Diante de tal complexidade, que
fascina e causa perplexidade h longa data, a tendncia cientfica e
profissional geral foi, historicamente, operar por redues, trazendo um
progresso significativo para a Psicologia e disciplinas conexas. Contudo,
nota-se uma paulatina ampliao, ao longo do tempo, do nmero de
variveis e parmetros considerados importantes para o estudo do
simblico, bem como um crescente questionamento do modo de observar
os mesmos, podendo-se afirmar que o campo passou de uma fase
"psicolgica" para uma "psicossocial" e, hoje, continua procurando integrar
contribuies de campos limtrofes, tais como Lingstica e Sociologia,
entre outros. Apesar dessa crescente complexificao conceptual e
tecnolgica existente em A.C. nos dias atuais, permanece vivo entre os
que a praticam o interesse pelo dado simblico natural, aliado aos novos
desafios profissionais que emergem continuamente nos diversos contextos
scio-culturais humanos, obrigando aperfeioamentos do mtodo e
respectivas concepes de trabalho. Nesse sentido, a grande contribuio
da A