Escolar Documentos
Profissional Documentos
Cultura Documentos
EM CINCIAS DO COMPORTAMENTO
SECRETARIA DE AVALIAO E INFORMAO EDUCACIONAL
Secretria
Maria Helena Guimares de Castro
Diretor-Geral
Og Roberto Dria
Pasquali, Luiz.
Teoria e mtodos de medida em cincias do comportamento /
organizado por Luiz Pasquali. Braslia: Laboratrio de Pesquisa em
Avaliao e Medida / Instituto de Psicologia / UnB: INEP, 1996.
432p.
CDU : 159.9.019.43
TEORIA E MTODOS DE MEDIDA
EM CINCIAS DO COMPORTAMENTO
LUIZ PASQUALI
(Organizador)
TEORIA E MTODOS DE MEDIDA EM CINCIAS DO COMPORTAMENTO
Edio financiada pelo Instituto Nacional de Estudos e Pesquisas Educacionais
Editorao eletrnica
Antonio Bezerra Filho
Francisco Edilson de Carvalho Silva
Reviso de texto
Antonio Bezerra Filho Jos
Adelmo Guimares
Capa
Accio Valerio da Silva Reis
Nenhum captulo deste livro poder ser reproduzido, por qualquer processo,
sem autorizao expressa do autor respectivo.
Impresso no Brasil
AGRADECIMENTOS
O Organizador
SUMRIO
PREFCIO .................................................................................... 11
APRESENTAO ........................................................................ 13
OS AUTORES: PERFIL ACADMICO PROFISSIONAL ................ 15
Desde o incio dos anos 90, o INEP tem sido um dos principais atores
da implementao do Sistema de Avaliao de Ensino Bsico (SAEB).
Responsvel pela avaliao do desempenho do sistema educacional, o
SAEB atua em trs eixos: rendimento do aluno, perfil e prtica docente e
gesto do ensino. A disseminao dos resultados obtidos com os trs ciclos
de aplicao do SAEB indica que o sistema vem se constituindo um marco
importante na construo de uma cultura de avaliao j presente nas
redes de ensino estaduais e municipais. Indica tambm que o SAEB vem
cumprindo seu papel enquanto instrumento de suporte a formulao de
estratgias e polticas educacionais que buscam elevar a qualidade e
eqidade da educao brasileira.
Luiz Pasquali
OS AUTORES: PERFIL ACADMICO-PROFISSIONAL
Eleonora Vivas
Mestre e doutora (M.Phil. e Ph.D.) em Psicologia pela Universidade
de Londres. Professora de ps-graduaco em Psicologia da Universidad
Simon Bolvar, em Caracas, Venezuela. Trabalha nas reas de avaliao
comportamental, teoria e fundamentos do enfoque cognitivo-comporta-
mental. Pesquisadora na rea da motivao e preveno de problemas de
linguagem e leitura psicologia da sade.
Hartmut Gnther
Nascido na Alemanha, estudou na Universitt Hamburg e na
Universitt Marburg. Graduou-se em Psicologia pelo Albion College, em
Michigan, EUA. Tendo realizado o mestrado em Psicologia Experimental
na Western Michigan University e o doutorado em Psicologia Social na
University of California at Davis, atualmente pesquisador e professor
titular da Universidade de Braslia (UnB). Tem vrios artigos publicados,
tanto no Brasil como no exterior.
Jorge de Souza
Bacharel em Cincias Estatsticas pela Escola Nacional de Cincias
Estatsticas, mestre em Cincias da Engenharia de Produo e doutor em
Estatstica pela Universidade Federal do Rio de Janeiro (UFRJ).
professor titular da Universidade de Braslia (UnB), com vrios trabalhos
publicados na rea de Estatstica, estando atualmente, como professor
visitante, no Departamento de Economia da Universidade Federal de
Pernambuco (UFPE). [Fax (081) 271-8360]
Luiz Pasquali
Licenciado em Filosofia, Teologia, Pedagogia e Psicologia. Mestre
e doutor em Psicologia pela Universit Catholique de Louvain, Blgica
(1970). professor titular da Universidade de Braslia (UnB), onde
responsvel pelas disciplinas de Psicometria (Uso dos Testes), Mtodos
e Medidas em Psicologia e Anlise Fatorial em Psicologia (Ps-Gradua-
o), coordenando tambm o Curso de Especializao em Avaliao e
Medida da UnB. coordenador do Laboratrio de Pesquisa em Avaliao
e Medida do Instituto de Psicologia da Universidade de Braslia. Tem cerca
de 40 trabalhos sobre instrumental psicolgico.
Maria Alice Magalhes D'Amorim
Licenciada em Filosofia e em Psicologia pela Pontifcia Universidade
Catlica do Rio de Janeiro (PUC-RJ), tendo completado sua formao em
Psicologia Aplicada na Universidade de Louvain, Blgica. Mestre pela State
University of lowa, EUA, fez o doutorado em Psicologia na Universidade de
Louvain, ps-doutorado em Administrao de Programas de Sade Mental
na University of North Carolina, EUA, e na Unidade de Psicologia do
Trabalho e das Organizaes da Universidade de Louvain Louvain-la-
Neuve, Blgica. Lecionou na Pontifcia Universidade Catlica do Rio de
Janeiro (PUC-RJ), na Universidade de Qubec em Trois Rivires, Canad,
na Universidade Federal da Paraba (UFPB), na Universidade de Braslia
(UnB) e na Universidade Federal do Rio Grande so Sul (UFRGS);
encontra-se atualmente na Universidade Gama Filho, na cidade do Rio de
Janeiro.
A TEORIA DA MEDIDA
Luiz Pasquali
Instituto de Psicologia
Universidade de Brasilia
A
medida em cincias do comportamento, notadamente na Psicolo-
gia, deveria ser chamada puramente de psicometria, similarmente
ao que ocorre em cincias afins a ela, onde se fala de sociometria,
econometria, politicometria, etc. Psicometria, contudo, tem sido abusiva-
mente utilizada dentro de um contexto muito restrito, referindo-se atestes
psicolgicos e escalas psicomtricas. De qualquer forma, a psicometria
ou medida em Psicologia se insere dentro da teoria da medida em geral
que, por sua vez, desenvolve uma discusso epistemolgica em torno da
utilizao do smbolo matemtico (o nmero) no estudo cientfico dos
fenmenos naturais. Trata-se, portanto, de uma sobreposio, ou melhor,
de uma interface entre sistemas tericos de saber diferentes, tendo a
teoria da medida a funo de justificar e explicar o sentido que tal
interface possui.
CINCIA E MATEMTICA
A NATUREZA DA MEDIDA
O problema do erro
A observao dos fenmenos empricos sempre sujeita a erros
devidos tanto ao instrumental de observao (os sentidos e suas
extenses atravs de instrumentos tecnolgicos) quanto a diferenas
individuais do observador, alm de erros aleatrios, sem causas
identificveis. Assim, tipicamente toda e qualquer medida vem acompa-
nhada de erros e, por conseqncia, o nmero que descreve um
fenmeno emprico deve vir acompanhado de algum indicador do erro
provvel, o qual ser analisado dentro de teorias estatsticas para
determinar se o valor encontrado e que descreve o atributo emprico est
dentro dos limites de aceitabilidade de medida.
Axiomas da medida
Como a medida consiste na atribuio de nmeros s propriedades
das coisas segundo certas regras, ela deve garantir que as operaes
empricas salvem os axiomas dos nmeros. A medida que salva todos
esses axiomas a mais sofisticada possvel e, por isso, rara (escala de
razo). A maioria das medidas, ao menos em cincias do comportamento,
se do por satisfeitas se puderem salvar, pelo menos, os axiomas de
ordem. Se somente os axiomas de identidade forem salvos (escala
nominal), a operao propriamente no chega a ser medida, mas trata-se
apenas de classificao, pois a nica caracterstica do nmero salva a
sua identidade; isto , o nmero utilizado para uma operao emprica
deve ser diferente do de uma outra operao. Para tanto, alis, o nmero
utilizado to-smente como numeral, a saber, um rabisco diferente de
outro, que poderia ser substitudo por qualquer outro sinal ou rabisco
(desde que diferentes entre si) sem a menor conseqncia para a medida.
O nmero, neste caso, serve apenas de etiqueta de uma classe de coisas.
A medida realmente acontece quando se salvam, pelo menos, os axiomas
de ordem dos nmeros. Ento, fica a pergunta: possvel se demonstrar
a existncia de ordem de magnitude nos atributos das coisas? Isto , as
coisas tm dimenses, entendidas estas como atributos mensurveis,
propriedades empricas possuidoras de magnitude? Como resposta a esta
questo poder-se-ia simplesmente assumir que sim: os atributos
empricos tm magnitude, como o senso comum nos parece dizer quoti-
dianamente quando fala de 'mais do que', 'maior que' e expresses
similares. Contudo, esta no parece ser uma base muito segura para
fundamentar uma teoria da medida. preciso, ento, demonstrar empi-
ricamente que tal ocorrncia existe na realidade das coisas. Nas cincias
fsicas esta questo parece resolvida, mas nas cincias sociais e do com-
portamento ela ainda suscita acirradas controvrsias. Segue uma tentativa
de demonstrao experimental de axiomas da medida.
Formas de medida
H diferentes maneiras (formas) de se atribuir nmeros s proprie-
dades dos objetos. Uma das taxonomas mais teis consiste em distinguir
trs formas diferentes de mensurao: medida fundamental, medida
derivada e medida por teoria (esta chamada de medida by fiat por
Campbell, 1928, 1938). Pode-se igualmente falar em medida direta e
medida indireta; e h outras ainda. A primeira, contudo, parece mais
esclarecedora.
Medida fundamental
a medida de atributos para os quais, alm de se poder estabelecer
uma unidade-base natural especfica, existe uma representao extensiva.
So dimenses (atributos mensurveis) que permitem a concatenao, isto
, dois objetos podem ser associados, concatenados, formando um terceiro
objeto de mesma natureza. Tal situao ocorre com os atributos de massa,
comprimento e durao temporal. Estes atributos permitem uma medida
direta e fundamental, dado que o instrumento utilizado para medi-los
possui a mesma qualidade que se quer medir neles. Assim, ao se medir o
comprimento de um objeto, utiliza-se um instrumento composto de
unidades de comprimento. A medida dele ser dada pela coincidncia de pontos
entre o comprimento do objeto e a unidade de comprimento marcada no
instrumento, por exemplo o metro.
Mesmo podendo ser possvel conceitualmente se proceder a uma
medida fundamental nos casos mencionados, nem sempre isto empiricamente
factvel. Por exemplo, como se faria uma medida fundamental de distncias
astronmicas ou subatmicas? Ou como se poderia medir fundamentalmente a
massa de uma galxia? Nestes casos e semelhantes preciso recorrer a outras
estratgias de medida, como a medida derivada.
Medida derivada
Unidades de medida
Normalmente existe interdependncia entre os fenmenos, de sorte
que, ao se variar um deles, o outro covaria com ele. Esta covariancia pode
ser expressa por alguma constante. Estas constantes podem ser univer-
sais, como o caso da gravitao universal que covaria com as gravitaes
locais de um sistema menor, por exemplo, a da massa, chamada inclusive
de constante universal de gravitao. Outras constantes pertencem a
algum sistema especfico (constantes do sistema ou locais), como a
constante entre massa e volume em Fsica ou as constantes da lei do
reforo em Psicologia. Evidentemente, a descrio de tais constantes pode
constituir uma medida indireta.
Alm de constantes que relacionam dois ou mais atributos, os
prprios atributos variam por conta prpria, assumindo diferentes
magnitudes, isto , eles so dimenses, entendendo por isso que eles
podem variar de magnitude e, portanto, podem ser mensurveis. Neste
caso, seria extremamente til se houvesse, para cada atributo diferente,
uma unidade bsica com a qual se pudesse determinar a magnitude do
mesmo. De fato, qualquer unidade que se queira definir serve aos pro-
psitos da medida, bastando haver consenso sobre a mesma. Mas fcil
ver as vantagens de se estabelecerem unidades-base aceitveis para
todos. Nas cincias fsicas, este esforo tem sido constante. O critrio que
tem guiado os fsicos na procura destas unidades-base foi a busca de um
fenmeno natural de estabilidade mxima que pudesse servir como padro
fsico da unidade-base para o sistema. A histria da procura destas uni-
dades tem lances de Babel, pois cada regio do mundo tinha seus sis-
temas de medida, incomensurveis com os de outras regies. H cerca de
200 anos, contudo, uma procura mais sistemtica e mais entrosada em
nvel mundial tem sido desenvolvida at que culminasse no Systme
International des Units (abreviado SI), definido na 11th General Conferen-
ce on Weights and Measures (Paris, 1960), onde foram estabelecidas seis
unidades-base ou primrias para os fenmenos fsicos, sendo todas as
restantes medidas derivadas destas seis primrias (Klein, 1974; Luce,
Suppes, 1986). A Tabela 1-2, na pgina seguinte, sintetiza estas unidades-
base consensuais, inclusive o mol, unidade posteriormente acrescida.
A grande maioria das outras unidades em Fsica so unidades
derivadas destas seis unidades-base. Por exemplo, densidade igual a
peso por volume (kg/m3), velocidade a metros por segundos (m/s), lumi-
nncia a intensidade da luz por rea que expressa em termos de
distncia (cd/m2), volt watts por ampre (V=W/A), watt joule por
segundo (W=J/s), joule newton vezes comprimento (J = N.m), newton
peso vezes distncia por tempo (N=kg'm/s2), etc.
A procura de unidades similares em cincias sociais e do comporta-
mento algo ainda precrio, exceto onde medidas fundamentais forem
possveis, como talvez em psicofisica (medida dos estmulos) e na anlise
experimental do comportamento (medidas de estmulos e freqncia de
respostas).
Em que consiste uma medida por lei? Mede-se por lei quando se
quer demonstrar empiricamente que dois ou mais atributos estruturalmente
diferentes mantm entre si relaes sistemticas. Duas condies so
expressas nesta concepo: 1) os atributos sao de natureza diferente, um
no redutvel ao outro por exemplo, a cor e a distncia so dois
atributos distintos dos fenmenos fsicos no caso do desvio para o
vermelho das linhas espectrais dos objetos na medida de distncias, do
mesmo modo que a resposta e o estmulo so dois atributos diferentes no
caso da medida psicofisica e da anlise experimental do comportamento;
2) uma relao sistemtica foi demonstrada cientificamente (empiricamen-
te) existir entre estes atributos. Assim, as manipulaes efetuadas num
atributo repercutem sistematicamente no outro, donde possvel estabele-
cer uma funo de covariancia entre os dois, uma lei.
Medida por teoria
Uma teoria no uma lei, dado que ela composta de axiomas ou
postulados e nao de fatos empricos. Ademais, ela cientfica se de seus
axiomas possvel deduzir hipteses empiricamente testveis. O caso da
medida por teoria ocorre tambm em Fsica, como ficou dito acima. No
caso das cincias sociais e do comportamento, ela mais facilmente dis-
cernvel quando se trabalha com variveis hipotticas, isto , nas teorias
da estrutura latente ou da modelagem latente (latent modeling).
Nesta concepo, a teoria versa sobre processos mentais (estrutu-
ras psicolgicas hipotticas), conceitualizando sua estrutura e sua din-
mica, e define o conjunto de comportamentos que os expressa. Assim,
uma teoria da inteligncia trata dos processos cognitivos, sua estrutura,
sua gnese, seu desenvolvimento, seus processos operativos, etc, bem
como dos comportamentos tpicos em que ela se expressa, tais como
resolver problemas numricos, problemas espaciais, problemas com
palavras, etc. E no nvel dos comportamentos que se faz a medida. De
sorte que, ao se medir por teoria neste caso, consiste em dizer que ao se
proceder a medida de um atributo emprico (o comportamento) est-se de
fato medindo a estrutura psicolgica latente, isto , um outro atributo e de
outra natureza (um atributo hipottico). A funo da teoria fundamental-
mente garantir a legitimidade de tal operao; trata-se, portanto, de um
problema de representao: a operao emprica de medir o comporta-
mento representa a medida da estrutura latente. Legitimar tal represen-
tao a funo da teoria psicomtrica (a questo da validade psicomtri-
ca da medida).
Na verdade, pode-se ver trs grandes linhas da teoria da medida
por teoria: a teoria da deteco do sinal em psicofisica, a teoria dos jogos
em Psicologia Social e a teoria das escalas e testes (a psicometria, num
sentido mais restrito). O fato de trabalharem com construios hipotticos
(processos cognitivos, preferncias, utilidade, etc.) seria o elo entre estes
tipos de teorias, bem como a procura de formas de medida desses mes-
mos construios.
A teoria da deteco do sinal trabalha com dois parmetros: relao
sinal-rudo ('d') e a disposio do sujeito ('beta'). O primeiro parmetro
define o grau de detectabilidade do sinal contra um fundo de rudo, e o
'beta' define o nvel de vontade ou disposio que o sujeito tem de ver o
sinal quando ele est presente.
A teoria dos jogos trabalha com o conceito de utilidade, introduzido
pela cincia econmica. Esta varivel representa a preferncia do sujeito
na escolha de uma alternativa de ao dentre duas ou vrias. A teoria dos
jogos determina as probabilidades de ganhos e perdas associadas com a
escolha de cada alternativa, bem corno permite verificar o nvel de prefe-
rncia do sujeito com relao a cada alternativa, possibilitando, assim, uma
ordenao destas alternativas em termos de preferncia.
NAO-NATURAL NATURAL
NAO-IGUAL ORDINAL ORDINAL
Conceito de erro
Tipos de erro
Erros de observao
Erros de amostragem
Como a pesquisa emprica normalmente no pode ser feita sobre
todos os membros de uma populao de eventos ou objetos, tipicamente
se seleciona uma amostra destes eventos ou objetos. Esta escolha de
indivduos no meio de uma populao sujeita a desvios, vieses, isto ,
erros. O problema no so os erros em si, se o interesse fosse tirar con-
cluses sobre a amostra selecionada. Acontece, porm, que o interesse do
pesquisador tirar concluses ou fazer inferncias sobre toda a populao
da qual a amostra foi retirada. Neste caso, o erro de amostragem desas-
troso, uma vez que poderia ocasionar inferncias errneas, dada a
presena de vieses da amostra com respeito a esta populao (falta de
representatividade). Para solucionaros problemas advindos da seleo da
amostra, foi desenvolvida a teoria estatstica da amostragem.
A teoria do erro
Dado que o erro est sempre presente em qualquer medida e que
sua presena constitui uma ameaa sria tomada de decises cientficas,
de capital importncia que haja meios de neutralizar ou diminuir os seus
efeitos ou, pelo menos, de conhecer sua grandeza, o mais aproximado
possvel, para saber o tamanho do risco em que se est incorrendo ao
tomar decises baseadas na medida. Todos os esforos para controlar o
erro atravs de procedimentos experimentais so necessrios, mas nem por
isso o erro vai desaparecer, visto que a sua ocorrncia imprevisvel, isto
, no nunca possvel se determinar as causas de todos os erros pos-
sveis numa medida. Para enfrentar esta situao foi desenvolvida a teoria
do erro, baseada na teoria da probabilidade e dos eventos casualides.
Um evento casualide ou aleatrio definido por Popper (1974,
p. 190): "Uma seqncia-evento ou seqncia-propriedade, especialmente
uma alternativa, se diz 'casualide' ou 'aleatria' se e somente se os
limites das freqncias de suas propriedades primrias forem 'absoluta-
mente livres', isto , indiferentes a qualquer seleo que se apoie nas
propriedades de qualquer nupla de predecessores". Em palavras mais
simples, um evento emprico aleatrio se sua ocorrncia no pode ser
predita a partir dos eventos que ocorreram antes dele, isto , ele
totalmente independente (livre) com relao ao que aconteceu antes.
Imagine o jogo de lanar uma moeda para obter cara ou coroa ou o de um
dado: qualquer que tenha sido o resultado nos lanamentos anteriores do
dado, o resultado (um entre os seis possveis) do prximo lanamento
totalmente imprevisvel isto liberdade absoluta.
O erro na medida considerado um evento aleatrio, pela teoria do
erro. Feita esta suposio, ento possvel tratar o erro dentro da teoria
da probabilidade, do teorema de Bernoulli, que baseia a lei dos grandes
nmeros e da curva normal, que determina a probabilidade de ocorrncia
dos vrios elementos da srie, no nosso caso, da srie aleatria composta
dos vrios tamanhos de erros cometidos na medida.
A curva normal define que uma seqncia aleatria de eventos
empricos se distribui normalmente em tomo de um ponto modal (mdia)
igual a 0 e uma varincia igual a 1. Este valor modal, no caso de uma
distribuio de erros, significa que estes se cancelam no final, dado que
este valor (0) o que possui a maior probabilidade na distribuio.
Contudo, isto absolutamente verdadeiro somente na distribuio de uma
srie aleatria de um nmero infinito de eventos, segundo o teorema de
Bernoulli. Este teorema, na verdade, afirma que um segmento 'x' de
elementos de uma srie aleatria infinita 'A' (isto , com liberdade
absoluta) que se aproxima da srie total (x->A) possui os mesmos
parmetros desta srie. Isto significa que, quanto maior o segmento, mais
prximo est dos parmetros da srie ou, em outras palavras, quanto
maior o segmento, menor o desvio dos parmetros dele dos da srie. Diz
Popper (1974, p.198): "Assim, o teorema de Bernoulli assevera que os
segmentos mais curtos de seqncias casualides mostram, muitas vezes,
grandes flutuaes, enquanto que os segmentos longos sempre se
comportam de modo que sugerem constncia ou convergncia; diz o
teorema, em suma, que encontramos desordem e aleatoriedade no
pequeno, ordem e constncia no grande. a este comportamento que se
refere a expresso 'lei dos grandes nmeros".
Na prtica da pesquisa, contudo, o erro da medida expresso pelo
erro padro da medida, que o valor mdio da varincia, isto ,
IMPORTNCIA DA MEDIDA
Preciso
CONCLUSO
REFERNCIAS BIBLIOGRFICAS
STEVENS, S.S. Mathematics, measurement and psychophysics. In: STEVENS, S.S. (Ed.).
Handbook of experimental psychology. New York: Wiley, 1951. p.1-49.
SUPPES, P., ZINNES, J.L. Basic measurement theory. In: LUCE, R.D., BUSH, R.R.,GALANTER,
E.G. (Eds.). Handbook of mathematical psychology. New York: Wiley, 1963. v.l, p.1-76.
CAPTULO 2
I
nformalmente, a psicofisica nasceu em aproximadamente 130 A.C., na
Astronomia, nas mos de Hiparco, com o desenvolvimento de uma
escala para quantificao de magnitude estelar; formalmente, com a
publicao do Elemente der Psychophysik, por Gustav Theodor Fechner,
em 1860, como uma proposta metodolgica para o estudo experimental
da alma. Este evento foi precedido por alguns outros eventos relevantes
que merecem meno. Daniel Bernoulli props, em 1738, que as pessoas
no agem com base no valor real do dinheiro, mas em uma transformao
psicolgica do seu valor real. Bernoulli props que a utilidade do dinheiro
aumenta como uma funo logartmica da quantidade do dinheiro. Em
1824, o matemtico Herbart props o conceito de limiar, ao afirmar que
eventos mentais precisam ter uma certa fora para serem conscientemente
experimentados. Herbart props ainda o uso de pressupostos e conceitos
matemticos para lidar com conceitos psicolgicos. Weber (1834-1846),
pesquisando sobre somatossentidos, observou que pesos grandes levan-
tados precisam diferir mais do que pesos pequenos para serem percebidos
como diferentes, levando formulao de que a diferena apenas per-
ceptvel (DAP) uma razo do peso levantado, criando as condies para
que Fechner enunciasse a lei que mais tarde veio a ter o nome de Weber.
Em torno de 1850, os astrnomos J. Herschel, W.R. Dawes e N.R. Pogson
formularam, independentemente de Fechner, a lei psicofisica bsica de
Fechner, no contexto de desenvolver a escala de magnitude estelar
originalmente concebida por Hiparco. Na dcada de 1850, o fsico J.A.F.
Plateau inventou o mtodo de bisseco, no qual o observador, dados dois
valores de estmulo, tinha que produzir um terceiro que parecesse ocupar
a metade do intervalo entre os estmulos padro. Especificamente, Plateau
* A preparao deste capitulo foi parcialmente financiada pelo CNPq, atravs do Auxlio
Integrado 50.0493/91-0. A autora agradece a Luiz Pasquali, Miosotis Lcio e Rosana Maria
Tristo Taveira, pela leitura crtica de verso preliminar e pelas vrias sugestes
oferecidas. Miosotis Lcio tambm colaborou no levantamento da bibliografia.
solicitou a artistas que, a partir de tintas branca e preta, produzissem um
cinza que parecesse estar equidistante do branco e do preto.
A publicao do Elemente der Psychophysik teve impacto na
comunidade cientfica europia e foi decisiva para o estabelecimento da
prpria Psicologia como disciplina cientfica. O estabelecimento e o pro-
gresso da psicofisica no foi, entretanto, ausente de percalos. A Univer-
sidade de Cambridge, na Inglaterra, recusou permisso para o estabe-
lecimento de um laboratrio de psicofisica porque isto "seria insultar a
religio por colocar a alma humana em um par de escalas", uma reao
que lembra a que sofreu Charles Darwin com o enunciado da teoria da
evoluo das espcies. Nos Estados Unidos, William James deixou publi-
camente claro seu desprezo pelo trabalho de Fechner, o que contribuiu
para a pouca participao dos laboratrios americanos de Psicologia
Experimental na consolidao da psicofisica (Adler, 1980; Boring, 1957).
A psicofisica criada por Fechner e os desdobramentos sob sua
influncia terica e metodolgica so referidos na literatura como psico-
fisica fechneriana ou clssica. Fechner tinha um interesse especial pela
questo mente-corpo, e sua proposta psicofisica bsica, R=f(S), tem
embutidos o pressuposto de identidade psicofisica e o de que as pessoas
no tm acesso direto s sensaes, as quais deveriam ser medidas indi-
retamente atravs de sucessivos limiares diferenciais. Mais especifica-
mente, ele pressupunha que a diferena apenas perceptvel (DAP) a
unidade de sensao, que diferentes DAPs correspondem a uma mesma
sensao e que as DAPs podem se somar para constituir uma escala. O
investimento de Fechner no estudo das sensaes no deve ser interpre-
tado como refletindo sua posio sobre o objeto principal do desenvolvi-
mento da psicofisica, mas como refletindo o fato de que Fechner viveu em
uma poca em que eram influentes filsofos associacionistas empiricistas
que defendiam que todo o conhecimento e as idias se devem, em ltima
instncia, a experincias sensoriais com o mundo externo. No surpreende,
portanto, que tendo Fechner um profundo interesse pela Filosofia, esco-
lhesse as sensaes como o ponto de partida de seu extenso "programa"
psicofisico, o qual inclua o estudo da memria e do pensamento.
46
A lei de Weber tem sido testada para vrios tipos de estmulos,
mostrando-se aplicvel em um conjunto grande de situaes. Com seu
uso podemos fazer afirmaes gerais importantes, como, por exemplo,
acerca da comparao entre espcies quanto discriminabilidade de
estmulos em uma dada modalidade sensorial, discriminabilidade relativa
dos vrios sistemas sensoriais para um mesmo tipo de estmulo em uma
dada espcie. A lei tem uma limitao igualmente bem documentada, que
a sua no aplicabilidade para estmulos de magnitude muito pequena. Os
dados tipicamente mostram que quando os estmulos tm magnitude muito
pequena, c relativamente grande e tende a diminuir com o aumento na
magnitude do estmulo at atingir um valor a partir do qual passa-se a
verificar a constncia expressa na lei. Em algumas condies especficas,
a constncia tambm no se verifica para valores muito elevados de
estmulo.
Lei de Fechner
Baseado nos pressupostos de que a diferena apenas perceptvel
(DAP) a unidade de sensao e que diferentes DAPs correspondem a
um mesmo incremento psicolgico em magnitude sensorial, Fechner
props constituir uma escala de magnitude sensorial somando DAPs a
partir do limiar absoluto. Fechner pressups tambm a validade da lei de
Weber e, a partir dela, derivou a frmula que ficou conhecida como a lei de
Fechner, abaixo representada:
Lei de Stevens
Stevens, em contraposio direta a Fechner, props na dcada de
50 que a razes iguais de estmulo correspondem razes iguais de sen-
saes. Descrita matematicamente, esta relao pode ser reproduzida por:
Fig. 2-2 Representao estilizada dos mesmos dados da Fig. 2-1, loga-
ritmicamente transformados. Observe-se que as trs funes so retas,
que a curva de acelerao positiva se transformou em uma reta de inclina-
o maior que 1 e que a curva de acelerao negativa se transformou em
uma reta de inclinao menor que 1. (Adaptado de Stevens, 1975, p.17)
PSICOFISICA CLASSICA
PSICOFSICA MODERNA
DETECO DE SINAL
Procedimento sim-no
O experimento organizado em tentativas de dois tipos. Em algu-
mas tentativas o sinal apresentado (mais rigorosamente, tentativas
contendo sinal e rudo) e em outras tentativas o sinal no apresentado
(mais rigorosamente, tentativas contendo apenas rudo). O observador
informado da matriz de pagamento (ou, em linguagem coloquial, do que tem
a ganhar e perder com acertos e erros, respectivamente). Sua tarefa sim-
plesmente julgar, atravs de uma resposta simples do tipo sim/no, se um
sinal est ou no presente na tentativa Em cada sesso experimental vigora
uma condio de matriz de pagamento e de probabilidade sinal/rudo.
Poder traar uma curva de isossensibilidade exige que o experimento
inclua vrias condies de probabilidade sinal/rudo, o que muitas vezes
no feito, pois isto exige vrias sesses experimentais e um nmero
muito grande de tentativas. Nestas circunstncias no existem condies
de se testar os pressupostos de distribuio normal e varincias iguais,
tendo-se que usar um tratamento estatstico que dispense a verificao
destes pressupostos.
PSICOFSICA ANIMAL
Aspectos motivacionais
A impossibilidade de usar instrues verbais, muito ao gosto dos
estudiosos da psicofisica humana, leva ao uso de regras de contingncia.
O estabelecimento destas regras no trivial. Tomemos, por exemplo, o
caso de especificao de limiar absoluto. Se razovel que uma resposta
de deteco na ausncia de estmulo seja considerada uma resposta
errada e, portanto, deva no ser reforada ou at mesmo punida, no
razovel planejar que a ausncia de resposta na presena de um estmulo
fraco seja considerada erro, pois uma incgnita a magnitude de estmulo
necessria para que ele seja estmulo efetivo. O uso de reforamento
positivo, ao mesmo tempo que eficaz em manter o animal engajado na
tarefa, impe limites ao nmero de tentativas contidas em uma sesso
experimental, em virtude de saciao do reforador, o que leva ao cuidado
de que o procedimento otimize a razo tentativas teis/tentativas totais.
Resposta de observao
A baixa varincia dos dados psicofsicos depende de que o animal
esteja atento ao estmulo sensorial e adequadamente posicionado, de
modo que o estmulo entre em contato com o rgo receptor de forma
especificvel e constante. Tipicamente uma tentativa iniciada com a
apresentao de um estmulo que sinaliza a ocasio para a emisso de
uma resposta de observao. Isto significa, por exemplo, no caso de
estmulos visuais, que o procedimento seja tal que o estmulo sensorial s
ser apresentado se o animal estiver com a cabea posicionada de uma
maneira determinada, para assegurar que os olhos estejam a uma
distncia e orientao especificadas em relao ao estmulo. Em um
procedimento tpico, a emisso de uma resposta de orientao condio
para que se inicie o intervalo que pode ou no conter o estmulo sensorial.
A correta emisso da resposta de observao reforada com um
estmulo arbitrrio que tambm exerce a funo de sinalizar o incio de um
intervalo de apresentao de estmulo. A topografia desta resposta
depende de variveis prprias do experimento, como a espcie animal, a
modalidade e a dimenso de estmulo em estudo.
Controle de estmulo da resposta de deteco
O procedimento precisa incluir salvaguardas para que no existam
outras variveis, alm do prprio estmulo sensorial em estudo, exercendo
o papel de sinalizadores para a ocorrncia da resposta de deteco. A
prpria existncia de uma sinalizao para a ocorrncia do estmulo sen-
sorial pode propiciar a ocorrncia de respostas indevidas de deteco. Um
animal pode estimar o intervalo de tempo entre eventos relevantes e con-
venientemente espaar suas respostas de forma a maximizar a obteno
de reforos. Embora esta afirmao costume soar como um exagero para
aqueles no familiarizados com o estudo de aprendizagem animal, ela est
fartamente documentada na literatura especializada. Salvaguardas tpicas
para impedir esta possvel estratgia de resposta so: tornar variveis o
tempo entre a emisso da resposta de observao e a apresentao do
estmulo sensorial e o tempo entre a resposta de deteco e o incio da
tentativa seguinte; punir respostas de observao e respostas de deteco
na ausncia de seus respectivos estmulos sinalizadores com um timeout,
punir respostas de deteco com tempo de reao inferior ao mnimo
necessrio, considerando o que se conhece sobre tempo mnimo de
resposta.
Os controles acima so necessrios, mas ainda no suficientes. Por
exemplo, um switch que aciona um tom pode conter transientes audveis,
fazendo com que a ocorrncia do estmulo seja detectvel independente-
mente de sua intensidade e, em conseqncia, o animal seja reforado
pela deteco desses transientes, o que pode levar o pesquisador a
concluir pela sua supersensibilidade. Uma forma de controlar isto
introduzir pseudotentativas nas quais tudo ocorre como em uma tentativa
regular, exceto que o estmulo apresentado em uma magnitude aberran-
temente distanciada da faixa de sensibilidade conhecida para a espcie.
O uso de pseudotentativas propicia uma forma de monitorar a qualidade
do desempenho do animal. A porcentagem de respostas a estas tentativas
pode ser usada para decidir sobre a confiabilidade dos dados. As res-
postas a pseudotentativas, dentro de um referencial de teoria de deteco
de sinal, podem ser um indicador de critrio de resposta. Assim, um animal
conservador ter uma baixa proporo de respostas a estas tentativas e
um limiar mais alto; um animal menos conservador ter uma proporo
mais alta de respostas a estas tentativas e um limiar mais baixo. Um
controle sobre este critrio de resposta pode ser tentado via manipulao
da especificao do timeout.
PSICOFSICA DA CRIANA
Psicofisica do feto
A pesquisa sobre a ontogense das sensaes tem, obviamente, um
interesse especial na descrio de quando se inicia o responder a est-
mulos nas diferentes modalidades sensoriais. H vrias evidncias bem
estabelecidas de que as crianas j nascem com competncia para detec-
tar uma srie de estmulos ambientais. Vide, por exemplo, reviso de
Cowart (1981), na rea de sentidos qumicos, e de Reisman (1987), na rea
de somatossentidos. Assim sendo, o surgimento dessa competncia
precisa ser buscado no feto, um empreendimento problemtico pela
inacessibilidade relativa do observador psicofisico.
Observao extra-uterina do feto
Uma abordagem encontrada na literatura mais antiga o estudo de
fetos no-viveis e com poucas horas de vida aps o aborto. Estes
estudos, necessariamente muito primitivos, se concentraram na obser-
vao da presena ou no de reflexos (vide reviso de Reisman, 1987) e
mostraram respostas bastante precoces a estmulos tteis aplicados
face. Dadas as circunstncias de coleta de dados, a disponibilidade e
interpretao de dados so muito problemticas.
Observao intra-uterina do feto
Birnholtz e Bernacerraf (1983) mostraram que a ultra-sonografiafetal
permite a observao de atividade muscular fetal em resposta a sons
apresentados extra-uterinamente. Esta tcnica contm uma srie de
limitaes relacionadas a especificao de estmulo sensorial e a repertrio
comportamental disponvel. No presente momento permite informaes
apenas de natureza qualitativa, embora o carter no-invasivo e a disso-
ciao de condies patolgicas imprimam, em princpio, maior garantia de
validade dos dados obtidos. A tcnica promissora especialmente para o
estudo da modalidade auditiva, mas ainda no se transformou em uma
rotina de pesquisa. Na rea dos sentidos qumicos, uma possibilidade
sugerida em Cowart (1981) a observao de movimentos de deglutio
em resposta a alterao na composio do lquido amniotico, produzida
pela introduo de substncias qumicas na cavidade intra-uterina, atravs
de sonda.
Psicofisica do Infante
Procedimentos baseados em atividade geral fisiolgica e comportamental
Alteraes em medidas como padro do ciclo de sono, taxa de bati-
mento cardaco, padro de respirao, nvel de vrias substncias na cor-
rente sangnea tm sido usados para o estudo das sensaes, embora
sejam mais encontrados em estudos mais antigos. Schneider, Trehub e
Bull (1979) fizeram uma anlise comparando os resultados de experimen-
tos sobre limiar auditivo em recm-nascidos usando uma variedade de
respostas e encontraram grandes discrepncias nos dados, argumentando
pela sua baixa confiabilidade. Reisman (1987), fazendo uma reviso de
pesquisas sobre dor em bebs circuncidados, tambm encontrou dificul-
dades na interpretao dos dados com essa categoria de medida. Estudos
sensoriais baseados em atividade fisiolgica e comportamental gerais,
rigorosamente falando, nem se classificam como estudos psicofsicos; sua
incluso aqui , muito mais, uma chamada de ateno para a precariedade
metodolgica no estudo da ontogense das sensaes.
Procedimentos baseados em respostas especficas de orientao
A criana recm-nascida e at aproximadamente de quatro meses
de idade tem sido pesquisada com procedimentos principalmente basea-
dos em seu repertrio de reflexos incondicionados. A observao da
ocorrncia de respostas incondicionadas apresentao de estmulos
especficos permite afirmar que a criana detecta o estmulo, mas no tem
permitido fazer afirmaes confiveis a respeito de valores mnimos de
estmulo necessrios para que ocorra uma sensao. Estes reflexos
tambm esto sujeitos a habituao, ou seja, sua apresentao repetida
leva ao enfraquecimento e eventual desaparecimento da resposta, fazendo
com que um experimento tenha que se limitar a um pequeno nmero de
observaes. Esta limitao no facilmente contornada pela repetio do
experimento a intervalos considerveis na mesma criana, no s porque
o repertrio de respostas vai se alterando como porque os prprios
sistemas sensoriais esto em desenvolvimento. O experimentador costuma
ento recorrer anlise de dados de grupo, o que contrrio tradio
psicofisica de privilegiar delineamentos intra-sujeito e anlise de dados
individuais. Algumas destas respostas especficas vm sendo estudadas
sistematicamente, razo pela qual so identificadas a seguir.
Mtodo do olhar preferencial
Este mtodo, creditado a Fantz e Berlyne, que o desenvolveram
simultnea e independentemente, baseado na tendncia observada em
crianas pequenas de fixar o olhar em um estmulo visual com padro e de
no fixar o olhar em um estmulo liso, em uma situao de escolha. Tipica-
mente, so registrados dados referentes direo da primeira fixao,
nmero de fixaes e tempo de fixao em cada estmulo. Interpreta-se
que a criana detecta um padro visual se a ele corresponder maior
freqncia e durao de fixao do olhar. Do mtodo do olhar preferencial
surgiu uma variante, o mtodo do olhar preferencial de escolha forada,
atribudo a Teller. Neste segundo mtodo, um observador adulto colo-
cado em uma posio na qual pode observar os olhos da criana, mas no
os estmulos sendo apresentados. A tarefa do observador julgar a loca-
lizao do padro com base na observao do olhar da criana, sendo-lhe
permitido escolher o(s) aspecto(s) do olhar da criana que julgar mais
nformativo(s). Se o julgamento de localizao do observador for estatisti-
camente diferente de desempenho aleatrio, interpreta-se que a criana
detecta o padro (Banks, Dannemiller, 1987).
Habituao
Habituao mais do que um mtodo; um paradigma a partir do
qual uma srie de mtodos especficos emergiram, adaptados para moda-
lidades diferentes de estmulo. Baseia-se no fato de que, quando um
estmulo novo apresentado, o organismo emite uma resposta de orien-
tao. Com a manuteno do estmulo ou sua apresentao repetida a
curtos intervalos de tempo h um decrscimo e eventual desaparecimento
da resposta. Sendo o estmulo alterado (novo estmulo apresentado), a
resposta de orientao reaparece. Assim, por exemplo, estmulos visuais
novos geram uma explorao visual que tende a desaparecer com a
manuteno do estmulo, mas reaparece com a troca do estmulo por um
novo; estmulos auditivos geram uma resposta de virada de cabea em
direo ao som, a qual tende a desaparecer com manuteno do estmulo.
Este paradigma inclui tambm fenmenos em que a resposta de orienta-
o envolve a inibio de uma atividade em andamento. Por exemplo, a
resposta de suco interrompida com a apresentao de um som; a ini-
bico da suco habitua-se reinstalando-se a suco com a manuteno
do estmulo auditivo, mas a apresentao de estmulo auditivo diferente
reinstala a inibio. A interpretao costumeira dos dados que se ocorrer
desabituao, ento os estmulos envolvidos so discriminveis. O leitor
pode consultar Dodwell, Humphrey e Muir (1987) para exemplos detalha-
dos do uso do paradigma ao estudo da percepo visual de padres.
Varredura visual
O mtodo baseado no fato de que, quando as pessoas exploram
visualmente imagens, a varredura da imagem segue padres caractersti-
cos (Dodwell, Humphrey e Muir, 1987), e a anlise destes padres de
varredura deveriam informar sobre aspectos do estmulo visual aos quais
a pessoa responde. Dodwell e colaboradores alertam que a implementao
deste mtodo em crianas bastante complexa, do ponto de vista tcnico.
Bergamasco (1992) observa que, devido imaturidade de fotorreceptores
em uma faixa precoce de idade, a melhor imagem visual pode no corres-
ponder viso foveal, o que dificulta a interpretao do dado tipicamente
analisado com o uso deste mtodo. Feitas estas ressalvas, o mtodo til
para o estudo de percepo de forma e de padro.
Expresses faciais
Uma abordagem adicional tem sido a de caracterizar a relao entre
tipos de estmulo e tipos de topografia de resposta. Nesta abordagem,
quando aplicada ao estudo da gustao, o experimentador pretende carac-
terizar a relao entre topografias especficas de movimentos da face,
incluindo lbios e lngua, a concentraes e qualidades de substncias
qumicas aplicadas boca. Uma anlise num nvel ainda mais molecular
na rea de gustao envolve dissecar as caractersticas do comportamento
de ingesto de lquidos, identificando separadamente aspectos como
nmero de jorros de ingesto, durao dos jorros de ingesto, pausas
entre jorros, volume ingerido, etc. Uma preocupao central nestas
microanlises a viabilidade de dissociar aspectos estritamente sensoriais
de aspectos hednicos da resposta ao estmulo qumico (Crook, 1987).
Sugar de alta amplitude
Diferencia-se o uso de um procedimento baseado na resposta de
sugar, originalmente proposto para o estudo da viso e posteriormente
adaptado por Eimas e colaboradores (1971) para o estudo da audio. O
que se segue uma descrio baseada em Patricia Kuhl (1987) represen-
tativa do uso contemporneo deste procedimento, chamado de sugar de
alta amplitude. D-se criana uma chupeta que contm, internamente,
um transdutor de presso. Desta forma monitora-se a ocorrncia e a
magnitude da resposta de sugar. Respostas de sugar de magnitude acima
de um critrio so reforadas com a apresentao de um som. O som
mantido at que ocorra habituao da resposta, de acordo com um certo
critrio de reduo. Ocorrida a habituao, o som mudado. A mudana
no som gera desabituao da resposta. A desabituao interpretada
como indicador da discriminabilidade dos dois sons.
Kuhl aponta algumas limitaes deste mtodo: a) no separa
convincentemente variveis sensoriais de variveis de ateno e moti-
vao pelo estmulo; b) exige tratamento grupai de dados; c) crianas
acima de 4 meses no demonstram interesse pela tarefa, o que limita seu
uso para estudos longitudinais. No obstante, parece ser o mtodo
disponvel mais confivel e com resultados mais consistentes para o
estudo da audio de crianas at os 4 meses.
CONCLUSES
MEDIDA PSICOMETRIA
Luiz Pasquali
Instituto de Psicologia
Universidade de Braslia
H
cerca de 20 anos, Guttman (1971) ainda se interrogava o que
exatamente significava "medida" em cincias sociais e do com-
portamento. Embora, nestas cincias, aparecessem correntes os
termos sociometra, antropometria, biometria, psicometria, econometria e
outras 'metrias', continuavam dvidas sobre sua significao no campo
da epistemologia e da metodologia. Os vrios prefixos das "...metrias"
evidentemente revelavam a rea de contedo em que a medida era
aplicada. Assim, psicometria seria o uso da medida em Psicologia.
Trao latente
O conceito de trao latente no isento de ambigidades e
controvrsias entre os autores que trabalham com tal construto. A
variedade de expresses utilizadas para represent-lo j indica tal
dificuldade. Trao latente vem referido sob denominaes como: varivel
hipottica, varivel fonte, fator, construto, conceito, estrutura psquica, trao
cognitivo, processo cognitivo, processo mental, estrutura mental, habilida-
de, aptido, trao de personalidade, processo elementar de informao,
componente cognitivo, tendncia e outros. A prpria natureza ontolgica
de trao latente deixa dvidas se ele concebido como um rtulo,
representando uma sntese hipottica de um conjunto de comportamentos
reais, ou como uma realidade mental. Para este autor, o conceito faz mais
sentido quando entendido como realidade na concepo popperiana de
que real aquilo que age sobre coisas consideradas reais, como as coisas
fsicas materiais: "Deve-se ento admitir que as entidades reais podem ser
concretas ou abstratas em vrios graus. Em Fsica, aceitamos foras e
campos de fora como reais, pois agem sobre coisas materiais. Mas essas
entidades so mais abstratas e, talvez, tambm mais conjeturis ou
hipotticas do que so as coisas materiais comuns. Foras e campos de
fora so ligados a coisas materiais, a tomos e a partculas. Tm um
carter dispositivo: so tendncias para interagir. Podem assim ser
descritas como entidades tericas altamente abstratas, ns as aceitamos
como reais, quer elas ajam de forma direta ou indireta sobre as coisas
materiais." (Popper, Eccles, 1977, p.27-28).
Alm desta controvrsia, existem diferentes maneiras de conceber
trao latente quando se trata de definir sua estrutura elementar. Na
verdade, h aqui duas tendncias distintas e em vrios nveis: concepo
elementarista (reducionista) e concepo estrutural, conforme detalhado
na Figura 3-1.
Fig. 3-1 Vises elementarista e estrutural de trao latente.
Sistema
O sistema representa o objeto de interesse, chamado tambm de
objeto psicolgico. A psicometria enfoca como seu objeto especfico as
estruturas latentes, os traos psicolgicos; ela teoriza a partir destas
estruturas hipotticas. Deste enfoque, evidentemente, surgem dificuldades,
dado que a cincia emprica, dentro da qual a Psicologia se define, tem
como objeto de conhecimento os fenmenos naturais abordados atravs
da observao, que, no caso da Psicologia, o comportamento. Este
problema ser abordado na seo da representao comportamental da
estrutura latente. Aqui relevante salientar que a psicometria trabalha com
a teoria dos traos latentes, sendo, portanto, as estruturas psicolgicas
latentes o seu objeto ou sistema direto de interesse. O sistema pode ser
considerado de vrios nveis, dependendo do interesse do pesquisador.
Poder-se-ia falar de um sistema universal e de sistemas locais. O
universal sendo a estrutura psicolgica total do ser humano, e os sistemas
locais, os vrios subsistemas de interesse. Assim, a inteligncia pode ser
considerada um subsistema dos processos cognitivos, e estes, da estrutura
latente geral; ou mesmo, a inteligncia, digamos, verbal, pode ser conside-
rada um sistema quando ela for o interesse imediato e na qual vrios
aspectos podem ser considerados, como a compreenso verbal e a
fluencia verbal. Sistema, portanto, constitui-se como tal quando representa
o objeto imediato de interesse dentro de um delineamento de estudo e no
uma entidade ontolgica, monoltica e unvoca.
Propriedade
Um sistema apresenta atributos que so os vrios aspectos ou as
propriedades que o caracterizam. Por exemplo, o sistema fsico se
apresenta com os atributos de massa, comprimento, etc. Similarmente, a
psicometria concebe os seus sistemas como possuidores de proprieda-
des/atributos que definem os mesmos, sendo estes atributos o foco
imediato de observao/medida. Assim, a estrutura psicolgica apresenta
atributos do tipo processos cognitivos, processos emotivos, processos
motores, etc. A inteligncia, como subsistema, pode apresentar atributos
de tipo raciocnio verbal, raciocnio numrico, etc. O sistema se constitui
como objeto hipottico que abordado (conhecido) atravs da pesquisa
de seus atributos.
Magnitude
A psicometria assume, ainda, que estes atributos psicolgicos
apresentam magnitude: os atributos so dimenses, isto , so mensur-
veis. Trata-se do conceito de quantidade: os atributos ocorrem com quan-
tidades definidas e diferentes de indivduo para indivduo. Quantidade um
conceito matemtico que se define em funo dos axiomas de ordem e de
aditividade dos nmeros: os nmeros no somente so diferentes, mas
uns so maiores que outros, de sorte que eles podem ser ordenados numa
srie monotnica crescente de magnitude. Ao se falar de magnitude dos
atributos empricos, quer se referir, pelo menos, a esta propriedade num-
rica de ordem crescente. Digo pelo menos, porque nem sempre possvel
salvar na medida o axioma da aditividade que implica a possibilidade de
concatenao, resultando em medida de nvel intervalar ou de razo. Alis,
esta suposio de magnitude das propriedades psicolgicas que torna
interessante a utilizao do modelo matemtico no estudo dos fenmenos
de que trata a Psicologia.
80 a 100 V 10%
60 a 80 IV 20%
40 a 60 III 40%
20 a 40 II 20%
0 a 20 I 10%
O ndice D tem que ser positivo, e quanto maior for, mais discrimi-
nativo ser o item. Obviamente, um D nulo ou negativo demonstra ser o
item no-discriminativo.
O teste "t"
Um ndice de discriminao mais exato, embora mais laborioso de
se conseguir, consiste na anlise da diferena entre as mdias obtidas
pelos grupos superior e inferior. Neste caso, necessrio o clculo das
respectivas mdias e de suas varincias. O nvel de significancia do teste
't' pode ser verificado com exatido em tabelas estatsticas prprias.
Coeficientes de correlao
O coeficiente phi trabalha com dados dicotmicos, numa tabela de
quatro cselas, e produz um valor que vai de -1 a +1, como qualquer
coeficiente de correlao. O clculo deste coeficiente pode ser conseguido
atravs das tabelas de Jurgensen (1947), para o caso em que o nmero de
sujeitos for o mesmo nos dois grupos de sujeitos, ou das tabelas de
Edgerton (I960), para o caso deste nmero ser diferente.
O coeficiente bisserial de correlao (rb) utiliza as mdias dos
escores dos sujeitos que passaram ou que no passaram o item. Os livros
de estatstica apresentam vrias formas de clculo deste coeficiente
(Guilford, Fruchter, 1973).
O clculo do ndice de discriminao com base no escore total do
teste apresenta um problema terico. Na verdade, procura-se analisar a
adequao do item (em termos de discriminao) baseada nas infor-
maes obtidas de todo o elenco de tens (escore total). Tal procedimento
parece incongruente, dado que a adequao dos demais itens tambm est por
ser demonstrada, inclusive a esta altura das anlises do teste ainda no se sabe
se os itens do teste so homogneos, isto , se o teste unidimensional,
suposio necessria para se poder obter um escore total. Tenta-se resolver
este problema procedendo-se a uma anlise fatorial dos itens antes da prpria
anlise individual dos mesmos.
3) Item Response Theory (IRT ou ICC)
Esta teoria de anlise dos itens possui uma longa histria (desde os anos
50), mas s bem recentemente est sendo utilizada praticamente, dadas as
dificuldades das anlises estatsticas envolvidas que exigem o poder de
avanados softwares e micros de certo porte. AIRT uma teoria estatstica, mas
de utilizao direta na psicometria, inclusive com grandes vantagens sobre
outros mtodos tradicionais de anlise de itens.
Os modelos matemticos envolvidos nesta teoria so bastante
complexos e, embora seu conhecimento constitua uma grande vantagem, no
parece ser indispensvel seu domnio para uso inteligente por parte do usurio.
A compreenso da sua lgica, entretanto, indispensvel.
Primeiramente, h vrios modelos matemticos envolvidos na IRT. Na
verdade, h trs deles principais, dependendo do nmero de parmetros que
pretendem avaliar dos itens. Os parmetros em questo so a dificuldade, a
discriminao e a resposta aleatria (ou melhor, a resposta correta dada ao
acaso). Assim, temos o modelo logstico de 1, 2 ou 3 parmetros.
Todos os modelos trabalham com traos latentes, isto , teorizam sobre
as estruturas latentes, como faz a teoria psicomtrica. Entendem os sistemas
psicolgicos latentes como possuindo dimenses, isto , propriedades de
diferentes magnitudes ou mensurveis. Por isso, esta teoria tambm
conhecida como a teoria do trao latente ou a teoria da curva caracterstica do
item {tem characteristic curve - ICC). A teoria supe que o sujeito possui um
certo nvel de magnitude do trao latente, designado por theta (0), o qual
determinado atravs da anlise das respostas dos sujeitos por meio de diversas
funes matemticas. A funo do modelo completo de trs parmetros :
mas corta, por exemplo, o eixo dos X, indicando que o teste como um todo
mais difcil para a amostra indicada neste eixo (vide Figura 3-5). Os itens
mais difceis para uma ou outra amostra aparecem indentados em direo
ao eixo da amostra para a qual tais itens so particularmente difceis.
Assim, por exemplo, o item # 1 mais difcil para a amostra A, sendo o item
#2 mais difcil para a amostra B.
Uma grande vantagem do enfoque da IRT neste particular consiste
em possibilitar a descoberta das causas de desvio de certos tens (o fato
de serem mais difceis para uma amostra do que para outra) e, assim, se
poder corrigir esta causa e tentar recuperar o item para o teste (Ellis, 1991).
b) A resposta ao acaso
Os fatores que determinam a resposta ao acaso no so determin-
veis, pois so, por definio, aleatrios. Tal ocorrncia pode ser devido a
Fig. 3-5 Distribuio dos b de duas amostras.
Validade
Costuma-se definir a validade de um teste dizendo que ele vlido se de
fato mede o que supostamente deve medir. Embora esta definio parea uma
tautologia, na verdade ela no , considerada a teoria psicomtrica exposta
acima. O que se quer dizer com esta definio que, ao se medirem os
comportamentos (itens), que so a representao do trao latente, est-se
medindo o prprio trao latente. Tal suposio justificada se a representao
comportamental for legtima. Esta legitimao somente possvel se existir uma
teoria prvia do trao que fundamente que a tal representao comportamental
constitui uma hiptese dedutvel desta teoria. A validade do teste (este
constituindo a hiptese), ento, ser estabelecida pela testagem emprica da
verificao da hiptese pelo menos, esta a metodologia cientfica. Assim,
fica muito estranha a prtica corrente na psicometria de se agrupar intuitiva-
mente uma srie de itens e, a posteriori, verificar estatisticamente o que eles
esto medindo. A nfase na formulao da teoria sobre os traos tem sido muito
fraca no passado; com a influncia da Psicologia Cognitiva, esta nfase
felizmente est voltando ou dever voltar ao seu devido lugar na psicometria.
A validao da representao comportamental do trao, isto , do teste,
embora constitua o ponto nevrlgico da psicometria, apresenta dificuldades
importantes que se situam em trs nveis ou momentos do processo de
elaborao do instrumento: o nvel da teoria, a coleta emprica da informao e
a prpria anlise estatstica da informao.
No nvel da teoria se concentram talvez as maiores dificuldades. Na
verdade, a teoria psicolgica se encontra ainda em estado embrionrio,
destituda quase que totalmente de qualquer nvel de axiomatizao, resultando
disto uma pletora de teorias, muitas vezes at contraditrias. Basta lembrar de
teorias como behaviorismo, psicanlise, psicologia existencialista, psicologia
dialtica e outras, que postulam princpios irredutveis entre as vrias teorias e
pouco concatenados dentro de uma mesma teoria ou, ento, em nmero
insuficiente para se poder deduzir hipteses teis para o conhecimento
psicolgico. Havendo esta confuso no campo terico dos construtos, torna-se
extremamente difcil para o psicometrista operacionalizar estes mesmos
construtos, isto , formular
hipteses claras e precisas para testar ou, ento, formular hipteses
psicologicamente teis. Ainda quando a operacionalizao for um sucesso, a
coleta da informao emprica no senta de dificuldades, como, por exemplo,
a definio inequvoca de grupos critrios onde estes construios possam ser
idealmente estudados. Mesmo no nvel das anlises estatsticas encontramos
problemas. Pela lgica da elaborao do instrumento, a verificao da hiptese
da legitimidade da representao dos construtos se faz pela anlise fatorial
(confirmatoria), que procura identificar, nos dados empricos, os construtos
previamente operacionalizados no instrumento. Acontece que a anlise fatorial
faz algumas postulaes fortes que nem sempre se coadunam com a realidade
dos fatos. Por exemplo, a anlise fatorial assume que as respostas dos sujeitos
aos itens do instrumento so determinadas por uma relao linear destes com
os traos latentes. Todos os mtodos atuais de anlise fatorial postulam esta
relao linear. H, ainda, o grave problema da rotao dos eixos, a qual permite
a demonstrao de um nmero sem fim de fatores para o mesmo instrumento.
Diante destas dificuldades, os psicometristas recorrem a uma srie de
tcnicas para viabilizar a demonstrao da validade dos seus instrumentos.
Fundamentalmente, estas tcnicas podem ser reduzidas a trs grandes classes:
tcnicas que visam validade de construto, validade de contedo e validade de
critrio (APA, I954).
Validade de construto
A validade de construto ou de conceito considerada a forma mais
fundamental de validade dos instrumentos psicolgicos e com toda a razo,
dado que ela constitui a maneira direta de verificar a hiptese da legitimidade da
representao comportamental dos traos latentes e, portanto, se coaduna
exatamente com a teoria psicomtrica. Historicamente, o conceito de construto
entrou na psicometria atravs da APA Committee on Psychological Tests, que
trabalhou de 1950 a 1954 e cujos resultados se tornaram as recomendaes
tcnicas para os testes psicolgicos (APA, 1954).
O conceito de validade de construto foi elaborado com o j clssico
artigo de Cronbach e Meehl (1955) "Construct validity in psychological tests",
embora o conceito j tivesse uma histria sob outros nomes, tais como validade
intrnseca, validade fatorial e at validade aparente (face validity). Estas vrias
terminologias demonstram a confusa noo que construto possua. Embora
tenham tentado clarear o conceito de validade de construto, Cronbach e Meehl
ainda o definem como a caracterstica de um teste enquanto mensurao de um
atributo ou qualidade, o qual no tenha sido "definido operacionalmente".
Reconhecem, entretanto, que a validade de construto reclama por um novo
enfoque cientfico. De fato, definir esta validade do modo que eles definiram
parece um pouco estranho em cincia, dado que conceitos no definidos
operacionalmente
no so suscetveis de conhecimento cientfico. Conceitos ou construios so
cientificamente pesquisveis somente se forem, pelo menos, passveis de
representao comportamental adequada; do contrrio, sero conceitos
metafsicos e no cientficos. O problema que os autores, sintetizando, alis, a
atitude geral dos psicometristas da poca, para definir validade de construto,
partiram do teste, isto , da representao comportamental, em vez de partir da
teoria psicomtrica que se fundamenta na elaborao da teoria do construto
(dos traos latentes). O problema no descobrir o construto a partir de uma
representao existente (teste), mas sim descobrir se a representao (teste)
constitui uma representao legtima, adequada do construto. Este enfoque
exige uma colaborao, bem mais estreita do que existe, entre psicometristas e
Psicologia Cognitiva.
A validade de construto de um teste pode ser trabalhada sob dois
ngulos: a anlise da representao comportamental do construto e a anlise
por hiptese.
1) A anlise da representao
So utilizadas duas tcnicas como demonstrao da conformidade da
representao do construto: a anlise fatorial e a anlise da consistncia
interna.
A anlise da consistncia interna consiste essencialmente em verificar a
homogeneidade dos itens que compem o teste. Assim, o escore total no teste
se torna o critrio de deciso, e a correlao entre cada item e este escore total
decide a qualidade do item: sendo alta a correlao, o item retido. O ndice
alpha (a) de Cronbach tipicamente utilizado como indicador sumrio da
consistncia interna do teste e, conseqentemente, dos itens que o compem.
H alguns problemas com esta tcnica como demonstrao da
conformidade da representao do construto. Primeiramente, o escore total
constitui uma dificuldade, dado que ele somente faz sentido se o teste j , a
priori, homogneo. Assim, a correlao de cada item com o escore total j
pressupe que os itens so somveis, isto , homogneos; em outras palavras,
se pressupe que todos os itens sejam uma representao do mesmo trao
(unidimensionalidade). Por outro lado, a intercorre-lao entre os itens no
uma demonstrao de que estes estejam medindo um e mesmo construto.
Suponha a situao de trs itens saturados em trs fatores, como segue:
Validade de critrio
Concebe-se como validade de critrio de um teste o grau de eficcia
que ele tem em predizer um desempenho especfico de um sujeito. O
desempenho do sujeito torna-se, assim, o critrio contra o qual a medida
obtida pelo teste avaliada. Evidentemente, o desempenho do sujeito
deve ser medido/avaliado atravs de tcnicas que so independentes do
prprio teste que se quer validar.
Costuma-se distinguir dois tipos de validade de critrio: 1 ) validade
preditiva e 2) validade concorrente. A diferena fundamental entre os dois
tipos basicamente uma questo do tempo que ocorre entre a coleta da
informao pelo teste a ser validado e a coleta da informao sobre o
critrio. Se estas coletas forem simultneas (mais ou menos), a validao
ser de tipo concorrente; caso os dados sobre o critrio sejam coletados
aps a coleta da informao sobre o teste, fala-se em validade preditiva.
O fato de a informao ser obtida simultaneamente ou posteriormente do
prprio teste no um fator tecnicamente relevante validade do teste;
relevante, sim, a determinao de um critrio vlido. Aqui se situa
precisamente a natureza central deste tipo de validao dos testes: 1)
definir um critrio adequado e 2) medir, vlida e independentemente do
prprio teste, este critrio.
Quanto adequao dos critrios, pode-se afirmar que h uma
srie destes que so normalmente utilizados, quais sejam:
1) Desempenho acadmico
Talvez seja o critrio mais utilizado na validao de testes de
inteligncia. Consiste na obteno do nvel de desempenho escolar dos
alunos, seja atravs das notas dadas pelos professores, seja pela mdia
acadmica geral do aluno, seja pelas honraras acadmicas que o aluno
recebeu, ou seja mesmo pela avaliao puramente subjetiva dos alunos
em termos de "inteligente" por parte dos professores ou colegas. Embora
seja amplamente utilizado, este critrio tem igualmente sido amplamente
criticado, no em si mesmo, mas pela deficincia que ocorre na sua
avaliao. sobejamente sabida a tendenciosidade por parte dos profes-
sores em atribuir as notas aos alunos, tendenciosidade nem sempre
consciente, mas decorrente de suas atitudes e simpatias em relao a este
ou aquele aluno. Esta dificuldade poderia ser sanada at com certa
facilidade, se os professores tivessem o costume de aplicar testes de ren-
dimento que possussem validade de contedo, por exemplo. Como esta
tarefa dispendiosa, o professor tipicamente no se d ao trabalho de
validar (validade de contedo) suas provas acadmicas.
Neste contexto, tambm utilizado como critrio de desempenho
acadmico o nvel escolar do sujeito: sujeitos mais avanados, repetentes
e evadidos a suposio sendo de que quem continua regularmente ou
est avanado em termos de sua idade possui mais habilidade. Evidente-
mente, nesta histria no entra somente a questo da habilidade, mas
muitos outros fatores sociais, de personalidade, etc, tornando este critrio
bastante ambguo e esprio.
2) Desempenho em treinamento especializado
Trata-se do desempenho obtido em cursos de treinamento em
situaes especficas, como no caso de msicos, pilotos, atividades
mecnicas ou eletrnicas especializadas, etc. No final deste treinamento
h tipicamente uma avaliao, a qual produz dados teis para servirem de
critrio de desempenho do aluno.
3) Desempenho profissional
Trata-se, neste caso, de comparar os resultados do teste com o
sucesso/fracasso ou o nvel de qualidade do sucesso dos sujeitos na
prpria situao de trabalho. Assim, um teste de habilidade mecnica pode
ser testado contra a qualidade de desempenho mecnico dos sujeitos na
oficina de trabalho. Evidentemente continua a dificuldade de levantar ade-
quadamente a qualidade deste desempenho em servio dos sujeitos.
4) Diagnstico psiquitrico
Muito utilizado para validar testes de personalidade/psiquitricos. Os
grupos-critrio so aqui formados em termos da avaliao psiquitrica:
normais vs. neurticos, psicpatas vs. depressivos, etc. Novamente, a difi-
culdade continua sendo a adequao das avaliaes psiquitricas feitas
pelos psiquiatras.
5) Diagnstico subjetivo
Avaliaes feitas por colegas e amigos podem servir de base para
estabelecer grupos-critrio. utilizada esta tcnica sobretudo em testes
de personalidade, onde difcil encontrar avaliaes mais objetivas. Assim,
os sujeitos avaliam seus colegas em categorias ou do escores em traos
de personalidade (agressividade, cooperao, etc), baseados na convi-
vncia que eles tm com os colegas. Nem precisa mencionar as dificulda-
des enormes que tais avaliaes apresentam em termos de objetividade;
contudo, a utilizao de um grande nmero de juizes poder diminuir os
vieses subjetivos nestas avaliaes.
6) Outros testes disponveis
Os resultados obtidos atravs de outro teste vlido que mea o
mesmo construto que o teste a ser validado servem de critrio para deter-
minar a validade do novo teste. Aqui fica a pergunta bvia: para que criar
outro teste, se j existe um que mede validamente o que se quer medir? A
resposta se baseia numa questo de economia: utilizar um teste que
demanda muito tempo para ser respondido ou apurado como critrio para
validar um teste que gaste menos tempo.
Todos estes critrios podem ser considerados bons e teis para fins
de validao de critrio. A grande dificuldade em quase todos eles se situa
na demonstrao da adequao da medida deles: em geral, a medida dos
mesmos precria, deixando, por isso, muita dvida quanto ao processo
de validao do teste. Entretanto, h exemplos famosos de testes vali-
dados atravs deste mtodo, como o caso do MMPI.
Validade de contedo
Um teste tem validade de contedo se ele constitui uma amostra
representativa de um universo finito de comportamentos (domnio);
aplicvel quando se pode delimitar a priorie claramente um universo de
comportamentos, como o caso em testes de desempenho, que preten-
dem cobrir um contedo delimitado por um curso especfico.
Para viabilizar um teste com validade de contedo, preciso que se
faam as especificaes do teste antes da construo dos itens. Estas
especificaes comportam a definio de trs grandes temas: 1) definio do
contedo, 2) explicitao dos processos psicolgicos (os objetivos) a serem
avaliados e 3) determinao da proporo relativa de representao no teste de
cada tpico do contedo.
Quanto ao contedo, trata-se de detalh-lo em termos de tpicos e
subtpicos e de explicitar a importncia relativa de cada tpico dentro do teste.
Tais procedimentos evitam a super-representao indevida de alguns tpicos e
sub-representao de outros por vieses e pendores pessoais do avaliador. Claro
que ser sempre o avaliador ou equipe de avaliadores quem vai definir este
contedo e a relativa importncia de suas partes, mas esta definio deve ser
tomada antes da construo dos itens, garantindo certa objetividade, pelo
menos, nas decises.
Quanto aos objetivos, um teste no deve ser elaborado para avaliar
exclusivamente um processo. Como na aprendizagem entram em ao vrios
processos psicolgicos, h interesse que todos eles sejam avaliados por um
teste de contedo. Por exemplo, o teste dever conter itens que avaliam a
memria (reproduzir), a compreenso (conceituar, definir), a capacidade de
comparao (relacionar) e de aplicao dos princpios aprendidos (solucionar
problemas, transferncia da aprendizagem).
Para facilitar a especificao do teste, pode-se utilizar uma tabela de
dupla entrada, com o detalhamento dos objetivos (processos) no topo e o
detalhamento dos tpicos esquerda, explicitando, no corpo da tabela, o
nmero de itens, conforme Tabela 3-4.
Total 8 6 10 24
Preciso (fidedignidade)
O problema que se enquadra sob o conceito de fidedignidade vem
relatado sob uma srie de outras denominaes, como preciso, fidedignidade,
constncia, consistncia interna, confiabilidade, estabilidade, confiana,
homogeneidade. As mais genricas e, por isso, as mais utilizadas so preciso
e fidedignidade.
Estas diferentes designaes mostram a variabilidade de conceitos que
preciso assume, dependendo do aspecto que este parmetro quer salientar do
teste. Na verdade, fidedignidade cobre aspectos diferentes de um teste, mas
todos eles se referem a quanto os escores de um sujeito se mantm idnticos
em ocasies diferentes; por exemplo, os escores obtidos num tempo 1 e num
tempo 2 para os mesmos sujeitos. Esta ocorrncia (identidade dos escores)
evidentemente supe que o trao que o teste mede se mantenha constante sob
estas diferentes ocasies, como suposto ser o caso, por exemplo, na maioria
dos traos de personalidade e de aptido. No seria o caso num teste de humor,
porque este trao por natureza varia de momento para outro, e um teste vlido
de humor produziria escores necessariamente diferentes. Assim, o conceito de
fidedignidade, na verdade, se refere ao quanto o escore obtido no teste se
aproxima do escore verdadeiro do sujeito num trao qualquer; isto , a
fidedignidade de um teste est intimamente ligada ao conceito da varincia erro,
sendo este definido como a variabilidade nos escores produzida por fatores
estranhos ao construto. Aparece, assim, claro que a fidedignidade de um teste
depende da questo do erro da medida, especificamente do erro produzido pelo
prprio instrumento: quanto o escore produzido pelo teste se distancia do escore
verdadeiro do sujeito no trao em questo, isto , a valor theta individual na IRT.
Para melhor conceber esta problemtica, preciso se referir varincia
verdadeira e varincia erro. Um procedimento de medida qualquer, por exemplo,
os escores em um teste, produz uma variabilidade nos resultados que, em parte,
provocada pelas diferenas no prprio trao medido entre diferentes sujeitos,
parte pela impreciso do prprio instrumento e parte, ainda, por uma srie de
outros fatores aleatrios. A fidedignidade da medida depende do tamanho da
varincia erro, que precisamente a variabilidade nos resultados provocada por
estes fatores aleatrios e pela impreciso do instrumento. Expressa mais
positivamente, a fidedignidade de um instrumento diz respeito ao montante de
varincia verdadeira que ele produz vis--vis a varincia erro, isto , quanto
maior a varincia verdadeira e menor a varincia erro, mais fidedigno o instru-
mento: um escore preciso um escore que se aproxima do valor verdadeiro,
expresso estatisticamente pelo erro padro da medida (tratado mais adiante).
A definio estatstica da fidedignidade feita atravs da correlao entre
escores de duas situaes produzidos pelo mesmo teste. Se o teste preciso,
esta correlao deve no somente ser significativa, mas se aproximar da
unidade (cerca de 0,90). De fato, uma correlao de 0,70, por exemplo,
expressaria uma comunalidade de apenas 49% entre as duas situaes
provocadas pelo mesmo teste nos mesmos sujeitos. Neste caso, a varincia
comum, digamos a varincia verdadeira, seria menor que a varincia erro,
demonstrando que o teste no produz resultados fidedignos,
isto , o teste no possui preciso. Esta correlao, no caso do parametro de
fidedignidade ou preciso, referida como o coeficiente de preciso ou de
fidedignidade.
Dependendo da tcnica utilizada para demonstrao da preciso de um
teste, surgem vrios tipos de preciso: teste-reteste, formas paralelas,
consistncia interna.
Preciso teste-reteste
Este tipo de preciso consiste em calcular a correlao entre as dis-
tribuies de escores obtidos num mesmo teste pelos mesmos sujeitos em duas
ocasies diferentes de tempo. A correlao de 1,00 seria obtida se no
houvesse varincia erro provocada pelo teste ou outros fatores aleatrios, como
fatores no controlados nos sujeitos ou na situao de testagem. Quanto mais
longo o perodo de tempo entre a primeira e a segunda testagem, mais chances
haver de fatores aleatrios ocorrerem, diminuindo o coeficiente de preciso.
Este intervalo de tempo permite a ao dos fatores mencionados por Campbell e
Stanley ( 1%3) sob o tema de fontes de erro devido histria, maturao,
retestagem e s interaes entre estes fatores, bem como ao prprio
instrumento. Por isso, vem-se as graves dificuldades que apresenta este tipo
de anlise da fidedignidade de um teste; particularmente grave aparece aqui a
questo da maturao, isto , se o prprio trao matura (se desenvolve,
modifica), esta anlise da preciso torna-se errnea, dada sobretudo a
eventualidade de que a maturao do trao se processe diferencial mente para
os diversos sujeitos testados. Alm disso, e particularmente em testes de
aptido, a testagem constitui um treinamento, e provavelmente diferencial, para
os sujeitos, o que provocar diferenas na retestagem entre os mesmos,
reduzindo novamente o coeficiente de preciso do teste. Para contornar estas
dificuldades, outros tipos de anlises foram elaboradas, como a das formas
alternativas ou anlise da consistncia interna.
Preciso de formas alternativas
Neste caso, os sujeitos respondem a duas formas paralelas do mesmo
teste, e a correlao entre as duas distribuies de escores constitui o
coeficiente de preciso do teste. A condio necessria para que esta anlise
seja vlida se situa na demonstrao de que as amostras de contedo (de itens)
em ambas as formas sejam equivalentes, isto , que os itens possuam nveis
equivalentes de dificuldade e de discriminao em ambas. Estes parmetros
podem ser facilmente verificados atravs da IRT; h, contudo, algumas
dificuldades neste tipo de anlise: as duas formas so aplicadas em sucesso
imediata, no eliminando assim totalmente o efeito do intervalo de tempo,
resultando na possvel introduo de efeitos da histria e do treinamento
(prtica) obtido ao responder primeira das formas alternativas; aparece
facilmente um efeito repetitrio, dado que os
itens de ambas as formas so similares, produzindo efeitos motivacionais
negativos no responderte. Alm disso, no tarefa fcil construir formas
alternativas, quando a construo de um s teste j uma tarefa dispendiosa,
razo pela qual poucos testes aparecem no mercado com formas alternativas.
Preciso da consistncia interna
As vrias tcnicas de estabelecer este tipo de preciso visam
verificar a homogeneidade da amostra de itens do teste, ou seja, a
consistncia interna do teste. As tcnicas mais utilizadas so: duas
metades, Kuder-Richardson e alfa de Cronbach. Todas elas exigem
aplicao do teste em apenas uma nica ocasio, evitando totalmente a
questo da constncia temporal.
1) Preciso das duas metades
Os sujeitos respondem a um nico teste numa nica ocasio. O
teste dividido em duas partes equivalentes, e a correlao calculada
entre os escores obtidos nas duas metades. Nao importante como o
teste dividido em duas metades, conquanto que estas sejam equivalen-
tes. Na prtica, contudo, as duas formas mais normalmente utilizadas so
a diviso do teste em primeira metade e segunda metade ou em itens
pares e itens mpares. Para efetuar esta anlise, de fato o teste no
precisa ser homogneo, isto , no qual todos os itens medem o mesmo
trao (por exemplo, itens somente verbais ou numricos); o que
fundamental que as duas metades emparelhem itens homogneos:
verbal com verbal, numrico com numrico, etc.
Neste tipo de preciso, preciso notar que o clculo da correlao
se baseia somente na metade do teste. Assim, num teste de 100 itens, a
correlao se basearia somente em 50 itens. Como o nmero de itens
afeta o tamanho do coeficiente de correlao, preciso corrigir este
coeficiente para que leve em considerao a extenso total do teste e,
assim, produzir um coeficiente de preciso mais justo para o teste. Esta
correo feita atravs da frmula de Spearman-Brown:
Padronizao (normas)
Padronizao, em seu sentido mais geral, se refere necessidade de
existir uniformidade em todos os procedimentos no uso de um teste vlido e
preciso: desde as precaues a serem tomadas na aplicao do teste
(uniformidade das condies de testagem, controle do grupo, instrues
padronizadas e motivar os examinandos pela reduo da ansiedade) at o
desenvolvimento de parmetros ou critrios para a interpretao dos resultados
obtidos. Em seu sentido mais tcnico de parmetro psicomtrico, a
padronizao se refere a este ltimo aspecto, isto , como interpretar os
resultados.
Um escore bruto produzido por um teste necessita ser contextualizado
para poder ser interpretado. Obter, por exemplo, 50 pontos num teste de
raciocnio verbal e 40 num de personalidade no oferece nenhuma informao.
Mesmo se dissermos que o sujeito acertou 80% das questes
no diz muito, visto que o teste pode ser fcil (80% ento seria pouco) ou difcil
(80% ento seria muito). Na verdade, qualquer escore deve ser referido a algum
padro ou norma para adquirir sentido. Uma tal norma permite situar o escore de
um sujeito, permitindo 1) determinar a posio que o sujeito ocupa no trao
medido pelo teste que produziu o tal escore e 2) comparar o escore deste sujeito
com o escore de qualquer outro sujeito. O critrio de referncia ou a norma de
interpretao constitudo tipicamente por dois padres: 1) o nvel de
desenvolvimento do indivduo humano (normas de desenvolvimento) e 2) um
grupo padro constitudo pela populao tpica para a qual o teste construdo
(normas intragrupo).
Normas de desenvolvimento
As normas de interpretao dos escores de um teste baseadas no
desenvolvimento se fundamentam no fato do desenvolvimento progressivo (nos
vrios aspectos de maturao psicomotora, psquica, etc.) pelo qual o indivduo
humano passa ao longo de sua vida. Neste sentido, so utilizados, como critrio
de norma, trs fatores: idade mental, srie escolar e estgio de
desenvolvimento.
1) A idade mental
Este critrio foi criado por Binet e Simon (1905). Estes autores falavam
de nvel mental, depois popularizado como idade mental. Binet e Simon
separaram empiricamente uma srie de 54 questes/tarefas em 11 nveis de
idade cronolgica: 3 a 10 anos (oito nveis), 12, 15 anos e idade adulta. As
questes que eram respondidas corretamente pela mdia de crianas/sujeitos
de uma idade cronolgica X definiam o nvel/idade mental correspondente a esta
idade cronolgica. Assim, a um sujeito que respondia a todas as questes que
as crianas de 10 anos eram capazes de responder era atribuda a idade mental
de 10 anos.
Na adaptao norte-americana da escala de Binet-Simon, a Stanford-
Binet (Terman, Merrill, 1960), a idade mental (IM ) foi expressa em termos da
idade cronolgica (IC), resultando no quociente intelectual, o Ql, atravs da
frmula:
Assim, quem responde a todas as questes correspondentes sua idade
cronolgica possui um Ql de 100 (por exemplo, para uma criana de 10 anos: Ql
= 100 x (10/10) = 100). A interpretao dos resultados em termos de Ql se faz
atravs da Tabela 3-5.
2) Srie escolar
Este critrio utilizado para testes de desempenho acadmico e so-
mente faz sentido quando se trata de disciplinas que so oferecidas numa
Tabela 3-5 Interpretao dos escores de Ql
Ql Interpretao
CONCLUSO GERAL
REFERNCIAS BIBLIOGRFICAS
CRONBACH, L. J., MEEHL, P.E. Construct validity in psychological tests. Psychological Bulletin,
Washington, D.C., v.52, p.281-302, 1955.
DUNNETTE, M.D. (Ed.). Handbook of industrial and organizational psychology. New York: Wiley, 1983.
EDGERTON, H.A. A table for computing the phi coefficient. Journal of Applied Psychology,
Washington, D.C., v.44, p.141-145, 1960.
EDWAR DS, A. L. The social desirability variable in personality assessment and research. New York:
Dryden, 1957.
--------------- . Social desirability and personality test construction. In: BASS. B.M., BERG, I .A.
(Eds.). Objective approaches to personality assessment. New York: Van Nostrand, 1959.
EDWARDS, AL, WALKER, J.N. Social desirability and agreement response set. Journal of Abnormal
and Social Psychology, n.62, p.180-183, 1961.
EDWARDS. AL, DIERS.C.J., WALKER, J.N. Response sets and factor loadings on 61 personality
scales. Journal of Applied Psychology. Washington, D.C., n.46, p.220-225. 1962.
EDWARDS. A.L., WALSH, J.A. The relationship between the intensity of the social desirability keying of
a scale and the correlation of the scale with Edwards' SD scale and the first factor loading of the
scale. Journal of Clinical Psychology. Brandon (VT), n. 19, p. 200-203, 1963.
ELLIS, B.B. Item response theory: a tool for assessing the equivalence of translated tests. Bulletin of
the International Test Commission, v.18, n.1-2, p.33-51, 1991.
GESELL. A., AMATRUDA, C.S. Developmental diagnosis. 2ed. New York: Hoeber-Harper. 1947.
GILLINSKY. A.S. The influence of the procedure of judging on the halo effect. American Psychologist.
Washington, D.C., v.2. p.309-310, 1947.
GUILFORD. J.P. FRUCHTER. B. Fundamental statistics in Psychology and Education. 5,ed. New York:
McGraw-Hill, 1973.
HALVERSON. H.M. The acquisition of skill in infancy. Journal of Genetic Psychology. Province-town
(MA), v.43, p.3-48, 1933.
HAMBLETON. R.K. Adapting tests for use in different cultures: technical issues and methods. Bulletin
of the International Test Commission, v.18, n.1-2, p.3-32.1991.
HEINEMAN. CE. A forced-choice form of the Taylor Anxiety Scale. Unpublished doctoral dissertation.
State University of Iowa. 1952.
HULIN. C.L.. DRASGOW. F.. PARSONS, C.K. Item response theory, applications to psychological
measurement. Homewood (IL): Dow Jones-Irwin, 1983.
IRONSON, G.H. Use of chi-square and latent trait approaches for detecting item bias. In: BERK, R.A.
(Ed.). Handbook of methods for detecting test bias. Baltimore (MD): Johns Hopkins University
Press. 1982. p.117-160.
JACKSON, D.N. Problems in preparing personality tests and interest inventories for use in multiple
cultures. Bulletin of the International Test Commissions.IH. n. 1-2. p.94-93, 1991.
JUNG. C.G. Psychologische Typen. Zurich: Rascher. 1921,
JURGENSEN, CE. Table for determining phi coefficients. Psychometrika, v. 12. p. 17-29, 1947.
KELLEY. T.L. The selection of upper and lower groups for the validation of test items Journal of
Educational Psychology. Washington, D.C., v.30, p.17-24. 1939.
KNOBLOCK. H., PASAMANICK. B. (Eds.). Gesell and Amatruda's developmental diagnosis. 3.ed. New
York: Harper and Row. 1974.
KRETSCHMER. E. Physique and character. New York: Hartcourt. 1925.
KUDER. G.F.. RICHARDSON. M.W. The theory of estimation of test reliability. Psychometrika. n.2. p.
151-160. 1937.
LAURENDEAU. M.. PINARD. A. Causal thinking in the child: a genetic and experimental approach.
New York: International Universities Press, 1962.
--------------- . The development of the concept of space in the child. New York: International
Universities Press, 1970.
LORD, F.M. Applications of item response theory to practical testing problems. Hillsdale (NJ): Erlbaum.
1980.
MESSICK. S., JACKSON. D.N. Acquiescence and the factorial interpretation of the MMPI.
Psychological Bulletin. Washington. D.C. v.58. p.299-304. 1961.
MULHOLLAND. T.M.. PELLEGRINO. J.W., GLASER, R. Components of geometric analogy solution.
Cognitive Psychology, v. 12..p.252-284. 1980.
MURRAY. H.A., et al. Explorations in personality. New York: Oxford University Press. 1938.
NEWELL. A.. SIMON. H.A. Human problem solving. Englewood Cliffs (NJ): Prentice-Hall. 1972.
NOVICK. M.R.. LEWIS. C. Coefficient alpha and the reliability of composite measurements.
Psychometrika. v.12. p. 1-13, 1967.
OOSTERHOF, A.O Similarity of various item discrimination indices. Journal of Educational
Measurement. Washington. D.C. v.13. p.145-150, 1976.
PELLEGRINO. J.W.. MUMAW. R.J.. SHUTE. V.J. Analysis of spatial aptitude and expertise. In:
EMBRETSON, SE. (Ed.). Test design: developments in psychology and psycho-metrics. 1985.
p.45-76.
PIAGET. J. The origins of intelligence in children. New York: International Universities Press. 1952.
PINARD. A.. LAURENDEAU, M. A scale of mental development based on the theory of Piaget:
description of a project. Journal of Research in Science Teaching. New York, v.2. p.253-260, 1964.
POPPER. K.R., ECCLES, J.C. O eu e seu crebro. Braslia: Ed. UnB, 1977.
RASCH. G. An individualistic approach to item analysis. In: LAZARSFELD, P.F., HENRY, N.W. (Eds).
Readings in mathematical social sciences. Cambridge (MA): MIT Press, p.89-107.
RULON. P.J. A simplified procedure for determining the reliability of a test of split-halves. Harvard
Educational Review. Cambridge (MA), v.9, p.99-103, 1939.
SHARON, A.T.. BARTLETT. C.J. Effect of instructional conditions in producing leniency on two types of
rating scales. Personnel Psychology. Durham (NC), v.22, p.251-263, 1969.
SHELDON. W.H. The varieties of human physique: an introduction to constitutional psychology. New
York: Harper, 1940.
STERNBERG, R.J. Intelligence, information processing, and analogical reasoning: the com-ponential
analysis of human abilities. Hillsdale (NJ): Erlbaum, 1977.
----------------. The nature of mental abilities. American Psychologist, Washington. D.C.. v.U.
p.214-230. 1979.
MEDIDAS ESCALARES
Luiz Pasquali
Instituto de Psicologia
Universidade de Braslia
ESCALAS PSICOFSICAS
O ENFOQUE DE THURSTONE
Esta matriz Fij pode ser transformada na matriz P,, onde pij = fij/N,
que pode ser transformada na matriz Zij atravs da tabela da curva normal,
a qual d as posies escalares dos itens no contnuo do construto,
conforme exemplificado nas Tabelas 4-2 e 4-3.
i
ITENS 1 2 3 4 5 6
j 1 .00 - .25 -.12 - .52 .25 .84 1.65
2 .25 .00 .52 .00 .52 .00 .00 .84
3 .13 .52 -.52 - -.39 - .84 1.28
4 -.52 -.25 .84 - 1.04 .39 1.04
5 -.84 .00 1.28 .00 - .25
6 -1.65 -.84 .25 .00
que foi utilizado nos clculos das tabelas acima para a obteno dos
valores escalares (processos discriminantes modais) dos estmulos. Vale
ressaltar que Thurstone oferece testes estatsticos para a verificao da
consistncia interna da escala resultante, bem como a verificao da ade-
quao das suposies feitas em cada caso utilizado.
Tendo-se obtido os valores escalares, em termos de desvios padres, de
uma grande srie de estmulos, pode-se construir uma escala intervalar,
selecionando aqueles (cerca de 20) que se situam a distncias iguais entre si.
Estes estmulos assim escalonados constituem a escala para a medida
das atitudes. Os procedimentos experimentais para aferir as atitudes do
sujeito consistem em pedir ao mesmo que escolha o item (estmulo) com o qual
ele mais concorda, sendo o valor escalar deste item a medida da atitude do
sujeito. Ou pede-se para o sujeito escolher os trs tens com os quais mais
concorda, e a medida da sua atitude ser a mdia dos valores escalares destes
trs itens.
A construo de escalas a partir desta lei de Thurstone extremamente
laboriosa. Na verdade, ela se torna quase impossvel com um nmero elevado
de itens, dado que a comparao dos mesmos 2 a 2 aumenta geometricamente
o nmero de comparaes a serem feitas. Para 10 estmulos temos (10 x 9)/2 =
45 comparaes, e para 100 itens temos (100 x 99)/2 = 4.950. Por isso,
Thurstone desenvolveu outras tcnicas de construo de escalas de atitude.
Uma delas o mtodo dos intervalos aparentemente iguais (Thurstone, Chave,
1929).
No caso deste mtodo, as afirmaes (cerca de 100) sobre um objeto de
interesse so impressas em cartes que os sujeitos devem distribuir em 11
pilhas segundo o grau de favorabilidade que, na sua opinio, a afirmao
apresenta em relao ao objeto psicolgico. As 11 pilhas so erigidas sobre um
contnuo de cartes etiquetados de A a K, onde A est ancorado com a
expresso 'desfavorvel', o K com 'favorvel' e o F (o carto a meio caminho de
A e K) com 'neutro'.
O valor escalar dos itens se faz atravs do clculo da mediana, tendo
como coeficiente de variabilidade o intervalo semi-interquartlico, como na
Tabela 4-4.
O ENFOQUE DE LIKERT
OENFOQUEDEGUTTMAN
1 1 11 01 11 3 1
23 00 00 11 1 3 00
45 00 0 0 01 21 1
1 0
Esta tabela montada de tal forma que nas colunas esto dispostos
os itens em ordem decrescente, do mais extremado ao mais brando, em
termos de atitude em relao ao construto, e nas linhas esto dispostos os
sujeitos, tambm em ordem decrescente do escore total obtido nos itens
(para cada item com o qual est de acordo, o sujeito recebe um ponto). Um
item que recebeu o acordo pelo sujeito obtm valor 1 e obtm 0 se o sujeito
no o marcou. Assim se forma uma tabela triangular, de tal sorte que
acima da diagonal deveriam aparecer somente 1 e abaixo somente 0. No
caso em pauta, como o item #1 o que expressa a atitude mais extrema
em relao ao construto, o sujeito que est de acordo com este item
deveria necessariamente marcar todos os outros itens, fato que no
ocorreu com o sujeito 1, que marcou o item #1 mas no marcou o item #3.
Situaes desta natureza provocam a ocorrncia de 0 acima da diagonal,
o que contado como um erro. Para o clculo do ndice de reprodutibilida-
de contam-se todos os erros, isto , os 0 acima da diagonal, que, no caso,
so dois. Assim, o nmero de valores apropriados na tabela 20 - 2 = 18.
O coeficiente de reprodutibilidade ser 18/20 = 0,90. Guttman afirma que o
coeficiente deve ser pelo menos de 0,90 para que a escala possa ser
considerada adequada.
Escalas tipo escalograma tm a vantagem de avaliar a unidimensio-
nalidade, bem como de apresentar uma garantia de que a amplitude do
contnuo do construto est sendo coberta, particularmente se o nmero de
itens for grande (pelo menos 10, sugere Guttman). Contudo, relativamente
raro de se encontrar na literatura esta forma de escalas. Por qu?
Primeiramente, nem todos os construtos psicolgicos permitem escalabli-
dade. Por exemplo, em atitude poltica, o sujeito pode estar de acordo com
uma posio do candidato e no com outra, o que poderia inclusive estar
indicando falta de unidimensionalidade da escala. Alm disso, Guttman
no oferece dicas de como elaborar os itens, isto , o escalograma tem
pouco poder heurstico; ele parece ser mais til para a anlise de uma
escala do que para guiar a construo dela.
PAI
forte __ :__ : __ :__ : __ :__ :_ fraco
bom _ :__ : __ :__ : __ : __ :_ mau
ativo _ :__ : __ :__ : __ :__ :_ passivo
-3.-2.-1. 0 . +1 . +2 . +3
ESCALA MULTIDIMENSIONAL
Plo terico
As escalas at aqui apresentadas so ditas unidimensionais, porque
elas visam avaliar os sujeitos em apenas um trao psicolgico. Falando-se
de uma escala multifatorial, neste caso, entender-se-ia um conjunto de
vrias escalas, cada uma medindo um fator ou trao independentemente.
Entretanto, um objeto psicolgico pode ser avaliado sob vrios aspectos ou
traos simultaneamente. Por exemplo: um candidato presidncia pode ser
avaliado em termos de sua filiao partidria (liberal vs. conservador),
recebendo uma pontuao nesta escala; ao mesmo tempo e independen-
temente, ele pode ser avaliado em termos de sua juventude (jovem vs. velho),
recebendo nesta escala uma outra avaliao, independente da que recebeu na
primeira escala. Teramos aqui, ento, duas escalas unidimen-sionais,
produzindo dois escores independentes. Contudo, pode-se pedir uma avaliao
simultnea do candidato em termos de ambos os atributos, a saber, filiao
partidria e juventude. No primeiro caso, o candidato teria dois escores: um em
filiao partidria e outro em juventude. No segundo caso, entretanto, o
candidato receberia apenas um escore, mas definido em termos de duas
dimenses, que seria ilustrado num espao bidimensional, onde um ponto
expresso por duas coordenadas. Assim, o escore dele, neste caso, seria
expresso como Xij , e no por X e Xj. Continuando nesta ilustrao, o mesmo
candidato poderia ser avaliado numa srie de n traos simultaneamente, de
sorte que o escore dele poderia ser expresso num espao n-dimensional, com
tantos subscritos quantos os traos sob os quais ele foi avaliado. Estas so as
escalas multidimensionais. No caso de uma avaliao em termos de duas
dimenses, o escore do candidato poderia cair em qualquer um dos quatro
quadrantes que resultam do espao bidimensional, como na Figura 4-2, onde o
candidato Xise situa em (-1,2).
Plo experimental
A tcnica para levantar os dados de escalas multidimensionais
consiste em pedir ao(s) sujeito(s) para avaliar(em) um objeto psicolgico
(candidato), no em um trao de cada vez, mas em comparar vrios
objetos psicolgicos em vrios traos. Por exemplo: Dados os candi-
datos A B C D, avaliar se os candidatos A e B so mais semelhantes
(prximos, iguais, etc.) entre si que os candidatos C e D. Assim, a
tcnica para a coleta da informao usa termos que se referem a
"distncia psicolgica" ou "proximidade psicolgica". Esta proximidade
vem designada sob vrios termos, tais como parentesco, dependncia,
associao, complementaridade, substitutividade, proximidade,
distncia, interao, etc.
Um exemplo poder ilustrar os procedimentos da tcnica das
escalas multidimensionais. Suponha quatro candidatos presidncia (A,
B, C ,D). Os respondentes reagem instruo de emparelhar 2 a 2 os
candidatos e dizer qual o candidato preferido entre os dois (i > j). Deste
procedimento podem surgir os seguintes dados:
i
CANDIDATOS A B C D
j A 7
B 5 8-
C 3 6 9
D
CONCLUSO
REFERNCIAS BIBLIOGRFICAS
ALBANESE. MA., FORSYTH, R.A. The one-, two- and modified two-parameter latent trait
models: an empirical study of relative fit. Educational and Psychological Measurement.
Durham (NC), v.44 n.2, p.229-246, 1984.
BALLIN. M.. FARNSWORTH, P.R. A graphic rating method for determining the scale values
of statements in measuring social attitudes. Journal of Social Psychology. Provincetown
(MA), v.13, p.323-327.1941.
BENDIG. AW. Reliability and the number of rating scale categories. Journal of Applied
Psychology. Washington, D.C., v.38, p.38-40. 1954.
BIRD, C. Social psychology. New York: Appleton-Century-Crofts. 1940.
BIRNBAUN, A. Some latent trait models and their use of inferring an examinee's ability. In:
LORD, F.M., NOVICK, M.R. (Eds.). Statistical theories of mental test scores. Reading
(MA): Addison-Wesley, 1968.
CAMPBELL, N.R. An account of the principles of measurement and calculations. London:
Longmans Green, 1928.
-------------- . Symposium: Measurement and its importance for philosophy. Proceedings Aristot.
Society Suppl.. London, v.17, p.121-142. 1938.
COOMBS, C.H. A theory of data. New York: Wiley. 1964.
DE BRUYNE, P., HERMAN, J DE SCHOUTHEETE, M. Dinmica da pesquisa em cincias
sociais. .Ved. Rio de Janeiro: Francisco Alves. s.d.
DEBETS. P.. BROUWER. E.. SIJTSMA, K., MOLENAAR, I.W. MSP: a computer program for
item analysis according to a nonparametric IRT approach. Educational and Psychological
Measurement. Durham (NC), v.49. n.3. p.609-613, 1989.
DEBETS. P., BROUWER, E. MSP: a program for Mokken Scale analysis for polychotomous
items. Groningen: IEC ProGAMMA, 1989.
DELBEKE, L. Construction of preference spaces. Louvain: Publications of the University of
Louvain, 1968.
EDWARDS, AL. Techniques of attitude scale construction. New York: Appleton-Century-
Crofts. 1957.
EDWARDS. AL., KENNY, K.C. A comparison of the Thurstone and Likert techniques of
attitude scale construction. Journal of Applied Psychology, Washington, D.C., v.53, p. 72-
83, 1946.
EDWARDS, A.L, KILPATRICK, F.P. A technique for the construction of attitude scales. Journal of
Applied Psychology, Washington, D.C., v.32, p.374-384, 1948.
EKMAN. P. (s.n.t.) 1963.
FISHBEIN, M. AJZEN, I. Beliefs, attitude and intention: an introduction to theory and research. Reading
(MA): Wesley, 1975.
GOLDSAMT, M.R. Effects of scoring method and rating scale length in extreme response style
measurement. College Park (MD): University of Maryland, 1971. (Unpublished doctoral
dissertation)
GUILFORD, J.P. Psychometric methods. 2ed. New York: McGraw-Hill, 1954.
GUTTMAN, L. A basis for scaling qualitative data. American Sociological Review, Washington,
D.C..V.9, p.139-150. 1944.
---------------- . The basis for scalogram analysis. In: STOUFFER, SA. et al. Measurement and
prediction. Princeton (NJ): Princeton University Press, 1950. p.60-69.
. The Cornell technique for scale and intensity analysis. Educational and Psycholog
ical Measurement. Durham (NC), v.7, p.247-280, 1947.
---------------- . The problem of attitude and opinion measurement. In: STOUFFER, S.A. et al.
Measurement and prediction. Princeton (NJ): Princeton University Press. 1950. p.46-59.
--------------- . On Festinger's evaluation of scale analysis. Psychological Bulletin. Washington,
D.C., V.44, p.451-465, 1947.
---------------- . Questions and answers about scale analysis. Research Branch, Information and
Education Division, Army Service Forces. Report D-2. 1945.
JENKINS. J.J., RUSSELL, W.A., SUCI. G.J. An atlas of semantic profiles for 360 words. In: Studies on
the role of language in behavior. Tech. Rep. No. 15. Minneapolis: University of Minnesota, 1957.
JONES, R.R. Differences in response consistency and subject's preferences for three personality
inventory response formats. Proceedings of the 67th Annual Convention of the American
Psychological Association, v.3, p.247-248, 1968.
KOMORITA. S.S. Attitude content, intensity, and the neutral point on a Likert scale. Journal of Social
Psychology. Provincetown (MA), v.61, p.327-334, 1963.
KRUSKAL, J.B., WISH, M. Multidimensional scaling. Newbury Park (CA): Sage Publications, 1991.
LIKERT, R. A technique for the measurement of attitudes. Archives of Psychology . v. 140, 1932.
LORD, F.M. A theory of test scores. Psychometric Monograph, Chicago (IL), n.l, 1952.
---------------- .Applications of item-response theory to practical testing problems. Hillsdale (NJ):
Lawrence Erlbaum, 1980.
MAGER, R.F. Medindo os objetivos de ensino ou "conseguiu um par adequado". Porto Alegre: Globo,
1981.
MATELL, M.S., JACOBY, J. Is there an optimal number of alternatives for Likert-scale items? Journal of
Applied Psychology. Washington, D.C., v.56, n.6, p.506-509, 1972.
---------------- . Is there an optimal number of Likert scale items? Study I: Reliability and validity.
Educational and Psychological Measurement, Durhan (NC), v.31, p.657-674, 1971.
MOLENAAR, I.W., SIJTSMA, K Mokken's approach to reliability estimation extended to multicategory
items. Kwant'rtatieve Methoden. Rotterdam, v.9 n.28, p.l 15-126,1988.
NEVO, B. Face validity revisited. Journal of Educational Measurement, Washington. DC, v.22, p.287-
293, 1985.
NEVO, B., SFEZ, J. Examinees' feedback questionnaires. Assessment and Evaluation in Higher
Education, Bath, v. 10, p.236-249, 1985.
OSGOOD, C.E., SUCI, G.J., TANNENBAUM, PH. The measurement of meaning. Urbana (IL):
University of Illinois Press, 1957.
----------------. A measure of relation determined by both mean difference and profile information.
Psychological Bulletin, Washington, D.C., v.49, p.251-262.
PEREIRA, CA. Alves. O diferencial semntico: uma tcnica de medida nas ciencias humanas e sociais.
So Paulo: tica, 1986.
POPPER, K.R. A lgica da pesquisa cientifica. So Paulo: Cultrix, 1972.
RASCH, G. Probabilistic models for some intelligence and attainment tests. Copenhagen: Danish
Institute for Educational Research, 1960.
SAFFIR, M.A. A comparative study of scales constructed by three psycho-physical methods.
Psychometrika, v.2, p. 179-198, 1937.
SEASHORE, R.H., HEVNER, K. A time-saving device for the construction of attitude scales. Journal of
Social Psychology, Provincetown (MA), v.4, p.366-372, 1933.
SIEGEL, S. Nonparametric statistics for the behavioral sciences. New York: McGraw-Hill, 1956.
SIJTSMA, K., DEBETS, P., MOLENAAR, I.W. Mokken scale analysis for polychotomous items: theory,
a computer program and an empirical application. Quality & Quantity, apud DEBETS, P..
BROUWER, E., SIJTSMA, K., MOLENAAR, I.W. MSP: a computer program for item analysis
according to a nonparametric IRT approach. Educational and Psychological Measurement, Durham
(NC), v.49 n.3, p.609-613, 1989.
STEVENS, S.S. Mathematics, measurement, and psychophysics. In: STEVENS, S.S. (Ed.). Handbook
of experimental psychology. New York: Wiley, 1951. p.1-49.
THURSTONE, L.L. A law of comparative judgment. Psychological Review, Washington, D.C., V.34,
p.273-286, 1927.
----------------. Psychophysical analysis. American Journal of Psychology, Champaign (IL), v.38,
p.368-389, 1927.
--------------- . The method of paired comparisons for social values. Journal of Abnormal and Social
Psychology, v.21, p.384-400, 1927.
--------------- . Equally often noticed differences. Journal ot Educational Psychology. Washington,
D.C.,v.l8,p.289-293, 1927.
THURSTONE. L.L, CHAVE, E.J. The measurement of attitude. Chicago (IL): University of Chicago
Press, 1929.
TORGERSON, W.S. Theory and methods of scaling. New York: Wiley, 1958.
TUCKER, L.R., MESSICK, S. An individual differences model for multidimensional scaling.
Psychometrika, v.28, p.333-367, 1963.
VAN DR VEER, F., HOWARD, K.I., AUSTRIA, A.M. Stability and equivalence scores based on three
different response formats. Proceedings of the 78th Annual Convention of the American
Psychological Association, v.5, p.99-100, 1970.
WEBB, S.C. A generalized scale for measuring interest in science subjects. Educational and
Psychological Measurement, Durham (NC), v.ll, p.456-469, 1951.
CAPITULO 5
Jorge de Souza
Departamento de Economa Universidade
Federal de Pernambuco
D
esde os primeiros estudos da psicofisica alem, na segunda
metade do sculo XIX, os psicometristas lidam com o problema de
ordenao de um conjunto de estmulos ou objetos psicolgicos
relativamente a uma de suas propriedades. D-se o caso, por exemplo,
quando os sujeitos do experimento, juizes ou examinandos, so instados
a manifestarem-se sobre qual o sinal sonoro, entre dois sinais a eles
submetidos, o mais intenso. Postos, assim, diante de um conjunto de
sinais sonoros expostos dois a dois, os juizes do as suas respostas, e
o objetivo do experimento obter uma ordenao ascendente dos
estmulos quanto s suas intensidades. Essa mesma ordenao
comparada com a correspondente ordem natural sob controle do
pesquisador. Quanto mais elevada for a compatibilidade entre as duas
seqncias, maior a acuidade perceptiva do examinando.
Sob esse enfoque, os diversos sentidos da percepo humana,
como a viso, a audio, a sensao de peso, etc, foram investigados na
psicofisica e, a partir deles, estabeleceram-se as chamadas leis da
psicofisica.
Retomando essas idias no sculo XX, Louis Thurstone, o grande
psicossociometrista norte-americano, concebeu uma situao mais geral
e pde estender as idias da psicofisica a uma classe mais ampla de
problemas que envolviam o conceito de trao psicolgico. O trao
psicolgico uma propriedade ou uma varivel de carter latente e,
portanto, no diretamente observvel ligada a algum sujeito ou objeto
de investigao. Enquadra-se nessa ordem, por exemplo, a varivel
latente que leva os consumidores a manifestarem suas preferncias entre
diversas marcas de um produto ou os cidados a escolherem seus
polticos preferidos num elenco de homens pblicos.
Algumas das teorias psicomtricas sobre o tratamento deste tema
so o objeto deste captulo.
O MODELO DOS JULGAMENTOS COMPARATIVOS
(5.1)
(5.2)
(5.3)
Fig. 5-1
(5.6)
Ao modelo por esse modo caracterizado d-se o nome de modelo
de julgamentos comparativos de Thurstone.
(5.7)
(5.8)
Ele pode ser resolvido, por exemplo, atravs do mtodo dos mnimos
quadrados, onde deve ser minimizada a funo
Derivando-se relativamente aos valores de escala, encontra-se que
e assim sucessivamente.
(i=1, 2
................................................................ m-1)
(5.9) ( / = 1 , 2 ......................m).
(5.10)
(5.11)
ou seja:
, ou
ainda
Fig. 5-2
ou ainda, equivocantemente,
(5.12) (j = 1, 2...................... k)
, ou seja,
( / = 1.2........ m).
(5.13)
O MODELO DE LUCE
se e somente se se e
(5.14)
somente se
em que o smbolo denota o empate entre os
estmulos O e Oj e o parmetro "e" positivo uma espcie de limiar que,
se no ultrapassado, impede a discriminao entre os estmulos Oi e Oj
desde o ponto de vista da manifestao de uma preferncia. Pela mesma
ordem de idias usadas anteriormente, transformam-se essas regras
para a correspondente verso probabilistica, ou seja, impem-se, agora,
os seguintes critrios decisorios de carter estatstico:
(5.15)
(5.16)
(5.17)
(5.19)
onde zi[j a abcissa da curva normal (0,1) cuja rea esquerda desse
valor igual a nji; deve-se notar que, desse modo, para o modelo Luce,
encontram-se duas abcissas, de acordo com a figura 5-3.
Fig. 5-3
(5.20)
(5.21)
Supondo, tambm, simplificadamente, que as varincias i
sejam independentes dos estmulos, concebe-se
que ser constante e, desse modo, pode-se faz-la
unitria porque esta hiptese corresponde apenas a uma mudana de
escala nos valores de escala, sempre interpretados na escala ordinal.
Desse modo, somando e subtraindo as duas equaes anteriores,
obtm-se as expresses
(5.22)
(5.23)
(5.24)
(5.25)
(5.26)
(5.27)
(5.28)
(5.29)
onde Nj nova matriz que resulta de N pela substituio antes enunciada.
Nesse caso, a soluo do problema de escalagem igual a
(5.30)
(5.31)
(5.32)
(5.33)
(5.34)
A implantao do algoritmo anterior requer, para sua implementao
mais eficaz, as seguintes providncias:
155
I) uma boa aproximao inicial para a sua rpida convergncia;
II) uma normalizao das aproximaes obtidas
em cada etapa.
A aproximao inicial, aqui sugerida, consiste simplesmente em
fazer ( = 1,2,..., m), isto , supe-se inicialmente uma prefern-
cia manifestada imparcialmente sob a hiptese de absoluta ignorncia no
concernente natureza dos estmulos.
A condio de normalizao naturalmente imposta em cada etapa
e consiste em substituir cada por
(5.34)
(5.35)
(5.36)
(5.37)
REFERENCIAS BIBLIOGRFICAS
BRADLEY, R.A.. TERRY. M.E. The rank analysis of incomplete block designs I: the method of paired
comparisons. Biometria, v.39, p.324-345, 1952.
FORD JR., L.R. Solution of a ranking problem from binary comparisons. American Mathematical
Monthly. Washington. D.C.. v.64. p.28-33, 1957.
GREENBERG, MG. A modification of Thurstone's law of comparative judgment category of equal or no
difference. Psychological Bulletin. Washington. D.C.. v.64. 108-112, 1965.
GUTTMAN, L. An approach for quantiting paired comparisons and rank order. Annals of Mathematical
Statistics. Hayward (CA), v.17, p.144-163. 1946.
HOTELLING, N. Analysis of a complex of statistical variables into principal components. Journal of
Educational Psychology. Washington. D.C.. v.24, p.417-441; 498-520,1933.
LUCE, R.D. Discrimination. In: LUCE, R.D., BUSH, R.R., GALANTER, E. Psychology. New York: Wley.
1963. v.1.
MICHAUD. P. Opinions aggregations. In: JANSE, J.. MARCOTORCHINO, J.F., PROTH, J. M. (Eds.).
New trends in data analysis and applications. Amsterdam: North Holland, 1983.
NISHISATO, S. Analysis of categorical data: dual scaling and its applications. Toronto: University of
Toronto Press, 1980.
--------------- . Optimal scaling of paired comparison and rank order data: an alternative to Gut-
tman's formulation. Psychometrika, v.43, p.263-271, 1978.
SIJBERG, L. Successive intervals scaling of paired comparisons. Psychometrika, v.32, p.297-308,1967.
SOUZA, J. de. Mtodos de escalagem psicossocial. Braslia: Thesaurus, 1987.
THURSTONE, L.L. A law of comparative judgment Psychological Review. Washington, D.C., v.34,
p.273-286, 1927.
CAPITULO 6
* Note-se que. neste trabalho, concebem-se de modo inovador as bases histricas da Psi-
cometria como o resultado da confluncia entre os esforos de psiclogos e estatsticos.
Para um mais amplo entendimento de uma formulao da histria da Psicometria, pode-se
consultar, deste mesmo autor. Histria das Idias Estatsticas. Recife: UFPE. 1995. Notas
internas.
efeito, no caso em tela, a inadaptabilidade do mtodo fatorial manifesta-se,
em primeiro lugar, pela justificvel rejeio que se deve esperar relativa-
mente a uma das hipteses nele implcitas, configurada como a incorrela-
o dos fatores ou variveis latentes. Nesse sentido, o leitor j deve
beneficiar-se da dvida natural que se lhe acomete sub-repticiamente,
bem verdade quanto adequao da Anlise Fatorial. Mas essa
mesma rejeio aos fatores ortogonais pode ser tambm justificada pela
ignorncia de quem os manuseia no referente hiptese de ortogonalida-
de ou incorrelao entre os fatores.
Infere-se daqui, na realidade, uma dupla manifestao da ignorncia
cientfica. Em primeiro lugar, no concernente s hipteses fundamentais
dessa frtil tcnica psicomtrica e, em segundo lugar, pelo desconheci-
mento de alternativas metodolgicas que superam satisfatoriamente a
restrio interposta. Assim, no caso, poder-se-ia optar pelo mtodo
sucedneo da Anlise Fatorial Oblqua como um meio propcio supe-
rao da sria restrio de ortogonalidade. Esta, sabe-se bem, no
encontra respaldo nem nos dados observacionais e nem, tampouco, nas
formulaes tericas subjacentes de todas as cincias psicossociais
pode-se dizer sem medo de errar.
No se h de inferir, desse exemplo e essa formulao consubs-
tanciaria, tambm, um erro inaceitvel , que a Anlise Fatorial clssica
com fatores ortogonais deva ser abandonada enquanto conhecimento
metodolgico no. O leitor mais versado nas literaturas estatstica e
psicomtrica iria logo nelas reconhecer a sua imprescindibilidade como
base ou etapa intermediria para alcanar a formulao mais pertinente ao
embasamento terico da sucednea e mais pertinente Anlise
Fatorial Oblqua.
Toda essa teia de consideraes apoiada no paradigma da Anlise
Fatorial auxilia-nos a concluir que, no geral, ignorncia quanto s bases
ou hipteses que sustentam os mtodos ou as tcnicas psicomtricas e
estatsticas o fator primordial de sua inadequao na abordagem dos
dados observacionais. Na realidade, essa ltima afirmao por demais
abusiva, porque a inadaptabilidade constatada no reside nos mtodos em
si mesmos, mas nas suas condies de aplicao. que eles se compor-
tam com neutralidade, esperando, ingenuamente, que seus usurios
saibam manej-los com respeito s suas idiossincrasias. Seria fcil e
cientificamente desonesto, convenhamos, assacar contra a Psicometria ou
a Estatstica, rs inocentes que padecem da mesma injustia com que as
uvas maduras, na fbula de La Fontaine, passaram por verdes pela
frustrao da raposa incapacitada para alcan-las.
Uma outra ordem de idias sobre a insuficincia dos conhecimentos
psicomtrico e estatstico resulta da considerao dos fins a que eles se
destinam. Para ilustrao, ponha-se, ainda, o exemplo com que se vem
tratando o tema. E muito comum encontrarem-se dezenas de complexos
artigos que versam sobre a inferncia estatstica em Anlise Fatorial. A to
conhecida e importante revista pioneira Psychometrika detentora de
recordes nesse sentido. Muito bem digo com nfase , esses artigos
laureiam seus autores pela originalidade de suas concepes, pela
sofisticao estatstica e matemtica que nos deixam complexados e com
sentimentos mesmo que ora so os da inferioridade, vezes outras os da
frustrao e esse o mais justo, reconheamos o do temor! Todas
essas dolorosas sensaes, infelizmente, no so manifestadas de modo
explcito; no as revelamos para no nos desnudarmos diante dos colegas
que, eles mesmos, ironicamente, tambm as padecem no altar sofrido de
limitaes iguais s que nos acicatam. E, se algo revelamos sobre isso em
algum momento, uma espcie de rancor que gera, a meu juzo, esse
sentimento difuso de averso Psicometria e, tambm, Estatstica de um
modo geral. Como bom psicanalista inquieto, eu veria como normais esses
sentimentos e, at mesmo, consider-los-ia mais que pertinentes ou
saudveis. que h algo de errado ou talvez inadequado por trs dessas
formulaes estreis, e exatamente essa sensao que quero analisar
friamente. Onde sustentar-se, ento, para consider-la em suas di-
menses corretas? Em que se podem apoiar os mortais psiclogo e
socilogo, condenados ambos, juntamente com politiclogos e pedagogos,
ao sacrifcio irremedivel nesse altar de formalismos lgico-matemticos?
H um caminho fcil, leitor, quero dizer, perfeitamente trilhvel, porque
possui para o intento apenas a difcil e delicada capacidade de observar;
mas deve-se faz-lo, claro, judiciosamente e sem idias preconcebidas
isso essencial. Com efeito, todos esses conhecimentos que se
diriam de cunho estatstico-inferenciais relativamente Anlise Fatorial
sustentam-se, entre vrias outras, na hiptese simples de que os erros dos
testes ou instrumentos de medio que geram os escores ou notas tm
distribuio normal de Gauss-Laplace. Essa a questo que deve ser
considerada quando nos propomos a dissecar a plausibilidade de
Psicometria no contexto psicossocial a que ela se destina. Interroguemo-
nos, assim, se a destacada hiptese estatstica sobre a normalidade dos
erros decorre da observao, do exame dos fatos, ou se, contrariamente,
ela fruto da gratuidade ou da convenincia com que, Procustos neurti-
cos da novidade cientfica, limitamos a realidade ao leito de ferro de
nossas convenincias acadmicas, para brilharmos nesse mundo falso de
publicaes e bibliografias!
No h aqui como fugir-se, tambm, sempre presente historicida-
de da cincia, sua realidade de poca, s marcantes influncias
importadas e, sobretudo, engolidas sem a imprescindvel digesto
presidida pelo amparo da crtica epistemolgica! Com efeito, a Anlise
Fatorial, desde os seus primrdios londrinos de 1904, sob a inteligncia de
Spearman e, sobremodo, sob a tutela posterior de estatsticos como
Hotelling, Thurstone, Wishart, Roy, Fisher e outros que, nos anos 30 e 40
deste sculo, consolidaram-na como uma teoria normal da Analise Estatstica
Multivariada, estava marcadamente influenciada pela mais que centenria teoria
dos erros normais, essa fecunda fonte de toda cincia observacional que
sustentou, tambm, a Estatstica Inferencial da linha desenvolvida de Ronald
Fisher, Egon Pearson e Jerzy Neyman. No entanto, preciso que se ressalte,
essa hiptese de normalidade, descoberta dos astrnomos e fsicos, era
adequada aos dados das cincias experimentais, era ditada pelas observaes
das cincias cujos experimentos eram controlados pelo pesquisador. Diante
disso, a concluso que nos compete enunciar a de que, infelizmente, o
conceito de erro distribudo normalmente no respaldado pela natureza das
observaes das variveis psicossociais obtidas, desde logo, mediante
instrumentos de mensurao mais precrios de que os das cincias
experimentais. Adot-la, assim, seria amarrar a realidade ao mesmo leito de
ferro das convenincias que nos servem ao papel de Procustos da cincia e no
a de verdadeiros cientistas ou, pelo menos, a de profissionais honestos e
capacitados. Que fazer? Essa a interrogao que, estarrecidos
justificadamente, nos fazemos agora. No h como precipitar-se diante disso.
Longe, muito longe mesmo, a idia de atirar tudo a esse lixo da cincia, to
impressionantemente rico de teorias, mtodos e tcnicas exibidos
pretensiosamente como os mais puros produtos da inteligncia e da cultura
humanas. Contenhamos a indignao natural diante da descoberta de que
tnhamos razo, de que no ramos to tolos quanto as complicaes
estatsticas nos faziam crer! J no nos devemos vexar, mas ver a tudo com
reservas deve ser a primeira atitude, o que sugere a prudncia, boa guia dos
nossos propsitos. E mais: antes de quaisquer outras consideraes, havemos
de concluir que a posio mais correta a de que, no estgio em que se situa a
inferncia da Anlise Fatorial e sobre ela que se sustenta o nosso
paradigma , que no convm adot-la a no ser em situaes muito
especficas. Isto porque, antes de mais nada, imprescindvel ver a Anlise
Fatorial Clssica como um mtodo eminentemente exploratrio, sem nenhum
cunho inferencial ou de confirmao de hipteses, que, este sim, o cerne da
Inferncia Estatstica. Alis, quase todo o aparato psicomtrico at hoje
conhecido convm que seja visto muito mais pela tica exploratria ou descritiva
e, menos do que desejam os seus tericos desavisados e usurios incautos,
pela viso ideal da induo estatstica.
A concluso a que chegamos sobre tudo o que se disse a de que, no
geral, o insucesso e a suspeio com que so vistos os mtodos psicomtricos
e estatsticos so fruto de vrias causas que se somam nessa empreitada de
desprezo pelo bom-senso: a falta de conhecimento das hipteses estatsticas
que lhes do respaldo, o seu uso abusivo, extrapolando-se os limites sem que
para isso haja autorizao cientfica e tcnica e, last but not least, o
desconhecimento de alternativas metodolgicas mais consentneas.
O ENSINO DA PSICOMETRIA E DA ESTATSTICA
IRT (Item Response Theory) j tem uma longa histria. Ela iniciou
com os trabalhos de Lord (1952, 1953) nos Estados Unidos e
Rasch (1960) na Holanda, que a utilizaram para testes de
desempenho e de aptido. Contudo, apenas ultimamente, a partir
de meados dos anos 80, a IRT vem se tornando a tcnica predominante
no campo dos testes. A razo da demora desta teoria em ser
amplamente utilizada em psicometria consiste na enorme complexidade
de manipulao de seus modelos matemticos, inviveis sem os
requintados programas de computador, e estes s comearam
efetivamente a entrar no mercado nos anos 80.
Atualmente, a IRT parece que veio para ficar e substituir grande
parte da teoria clssica da psicometria isto um fato que j ocorre no
Primeiro Mundo (USA, Canad, Europa, Japo, Israel, Austrlia); no res-
tante do mundo ela raramente utilizada, e no Brasil (Amrica Latina em
geral) ela sequer conhecida. Este captulo visa precisamente iniciar no
Pas o conhecimento e, esperamos, o uso desta tcnica no campo da
psicometria.
As publicaes em IRT vm crescendo e tomando conta das revis-
tas especializadas, como a Psychometrika. H centros importantes de
pesquisa nesta rea nos USA (University of Massachusetts at Amherst),
Holanda e Espanha (Universidade de Oviedo). Existe, inclusive, uma
sociedade internacional, a International Test Commission (ITC), que filia
seguidores da IRT. De fato, no Congresso Internacional da ITC, em
Oxford (Inglaterra), de julho de 1993, havia mais de 120 participantes de
cerca de 46 pases. Da Amrica Latina s estavam representados o Brasil
e a Argentina, com dois participantes cada.
O enorme impacto que a IRT vem tendo em psicometria se deve
ao fato de ela superar certas limitaes tericas graves que a psicometria
tradicional contm. Hambleton, Swaminathan e Rogers (1991) salientam
especialmente quatro dessas limitaes:
1) Os parmetros clssicos dos tens (dificuldade e discriminao)
dependem diretamente da amostra de sujeitos utilizada para estabelec-
los (group-dependenf). Da, se a amostra no for rigorosamente repre-
sentativa da populao, aqueles parmetros dos itens no podem ser
considerados vlidos para esta populao. Como conseguir amostras
representativas um problema prtico grave para os construtores de
testes; a dependncia dos parmetros dos itens na amostra obtida se
torna um empecilho de grandes propores para a elaborao de ins-
trumentos psicomtricos no enviesados.
2) A avaliao das aptides dos testandos tambm depende do
teste utilizado (test-dependent). Assim, testes diferentes que medem a
mesma aptido iro produzir escores diferentes da mesma aptido para
sujeitos idnticos. Testes com ndices de dificuldade diferentes evidente-
mente produziro escores diferentes. Mesmo no caso das formas
paralelas, h sempre a dificuldade de que o montante de erros nas duas
formas dificilmente seja o mesmo, o que produzir novamente escores
diferentes.
3) A definio do conceito de fidedignidade ou preciso na teoria
clssica dos testes constitui tambm uma fonte de dificuldades. Ela
concebida como a correlao entre escores obtidos de formas paralelas
de um teste ou, mais genericamente, como o oposto do erro de medida.
Ambos os conceitos apresentam dificuldades. Primeiramente, pratica-
mente impossvel satisfazer as condies de definio de formas
paralelas e, no caso do erro de medida, postulado que este seja
idntico em todos os examinandos postulado improvvel (Lord, 1984).
4) Outro problema da teoria clssica dos testes consiste em que
ela orientada para o teste total e no para o item individual. Toda a
informao do item deriva de consideraes do teste geral, no se
podendo assim determinar como o examinando se comportaria diante de
cada item individual.
Estas e outras dificuldades dos modelos e tcnicas clssicos de
medida incitaram os psicometristas procura de teorias alternativas que
pudessem permitir estabelecer (Hambleton et ai., 1991):
a) caractersticas do item sem ser dependente da amostra de sujeitos
utilizados;
b) escores dos examinandos independentes do teste utilizado;
c) um modelo em nvel do item em vez do teste;
d) um modelo que no exija formas rigorosamente paralelas para
avaliar a fidedignidade;
e) um modelo que oferea uma medida de preciso para cada escore
de aptido.
Essas caractersticas so precisamente oferecidas pela Teoria da
Resposta ao Item (Hambleton, 1983; Hambleton, Swaminathan, 1985; Lord,
1980; Wright, Stone, 1979; Hambleton, Swaminathan, Rogers, 1991; Muiz,
1990).
CARACTERSTICAS DA IRT
Teoria da IRT
Contrariamente teoria clssica de psicometria, a IRT trabalha com
traos latentes e coloca dois axiomas fundamentais: 1) o desempenho do sujeito
numa tarefa (item do teste) se explica em funo de um conjunto de fatores ou
traos latentes (aptides, habilidades, etc.) o desempenho o efeito, e a
causa so os traos latentes; 2) A relao entre o desempenho na tarefa e o
conjunto dos traos latentes pode ser descrita por uma equao monotnica
crescente, chamada de ICC (Item Characteristic Function ou Item Characteristic
Curve a curva caracterstica do item) e exemplificada na Figura 7-1, onde se
observa que sujeitos com aptido maior tero maior probabilidade de responder
corretamente ao item e vice-versa ( a aptido e P() a probabilidade de
resposta correta).
H um nmero ilimitado de modelos para expressar esta relao,
dependendo do tipo de funo matemtica utilizada e/ou do nmero de
parmetros que se quer descobrir para o item.
Propriedades da IRT
Entre as caractersticas da IRT, duas so de especial relevncia:
unidimensionalidade e independncia local.
Unidimensionalidade
A IRT postula que h apenas uma aptido responsvel pela realizao de
um conjunto de tarefas (itens). Parece pacfico que qualquer desempenho
humano sempre multideterminado ou multimotivado, dado que mais de um
trao latente entra na execuo de qualquer tarefa. Contudo, para satisfazer o
postulado da unidimensionalidade, suficiente admitir que haja uma aptido
dominante (um fator dominante) responsvel pelo conjunto de itens. Este fator
o que se supe estar sendo medido pelo teste. O postulado da
unidimensionalidade ainda continua importante, dado que a IRT, embora
estudos estejam sendo feitos nesta rea, ainda no possui solues adequadas
para modelos multidimensional.
Independncia local
Este postulado afirma que, mantidas constantes as aptides que afetam
o teste, as respostas dos sujeitos a quaisquer dois itens so estatisticamente
independentes. Seja 0 o conjunto de aptides que afetam um conjunto de itens,
Uj a resposta de um sujeito ao item i (i = 1, 2, ..., n) e a probabilidade de
resposta do sujeito i com
aptido significa a probabilidade de uma resposta correta e
a probabilidade de uma resposta errada. A independncia local
pode ser matematicamente afirmada como
MODELOS DA IRT
( l = 1. 2........n),
No nosso caso,
ny Pe(y) P(y)
1.000
x2 =
A frmula da funo
2) erro mximo =
Eficincia relativa
A l(0) permite comparar a relativa eficincia de um teste com relao
a outro em sua capacidade de estimar a aptido 0:
TRANSFORMAES DO 0
onde
191
APLICAES DA IRT
Banco de itens
CONCLUSO
REFERNCIAS BIBLIOGRFICAS
ANGOFF, W.H. Scales, norms, and equivalent scores. In: THORNDIKE. R.L. (Ed.). Educational
measurement. 2.ed. Washington, D.C.: American Council on Education, 1971. p.508-GC)0.
------------------ . Use of difficulty and discrimination indices for detecting test bias. Baltimore (MD):
The Johns Hopkins University Press. 1982.
ANGOFF, W.H., FORD, S.F. Item-race interaction on a test of scholastic aptitude. Journal of
Educational Measurement. Washington, D.C.. v.10, p.95-105, 1973.
BAKER. F. B. Methodology review: item parameter estimation under the one-, two-, and three-
parameter logistic models. Applied Psychological Measurement. St. Paul (MN). v.ll, p. 111-142,
1087.
BIRNBAUM, A. Some latent trait models and their use in inferring and examinee's ability. In: LORD,
F.M.. NOVICK, M.R. Statistical theories of mental test scores. Reading (MA): Addison-Wesley,
1968. p. 17-20.
ELLIS, B.B. Item Response Theory: a tool for assessing the equivalence of translated tests. Bulletin of
the International Test Commission, v.19 n.1/2, p.33-51, 1991.
HAMBLETON, R.K. Principles and selected applications of Item Response Theory. In: LINN, R.L. (Ed.).
Educational measurement 3.ed. New York: McMillan. 1989. p.147-200.
HAMBLETON, R.K. (Ed.). Applications of Item Response Theory. Vancouver (BC): Educational
Research Institute of British Columbia. 1983.
HAMBLETON. R.K.. SWAMINATHAN, H. Item Response Theory, principles and applications. Boston
(MA): Kluwer, 1985.
HAMBLETON, R.K., SWAMINATHAN. H., ROGERS. H.J. Fundamentals of Item Response Theory.
London: Sage, 1991.
JENSEN, A.R. Bias in mental testing. New York: Free Press, 1980.
------------------. How much can be boost IQ and scholastic achievement? Harvard Educational
Review, Cambridge (MA), v.39, p.1-123, 1969.
LORD, F.M. An application of confidence intervals of maximum likelihood to the estimation of an
examinee's ability. Psychometrika. v. 18, p.57-75.1953.
----------------- .Applications of Item Response Theory to practical testing problems. Hillsdale (NJ):
Lawrence Erlbaum, 1980.
LORD, F.M., NOVICK, M.R. Statistical theories of mental test scores. Reading (MA): Addison-Wesley.
1968.
MISLEWY. R.J., BOCK, R.D. BILOG: maximum likelihood item analysis and test scoring logistic models.
Mooresville (IN): Scientific Software, 1984.
MUIZ FERNANDEZ. J. Teora de respuesta a los tems: un nuevo enfoque en la evolucin psicolgica
y educativa. Madrid: Piramide, 1990.
RASCH, G. Probabilistic models for some intelligence and attainment tests. Copenhagen: Danish
Institute for Educational Research, 1960.
SCHEUNMAN, J. A method of assessing bias in the test items. Journal of Educational Measure-ment.
Washington, D.C., v.16, n.3, p.143-152. 1979.
------------------. Solving measurement problems with the Rasch model. Journal of Educational
Measurement. Washington, D.C., v.14, p.97-116. 1977b.
WRIGHT. B.D., STONE, M.H. Best test design. Chicago (IL): MESA Press. 1979.
WRIGHT. B.D.. MEAD, R.J., BELL, S.R. BICAL: calibrating items with the Rasch model. Chicago (IL):
University of Chicago. School of Education. 1979. (Statistical Laboratory Research Memorandum,
23B).
WRIGHT, B.D., PANCHAPAKESAN, N. A procedure for samplefree item analysis. Educational and
Psychological Measurement, Durham (NC), v.29, p.23-48, 1969.
2 PARTE
CONCLUSO
REFERNCIAS BIBLIOGRFICAS
REES, A.H., PALMER, F.H. Factors related to change in mental test performance. Developmental
Psychology Monographs, v.3, n.2, 1970.
RESCHLY, D.J. Aptitude tests in educational classification and placement. In: GOLDSTEIN, G.,
HERSEN, M. (Eds.). Handbook of psychological assessment. New York: Pergamon, 1990.
------------------ . Evaluation of the effects of SOMPA Measures on classification of students as
mildly retarded. American Journal on Mental Deficiency, v.86, p.16-20, 1981.
RESNICK, LB. The future of IQ testing in education. In: STERNBERG. R.J., DETTERMAN. D.K.
(Eds.). Human intelligence. Norwood (NJ): Ablex, 1979.
ROAZZI, A., SPINILLO. A.G., ALMEIDA, L.S. Definio e avaliao da inteligncia: limites e
perspectivas. In: ALMEIDA, L.S. (Ed.). Cognio e aprendizagem escolar. Porto:
Associao dos Psiclogos Portugueses, 1991.
ROSENTHAL. R.. JACOBSON. L. Pygmalion in the classroom. New York: Holt, Rinehart and
Wiston, 1968.
SATTLER, J.M. Age effects on Wechsler adult intelligence scale-revised tests. Journal of
Consulting and Clinical Psychology. Washington. D.C.. v.SO, p.785-786. 1982.
------------------ . Assessment of children. San Diego (CA): Jerome M. Sattler. 1988.
SPEARMAN, C. The abilities of man. New York: Macmillan, 1927.
STERNBERG, R.J. Beyond IO: a triarchic theory of human intelligence. Cambridge: Cambridge
University Press, 1985.
------------------ . Death, taxes, and bad intelligence tests. Intelligence, Norwood (NJ), v. 15, p.257-
269. 1991.
THORNDIKE, R.L, HAGEN, E.P., SATTLER, J.M. Stanford-Binet intelligence scale. 4.ed. Chigago
(IL): Riverside, 1986.
THURSTONE, L.L Primary mental abilities. Chicago (IL): Univ. Chicago Press, 1938.
TYLER, L.E. Individuality, human possibilities and personal choice in the psychological de-
velopment of men and women. San Francisco (CA): Jossey-Bass, 1981.
VANE. J.R.. MOTTA. R.W. Group intelligence tests. In: GOLDSTEIN, G., HERSEN, M. (Eds.).
Handbook of psychological assessment. New York: Pergamon, 1990.
VERNON, P.E. The structure of human abilities. London: Methuen, 1965.
VYGOTSKY. L.S. Mind in society, the development of higher psychological process. Cambridge
(MA): Harvard University Press, 1978.
------------------ . The measurement and appraisal of adult intelligence. Baltimore (MD): Williams
and Wilkins, 1958.
------------------ . The measurement of adult intelligence scale. Baltimore (MD): Williams and
Wilkins, 1939 e 1944.
WEISS, D.J.. DAVIDSON, M.L Test theory and methods. Annual Review ofPsychology.*.32, p.629-
658, 1981.
WESMAN, AG. Intelligenttesting. American Psychologist, Washington, D.C., v.36. p. 112-113, 1968.
WIGDOR, A.K.. GARNER, W.R. Ability testing: uses, consequences, and controversies.
Washington, D.C.: National Academy Press, 1982.
WILLIAMS, R.L The BITCH test. St. Louis (MO): Black Studies Program. Washington University,
1972.
------------------ . Danger: testing and dehumanizing the black child. Clinical Child Psychology
Newsletter, v.9, p.5-6, 1970.
------------------ . The problem of match and mismatch in testing black children. In: MILLER, L.
(Ed.). The testing of black students: a symposium. Englewood Cliffs (NJ): Prentice-Hall, 1974.
ZAZZO. R., GILLY M.. VERBA-RAD. M. Nouvelle chelle mtrique de l'intelligence. Paris: Armand
Colin, 1966.
------------------ . Nova escala mtrica da inteligencia. Lisboa: Livros Horizonte, 1978. v.1.
CAPITULO 9
METODO
Forma II a
(continua)
Fig. 9-1 (cont.)
Primera premisa
relacionai
(A1B) (AOB) (APB)
Id. =identidad, Sb. =subconjunto, Sp. = superconjunlo, Ov. =Iraslapamiento (overlap), Ex. =exclusin entre conjuntos. Las rela-
ciones Sp. entre parntesis pueden dar lugar a controversia con respecto a Ex.; ellas respuenden al criterio del autor que se ha
basado en (B1 A). Esta ambigedad surge del conjunto vacio cuando se lo emplea como trmino consecuente de las relaciones R.
PREMISAS EXTENSIONALES
Diagrama Rectangular
( + ) A ( + ) U
A-B-C-D -A-B-C-
(+) (-) B D
AB-C-D -AB-C-D
(-) (-) (-) (+) c
A-BC-D ABC-D -ABC-D -A-BC-D
(-) (-) (-) ( + ) D
A-BCD ABCD -ABCD -A-BCD
(-) (-) (-) -A-B-CD
A-B-CD AB-CD -AB-CD
En el caso en que A = 0
En el caso en que A
CONCLUSIONES
ABELSON, R.P. ARONSON, E., MCGUIRE, W.J.. NEWCOMB, T.M., ROSENBERG, M.J..
TANNEMBAUM, P.H. (Eds.)- Theories of cognitive consistency, a source-book. Chicago (IL): Rand-
McNally, 1968.
BENTHAM, J. Outline on a new system of logic. [S.I.: s.n.], 1827.
BOOLE, G. An investigation of the laws of thought. London: Macmillan, 1854.
--------------- .The mathematical analysis of logic. Cambridge (MA): MacMillan, Barclay and
MacMillan, 1847.
--------------- . The mathematical analysis of logic. Oxford: Basil Blackwell, 1948,1951.
BROUWER, L.E.J. Intuitionism and formalism. Bulletin of the American Mathematical Society, V.20,
p.81-96, 1913.
CERASO, J., PROVITERA. A. Sources of error in syllogistic reasoning. Cognitive Psychology. V.2,
p.400-410. 1971.
CHAPMAN. L.J., CHAPMAN, J.P. Atmosphery effect re-examined. Journal of Experimental Psychology
Washington, D.C.. v.58, p.220-226,1959.
CRONBACH. L.J., GLESER, G.C., RAJARATNAM, N.. NANDA. H. The dependability of behavioral
measure, theory of generalizability for scores and profiles. New York: Wiley, 1972.
DEL VAL, J.A. (Comp.). Investigaciones sobre lgica y psicologa. Madrid: Alianza Universidad, 1977.
DICKSTEIN, L.S. Differential difficulty of categorical syllogisms. Bulletin of the Psychonomic Society.
V.8, p.330-332. 1976.
ERICKSON. J.R. Research on syllogistic reasoning. In: REVLIN, R., MAYER, RE. (Eds.). Human
reasoning. Washington, DC: Winston, 1978.
--------------- . A set analysis theory of behavior in formal syllogistic reasoning tasks. In: SOLSO,
R.L. (Ed.). Theory of cognitive psychology, the Loyola Symposium. Potomac: Erlbaum. 1974.
EVANS, J.S.B.T. Selective processes in reasoning. In: EVANS, J.S.B.T. (Ed.). Thinking and reasoning,
psychological approaches. London: Routledge and Kegan. 1983.
FEATHER, NT. Acceptance and rejection of arguments in relation to attitude strength, critical ability,
and intolerance of incosistency. Journal of Abnormal and Social Psychology, v.69, p. 127-136,1965.
FELDMAN, S. (Ed.). Cognitive consistency, motivational antecedents and behavioral consequents. New
York: Academic Press, 1966.
FESTINGER, L A theory of cognitive dissonance. Stanford (CA): Stanford University Press, 1957.
FRANDSEN, A.N., HOLDER. J.R. Spatial visualization in solving complex verbal problems. Journal of
Psychology. Provincetown (MA), v.73, p.229-233, 1969.
FRASE, L.T. Belief, incongruity, and syllogistic reasoning. Psychology Reports, v. 18, p.982, 1966.
GOTTESMAN, L. CHAPMAN, L.J. Syllogistic reasoning errors in schizophrenia. Journal of Consulting
Psychology, v.24, p.250-255, 1960.
GUILFORD. J.P. Three faces of intellect. American Psychologist. Washington. D.C., v.14,
p.469-479, 1959.
HALPERN. J. Reasoning. In: EYSENCK. M.W. (Ed.). The Blackwell dictionary of cognitive
psychology. Oxford: Basil Blackwell. 1990.
HAMILTON, W. Lectures on metaphysics and logic. [S.I.: s.n.J, 1859.
HARRELL. W.A. The effects of alcohol use and offender remorsefulness on sentency decisions.
Journal of Applied Social Psychology. Silver Spring (MD). v. 11, p.83-91, 1981.
HEIDER, F. The psychology of interpersonal relations. New York: Wiley. 1958.
HENLE. M. Foreword. In: REVLIN, R., MAYER. R.E. (Eds.). Human reasoning. Washington,
D.C.: Winston. 1978.
. ------------ . On the relation between logic and thinking. Psychological Review. Washington.
D.C.. V.69, p.366-378, 1962.
HERBART, J.F. Hauptpunkte derlogik. [S.I.: s.n). 1808.
---------- . Lehrbuch zur einleitung in die philosophie. [S.I.: s.n.]. 1813.
JOHNSON-LAIRD, P.N. Mental models. Cambridge (MA): Harvard University Press. 1983.
------------- . El ordenador y la mente: introduccin a la ciencia cognitiva. Barcelona: Paids,
1990.
KAHNEMAN, D.. SLOVIC, P.. TVERSKY, A. (Eds.). Judgment under uncertainty: heuristics
and biases. Cambridge: Cambrigde University Press, 1983.
KANT, I. Logik. [S.I.: s.n.|. 1800. (Redactado por Jsche sobre apuntes de clase de Kant).
KASSIN, S.M. Base rates and prediction: the role of sample size. Personality and Social
Psychology Bulletin. Beverly Hills (CA). v.5, p.210-213, 1979.
LEFFORD, A. The influence of emotional subject matter on logical reasoning. Journal of
General Psychology. Provincetown (MA), v.34. p. 127-151, 1946.
LINDZEY. G ARONSON, E. (Eds.). The handbook of social psychology. 2.ed. Reading
(MA): Addison Wesley, 1969. v.3: The individual in the social context.
LIPPS, T. Grundzuge derlogik. [S.I.: s.n|. 1893.
LOPEZ ALONSO. A.O. Test de coherencia. Publicacin CIIPME. Buenos Aires, v.65. 1981.
------------- . Razonamiento humano: un test para su consistencia interna. Revista Signos
Universitarios. Buenos Aires, v.7, n.13 (Especial: Psicologa), 1988.
------------- . Razonamiento humano: distintos niveles de insight estructura y organizacin lgica
subyacente (versin ampliada). Cuadernos Pinero, Buenos Aires, n.16, 1990.
------------- . Razonamiento humano: distintos niveles de insight, estructura y organizacin lgica
subyacente. Revista de Psicologa General y Aplicada. Madrid, v. 44, n.2, p.221-230,199 la.
------------- . Haca una teora sistmico-ciberntica de la organizacin cognitiva de la mente y
del origen de la conciencia. Revista Signos Universitarios. Buenos Aires, v.10, n.19
(Especial: Miscelnea I), 1991b.
--------------. Incidencia de la codificacin de las premisas en el logro de un razonamiento
coherente. Revista Interdisciplinata, Buenos Aires, v.10 n.2, p. 137-167, 1991c.
--------------. Relational structures of premisses as determinant of reasoning coherence and
thought logical organization. Brussels, 1992. Trabajo presentado en el 25th. International
Congress of Psychology, Blgica, julio 1992.
LOPEZ ALONSO, A.O., RICARDI, N.C. La organizacin lgica del razonamiento en relacin con
categoras de diagnstico psiquitrico. Revista IRICE, Rosario, 1993.
LORD, C.R., ROSS, L, LEPPER, M.R. Biased assimilation and attitude polarization: effects of
prior theories on subsequently considered evidence. Journal of Personality and Social
Psychology, Washington, D.C., v.37, p.2098-2109, 1979.
McGUIRE, W.J. Cognitive consistency and attitude change. Journal of Abnormal and Social
Psychology, v.60, p.345-353,1960.
REVLIN, R. Two models of syllogistic reasoning: feature selection and conversion. Journal of
Verbal Behavior,w.l4, p.180-195, 1975.
RICARDI, N.C. Estudio evolutivo del pensamiento y su covariacin con la consistencia interna
del razonamiento en nios sordos y oyentes. Revista del Instituto de Investigaciones
Educativas. Buenos Aires, v.15, n.67/68, oct. 1989.
RIMOLDI, H.J.A. Problems of thinking about thinking: language, and logical structure in problem
processing. In: FROELICH, W., SMITH, G., DRAGUNS, J., HENTSCHEL, U. (Eds.).
Psychological processes in cognition and personality. Washington, D.C.: Hemisphere, 1984.
. A technique for the study of problem solving. Educational and Psychological Measure
ment, Durham (NC), v.15, n.4, p.450-461, 1955.
VON DOMARUS, E. The specific laws of logic in schizophrenia. In: KASAMIN, J.S. (Ed.). Language
and thought in schizophrenia. Berkeley: University of California Press, 1944.
VON WRIGHT, G.H. Ensayo de lgica modal. Buenos Aires: S. Rueda, 1970.
WASON, P.C. Problem solving and reasoning. British Medical Bulletin. Cognitive Psychology,
Edinburgh, v.3, p.206-210,1971.
--------------- . Realismo y racionalidad en la tarea de seleccin. In: CARRETERO, M., GARCIA
MADRUGA, J.A. (Comps.). Lecturas en psicologa del pensamiento. [S.l.]: Alianza Psicologa,
1984.
----------------. Reasoning. In: FOSS. B. (Ed.). New horizons in psychology. London: Penguin, 1966.
--------------- . Self contradictions. In: JOHNSON-LAIRD, P.N., WASON, P.C. (Eds.). Thinking:
readings in cognitive science. Cambrigde: Cambridge University Press, 1977.
WHITEHEAD, A.N., RUSSELL, B. Principia mathematica. Cambrigde: Cambridge University Press,
1910.
WOODWORTH, R.S., SELLS, S.B. An atmosphere effect in normal syllogistic reasoning. Journal of
Experimental Psychology, v.18, p.451-460, 1935.
OBSERVAO DO COMPORTAMENTO
Diretrizes metodolgicas
Como decorrncia das proposies tericas da etologia e da anlise
do comportamento aplicada, foi desenvolvida uma srie de diretrizes
metodolgicas para a realizao de estudos observacionais, que sero
descritas a seguir. Antes, porm, importante lembrar a questo da
seletividade. Segundo Hinde (1966), a seleo na observao inevitvel:
a descrio e a classificao envolvem rejeio de dados e seleo de
critrios. Sempre se corre o perigo de rejeitar os dados essenciais e utilizar
unidades de anlise irrelevantes. No entanto, a rejeio insuficiente de
dados pode levar a um conjunto de detalhes confusos e desviar a ateno
dos aspectos essenciais do problema. Para Hinde (1973), o grau de
seleo depende do problema estudado e do fato de que a preciso do
registro diminui medida que aumenta o nmero de respostas a registrar.
Avaliao da fidedignidade
O conceito de fidedignidade, de acordo com a teoria clssica dos
testes, apresentado por Johnson e Bolstad (1973, p.26) como "a
consistncia com que um teste mede um dado atributo ou fornece um
escore consistente em uma dada dimenso", sendo que "a exigncia
clssica de fidedignidade envolve a consistncia no instrumento de medida
ao longo do tempo (fidedignidade no teste-reteste) ou ao longo de
conjuntos de itens respondidos na mesma ocasio (fidedignidade split-
half)" (id. ibid., p.10). O autor discute a aplicao do conceito aos estudos
observacionais em anlise do comportamento aplicada e argumenta que
o clculo do acordo entre observadores no deve se constituir a nica
forma de aferir a fidedignidade desses estudos.
Weick (1968) cita Medley e Mitzel, que sugerem trs tipos de
fidedignidade, calculados atravs de diferentes ndices: acordo entre
observadores (diferentes observadores observando ao mesmo tempo),
estabilidade (o mesmo observador observando em ocasies diferentes) e
fidedignidade (observadores diferentes observando em ocasies diferen-
tes). A medida de acordo entre observadores, mais comumente utilizada,
privilegia a intersubjetividade, enquanto as demais privilegiam a replicabili
dade. O autor tambm cita Dunnette, que argumenta que h vrias fontes
de erros quando se faz observao, e que o tipo de fidedignidade
necessria para avaliar ou compensar cada um desses erros diferente.
Os tipos de erros mencionados so: a) amostragem inadequada de con-
tedo, quando observadores diferentes colhem amostras de apenas alguns
elementos de um comportamento complexo e essas amostras consistem de
elementos diferentes; b) tendncias de respostas ao acaso, que provm
de definies imprecisas de categorias ou de compreenso inadequada da
categoria por parte do observador, que o levam freqentemente ao uso de
definies intuitivas informais, mais variveis que as formalmente definidas;
c) mudanas no ambiente e d) mudanas na pessoa que est sendo
observada, duas alteraes que podem ocorrer ao longo do perodo de
observao. Dadas essas vrias fontes de erro, Weick (1968) sugere que a
fidedignidade seja medida de vrios modos. Num estudo ideal de obser-
vao, seriam feitas quatro comparaes: 1) as classificaes de duas
pessoas observando o mesmo evento seriam correlacionadas, prevenindo
erros de mudanas na pessoa e no ambiente; 2) as classificaes de um
mesmo observador observando um evento semelhante em duas ocasies
diferentes seriam comparadas, evitando-se erro de amostragem de
contedo; 3) depois seria correlacionado o acordo de dois observadores
observando um evento em duas ocasies diferentes, medida vulnervel s
quatro fontes de erro, da qual se pode esperar a fidedignidade mais baixa
dentre as quatro comparaes; 4) finalmente, as observaes de um nico
observador observando um nico evento seriam comparadas s outras
correlaes, em uma verificao da consistncia interna do observador. O
autor considera que possvel apenas aproximar-se deste ideal de
avaliao da fidedignidade, priorizando-se o acordo entre observadores em
relao a um nico evento. Tendo em vista as atuais possibilidades de
gravao em vdeo, considera-se que seria bastante vivel adaptar essas
propostas para avaliao da fidedignidade tanto durante o treino de
observadores como no teste de categorias de comportamento.
Uma reviso das variveis que podem afetar o ndice de concor-
dncia foi realizada por Batista (1977). No que se refere ao acordo entre
observadores quando utilizada a tcnica de registro cursivo, Batista e
Matos (1984) discutem a questo e sugerem definies e medidas aplic-
veis a essa tcnica de registro.
Batista (1985) analisa as diferenas de abordagem questo da
fidedignidade por autores ligados etologia e anlise do comportamento
e conclui que o pesquisador deve adequar a avaliao de fidedignidade s
caractersticas especficas de seu projeto de trabalho. A autora faz
algumas sugestes especficas:
a) Estudos preliminares que visem caracterizao de um fen-
meno podem se beneficiar mais de discusses informais entre pesqui-
sadores do que de testes formais de fidedignidade.
b) Estudos em que um nico observador efetua todos os registros
de comportamento podem ter avaliaes de fidedignidade de vrias
formas, entre as quais 1) a aferio da estabilidade do observador
atravs de verificao de seu desempenho no registro de um mesmo
vdeo em duas situaes diferentes e 2) a comparao de seu desem-
penho com o de um pesquisador experiente que tenha tido contato
prvio com as definies das categorias apenas por escrito.
c) Estudos em que diferentes observadores participem da coleta de
dados tero que contar necessariamente com um sistema de aferio
da preciso de cada um desses observadores. Um alto ndice de
acordo, no entanto, no indicar necessariamente a adequao do
sistema de categorias utilizado, uma vez que estes podero estar
reagindo a uma definio implcita da categoria.
d) O teste das definies de categorias poder ser realizado, em
parte, atravs da anlise dos desacordos constatados para categorias
especficas.
No que se refere fidedignidade, o importante reter o significado
mais amplo do termo e estabelecer formas de aferi-la que sejam compat-
veis com os objetivos de cada estudo.
A perspectiva sociointeracionlsta-construtivista
de estudo do desenvolvimento
Trata-se de uma perspectiva que aborda a situao de interao
social como constitutiva dos sujeitos. Enfoca o dilogo como troca nego-
ciada constitutiva dos sujeitos e da prpria troca (Lyra, 1988). Baseia-se,
em parte, em formulaes referentes aquisio da linguagem (Lemos,
1981), em que a autora considera que as situaes de interao so um
espao para a construo de relaes semnticas, morfolgicas e
sintticas pela criana. Ela prope uma continuidade entre o perodo pr-
verbal e o verbal na aquisio da linguagem e sugere que a criana deve
passar pelo processo de inserir-se numa estrutura didica com um
interlocutor para construir uma representao de si mesma e do outro
como interlocutores. Considera que sua proposio semelhante de
Vygotsky, citado por ela, de que as atividades da criana adquirem
significado em um sistema de relacionamento social, na medida em que o
caminho que vai do objeto para a criana e da criana para o objeto passa
pela relao com outra pessoa.
Dentro desse enfoque, Lyra e colaboradores (Lyra, 1988,1991; Lyra,
Galindo, Cipriano, 1990; Lyra, Cabral, Pantoja, 1991) tm desenvolvido um
programa de pesquisa das interaes entre me e beb, realizando
registros longitudinais em vdeo em situao natural. Tm sido analisadas
como atividades partilhadas as interaes "face a face" e as interaes
"me-objeto-beb". Nas interaes "face a face", tm sido estudadas a
produo vocal e o sorriso. Ao discutir aspectos referentes transcrio e
anlise de dados em vdeo, Lyra (1991) afirma a necessidade de uma
"filiao profunda" entre a posio terico-epistemolgica do pesquisador
e a metodologia de transcrio e anlise de dados a ser adotada.
Esclarece alguns pontos acerca de sua concepo de estudo, destacando-
se: a) a necessidade de explorao de registros longitudinais; b) uma
concepo de causalidade como transformaes e construes bidirecio-
nais e interdependentes; c) o enfoque em ambos os sujeitos bem como na
interao entre eles; d) a viso da diade como unidade de anlise
indissocivel. Nesse sentido, prope como soluo metodolgica para uma
primeira fase do programa de pesquisa a descrio e anlise de momentos
identificados como qualitativamente diferentes dos anteriores e posteriores,
"procurando relacionar as transformaes e construes identificadas
compreenso do dinamismo existente na histria da diade, ou seja, aos
processos de troca negociada entre os parceiros, chamados de processos
dialgicos" (Lyra, 1991, p.294). Decorre da a necessidade do registro
longitudinal em vdeo, cuja transcrio e anlise so efetuadas a partir de
critrios derivados dessas concepes.
A partir dessa anlise, de cunho qualitativo, a autora relata o
destaque de um elemento presente nas organizaes face a face: as
trocas vocais, que ensejaram uma segunda fase de seu programa de
pesquisa, incluindo uma verificao quantitativa das modificaes
identificadas na produo vocal do beb. Reafirma, entretanto, que sua
posio terica v a quantidade como filiada qualidade, sendo que a
compreenso do processo de transformao e construo continuam a
depender de uma anlise qualitativa.
Outro exemplo de trabalho nessa perspectiva o de Oliveira (1988a),
que realizou um estudo longitudinal em uma creche pblica, usando a
noo de "jogo de papis" como foco da anlise dos dados, registrados em
vdeo. A anlise das transcries foi realizada com base na seleo de
trechos em que se evidenciava a construo de enredos de diferentes
papis construdos pelas crianas no grupo e no faz-de-conta. A anlise
mostrou a construo coletiva da brincadeira e uma crescente diferen-
ciao de papis. A autora tem analisado tambm situaes de interao
adulto-criana em creches e pr-escolas. Ela discute o conceito de papel
na anlise do processo interacional, retomando postulados da Psicologia
sociointeracionista de base dialtica do incio do sculo, e prope um
enfoque processual que concebe a interao "como constituindo os
sujeitos e no como influncias, mesmo que recprocas, entre sujeitos j
constitudos" (Oliveira, 1992).
Ainda um outro exemplo de pesquisa abordando a interao entre
crianas como um processo de construo mtua o trabalho de Pedrosa
(1989), que fez gravaes em vdeo na creche, em situao de recreao
livre. A autora apresenta seus dados na forma de descrio de onze
episdios, indicando para cada um: a) o nome do episdio; b) dados sobre
a data, horrio, durao, crianas envolvidas; c) descrio da situao
(presente e imediatamente anterior); d) resumo do episdio e descrio
detalhada do mesmo. A anlise dos dados evidencia: a) a ocorrncia de
brincadeira compartilhada em grupo, sem a sugesto do adulto, em
crianas desde menos de dois anos de idade; b) o levantamento de
hipteses sobre processos de regulao, tais como o "arranjo" da
brincadeira, ajustamentos rtmicos e posturais, regras, etc. Discutindo
questes referentes transcrio e anlise de registro em vdeo, Pedrosa
e Carvalho (1991, p.285) definem episdio interativo como "um segmento
de registro onde aparecem seqncias interativas claras e conspicuas ou
trechos do registro em que se pode circunscrever um grupo de crianas a
partir do arranjo que formam e/ou da atividade que realizam" e consideram
que o recorte em episdios corresponde a uma primeira forma de seleo
dos dados que parece til para perseguir a estrutura interacional do grupo.
Afirmam que o incio de um episdio pode ser delimitado por um fato a
partir do qual se articula uma seqncia interativa (por exemplo: uma
criana pega um apito e comea a sopr-lo) ou o episdio pode emergir
de uma situao em que vrios elementos se combinam e se constituem
em uma seqncia, s vezes s reconhecida a posteriori, e cujo incio
algumas vezes arbitrado, o mesmo ocorrendo para a delimitao do
trmino de um episdio.
Os episdios so a seguir divididos em momentos, com critrios
bastante flexveis. Em alguns casos, segue-se a composio social do
grupo; em outros, a configurao da seqncia em curso, seguindo pistas
como o contedo da brincadeira, a distribuio espacial, etc. As autoras
ressaltam que essa proposta de recorte decorre de sua concepo de
interao, concebida como "um processo de influncias recprocas entre
os parceiros" (id. ibid., p.286), admitindo que a estruturao desses arranjos
envolve processos de regulao entre as crianas.
As autoras destacam dois tipos de transcrio do episdio: um que
privilegia uma seqncia de interao identificada e descreve o comporta-
mento das outras crianas que tambm esto em cena, apenas se estiver
diretamente relacionado quela seqncia nesse caso, o interesse
seguir a trama interacional especfica; j o outro tipo de transcrio procura
incluir tanto as seqncias interacionais quanto informar sobre todos os
comportamentos das crianas que aparecem em cena, com um foco de
ateno mais abrangente, usado quando se deseja comentar as regu-
laes recprocas entre as crianas presentes num registro.
Quanto ao nvel de detalhamento na transcrio do episdio,
Pedrosa e Carvalho propem como regra: o comportamento das crianas
dever ser transcrito em detalhes apenas se essa descrio for esclarece-
dora para a compreenso do que se deseja demonstrar. Com base nesta
regra, s se descreve, por exemplo, a postura da criana em suas mincias
morfolgicas quando esta for o alvo de interesse do trabalho (por exemplo:
uma inclinao de tronco da criana pode interessar quando for seguida
de movimento semelhante por outra criana).
As autoras sugerem, ainda, o registro de impresses provocadas no
pesquisador pelas aes das crianas, distinguindo-as dos fatos observa-
dos, dando um "tom" situao e favorecendo a compreenso do episdio.
A anlise qualitativa proposta a partir de perguntas que levam ao
exame e ao reexame dos episdios e sua relao com as formulaes
tericas subjacentes.
Assim, dentro da perspectiva sociointeracionista-construtivista, tm
sido exploradas novas formas de anlise e tratamento de dados, decorren-
tes das formulaes tericas adotadas pelos pesquisadores da rea.
REFERNCIAS BIBLIOGRFICAS
ADES, C. A teia e a caa da aranha Argiope argentata. So Paulo, 1972. Tese (Doutorado)
Faculdade de Filosofia. Letras e Cincias Humanas, USP.
ALTMANN, J. Observational study of behavior: sampling methods. Behaviour, v.49, p.227-267,
1974.
ALTMANN, S.A. Sociobiology of rhesus monkeys: the stochastics of social communication.
Journal of Theoretical Biology, London, v.8, p.490-522, 1965.
ALVES, Z.M.B.A. Anlise da interao me-criana: um estudo longitudinal (dos dois ao seis
meses) da evoluo de seqncias de interao. Ribeiro Preto, 1973. Tese (Doutorado)
Faculdade de Filosofia, Cincias e Letras, USP.
ALVES, Z.M.B.A., CARVALHO, A.M.A., MARTURANO, EM., METTEL. T.P.L. ROSSETTI-
FERREIRA, M.C. Questes metodolgicas no estudo da interao humana. In: REUNIO
ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 17, 1987. Anais...
Ribeiro Preto, 1987. p.531-541.
BAER, D.M., WOLF, M.M., RISLEY, T. Some current dimensions of applied behavior analysis.
Journal of Applied Behavior Analysis, Lawrence (KS), v.1, n.l, p.91-97, 1968.
BASTOS, M.F., CARVALHO, A.M.A. Empatia entre crianas. In: REUNIO ANUAL DASOCI-
EDADE DE PSICOLOGIA DE RIBEIRO PRETO, 21,1991. Anais... Comportamento pro-
social: questes filogenticas e ontogenticas. Ribeiro Preto, 1991. p.l 14-116.
BATISTA CG. Catlogo de comportamentos motores observados durante uma situao de
refeio. So Paulo, 1978. Dissertao (Mestrado) Instituto de Psicologia, USP.
--------------. Concordncia e fidedignidade na observao. Psicologia, v.3, n.2, p.39-49,1977.
--------------. Elaborao de um catlogo de comportamentos motores observados na interao
entre pais e filhos. Psicologia, v.6, n.3, p.47-81, 1980.
--------------. Mes e crianas brincando: um estudo de influncias recprocas. So Paulo, 1989.
Tese (Doutorado) Instituto de Psicologia, USP.
BATISTA, CG. Objetivos da avaliao da fidedignidade em estudos observacionais. Psicolo-
gia: Teoria e Pesquisa, v.1, n.3. p.205-214, 1985.
BATISTA. CG., MATOS, MA. O acordo entre observadores em situao de registro cursivo:
definies e medidas. Psicologia, v.10, n.3, p.57-69, 1984.
BERGAMASCO, N.H.P. Expresses faciais de recm-nascidos em resposta a estmulos
gustativos e olfativos. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RI-
BEIRO PRETO. 21. 1991. Anais... Transcrio e anlise de registro em vdeo. Ribeiro
Preto. 1991.p.291-292.
. . Percepo de estmulos qumicos em recm-nascidos: discriminao e prefe
rncias. In: REUNIO ANUAL DASOCIEDADE BRASILEIRA DE PSICOLOGIA, 22.1992.
Resumos de comunicaes cientificas..., n.336.1. [S.I.], 1992.
BERGAMASCO, N.H.P, LIMA, A., KRUSNAUKAS, I. Valor de comunicao das respostas
faciais de recm-nascidos. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRO PRETO, 21, 1991. Resumos..., n.211. Ribeiro Preto, 1991.
BIJOU, S.W., PETERSON, R.F., AULT, M.H. A method to Integrate descriptive and empirical
field studies at the level of data and empirical concepts. Journal of Applied Behavior
Analysis. Lawrence (KS), v.1, n.2, p.175-191. 1968.
BLURTON JONES, N. (Org.). Ethological studies of child behavior. Cambridge: Cambridge
University Press, 1972.
BRANCO, A.U. Ontogense e promoo do comportamento pr-social. In: REUNIO ANUAL
DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 21.1991. Anais... Comporta-
mento pr-social: questes filogenticas e ontogenticas. Ribeiro Preto, 1991. p.110-113.
. Socializao na pr-escola: o papel da professora e da organizao das ativida
des no desenvolvimento das interaes sociais entre as crianas. So Paulo, 1989. Tese
(Doutorado) Instituto de Psicologia, USP.
BRANCO, A.U., METTEL, T.P.L Comportamento pr-social: um estudo com pr-escolares.
Psicologia, v.10, n.1. p.43-61, 1984.
-------------- . A interao professora-alunos na pr-escola: uma metodologia de anlise. In:
REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 19,1989.
Resumos..., n. 222. Ribeiro Preto, 1989a.
. Socializao na pr-escola: fatores interativos e ambientais relacionados s intera
es criana-criana. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRO PRETO, 19,1989. Resumos..., n. 231. Ribeiro Preto, 1989b.
BRANDO, CR. Pesquisar-participar. In: BRANDO, CR. (Org.). Pesquisa participante. So
Paulo: Brasiliense. 1981.
BUSSAB, V.S.R. Comportamento pr-social: questes filogenticas. In: REUNIO ANUAL
DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 21.1991. Anais... Comporta-
mento pr-social: questes filogenticas e ontogenticas. Ribeiro Preto, 1991. p.197-209.
-------------- . Processos de ritualizao: aspectos filogenticos e ontogenticos. In: REUNIO
ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 18,1998. Resumos...,
n. 132. Ribeiro Preto, 1988.
CAMPOS DE CARVALHO, M.l. Arranjo espacial e distribuio de crianas de 2-3 anos pela
rea de atividades livres em creche. So Paulo, 1990. Tese (Doutorado) Instituto de
Psicologia, USP.
CAMPOS DE CARVALHO, M.l. Organizao espacial da rea de atividades livres em cre-
ches. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO,
18, 1988. Anais... Condies ambientais na educao do indivduo especial. Ribeiro
Preto, 1988. p.305-310.
CARVALHO, A.M.A. Abordagem etolgica: desenvolvimento, socializao. So Paulo, 1978.
Apostila utilizada no curso de Ps-Graduao do Departamento de Psicologia Expe-
rimental. Instituto de Psicologia, USP.
-------------- . Algumas reflexes sobre o uso da categoria "interao social". In: REUNIO
ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 18, 1988. Anais...
Avanos recentes em Psicologia do desenvolvimento. Ribeiro Preto, 1988. p.511-515.
-------------- . Alguns dados sobre a diviso de trabalho entre obreiras de Atta sexdens rubropi-
losa, Forel, 1908 (Hymenoptera-Formicidae), em colnias iniciais, mantidas em labo-
ratrio. So Paulo, 1972. Tese (Doutorado) Faculdade de Filosofia, Letras e Cincias
Humanas, USP.
-------------- . Critrios para a descrio e anlise de relaes interindividuais: reviso crtica e
anlise emprica. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO
PRETO, 21,1991. Resumos..., n. 202. Ribeiro Preto, 1991a.
-------------- . Questes conceituais. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA
DE RIBEIRO PRETO, 21, 1991. Anais... Comportamento pr-social: questes filoge-
nticas e ontogenticas. Ribeiro Preto, 1991b. p.104-106.
. Relaes interpessoais: o nvel de recorte. In: REUNIO DA SOCIEDADE BRA
SILEIRA DE PSICOLOGIA, 22. 1992. Resumos de comunicaes cientficas..., n.342.2.
[S.I.], 1992.
CARVALHO, A.M.A., BERALDO, K.E.A. Interao criana-criana: ressurgimento de uma
rea de pesquisa e suas perspectivas. Cadernos de Pesquisa, So Paulo, v.71, p.55-61,
1989.
CATANIA, A.C. The nature of learning. In: NEVIN, J.A., REYNOLDS, G.S. (Orgs.). The study
of behavior. Glenview: Scott, Foresman and Co, 1973.
CHAGURI, AC, RUBIANO, M.R.B., SILVA JR., V., ROSSETTI-FERREIRA, M.C. A organi-
zao de crianas em creches com diferentes enfoques pedaggicos. In: REUNIO
ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 21,1991. Resumos...,
n.205. Ribeiro Preto, 1991.
COPI, I.M. Introduo lgica. Trad. por lvaro Cabral. So Paulo: Mestre Jou, 1974.
CORRAZE, J. As comunicaes no-verbais. Trad. por Roberto C. Lacerda. Rio de Janeiro:
Zahar, 1982.
COUTINHO. S.M.G.. ZANNON, C.M.L.C. Estudo exploratrio de interaes sociais em setor
de emergncia peditrica. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRO PRETO, 21, 1991. Resumos.... n. 88. Ribeiro Preto, 1991.
CREPALDI, M.A., ZANNON, C.M.LC. Hospitalizao infantil: estudo da interao equipe
famlia em unidade peditrica. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA
DE RIBEIRO PRETO, 19, 1989. Resumos..., n. 40. Ribeiro Preto, 1989.
CUNHA, W.H.A. Acerca de um curso ps-graduado destinado ao treino da observao
cientfica no domnio das cincias do comportamento. Cincia e Cultura, So Paulo, v.27,
p.846-853, 1974.
CUNHA, W.H.A. Alguns princpios de categorizao, descrio e anlise do comportamento.
Cincia e Cultura, So Paulo, v.28, p.15-24, 1976.
------------- . O estudo etolgico do comportamento animal. Cincia e Cultura. So Paulo, v.27
p.262-268, 1975.
------------- . Explorao no mundo psicolgico das formigas: uma investigao de algumas
modificaes de comportamento. So Paulo, 1967. Tese (Doutorado) Faculdade de
Filosofia, Letras e Cincias Humanas, USP.
------------- . Introduo ao desenvolvimento histrico e aos princpios bsicos da etologia.
Palestra apresentada no I Encontro de Etologia. Jaboticabal, 1983.
DANNA, M.F., MATOS, M.A. Ensinando observao: uma introduo. So Paulo: Edicon,
1982.
DELAMONT, S., HAMILTON, D.A. A pesquisa em sala de aula: uma crtica e uma nova
abordagem. In: PATTO, M.H.S. (Org.) Introduo Psicologia Escolar. Sao Paulo: TA.
Queiroz, 1981.
DELEVATI, N.M., LIRA, B.B.P., CSAR, O.P., PIRES, S.G., OTTA, E. Influncia do sorriso na
percepo de pessoas em funo de caractersticas do sujeito e do modelo. In: REUNIO
ANUAL DA SOCIEDADE BRASILEIRA DE PSICOLOGIA, 22,1992. Resumos de comu-
nicaes cientficas..., n.30. [S.I.], 1992.
DESSEN, M.A.S.O, METTEL, T.P.L. Interao pais-primognito quando da chegada de uma
segunda criana na famlia - um estudo de caso. Psicologia, v.10, n.2, p.27-39, 1984.
DURAN, A.P. O estudo da interao professor-aluno no Brasil: algumas tendncias, algumas
questes. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO
PRETO, 17,1987. Anais... Perspectivas para estudo da relao professor-aluno. Ribeiro
Preto, 1987. p.77-85.
. Padres de comunicao oral e compreenso da comunicao escrita na universi
dade: estudos no Nordeste. So Paulo, 1981. Tese (Doutorado) Instituto de Psicologia,
USP.
FAGUNDES, A.J.F.M. Definio e anlise da resposta de sorrir em situao de leitura de
textos humorsticos. Psicologia, v.4, n.3, p.53-108, 1978.
------------- . Descrio e registro de comportamento. So Paulo: Edicon, 1981.
GIL-CENEVIVA, M.S.A. Interao professor-aluno: estudo descritivo das perguntas dos
alunos em uma sala de aula de primeira srie do Primeiro Grau. Joo Pessoa, 1985.
Dissertao (Mestrado) Universidade Federal da Paraba.
GIL, M.S.C.A. Anlise funcional da interao professor-aluno: um exerccio de identificao
de controles recprocos. So Paulo, 1990. Tese (Doutorado) Instituto de Psicologia,
USP.
. Anlise funcional da interao professor-aluno: In: REUNIO ANUAL DA SOCIE
DADE DE PSICOLOGIA DE RIBEIRO PRETO, 21,1991. Anais... Ciclo de estudos em
anlise do comportamento IV: novos problemas e novas solues. Ribeiro Preto, 1991.
p.315-321.
HALL, R.V. Manipulao de comportamento - parte 1: modificao de comportamento. Trad.
por Waldir Bettoi. So Paulo: EPU: EDUSP. 1973.
HINDE, R.A. Animal behaviors synthesis of ethology and comparative psychology. New York:
McGraw-Hill, 1966.
HINDE. R.A. The bases of a science of interpersonal relationships. In: DUCK, S., GILMOUR, R.
(Eds.). Personal relationships. Londres: Academic Press, 1981. v.1.
----------------. On the design of check-sheets. Primates, Aichi, v.14, p.393-406. 1973.
HUIT, S.J., HUTT, C. Observao direta e medida do comportamento. Trad. por Carolina M. Bori.
Sao Paulo: EPU: EDUSP, 1974.
JOHNSON, S.M., BOLSTAD, OD. Methodological issues in naturaliste observation: some
problems and solutions for field research. In: HAMERLYNCK, LA., HANDY, L.C., MADH, E.J.
(Eds.). Behavior change-, methology, concepts and practice. [S.I.]: Research Press, 1973.
KERBAUY, R.R. Autocontrl: manipulao de condies do comportamento alimentar. So
Paulo, 1972. Tese (Doutorado) Faculdade de Filosofia, Letras e Cincias Humanas, USP.
LEMOS, C. de. Interactional processes in the child's construction of language. In: DEUTSCH, W.
(Ed.). The child's construction of language. Londres: Academic Press, 1981.
LI NHARES, M.B.M. Interao professora-aluno em uma classe de 1a. srie com substituio de
professoras. So Paulo, 1988. Tese (Doutorado) Instituto de Psicologia, USP.
LOPES, M.F., BUENO, J.L.O., BARNABE. "OBS": uma ferramenta para anlise seqencial e de
freqncia e durao de varias categorias comportamentais. In: REUNIO ANUAL DA
SOCIEDADE BRASILEIRA DE PSICOLOGIA, 22, 1992. Resumos de comunicaes
cientficas, n.233. [S.I.], 1992.
LYRA, M.C., GALINDO, W.C.M., CIPRIANO, A.M. A mediao construda "face-a-face" na diade
me-beb: a produo vocal e o sorriso. In: REUNIO ANUAL DA SOCIEDADE DE
PSICOLOGIA DE RIBEIRO PRETO,20,1990. Resumos..., n.16. Ribeiro Preto, 1990.
LYRA. M.O. CABRAL, EA, PANTOJA, A.P.F. A produo vocal do beb: diferenciao das
interaes "me-objeto-beb". In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRO PRETO, 21,1991. Resumos..., n.214. Ribeiro Preto, 1991.
----------------. Estudo da interao verbal criana-me. Sao Paulo, 1972. Tese (Doutorado)
Faculdade de Filosofia, Letras e Cincias Humanas, USP.
MARTURANO, E.M. Interao professor-aluno: desafios pesquisa. In: REUNIO ANUAL DA
SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 22,1987. Anais... Perspectivas para
estudo da relao professor-aluno. Ribeiro Preto, 1987. p.86-90.
---------. A lgica do sistema de categorias e a anlise do comportamento verbal. In: REU
NIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 18, 1988.
Anais... Avanos recentes em Psicologia do desenvolvimento. Ribeiro Preto, 1988. p.517-
520.
-------------. Relao entre o julgamento da professora e o comportamento dos alunos estudo
de um caso. Psicologia, v.12, n.3, p.47-58, 1986.
MARTURANO, EM., BERTOLDO, A.A., CAMELO, A.L.P. Estudo descritivo do intercmbio verbal
em sala de aula atravs da anlise de contingncia uma contribuio metodolgica.
Psicologia, v.8, n.3, p.19-36, 1982.
MICHAEL, J. Characteristics of a good definition. Washington, DC, 1975. Apostila para distri-
buio interna na American University.
MORAIS, G.S. (Org.). Pesquisa e realidade no ensino de primeiro grau. So Paulo: Cortez, 1980.
--------------- . Pesquisas sobre interao professor-aluno e interveno na escola. In: REUNIO
ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 17, 1987. Anais...
Perspectivas para estudo da relao professor-aluno. Ribeiro Preto, 1987. p.94-98.
OLIVEIRA, Z.M.R. Jogo de papis-, uma perspectiva para anlise do desenvolvimento humano.
So Paulo, 1988a. Tese (Doutorado) Instituto de Psicologia, USP.
OTTA, E., SARRA, S. Uma anlise motivacional do sorriso e do riso. In: REUNIO ANUAL DA
SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 18. 1988. Resumos..., n. 131. Ribeiro
Preto, 1988.
PATTO. M.H.S. A observao antropolgica na interao professor-aluno: resumo de uma
proposta. In: PATTO. M.H.S. (Org.). Introduo Psicologia Escolar. So Paulo: TA.
Queiroz, 1981.
PEDROSA. M.I.P.C. Interao criana-criana: um lugar de construo do sujeito. So Paulo,
1989. Tese (Doutorado) Instituto de Psicologia, USP.
PEDROSA. M.I.P.C, CARVALHO, A.M.A. Anlise qualitativa de interao entre crianas como
processo de construo mtua. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA
DE RIBEIRO PRETO, 21, 1991. Anais... Transcrio e anlise de registro em vdeo.
Ribeiro Preto, 1991. p.285-290.
PEDROSA, G.B. Relaes entre crianas pequenas de mesma idade: algumas caractersticas
da dinmica das dades. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE
RIBEIRO PRETO, 22,1992. Resumos de comunicaes cientficas, n.146. Ribeiro Preto.
1992.
PRADO, L.E.S. Fato e significado. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA
DE RIBEIRO PRETO, 18, 1988. Anais... A questo da subjetividade em Psicologia. Ri-
beiro Preto, 1988. p.411-417.
RAMOS, A.T.A. Estudo descritivo das relaes contingenciais no intercmbio verbal de
criana com retardo no desenvolvimento da fala, com a professora e a me, em situao
natural. So Paulo, 1979. Dissertao (Mestrado) Instituto de Psicologia, USP.
RAMOS CERQUEIRA, A.T.A. Anlise de relaes de contingncia do repertrio verbal de
mes e crianas num contexto Interativo. In: REUNIO ANUAL DA SOCIEDADE DE
PSICOLOGIA DE RIBEIRO PRETO, 18,1988. Resumos.... n. 196. Ribeiro Preto. 1988a.
. Estudo descritivo do repertrio verbal de mes e crianas de baixo nvel scio-
econmico num contexto interativo. In: REUNIO ANUAL DA SOCIEDADE DE PSICO
LOGIA DE RIBEIRO PRETO, 18, 1988. Resumos..., n.197. Ribeiro Preto, 1988b.
REBER, A.S. The Penguin dictionary of Psychology. London: Penguin, 1985.
RIBEIRO, F.L. Um estudo sobre o comportamento da fmea durante a fecundao da colnia
em Atta sexdens rubropilosa, Porei, 1908 (Hymenoptera-Formicidae). So Paulo, 1972.
Tese (Doutorado) Faculdade de Filosofia. Letras e Cincias Humanas, USP.
RICHARDS, M.P.M., BERNAL, J. An observational study of mother-infant interaction. In:
JONES, Blurton (Ed.). Ethological studies of child behaviour. Cambridge: Cambridge
University Press, 1972.
RODRIGUES, M.A.C. Psicologia infantil: a independncia da criana pr-escolar. So Paulo:
Edicon, 1985.
ROSSETTI-FERREIRA. M.C. Development of a method for the study of mother-child inter-
action during meal-time. Londres, 1967. Tese (Doutorado).
--------------. Me e criana - separao e reencontro: observao em situao de grupo. So
Paulo: Edicon, 1986.
RUBIANO, M.R.B. Ocorrncia de atividades ldicas e compartilhadas em diferentes "settings".
In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 21,
1991. Anais... Transcrio e anlise de registro em vdeo. Ribeiro Preto, 1991. p.281-284.
------------- . Suportes ambientais e organizao social de crianas em creches. So Paulo, 1990.
Tese (Doutorado) Instituto de Psicologia, USP.
SATO, T. Classificao numrica do comportamento I - a construo de matrizes mtricas.
Psicologia, v.13, n.l, p.55-64, 1987.
SCHERER, K-, EKMAN, P. (Orgs.)- Handbook of methods in nonverbal behavior research.
Cambridge: Maison des Sciences de l'Homme: Cambridge University Press, 1982.
SIDMAN, M. Tactics of scientific research: evaluating experimental data in Psychology. New
York: Basic Books, 1960.
SILVA, A.A. Julgamento de expresses faciais de emoes: fidedignidade, erros mais fre-
qentes e treinamento. So Paulo, 1987a. Tese (Doutorado) Instituto de Psicologia,
USP.
-------------- . Expresses faciais de emoes: algumas questes centrais que ainda no foram
pesquisadas ou foram pesquisadas de uma forma insatisfatria. In: REUNIO ANUAL DA
SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 17,1987. Anais... Pesquisas que
visam emoes. Ribeiro Preto, 1987b. p. 123-129.
SKINNER, B.F. Cincia e comportamento humano. Trad. por Joo Cludio Todorov e Rodol-
pho Azzi. Braslia: Ed. UnB, 1967.
-------------- . Contingncias do reforo. Trad. por Rachel Moreno. In: OS PENSADORES. So
Paulo: Abril Cultural, 1975. v.51.
-------------- . Verbal behavior. Englewood Cliffs (NJ): Prentice-Hall, 1957.
SLATER, P.J.B. Describing sequences of behavior. In: BATESON, P.P.G., KLOPFER. P.H.
(Eds.). Perspectives in ethology. Londres: Plenun Press, 1973.
SOLLITTO, N.A. Observao da interao me-nen em uma situao natural. So Paulo,
1972. Tese (Doutorado) PUC-SP.
STADDON, J.E.R. On the notion of cause, with applications to behaviorism. Behaviorism,
Reno (NV), v.1, p.25-63,1973.
STELLA, E.M. A field-descriptive and experimental study of verbal behavior in one year old
children. Londres, 1974. Tese (Doutorado).
THIOLLENT. M. Notas para o debate sobre pesquisa- ao. In: BRANDO, CR. (Org.).
Repensando a pesquisa participante. So Paulo: Brasiliense, 1984.
VAN HOOF, J.A.R.A.M. Categories and sequences of behavior: methods of description and
analysis. In: SHERER, K.R., EKMAN, P. (Eds.). Handbook of methods in nonverbal
behavior research. Cambridge: Maison des Sciences de l'Homme: Cambridge University
Press, 1982.
VIEIRA, T. Estudo observacional sobre modalidades de aes representativas em brinquedo
de faz-de-conta. In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEI-
RO PRETO, 18, 1988. Resumos..., n.128. Ribeiro Preto. 1988a.
------------- . Brinquedo de faz-de-conta: um estudo sobre interesse de crianas em objetos.
In: REUNIO ANUAL DA SOCIEDADE DE PSICOLOGIA DE RIBEIRO PRETO, 18,
1988. Resumos..., n.129. Ribeiro Preto, 1988b.
VIEIRA, T.A.M. Elaborao de um catlogo de categorias de comportamento: uma contri
buio para o estudo etologico do homem. So Paulo, 1975. Dissertao (Mestrado)
Instituto de Psicologia, USP.
WEICK, KE. Systematic observation methods. In: LINDZEY, G, ARONSON, E. (Eds.). The
handbook of sodai psychology. New York: Addison Wesley, 1968. v.2.
WITTER, G.P. Discriminao de forma oposio: conhecimento da contingncia de reforo.
So Paulo, 1969. Tese (Doutorado) Faculdade de Filosofia, Letras e Cincias Huma-
nas, USP.
CAPTULO 11
A MEDIDA DA CRIATIVIDADE
Fidedignidade
Nas vrias medidas de criatividade disponveis na literatura, sobre-
tudo nas que dizem respeito aos testes de pensamento divergente, as trs
distintas formas de se estimar fidedignidade tm sido encontradas. Tanto
a abordagem teste-reteste ou seja, a correlao entre a mesma forma
de um teste aplicado em diferentes momentos, como formas alternativas
ou paralelas de um mesmo instrumento como a abordagem de consis-
tncia interna tm sido empregadas para estimar a fidedignidade.
Entretanto, segundo Michael e Wright (1989), dependendo da modalidade
de medida de criatividade, um ou outro tipo de abordagem seria mais
adequado. Segundo estes autores, no caso de medidas de pensamento
divergente, por exemplo, o uso de formas alternativas seria mais adequa-
do, ao passo que, no caso de qualquer tipo de avaliao que envolva
observao, que o que ocorre, por exemplo, quando se utilizam juizes
para avaliar a criatividade de produtos, as abordagens de consistncia
interna so as mais apropriadas.
Como discutido anteriormente por Fleith e Alencar (no prelo), a
fidedignidade nas medidas de criatividade pode ser afetada principalmente
pela heterogeneidade do domnio amostrado, ou seja, pela ausncia de um
universo claramente definido a respeito de criatividade, do qual os itens
dos instrumentos so retirados, pela amostragem de contedo, pela subje-
tividade do avaliador e pelos fatores motivacionais (tanto do avaliador
quanto do avaliado) presentes na situao de avaliao.
Algumas das dificuldades encontradas com relao fidedignidade
devem-se ao fato de que h dados sobre pessoas criativas que sugerem
variaes substanciais da mesma em diferentes perodos em sua produo
criativa. Ademais, fatores motivacionais e mesmo do contexto podem afetar
o desempenho do sujeito em um teste, e isto naturalmente vai refletir em
alguns ndices de fidedignidade da medida. Apesar destes aspectos, no
caso do Teste Torrance de Pensamento Criativo, que o mais utilizado em
pesquisa, h diversos estudos no manual do mesmo (Torrance, 1966,1974)
indicando coeficientes de fidedignidade teste-reteste acima de 0,50 para
as diferentes medidas. Em um de seus estudos apresentados no manual,
com uma amostra de estudantes universitrios, Torrance obteve coeficien-
tes variando de 0,68 a 0,85 para os vrios testes de sua bateria em um
intervalo de trs meses. Os estudos revistos por Torrance indicam ainda
coeficientes de fidedignidade mais altos para adultos do que para crianas
e maiores nas medidas de fluencia e flexibilidade dos testes verbais. Em
um estudo realizado pela autora (Alencar, (1974a), em uma amostra de 159
sujeitos de 4 e 5a sries, obtiveram-se coeficientes variando de 0,01 a 0,56
para 12 medidas de criatividade dos Testes Torrance de Pensamento
Criativo em um intervalo de quatro meses, bem mais baixos, portanto, do
que os coeficientes citados na literatura.
Validade
Vrios so os autores que examinaram, no contexto da avaliao da
criatividade, algumas questes relativas validade. Esta, como se sabe,
o aspecto mais importante a ser considerado, e est ancorada, segundo
Wolf (apud Michael, Wright, 1989), em trs questes, a saber: a) o que o
teste supe medir; b) o que o escore derivado da aplicao de um teste
significa; c) como o escore de um indivduo em uma medida se relaciona
com outros fatos observveis relativos ao indivduo.
Com relao validade de critrio, que inclui tanto a validade con-
corrente como a preditiva, o grande desafio tem sido a identificao de
medidas de critrio relevantes e que sejam plenamente satisfatrias. No
caso da validade concorrente, esta tem sido, muitas vezes, levantada atravs
da comparao de resultados de testes com avaliaes feitas por profes-
sores e colegas, que, como vimos anteriormente, muitas vzes apresenta
dificuldades. Por outro lado, com relao validade preditiva, especial-
mente no caso da Bateria Torrance, inmeros estudos tm apontado para
correlaes significativas observadas entre resultados de testes obtidos em
um dado momento e o registro de atividades criativas por parte dos
mesmos sujeitos cinco ou mais anos aps. Este aspecto foi examinado por
Treffinger para os Testes Torrance de Pensamento Criativo, tendo este
autor observado correlaes positivas e significativas entre resultados nos
testes e critrios de realizaes criativas em estudos envolvendo perodos
que variaram de 9 meses a 22 anos (Treffinger, 1985).
Examinando a validade de critrio de testes de criatividade, Michael
e Wright (1989) lembram alguns fatores que podem afetar a interpretao
de um coeficiente de validade, s vezes adversamente. Estes autores
lembram, por exemplo, a necessidade de que o observador ou avaliador
de comportamentos criativos se previna contra o uso que, s vezes,
consciente ou inconscientemente, faz de informaes obtidas atravs da
administrao prvia de testes, no momento em que estiver fazendo um
julgamento do desempenho do sujeito em algumas medidas do critrio.
Ademais, segundo estes autores, o grau de fidedignidade, tanto do preditor
mas especialmente da medida de critrio, um elemento potencialmente
atenuante da magnitude do coeficiente de validade. Na maior parte das
circunstncias, a fidedignidade da medida de critrio tende a ser mais
baixa do que aquela associada com o teste. Caso a varivel de critrio ou
teste no for estvel e consistente, isto certamente vai afetar o grau de
correlao entre as medidas.
Com relao validade de construto, tem sido lembrado que um dos
requisitos para o seu estabelecimento a validade convergente, ou seja,
a demonstrao de que a medida selecionada de um dado comportamento
se relacione com outras medidas do mesmo construto e com outras
variveis relativas ao critrio, que tenham uma relao com o construto.
Um segundo requisito se refere validade discriminativa, demonstrando
que a medida selecionada independente de variveis de outros
construios teoricamente distintos (Michael, Wright, 1989).
Um dos aspectos que tm sido discutidos com relao validade de
construto diz respeito ao fato de que uma vez que a criatividade engloba
um conjunto complexo de construios interrelacionados, um dos grandes
desafios reside na operacionalizao de construios tericos claros que
constituam o fundamento do comportamento criativo.
Vrias evidncias de validade de construto tm sido apontadas para
alguns dos instrumentos disponveis na rea, especialmente para a Bateria
Torrance. Entretanto, h necessidade de mais pesquisas no caso da vasta
maioria de instrumentos disponveis para que os padres de qualidade
apontados pela psicometria sejam atendidos.
Quanto validade de contedo, o grande desafio para os construto-
res de testes atender s exigncias de que o contedo do instrumento
efetivamente abranja uma amostra representativa do domnio em questo.
Este desafio foi inclusive apontado por Torrance (1974, p.21), no manual do
seu teste, quando afirma:
"Uma vez que a pessoa pode se comportar criativamente em um nmero
quase infinito de maneiras, na opinio do autor seria ridculo tentar desenvolver
uma bateria compreensiva de testes de pensamento criativo que constitusse
uma amostra de qualquer tipo de universo de habilidades de pensamento
criativo. O autor no acredita que algum possa atualmente especificar o nmero
e amplitude de testes necessrios para dar uma avaliao completa ou mesmo
adequada das potencialidades de uma pessoa para o comportamento criativo."
Condies de aplicao
Com relao a este aspecto, especialmente Michael e Wright (1989)
lembram a necessidade de controle de alguns fatores, como os especifica-
dos a seguir: a) tempo disponvel para o examinando responder ou para
o observador fazer o seu julgamento; b) nvel de dificuldade das palavras
e maneira de apresentar as instrues, incluindo nmero comparvel de
exemplos ilustrativos para todos os que iro responder ao instrumento; c)
controle de fatores que poderiam distrair a ateno do sujeito, como
barulho, iluminao inadequada, clareza das instrues e ilustraes
contidas no instrumento e at mesmo a seqncia e nmero de testes
administrados.
Com relao a este ltimo aspecto, a autora deste captulo tem
observado, por exemplo, que no caso da Bateria Torrance, a aplicao de
toda a parte verbal mostra-se bastante cansativa, no s para crianas
mas at mesmo para adultos. Isto faz com que muitos sujeitos no dem
o nmero de respostas que poderiam, especialmente nos ltimos testes.
Treffinger (1987) fez uma reviso de vrios estudos sobre o efeito de
condies de aplicao e clima predominantes durante a mesma no
desempenho em testes de criatividade. Estes estudos mostram que os
resultados nestes testes so afetados pelos procedimentos utilizados
durante a administrao dos instrumentos. Por esta razo, necessrio
uma orientao segura e mesmo um treinamento para aqueles que vo
aplicar testes, no sentido de se assegurar condies adequadas e compa-
rveis em todas as aplicaes.
A nossa experincia tem mostrado tambm que um cuidado especial
deve ter o pesquisador no uso de testes de criatividade, quando a
aplicao grupai e no individual. Sobretudo no caso da utilizao de
testes de pensamento criativo para crianas e adolescentes e para sujeitos
de status scio-econmico baixo, o fator motivacional afeta em muito o
desempenho nos testes e, em grupo, difcil de se controlar esta
varivel. O prprio Torrance, autor do teste mais utilizado de pensamento
criativo, lembra que a maneira como o seu teste aplicado afeta os
resultados. Segundo ele, at o momento em que aplicado (final de
semestre, por exemplo) exerce efeito no desempenho, tendo Torrance
constatado que alunos, ao final do semestre, no saam to bem neste
instrumento como anteriormente, mesmo aps um treinamento de criati-
vidade e com alta motivao (Torrance, 1988).
Uma anlise do estado da arte em medidas de criatividade nos leva,
pois, a concluir que estamos ainda em um estgio bem preliminar de
domnio de conhecimento nesta rea, com muitas conquistas a serem feitas
para que possamos clarificar muitas das questes a respeito de medidas
de criatividade, que no foram ainda respondidas ou o foram de maneira
incompleta ou inadequada. Como lembra Petrosko (1978), o grande desafio
de se medir criatividade reside no paradoxo de se tentar construir uma
maneira padronizada de se capturar algo que foge padronizao.
REFERENCIAS BIBLIOGRFICAS
. Torrance tests of creative thinking: norms- technical manual. Princeton (NJ): Person
nel Press, 1966.
--------------- . Torrance tests of creative thinking: norms and technical manual. Bensenville (II):
Scholastic Testing Service, 1974.
--------------- . The nature of creativity as manifest in its testing. In: STERNBERG, R.J. (Ed.). The
nature of creativity, contemporary psychological perspectives. Cambridge: Cambridge
University Press, 1988.
TORRANCE, E.P., KHATENA, J. What kind of person are you? Gifted Child Quarterly, Williams-
ville (NY), V.14, p.71-76, 1970.
TREFFINGER, D.J. Research on creativity assessment. In: ISAKSEN, S.G. (Ed.). Frontiers of
creativity research: beyond the basics. Buffalo (NY): Bearly. 1987.
URBAN, K.K. Recent trends in creativity research and theory. Western Europe, v.1.n.O, p.99-
113,1990.
ESTRATEGIAS E MEDIDAS
EM ANLISE DE CONTEDO
Edson A. de Souza Filho
Universidade Estadual do Norte Fluminense, Campos, RJ
M6
o
Ia
Ib
le
AP
AB
CONCLUSES E PERSPECTIVAS
FISHBEIN, M., AJZEN.. I. Belief, attitude, intention and behavior, an introduction to theory and
research. Cambridge (MA): Addison-Wesley. 1975.
GHIGLIONE, R.. BLANCHET. A. Analyse de contenu et contenus d'analyses. Paris: Dunod, 1991.
HOLSTI. O.R. Content analysis. In: LINDZEY. G., ARONSON. F. (Eds.). Handbook of social
psychology. Cambridge (MA): Addison-Wesley. 1969.
KATZ, E. The two steps of communication. In: SCHRAMM. W. (Ed.). Mass communication.
Glencoe: Free Press, 1960.
McCLELLAND. D.C.. FRIEDMAN. CA. Across-cultural study of the relationship between child
training practices and achievement motivation appearing in folk tales. In: SWANSON. G.E.,
NENCOMB. T.M.. HARTLEY, E.H. (Eds.). Readings in social psychology. New York: Holt
1953.
OSGOOD, CE. The representational model. In: POOL, S. (Ed.). Trends in content analyses.
Urbana (IL): University of Illinois Press, 1959.
OSGOOD, CE., WALKER, G. Motivation and language behavior: a content analysis of suicide
notes. Journal of Abnormal and Social Psychology, v.59, p.58-67, 1959.
PCHEUX, M. Analyse automatique du discours. Paris: Dunod. 1966.
POTTER, J., WETHERELL, M. Discourse and social psychology. Londres: Sage. 1987.
SOUZA FlLHO, E.A. de. Alguns pressupostos tericos e metodolgicos do estudo de repre-
sentaes sociais. SIMPSIO BRASILEIRO DE PESQUISA E INTERCMBIO CIENTFICO EM
PSICOLOGIA, 3, 1990. Anais..., p.384-387. [S.I.: s.n.), 1990.
--------------- . Heterossexuais e homossexuais no Rio de Janeiro no contexto da AIDS. No prelo.
WICKLUND, R.A.. DUVAL, S. A theory of objective self awareness. New York: Academic Press,
1972.
CAPTULO 13
MEDIDA PROJETIVA
REFERNCIAS BIBLIOGRFICAS
ABT, LE. Una teoria de Ia psicologia proyectiva. In: ABT, LE.. BELLAK, L. Psicologia progredi-
va. Buenos Aires: Paids, 1%7. p.37-53.
ANZIEU. D. Os mtodos projetivos. Rio de Janeiro: Campus. 1981.
ARLOW, J.A., BRENNER. C. Psychoanalytic concepts and the structural theory. New York:
International Universities Press. 1964.
BELLAK, L Sobre los problemas del concepto de proyeccin: una teoria de la distorcin
aperceptiva. In: ABT, L.E.. BELLAK. L. Psicologia proyectiva. Buenos Aires: Paids. 1967.
p.25-36, 1967.
-------------- . El uso clinico de las pruebas psicolgicas del TAT, CAT y SAT. Mexico: Manual
Moderno. 1979.
BELLAK, L. BELLAK, S. Teste de apercepo temtica (com figuras animais). So Paulo:
Mestre Jou, 1981.
BELLAK. L. HURVICH, M., GEDIMAN, H.K. Ego functions in schizophrenics, neurotics and
normals. New York: Wiley-Interscience, 1973.
BERG, M. Borderline psychopathology as displayed by psychological tests. Journal of Person-
ality Assessment, Portland (OR), v.47, n.2. p. 120-133,1983.
BERGER, M. Psychological testing. In: RUTTER, M., HERSON, L. Child psychiatry, modern
approaches. London: Blackwell. 1977. p.306-333.
BERNSTEIN, J. Introduccin: I. Mtodos proyectivos. In: MURRAY. H.A. Test de apercepcin
temtica (TAT). Buenos Aires: Paids, 1951. p. 13-23.
BLATT, S.S. Whore have we been and where are we going? Reflections on 50 years of person-
ality assessment Journal of Personality Assessment, Portland (OR), v.50, n.3, p.343-346
1986.
BLATT, S.S., BERMAN, W.H. A methodology for the use of the Rorschach in clinical research.
Journal of Personality Assessment. Portland (OR), v.4, n.3, p.226-239, 1984.
CARR, L.C., GOLDSTEIN, E.G. Approaches to the diagnosis of borderline conditions by use
of psychological tests. Journal of Personality Assessment, Portland (OR), v.45, n.6, p.563-
574,1981.
--------------- . Sistema comprensivo del Rorschach. 2,ed. Madrid: Pablo del Rio, 1980. v.1.
--------------- . Sistema comprensivo del Rorschach. Madrid: Pablo del Rio, 1978. v.2.
EXNER, J.E., EXNER, D.E. How clinicians use the Rorschach. Journal of Personality
Assessment, Portland (OR), v.36, p.403-408, 1972.
FERREIRA, A.B.H. Novo dicionrio da Lingua Portuguesa. 2.ed. Rio de Janeiro: Nova Fronteira,
1986.
FREUD, A. Infncia normal e patolgica. Rio de Janeiro: Zahar, 1971.
FREUD, S. Formulaes sobre os dois princpios de funcionamento mental. In: EDIO
STANDARD brasileira das obras psicolgicas completas de Sigmund Freud. Rio de Janeiro:
Imago, 1969a. v.12. p.277-286.
GARTNER, J., HURT, S.W., GARTNER, A. Psychological signs of borderline personality disorder:
a review of the empirical literature. Journal of Personality Assessment, Portland (OR), v.53,
n.3, p.423-441,1989.
MUNDY, J. The use of projective techniques with children. In: WOLMAN, B. (Ed.). Manual of
childpsychopathology. New York: MacGraw-Hill, 1972. p.791-819.
MURRAY, H.A. Test de Apercepcin Temtica (TAT). Buenos Aires: Paids, 1951.
MURSTEIN, B.I., PRYER, R.R. The Concept of projection: a review. Psychological Bulletin,
Washington, D.C., v.56, n.5, p.353-374,1959.
PETERSON, C.A., SCHILLING, KM. Card pull in projective testing. Journal of Personality Assessment.
Portland (OR), v.47, n.3. p.265-283. 1983.
PHARES, E.J. Clinical psychology, concepts, methods, and profession. Homewood (IL): Dorsey, 1984.
PIOTROWSKI, C, SHERRY. D.. KELLER, J.W. Psychodiagnostic test usage: a survey of the Society
for Personality Assessment. Journal of Personality Assessment. Portland (OR), v.49, n.2, p.115-
119, 1985.
POLLYSON, J.. NORRIS, D., OTT, E. The recent decline in TAT research. Professional Psychology:
Research and Practice. Washington, D.C., v.16, n.2, p.26-28, 1985.
PRUITT. J.A., SMITH, M.C.. THELEN. M.H.. LUBIN, B. Attitudes of academic clinical psychologists
toward projective technique: 1968-1983. Professional Psychology: Research and Practice,
Washington, D.C., v. 16, n.6. p.781-788, 1985.
RAPAPORT, D. El modelo psicanalitico, la teoria del pensamiento y las tcnicas proyectivas. Buenos
Aires: Horm, 1978.
. Sobre la teoria psicanalitica del pensar. In: GILL, M.M.. RAPAPORT, D. Aportacio
nes a la tcnica psicanalitica. Mexico: Pax-Mexico, 1962, p.97-117.
-------------- . Tests de diagnstico psicolgico. Buenos Aires: Paids, 1965.
RAPAPORT, D., GILL, M.M., SCHAFER, R. Diagnostic psychological testing, ed.rev. New York:
International Universities Press, 1972.
ROSENBERG, P.H., MILLER, G.A. Comparing borderline definitions: DSM-III borderline and
schizotypal personality disorders. Journal of Abnormal Psychology. Washington, D.C., V.98. n.2,
p.161-169, 1989.
SARGENT, H. Projective methods: their origins, theory and application in personality research.
Psychological Bulletin. Washington, D.C., v.42, n.5, p.257-293,1945.
SCHAFER, R. Projective testing and psychoanalysis. New York: International Universities Press, 1978.
SHNEIDMAN, E. Projective Technique. In: WOLMAN, B. (Ed.). Handbook of clinical psychology. New
York: McGraw-Hill, 1965. p.498-521.
VANE. J.R.. GUARNACCIA. V.C. Personality theory and personality assessment measures:
How helpful to the clinician? Journal of Clinical Psychology, Brandon (VT), v.45, n. 1. p.5-
19, 1989.
WADE. T.C., BAKER, T.B. Opinions and use of psychological tests - a survey of clinical
psychologists. American Psychologist, Washington, D.C., p.874-882, Oct. 1977.
WEINER, I.B. Conceptual and empirical perspectives on the Rorschach assessment of psycho-
pathology. Journal of Personality Assessment, Portland (OR), v.59, n.3. p.472-479, 1986.
------------- . The future of psychodiagnosis revisited. Journal of Personality Assessment Portland
(OR). V.47, n.5. p.451-461. 1983.
WERLANG, B.G., CUNHA, J.A. Avaliao da personalidade sob o enfoque projetivo. In:
CUNHA, J.A. Psicodiagnstico-R. 4.ed.rev. Porto Alegre: Artes Mdicas, 1993. p.123-129.
WOLFF, W., PRECKER, J.A. El movimiento expressivo y los mtodos de la psicologia experi-
mental profunda. In: ANDERSON. H.H.. ANDERSON, G.L. Tcnicas proyectivas de
diagnstico psicolgico. Madrid: Rialp. 1976, p.515-559.
ZUBIN, J.. ERON, L.D., SCHUMER, F. An experimental approach to projective techniques.
New York: Wiley. 1965.
CAPTULO 14
S
egundo Fishbein (1980), possvel explicar e predizer o comporta-
mento humano usando apenas alguns conceitos, ligados entre si
por uma estrutura terica de carter compreensivo e global. Nesse
texto, Fishbein atribui, pela primeira vez, o nome de Teoria da Ao
Racional ao conjunto de seus trabalhos, justificando a escolha deste
nome pelo pressuposto bsico da teoria de que as pessoas agem de
modo racional, processando implcita ou explicitamente as informaes
de que dispem e utilizando-as como insumos em suas decises. A teo-
ria, porm, no assume que as informaes processadas sejam necessa-
riamente completas ou verdicas, apenas que, estando estas disponveis,
so usadas, e quando no o esto, ativamente buscadas. O autor afirma
tambm nesse texto que a teoria est ainda incompleta e em busca de
aperfeioamento, mas que a mesma tem-se revelado til, pois fornece
aos pesquisadores um enfoque sistemtico para o estudo do comporta-
mento volitivo em um grande nmero de reas; alm disto, a Teoria da
Ao Racional pode servir como instrumento para a identificao de fato-
res que distinguem as pessoas que realizam determinado comportamento
das que no o fazem, sejam estas diferenas explicadas pelo modelo
terico ou oriundas de variaes sociodemogrficas ou de personalidade.
O objetivo da Teoria da Ao Racional compreender e predizer o
comportamento, o que exige uma definio operacional deste compor-
tamento. A teoria assume que a maioria das atividades humanas possui
relevncia social e est sob controle volitivo; como decorrncia deste
pressuposto, a teoria considera a inteno de realizar ou no uma
atividade como o melhor preditor do comportamento futuro. Embora no
exista uma correlao perfeita entre o dizer e o fazer, na maioria dos
casos, salvo quando fatores situacionais interferem, a pessoa se comporta
de acordo com a sua inteno. Como uma teoria deve ultrapassar o nvel
da predio dos fenmenos para chegar sua explicao, torna-se
necessrio identificar os determinantes da inteno e, portanto, do
comportamento.
Segundo a Teoria da Ao Racional, a inteno de realizar uma
ao, chamada de inteno comportamental (I), est sob a influncia de
dois determinantes bsicos, um pessoal e o outro social. O fator pessoal
a ponderao probabilistica das possveis conseqncias da ao e sua
avaliao em termos de nvel de favorabilidade; este determinante leva o
nome de atitude em relao ao comportamento (ATc). O fator social a
percepo, pela pessoa, das presses sociais sofridas na realizao ou
no de um comportamento especfico; como se trata da percepo das
normas sociais, este fator chamado de norma subjetiva (NS). De modo
geral, a inteno de realizar uma atividade, tal como ir a uma festa, resulta
de uma avaliao pessoal positiva das possveis conseqncias desta
ao e da percepo de que ela ser socialmente aprovada. A importncia
relativa de cada um destes dois determinantes da inteno varia segundo
a pessoa e o tipo de comportamento a ser realizado, tornando-se assim
o clculo do peso de cada um destes fatores uma questo emprica. O
modelo terico permitir determinar, para cada ao estudada, o fator que
mais contribuiu para a inteno comportamental. Esta relao entre as
diversas variveis do modelo pode ser expressa atravs de uma equao:
+3 +2 +1 0 -1 -2 -3
+3 +2+1 0 -1 -2 -3
+3 +2 +1 0 -1 -2 -3
+3 +2+1 0 -1 -2 -3
bom------------------------------------------------------------ mau
+3 +2 +1 0 -1 -2 -3
bom------------------------------------------------------------ mau
+3 +2 +1 0 -1 -2 -3
bom------------------------------------------------------------ mau
+3 +2+1 0 -1-2 -3
+3 +2 +1 0 -1 -2 -3
provvel------------------------------------------------------------ improvvel
+3 +2 +1 0 -1 -2 -3
provvel------------------------------------------------------------ improvvel
+3 +2 +1 0 -1 -2 -3
A medida em situaes de escolha
Em muitos casos estamos diante de uma escolha entre dois ou mais
comportamentos mutuamente exclusivos. Nestes casos, a medida da ati-
tude deve ser feita em relao a cada uma das alternativas, para melhorar
o nvel de previso da inteno comportamental e, atravs dela, a previso
do comportamento. Assim, se o indivduo tem de escolher entre dois com-
portamentos, como fazer ou no dieta para perder peso, a diferena
algbrica entre os escores da atitude em relao a cada uma das alter-
nativas ser melhor preditora da inteno que o escore atitudinal em
relao a qualquer um dos dois comportamentos.
No caso de vrias alternativas, como beber refrigerante, suco de
fruta ou cerveja, a ordenao pelos sujeitos destas alternativas ser a
melhor preditora de sua inteno de beber cerveja, j que esta ter o
primeiro lugar na sua ordenao. No caso da norma subjetiva, a opinio
dos referentes e a motivao para acat-la tambm devem ser medidas
para todas as alternativas, a fim de melhorar a predio da inteno. Estas
medidas devem manter para cada alternativa a unidade de ao (beber),
contexto (local) e momento (dia, hora), embora variem os objetivos
(bebidas).
Um exemplo da medida em situao de vrias alternativas foi dado
por Ajzen e Fishbein (1969), quanto s possveis atividades de 100 estu-
dantes universitrios nas noites de sexta-feira.
Os autores listaram oito possveis atividades, mutuamente exclusi-
vas, que poderiam ser realizadas pelos estudantes:
1 Ira uma festa
2 Visitar uma exposio de arte moderna
3 Ver um filme na televiso
4 Ira um concerto
5 Jogar pquer
6 Iro cinema
7 Participar de um grupo de debates
8 Ler um livro policial
Resultados
Uma anlise de varincia foi usada para cada uma das 76 medidas.
1 A predio da inteno comportamental de ato nico (I) foi feita
atravs de uma regresso mltipla, tendo como variveis independentes
ATc, NSp e NSs. Os resultados podem ser vistos na tabela 14-2.
CONCLUSO
AJZEN, I. Attitudes, personality and behavior. [S.I.]: Milton Keynes Open University Press,
1988.
AJZEN, I., FISHBEIN, M. Attitudes and normative beliefs as factors influencing behavioral
intentions. Journal of Personality and Social Psychology, Washington, D.C.,v.21,n. 1, p. 1-
9, 1972.
--------------. Attitudes towards objects as predictors of single and multiple behavioral criteria.
Psychological Review, Washington, D.C., v.81, n.l, p.59-74, 1974.
--------------. Attitudinal and normative variables as predictors of specific behaviors. Journal of
Personality and Social Psychology, Washington, D.C., v.27, n.l, p.41-57,1973.
------------- . The prediction of behavioral intentions in a choice situation. Journal of Experimental
Social Psychology, New York, v.5, p.400-416, 1969.
-------------- . Understanding attitudes and predicting social behavior. Englewood Cliffs (NJ):
Prentice-Hall. 1980.
FISHBEIN, M. A theory of reasoned action: some applications and implications. In: HOWE,
H.E., PAGE, M.M. (Eds.). Beliefs, attitudes and values: Nebraska Symposium on
Motivation, 1979. Lincoln (NB): University of Nebraska Press, 1980.
FISHBEIN, M., AJZEN, I. Beliefs, attitude and intention: an introduction to theory and research.
Reading (MA): Wesley, 1975.
CAPITULO 15
DESENVOLVIMENTO DE INSTRUMENTO
PARA LEVANTAMENTO DE DADOS (SURVEY)
Hartmut Gnther
Instituto de Psicologia
Universidade de Brasilia
Estrutura do Instrumento
A estrutura do instrumento assegura que todos os temas de
interesse do pesquisador sejam tratados e que se mantenha o interesse
do respondente em continuar. Uma primeira regra que itens tratando de
uma mesma temtica devem ficar juntos, recebendo uma introduo que
ajuda o respondente focalizar na temtica a ser tratada:
Inicialmente, gostaria de saber da sua opinio sobre o sistema de segu-
rana pblica ...
Uma segunda considerao que os conjuntos de itens que tratam
de uma mesma temtica devem seguir uma ordem. Esta ordem do
mais geral para o mais especfico; do menos delicado, menos pessoal,
para o mais delicado, mais pessoal. Desta forma, o ltimo conjunto de
itens trata das caractersticas socioeconmicas do respondente.
Dependendo do assunto, a mesma regra 'do geral para o especfico'
pode ser aplicada seqncia dos itens dentro de uma determinada
temtica. Ressalve-se entretanto que, em se tratando de um conjunto de
itens que constituem uma escala, os itens devem ser misturados, para
evitar que dois itens tratando essencialmente de um mesmo aspecto
sejam apresentados um aps o outro.
Na pesquisa hipottica entre moradores de um bairro realizada em
forma de entrevista pessoal, a parte formal da coleta de dados poderia
ser precedida por perguntas gerais sobre a situao do respondente na
cidade e bairro:
H quanto tempo mora nesta cidade? [Caso
apropriado] Antes, morava onde? Em geral,
est satisfeito em morar aqui?
Estas perguntas iniciais serviriam menos para obter informao do
respondente e mais para estabelecer um relacionamento de confiana
entre respondente e pesquisador. Entretanto, deve-se atentar para o fato
de que estas perguntas tero que ser repetidas de maneira formal mais
adiante, dentro da entrevista, enquadrando-se os dois primeiros itens
dentro do conjunto da caracterizao socioeconmica e o terceiro na
srie sobre satisfao com o bairro.
Um terceiro princpio de organizao do instrumento que, na
medida apropriada, este deve seguir uma ordem lgica. Usando a hipo-
ttica pesquisa sobre moradia como exemplo, pergunta-se inicialmente
a cidade, depois sobre o bairro, a rua e o prdio onde o respondente
mora. Alm de progredir do geral para o mais especfico, tambm vem se
aproximando do respondente, i., uma pergunta sobre o relacionamento
entre os moradores da cidade menos pessoal, menos ameaadora do
que sobre o relacionamento do respondente com seu vizinho. Fazendo
perguntas mais pessoais aps ter estabelecido um certo nvel de
confiana entre entrevistador e entrevistado ajuda a eliciar respostas
confiveis (veja Gnther, Brito, Silva, 1989).
Assim, perguntas pessoais sobre o respondente constituiriam o
ltimo conjunto:
Concluindo, gostaramos de fazer algumas perguntas para melhor caracte-
rizar os respondentes desta pesquisa...
Um erro comum de instrumentos o de comear com perguntas
pessoais, muitas vezes numa seo chamada 'identificao'. Em se
tratando de pesquisa, no convm identificar o respondente. Antes, pelo
contrrio, geralmente h que se assegurar que a pesquisa no visa
identificar indivduos, mas que perguntas scio-demogrficas, como sexo,
idade, educao, estado civil, composio da famlia, renda, tempo de
moradia, etc, servem apenas para caracterizar a amostra. Perguntar o
nome no incio de uma entrevista pessoal pode facilitar trato interpessoal,
mas, mesmo sem registr-lo, pode contradizer qualquer afirmao de
confidencialidade da entrevista.
DESENVOLVIMENTO DE ITENS
Linguagem
Quanto linguagem usada na formulao dos itens, atenta-se,
inicialmente, para a compreenso dos mesmos pela populao-alvo da
pesquisa. Abreviaes, gria profissional, termos regionais devem ser
evitados, da mesma maneira que termos especiais ou sofisticados para
uma determinada populao-alvo.
Ambigidade
Relacionado questo da linguagem em si est o problema da
ambigidade. O respondente est entendendo aquilo que o pesquisador
est perguntando?
Vis e nfase
Finalmente, a escolha das palavras pode dirigir as respostas.
Quando se pergunta sobre utilizao de reas comuns num bloco de
residncia, pode-se indagar se algo deve ser 'proibido', 'no permitido',
'evitado' ou 'impedido'. Da mesma maneira que os avisos 'proibido
estacionar' e 'pede-se no estacionar* provocam comportamentos dife-
rentes, o nmero de respondentes que concordam com um item que
contm a palavra 'proibir' e 'no permitir' varia (Schuman, Presser, 1981).
Assim, convm sempre realizar um estudo piloto para verificar se e
como as perguntas esto sendo entendidas pelos respondentes.
Escala nominal
Conforme os exemplos dados na Tabela 15-1, numa escala nominal
utilizam-se nmeros ou smbolos somente para identificar pessoas,
objetos ou categorias. Exemplos para as cincias sociais seriam local de
nascimento, sexo, estado civil, bem como certos atributos (como cor de
cabelo) ou uso de aparelhos (como culos ou bengala). A forma de
apresentar estes itens a seguinte:
Qual o estado civil de V.Sa.?
Solteiro(a) .................................................................... 1
Casado(a) ........................................................................... 2
Vivendo maritalmente ..................................................... 3
Desquitado(a) .............................................................. 4
Divorciado(a)................................................................. 5
Separado(a) .................................................................. 6
Vivo(a) ........................................................................ 7
Outro ........................................................................... 8
Apontamos para alguns aspectos deste item. Primeiro, mesmo ao
se preparar um instrumento para auto-aplicao, deve-se pensar em um
dilogo com o respondente. Contrariamente a uma declarao de renda ou
ficha de procura de emprego, convm estabelecer um bom raport com o
respondente. Assim, uma frase como 'qual o estado civil de Va.Sa.?' (ou,
conforme relacionamento com a populao-alvo, 'o seu') soa melhor do
que solicitar simplesmente 'estado civil'. Conforme o que ns sabemos
sobre a populao-alvo, mais ou menos alternativas podem ser apresen-
tadas. Muitas vzes, 'solteiro, casado, outro1 suficiente. O importante
que as opes sejam a) mutuamente exclusivas e b) cubram todas as
alternativas. Uma outro maneira de formular alternativas do estado civil :
Nunca casado(a) ................................................................ 1
Sempre casado(a), i., casado(a) e nunca divorciado(a).......... 2
Divorciado(a)...................................................................... 3
Recasado(a) ..................................................................... 4
Dependendo do objetivo da pesquisa para o qual um determinado
item est sendo utilizado, o primeiro ou o segundo exemplo do item
'estado civil' pode ser mais apropriado. Entretanto, da mesma maneira
como o leitor pode ter reagido inicialmente ao segundo exemplo, sem
dvida, a maioria dos respondentes reagiria ainda mais. um exemplo
concreto de distinguir entre o conceito subjacente que se quer analisar
numa determinada pesquisa (i., as quatro categorias do segundo
exemplo) e o que se pode, do ponto de vista prtica e conceitualmente
factvel, perguntar maioria dos respondentes.
Escala ordinal
Conforme os exemplos dados na Tabela 15-1, numa escala ordinal
os nmeros ou smbolos, alm de identificarem pessoas, objetos ou
categorias, os ordenam numa dimenso subjacente. Exemplos para as
cincias sociais seriam hierarquizao de preferncia entre objetos, status
social ou itens de uma escala Likert. A forma de apresentar estes itens
a seguinte:
Como voc sabe, a Prefeitura est lanando um programa de recuperao
dos bairros da cidade. Solicitamos que indique entre as medidas listadas a
seguir qual a que deve ser realizada primeiro, qual a segunda a ser realizada,
qual a terceira e qual a quarta:
N de ordem de
realizao
Consertar a infra-estrutura (caladas, iluminao pblica, etc.) ____
Consertar as vias e sinalizao de transito............................ ____
Construir/consertar escolas do bairro ................................... ____
Construir/consertar os postos de sade do bairro ................. ____
Outros, quais? .................................................................... ____
A tarefa do respondente a de marcar a ordem de importncia no
espao indicado. Para cada um dos quatro itens ou, posteriormente,
variveis, pode-se determinar uma distribuio de freqncia: Quantas
vezes 'sinalizao de trnsito' foi mencionada como sendo a mais
importante, a segunda, a terceira e a quarta medida. Ainda, possvel
sumariar estes dados indicando quantas vezes cada um dos itens (no
caso, medidas da prefeitura) foi mencionado como o mais importante.
Desta maneira, os valores modais e medianos podem ser calculados, mas no a
mdia. Um outro exemplo de escalas ordinais apresentado pela escala de
valores de Rokeach (1973; Gnther, 1981). A tarefa do responderte consiste em
ordenar 18 valores segundo a sua importncia para si. Apesar de Rokeach ter
sugerido o uso de etiquetas para forar o responderte a atribuir um determinado
valor hierrquico a cada valor ou item no lugar de espaos como no exemplo
anterior, os dados apresentam uma srie de dificuldades para anlise. Moore
(1975) mostrou que, apresentando os 18 valores da escala de Rokeach na
verso original ou como 18 itens de uma escala tipo Likert (veja a seguir),
obtm-se, essencialmente, os mesmos resultados, sendo que a escala Likert
mais fcil de responder e analisar.
Escala Likert
Por ter sido citada como exemplo de escala ordinai e escala intervalar,
consideremos a escala tipo Likert separadamente. Ela a mais utilizada nas
cincias sociais, especialmente em levantamentos de atitudes, opinies e de
avaliaes. Nela apresenta-se um determinado nmero de alternativas para
julgar um enunciado, conforme o seguinte exemplo:
Inicialmente, gostaramos de saber o que os moradores do bairro acham
sobre os servios oferecidos pela Prefeitura. Para cada servio a seguir,
indique, por favor, se voc o avalia como (1) muito ruim, (2) ruim, (3) razovel,
(4) bom ou (5) muito bom. Para isto, faa um crculo em volta do nmero que
melhor representa sua avaliao:
Escala intervalar
Conforme consta na Tabela 15-1, numa escala intervalar as
caractersticas no somente podem ser ordenadas numa dimenso
subjacente, mas os intervalos tm um tamanho conhecido e podem ser
comparados, enquanto que itens de uma escala tipo Likert com alternativas
na dimenso concordodiscordo mostram uma certa dificuldade em ser
considerados como uma escala de intervalo. Isto pode ser contornado
apresentando-se uma verdadeira escala ou rgua:
Utilizando a seguinte escala, que varia de muito ruim a muito bom, avalie os
servios prestados pela Prefeitura, riscando o ponto na mesma que melhor
representa sua avaliao:
Servio de Limpeza Urbana Muito I _____________________ I Muito
Ruim Bom
Enquanto este tipo de representao visual de um escala pode
'medir' com maior certeza o grau de avaliao, muito difcil de apurar,
uma vez que se precisa de uma rgua milimetrada para determinar exata-
mente onde o respondente marcou sua resposta nesta escala. Um outro
exemplo clssico de uma escala intervalar a utilizada por Milgram (1974)
para determinar o grau de obedincia dos participantes s instrues nas
suas pesquisas. Ostensivamente, o participante aplicava choques eltricos
que variavam entre 15 e 450 volts. O grau de obedincia correspondia
voltagem onde o participante se recusava a continuar aplicando mais
choques, i., quanto mais baixa a voltagem, menos obediente.
Escala de razo
Exemplos da escala de razo utilizada nas cincias sociais so
salrio ou tempo gasto com uma determinada tarefa. A apresentao dos
itens reverte a perguntas abertas:
Considerando o seu tempo livre e de recreao, solicitamos que indique:
REFERNCIAS BIBLIOGRFICAS
Desarrollo
Haciendo un poco de historia, la experiencia en Evaluacin
Conductual comenz en el rea de la docencia como un apoyo y
ampliacin de los aspectos metodolgicos de una asignatura bsica de
Anlisis Experimental de la Conducta, tal y como se utilizaba en el
laboratorio. En este sentido se inscriba dentro de una conceptualizacin
de tipo conductista radical, basado fundamentalmente en el modelo
Skinneriano. Si bien en principio se describa la metodologa que se uti-
lizaba en los experimentos de la investigacin bsica, no iba acompaada
de una praxis que le proporcionara un referente directo y con experiencia
de primera mano. En esta primera etapa se recurri slo a las referencias
bibliogrficas, pues no estaba dentro de los planes de desarrollo de
nuestro grupo hacer instalaciones de laboratorio para este tipo de
investigacin.
Posteriormente se introdujeron los registros observaclonales de
tipo conductual, realizados en el ambiente natural, y los diseos de un
solo sujeto, tipo reversin, criterio cambiante y L-B mltiple. Esto res-
pondi al mayor nfasis que al Anlisis Conductual Aplicado se dio en
ese momento. Los aspectos metodolgicos que suscriba el Anlisis
Conductual Aplicado para la epoca constituyeron una alternativa viable
en la investigacin aplicada, sobre todo como contraste ante una "meto-
dologa tradicional" avasallante y poderosa. De acuerdo a las etapas
sealadas por Fernndez Ballesteros (1987), nosotros "llegamos" a la
Evaluacin Conductual en su etapa de 'constitucin'. Esta la ubica
Fernndez Ballesteros en la dcada entre 1965 y 1975, caracterizada por
la presentacin de una alternativa funcional, o analtico-conductual, a la
evaluacin psicolgica. Hubo una consonancia con Kanfer y Saslow
(apud Fernndez Ballesteros, 1991) quienes plantean que la evaluacin
debe dirigirse a "la descripcin de la conducta problemtica, los tactores
que la controlan y el medio a travs del cual puede ser modificada".
Con este nfasis aplicado, la evaluacin estuvo ms que todo
circunscrita a la obervacin directa de conductas, realizadas especial-
mente en el ambiente natural del sujeto o sujetos a estudiar. Igualmente,
fueron de los diseos de investigacin intra-sujeto los que predominaron
en las experiencias realizadas en las actividades prcticas y las interven-
ciones, tipo investigacin, que se implementaron tanto en escuelas como
en otros contextos, con nios al igual que con adultos. Esta fue parte de
la reaccin de la corriente conductual a la investigacin de tipo "tradicio-
nal" y basada exclusivamente en diseos de grupos.
Sin embargo, este modelo basado en el Anlisis Conductual
Aplicado se fu quedando corto, pues ya la interaccin entre la docencia
y la investigacin estaba generando necesidades especficas en relacin
al tipo de informacin del sujeto que era necesario considerar para
obtener una perspectiva ms completa de su funcionamiento. Tambin,
y por qu no decirlo, siguiendo la tendencia general en el rea, se
introdujeron aspectos menos observables, pero necesarios para una
evaluacin y anlisis menos parcelados del individuo. Los aspectos
internos, no observables del sujeto, era necesario tomarlos en cuenta.
Nos referimos, entre otros, a la introduccin del auto-informe o auto-
reporte como una fuente de informacin importante, que aporta datos no
accesibles de otra manera. El trabajo en el rea del auto-control plante
la inminente necesidad de contar con la experiencia interna del sujeto y
a la vez considerar al auto-informe como una alternativa vlida capaz de
reflejar una parte importante de la conducta. Adicionalmente al trabajo
con auto-control se incursion en el rea de la Psicologa de la Salud, la
cual necesariamente debe basarse en informacin por parte del sujeto
tanto referida a su experiencia vital como a sus concepciones acerca de
tpicos particulares. En este sentido se ha hecho uso tanto de escalas ya
elaboradas y probadas por otros autores para la exploracin de variables
tales como apoyo social, estrs laboral, auto-control, etc.; como otras
diseadas ad hoc para estudiar aspectos especficos de inters.
Este tipo de instrumento de evaluacin proporcion datos recopila-
dos de una manera sistemtica, y aunque provenientes de instrumentos
validados, no fueron utilizados con referencia a normas estandarizadas,
como es el uso de los tpicos tests psicomtricos. La informacin obtenida
a travs de estas escalas cumple un papel de tipo ms bien descriptivo.
Adicionalmente, la necesidad de tener acceso a datos de tipo
psicofisiolgico que brindasen un cuadro ms completo del individuo,
introdujo dentro de la evaluacin otro componente importante que
completa el cuadro correspondiente a los tres canales de respuesta. En
este sentido se pueden sealar las evaluaciones de ritmo cardaco, de
tensin arterial, de reactividad cardiovascular y otras que complementan
una evaluacin ms integral del individuo, las cuales son de gran rele-
vancia para el estudio de factores psicofisiolgicos ligados a respuestas
emocionales y enfermedades cardiovasculares. Este es slo un ejemplo
de la aplicabilidad y, ms que todo, la necesidad de contar con evaluaci-
ones que brinden informacin de este canal de respuesta que en algunos
casos, dependiendo del objeto de estudio, no se puede dejar de lado.
Y como marco referencial para la accin del individuo, tambin el
ambiente donde ste se desenvuelve es tomado en cuenta desde dife-
rentes puntos de vista, tanto en lo relativo al aspecto del entorno fsico y
social como en cuanto a la percepcin que tiene el individuo de l. En la
Figura 16-1 se muestra el desarrollo del modelo de evaluacin.
Integracin metodolgica
En la actualidad, a pesar de que el rea de evaluacin conductual
se ha desarrollado ampliamente, se ha hecho necesaria la concurrencia de
otro tipo de evaluacin menos estructurada y ms dirigida a tratar con los
aspectos de validez de los temas a evaluarse. Nos referimos en este caso
a la utilizacin de una metodologa ms de tipo cualitativa (ver Figura
16-4). Esta se hace necesaria sobre todo en las etapas iniciales de la
investigacin, cuando se considera un problema que, si bien puede existir
una forma tipificada de evaluacin para abordarlo, puede ste tener
caractersticas propias y diferentes a las que tendra ese mismo problema
en otros contextos. Me refiero, por ejemplo, a aquellas ocasiones en las
cuales podra pensarse que existen diferencias sociales y culturales que
incidiran en un planteamiento diferente del mismo problema.
Integracin en la praxis
Una primera caracterstica que determina el tipo de evaluacin que
realizamos es que generalmente sta viene dada por las necesidades que
se plantean en los trabajos de investigacin. Dado que la investigacin
es una parte integrante fundamental de nuestra prctica docente, pues,
como ya se mencion al principio del captulo, es la investigacin la que fija
la pauta docente y tambin de las actividades diarias de los mismos
docentes, sta es altamente tomada en cuenta. En ella se plantean pro-
blemas reales a solucionar y a los cuales necesariamente se impone dar
respuesta. Por tanto se regresa muchas veces a la teora y, por ende a la
bibliografa, como queda ilustrado en la Figura 16-5. Este enriquecimiento
constante se vierte directamente a los estudiantes, en la actividad docente.
Se ha logrado una integracin entre investigacin y docencia. Ac pode-
mos sealar como ejemplo que las necesidades metodolgicas planteadas
por los proyectos de investigacin tanto de profesores como de estudiantes
en proceso de elaborar su trabajo de grado proporcionan nuevos temas
para la docencia, basados en experiencias directas y recientes.
REFERENCIAS BIBLIOGRFICAS