Você está na página 1de 34

TESTES REFERENTES A CONSTRUTO:

TEORIA E MODELO DE CONSTRUÇÃO


Luiz Pasquali

INTRODUÇÃO torial; esses conhecimentos são decisi-


vos nos procedimentos analíticos.
Inicialmente, é importante alertar
o leitor de que a tecnologia aqui apre- A teoria e
o modelo de
elaboração
sentada de elaboração de instrumentos de instrumental psicológico apresentados
psicológicos exige o conhecimento de al- neste capítulo são aplicáveis à constru-
gumas disciplinas ensinadas nas universi- ção de testes psicológicos de aptidão, de
dades, bagagem sem a qual dificilmente inventários de personalidade, de escalas
o pesquisador poderá se considerar apto psicométricas de atitude e do diferencial
a construir instrumentos psicológicos. En- semântico. O modelo, que é detalhado
tre essas disciplinas salientam-se particu- na Figura 8.1, se baseia em três grandes
larmente as seguintes, às quais este livro polos, que chamaremos de procedimentos
remete sem poder substituí-las, apenas teóricos, procedimentos empíricos (expe-
indicando o momento no processo de ela- rimentais) e procedimentos analíticos (es-
boração do instrumento em que elas têm tatísticos).
seu espaço de aplicação: O polo teórico enfoca a questão da
teoria que deve fundamentar qualquer
*
psicometria: fundamental para a teo- empreendimento científico, no caso a
ria da medida em psicologia, particu- explicitação da teoria sobre o construto
larmente o conhecimento da teoria da ou objeto psicológico para o qual se quer
resposta ao item (TRI); desenvolver um instrumento de medida,
e
disciplinas de teoria psicológica, tais bem como a operacionalização do cons-
como história e sistemas, teorias da truto em itens. Este polo expõe a teoria
personalidade, psicopatologia, psicolo- do traço latente, bem como a explicitação
gia social, etc.; essas disciplinas são bá- dos tipos e categorias de comportamentos
sicas para os procedimentos teóricos; que constituem uma representação ade-
e
disciplinas de delineamento de pes- quada desse traço.
quisa científica; esse conhecimento é O polo empírico ou experimental de-
fundamental para os procedimentos fine as etapas e técnicas da aplicação do
experimentais; instrumento piloto e da coleta válida da
e
disciplinas de estatística -
estatística informação para proceder à avaliação da
básica, análise de hipótese, análise fa- qualidade psicométrica do instrumento.
166 Luiz Pasquali & cols.

O polo analítico estabelece os proce- tão ocorrendo; tal fenômeno vem identifi-
dimentos de análises estatísticas a serem cado sob a égide do rótulo "fase".
efetuadas sobre os dados para levar a um
instrumento válido, preciso e, se for o
caso, normatizado. PROCEDIMENTOS TEÓRICOS
A Figura 8.1 apresenta e detalha,
para cada um desses três procedimentos, Os procedimentos teóricos devem
as etapas ou passos pelos quais se deve ser elaborados para cada instrumento,
passar para se poder progredir sistema- dependendo, portanto, da literatura exis-
ticamente na elaboração de um instru- tente sobre o construto psicológico que o
mento de medida psicológica baseado instrumento pretende medir. A teoria ain-
em construtos. Além disso, define, para da é, infelizmente, a parte mais fraca da
cada passo, o método ou métodos a serem pesquisa e do conhecimento psicológicos,
utilizados para superar o problema espe- o que tem como consequência a precarie-
cífico que constitui a tarefa a ser resolvi- dade dos atuais instrumentos psicométri-
da em cada passo, bem como o produto cos de medida nesta área. Na verdade, os
que decorre como resultado da solução instrumentos baseados em uma teoria psi-
do problema de cada passo. Além desses cológica prévia mais elaborada (por exem-
detalhes técnicos, a figura apresenta, para plo, "Edwards personal preference sche-
os três procedimentos, uma metanálise na dule") não são dos melhores no mercado.
qual se procura enquadrar e delimitar o Tal ocorrência explica, em parte, por que
evento ou eventos psicométricos que es- os psicometristas sistematicamente fogem

Procedi-
TEÓRICOS
mentos

Fase TEORIA |
CONSTRUÇÃO DO INSTRUMENTO
Categ. Comport.
Literatura Análise
Literatura / Peritos / Experiência teórica
Método Reflexão / Interesse / Índices Experiência
-

!Análise de conteúdo ntrevi -


isa
Y Y Y Y sema

Sistema Sl2!p ni 4 Operacio- Análise


Passo 1
rd Definições
Psicológico nalidade nalização dos itens

Objeto Fatores -
Constitutiva Instrumento Í

Produto Atributo
(dimensões)
Itens
Piloto
Psicológico -
Operacional
- - - - -

Procedi-
EXPERIMENTAIS ANALÍTICOS
mentos

Fase VALIDAÇÃO DO INSTRUMENTO NORMATIZAÇÃO

Literatura/Peritos Seguir Análise Análise empírica Consistência


Grupos critério
Método (Experiência Planejamento Fatorial dos itens (ICC) Intema

pL E
AP] Apli
2 Di Análise Precisão do
Passo 7 da £I10 11 Estabelecimenty
à de
Aplicação eColeta nalidade dos itens Instrumento Normas

Amostra Dados Fatores Dificuldade Normas


Índices de
Produto Instruções Matriz ú
-
Carga fatorial Discriminação .
Precisão %,z
-
Formato -
Autovalor Chute
-Sistemática Comunalidade,
Tarefa

Figura 8.1
Organograma para elaboração de medida psicológica.
Instrumentação psicológica 167

da explicitação de uma teoria preliminar e elaboração de um instrumento de medida


iniciam a construção do instrumento pela para o tal construto. Apesar do avanço e
coleta intuitiva e mais ou menos aleatória da sofisticação estatísticos na psicometria,
de uma amostra de itens, que dizem pos- parece ser essa fraqueza da base teórica
suir face validity, isto é, parecem cobrir o que vem maculando a imagem dos pro-
traço para o qual eles querem elaborar o cedimentos psicométricos na observação
instrumento de medida. Embora isso não dos fenômenos psicológicos. Na verdade,
pareça muito científico, infelizmente é o com uma base teórica coerente e, quando
que ocorre mais frequentemente na cons- possível, completa, torna-se viável uma
trução de instrumental psicológico. definição dos tipos e características dos
A inexistência de teorias sólidas so- comportamentos que irão constituir a re-
bre um construto não deve ser desculpa presentação empírica dos traços latentes
para o psicometrista fugir de toda a es- e, assim, facilitar a tarefa do psicometris-
peculação teórica sobre ele. É obrigação ta em operacionalizá-los adequadamente
dele levantar, pelo menos, toda a evidên- (isto é, a construção dos itens se torna
cia empírica sobre o construto e procurar coerente e adequada).
sistematizá-la e, assim, chegar a uma mi- De qualquer forma, a Figura 8.2 de-
niteoria sobre ele, que possa guiá-lo na talha esses procedimentos teóricos.

NOTA EXPLICATIVA
A terminologia em ciência e, diria, particularmente em psicologia não é uniforme infelizmente. Por isso, é
útil conceituar preliminarmente certas expressões aqui utilizadas, como segue:

« Sistema: sinônimo de objeto, coisa, ser, entidade que possui propriedades ou atributos. O sistema é
definido não necessariamente pela natureza, mas pelo interesse do discurso, e existente neste mundo
do discurso.
« Atributo: propriedade, qualidade, aspecto, componente do objeto. Ele é caracterizado por ser mensurá-
vel em um contínuo de pontos de magnitude.
Magnitude: qualidade de um sistema que pode assumir diferentes valores de quantidade, isto é, ela
pode ser mais ou maior que (>) ou menos ou menor que (<).
« Isomorfismo: afirmação de correspondência entre propriedades do número (matemática) e quantidades
das propriedades dos sistemas da natureza (física ou não).
-
Definição: delimitação de um conceito em termos de suas propriedades específicas. Ela é constitutiva ou for-
mal se o conceito ou construto for definido em termos de outros construtos. Ela é operacional ou epistêmica
se o conceito ou construto for definido em termos de fatos empíricos, da experiência ou observação.

Procedi-
TEÓRICOS
mentos

Fase TEORIA |
CONSTRUÇÃO DO INSTRUMENTO
Categ. Comport.
Literatura Análise
Literatura / Peritos / Experiência -
teórica
Método Reflexão / Interesse / Índices
! Análise de conteúdo
Experiência
Entrevista -
semântica
Y Y Y
Passo 1
Sistema EN Propri
pi
4 Definiçõ
Si Operacio- Análise
Psicológico nalidade nalização dositens

Objeto Fatores -
Constitutiva Instrumento
Produto Psicológico
Atributo
(dimensões)
Itens
Piloto
-
Operacional

Figura 8.2
Procedimentos teóricos na elaboração da medida psicológica.
168 Luiz Pasquali & cols.

O sistema psicológico seu objeto específico as estruturas laten-


tes, os traços psíquicos ou processos men-
Qualquer sistema ou objeto que pos- tais, se quiser, que assim se constituem no
sa eventualmente ser expresso em termos seu objeto ou sistema direto de interesse.
observáveis é suscetível de se tornar um O sistema pode ser considerado de vá-
objeto para fins de mensuração. Aconte- rios níveis, dependendo do interesse do
ce, porém, que um objeto em si não pode pesquisador. Pode-se falar de um sistema
ser medido. Os objetos podem apenas ser universal e de sistemas locais, o universal
enumerados. O que pode ser medido são sendo a estrutura psicológica total do ser
as propriedades ou atributos de um ob- humano e os locais, os vários subsistemas
jeto, desde que apresentem magnitudes, de interesse. Assim, a inteligência pode ser
isto é, diferenças individuais, tais como considerada um subsistema dos processos
intensidade, peso, altura, distância, etc. cognitivos e estes da estrutura latente ge-
Por isso esses atributos são geralmen- ral, ou mesmo a inteligência, digamos,
te chamados de variáveis, dado que não verbal pode ser considerada um sistema
são invariantes entre sistemas individuais quando ela for o interesse imediato e na
diferentes ou eles mesmos em diferentes qual vários aspectos podem ser considera-
ocasiões ou situações. dos, como a compreensão verbal e a fluên-
Se o sistema ou objeto representa cia verbal. Sistema, portanto, constitui-se
o universo de interesse, o atributo dele em sistema como o objeto imediato de
constitui uma delimitação desse univer- interesse dentro de um delineamento de
so. O sistema realmente é definido pelo estudo, e não é uma entidade ontológica
interesse do investigador. Como ciência
a monolítica e unívoca.
procura o conhecimento e não o poder ou Esses vários níveis de sistemas ocor-
a afirmação pessoal ou a política, então rem mesmo nas coisas físicas. Assim, por
para o cientista não existe sistema privi- exemplo, para o biólogo podem ser sis-
legiado; todo e qualquer sistema é digno temas o organismo em sua totalidade ou
e válido para ser conhecido. Obviamente, parte dele, como é o sistema neurológico
interesses políticos, sociais, pedagógicos, para o neurólogo, o sistema vascular para
financeiros podem ditar a escolha de um o cardiólogo, etc. O químico se interessa
objeto de estudo. Assim, a relevância de pelos elementos da tabela periódica, em
um sistema de estudo não é ditada pelo que os seus sistemas naturais (água, ar,
saber em si, mas por fatores extrínsecos etc.) se reduzem a esses elementos de
a ele; nem por isso esses fatores extrínse- interesse desse profissional. O físico nu-
cos são negligenciáveis no contexto geral clear estuda seus sistemas reduzindo-os
do universo da natureza e do ser huma- finalmente às partículas quark (top, bot-
no, dado que o ser humano (pesquisador) tom, strange, etc.), às forças glúons (força
está situado em um contexto e tem suas forte, fraca, gravitacional) e aos processos
prioridades em parte ditadas por esse léptons (elétrons, pósitrons). Em psico-
contexto. Assim, não há maior sabedoria logia, também encontramos tais níveis
em se estudar um grão de areia do que de sistemas. Considere, por exemplo, os
a sobrevivência do ser humano, embora processos cognitivos: Piaget e Spearman
para nós, seres humanos, esta última pa- consideram a inteligência como uma
reça bem mais relevante. grande estrutura (um sistema) que evolui
Enfim, o sistema representa o objeto geneticamente; os fatoristas consideram
de interesse, chamado também de objeto a inteligência no nível de estruturas me-
psicológico. A psicometria enfoca como nores, quando falam de raciocínio verbal,
Instrumentação psicológica 169

numérico, abstrato, etc.; Sternberg vai talidade dos artigos e trabalhos feitos em
ainda mais longe nessa elementarização psicologia em nível mundial. Além deste,
dos sistemas (processos) cognitivos, bus- há o Educational Index, para os interessa-
cando seus elementos no que ele chama dos na psicologia aplicada à educação, o
de componentes cognitivos; e, finalmen- Index Medicus, para os interessados em
te, Newell e Simon levam ao extremo esse psicologia clínica, e o Sociological Index,
elementarismo quando defendem os pro- onde aparecem temas referentes à psico-
cessos elementares de informação (ele- logia social. Na falta de tais fontes ou se,
mentary information process EIP) como
-
ainda assim, o tema não surgiu na per-
os elementos últimos dos processos cogni- cepção do pesquisador (aluno), ele pode
tivos. A qualquer desses níveis, o pesqui- recorrer a peritos, que, no caso do aluno,
sador pode se colocar e definir este nível é normalmente seu orientador. Enfim,
como o nível do sistema de seu interesse. o problema a ser resolvido nesse passo
Não é preciso ver oposições teóricas anta- consiste em se ter uma ideia, um tema,
gônicas nesses vários autores quanto aos um assunto para pesquisar. A esse tema
processos cognitivos. Eles simplesmente se chamamos de objeto psicológico, que re-
põem em horizontes diferentes e, por isso, presenta o produto esperado desse passo
veem níveis diferentes de realidade, aliás, na elaboração do instrumento. Agora, O
da mesma realidade. É apenas o exclusi- sistema escolhido pode ser mais amplo ou
vismo, na verdade desnecessário, desses mais restrito, como vimos anteriormente
autores em afirmar que seu horizonte é ao falarmos dos diferentes níveis de sis-
o único ou o melhor para ver a realidade temas. Obviamente, quanto mais restrito
dos processos cognitivos. Isso vale, aliás, ou elementar for o sistema, mais fácil se
para qualquer outro processo psicológico, torna a construção de um instrumento de
como a personalidade, por exemplo. medida. Por isso, é relevante definir como
Enfim, o problema a ser resolvido sistema psicológico um processo ou traço
neste passo praticamente se reduz a que latente o mais próximo do interesse direto
o pesquisador, que pretende construir um do pesquisador. Tipicamente isso significa
instrumento, deve ter uma ideia, por mais definir um sistema o mais elementar pos-
vaga que seja, sobre o que é que ele quer sível, dentro do interesse. Sistemas vagos
trabalhar, para que tema da psicologia ele e gerais dificultam depois sua operacio-
está interessado em construir um instru- nalização para fins de pesquisa empírica,
mento de medida e pesquisa. Este proble- como é a construção de um instrumento
ma é, evidentemente, mais aparente em de medida.
aluno de pós-graduação, ao qual se apre-
senta a necessidade de apresentar uma
dissertação no final do curso e ainda não A propriedade do sistema psicológico
tem ideia sobre que assunto em psicolo-
gia ele quer desenvolver sua tese. Na falta O sistema, já dissemos, não consti-
de qualquer outra indicação ou interesse tui objeto direto de mensuração, mas sim
específico, tal indivíduo pode se dirigir suas propriedades ou atributos, que são
aos livros índices onde estão elencados os os vários aspectos que o caracterizam.
principais trabalhos que se vêm fazendo Por exemplo, o sistema físico se apresenta
em psicologia. Para o psicólogo há uma com os atributos de massa, comprimento,
série de tais livros, sendo o mais útil o etc. Similarmente, a psicometria conce-
Psychological Abstracts, que é publicado be os seus sistemas como possuidores de
mensalmente e onde aparece a quase to- propriedades/atributos que os definem,
170 Luiz Pasquali & cols.

sendo esses atributos o foco imediato de como raciocínio verbal, raciocínio numé-
observação/medida. Assim, a estrutura rico, raciocínio abstrato, memória, per-
psicológica apresenta atributos do tipo cepção espacial, etc.
processos cognitivos, processos emotivos, Para se definir um instrumento de
processos motores, etc. A inteligência, medida, é preciso decidir qual ou quais
como subsistema, pode apresentar atri- dessas propriedades serão o objeto ime-
butos de tipo raciocínio verbal, racioci- diato de interesse. Ademais, à medida que
nio numérico, etc. O sistema se constitui o conhecimento sobre o sistema cresce,
como objeto hipotético que é abordado cresce também o número de novas pro-
(conhecido) por meio da pesquisa de seus priedades descobertas, que, por sua vez,
atributos. podem se tornar novos subsistemas de
O problema específico deste passo interesse, uma vez que se vão descobrin-
consiste em passar de um objeto psico- do propriedades diversas dentro desses
lógico, normalmente amplo demais para novos subsistemas. Enfim, é de importân-
pesquisar, para a delimitação dos aspec- cia para se prosseguir sem transtornos e
tos específicos dele que se deseja estudar desvios de rumo que se defina claramente
e para os quais se quer construir um ins- e preliminarmente as propriedades do sis-
trumento de medida. De fato, qualquer tema de interesse que se quer estudar. Tal
sistema apresenta ilimitado número de definição evita que se misture, no prosse-
propriedades. A rosa, por exemplo, tem guimento do processo, "alhos e bugalhos",
perfume, cor, peso, tamanho, beleza, rit- como, por exemplo, utilizar uma amostra
mo de crescimento, etc. É relevante, para de itens que mais medem aspectos de co-
se poder escolher ou construir um instru- nhecimento de vocabulário, quando, de
mento de medida, definir qual ou quais fato, se queria atingir o raciocínio verbal.
propriedades do sistema serão objeto de Com isso, também não se está afirmando
estudo. Por exemplo, se meu interesse se que entre tais propriedades de um siste-
focaliza sobre a criança, não é possível es- ma não haja correlações. Antes, pelo con-
tudar, de uma só vez, tudo sobre a crian- trário, relações e interações entre as pro-
ça. Então, tenho que me decidir por um priedades de um mesmo sistema são uma
aspecto mais restrito referente à criança, suposição não somente legítima, mas pro-
que enfim vou pesquisar. Assim, da crian- vável. Contudo, o que se está afirmando
ça posso estudar o seu desenvolvimento é que é preciso partir com conceituações
psicomotor, o desenvolvimento cognitivo, e definições claras e precisas, bem como
o desenvolvimento da linguagem, a enu- delimitadas, uma vez que a capacidade de
rese, a timidez, a agressividade, etc. Em conhecimento humano não é abrangente.
qual desses ou outros aspectos estou pre- Como se decidir por este ou aquele
sentemente e diretamente mais interessa- aspecto? Novamente, recorro ao meu in-
do? Pois esse ou esses aspectos constituem teresse, à ajuda dos livros índices e aos
a propriedade do objeto criança que pre- peritos (concretamente, ao meu orienta-
sentemente quero abordar. A esses aspec- dor, se eu for aluno).
tos escolhidos chamamos de atributo. Ou
o seu interesse pode se focalizar sobre a
inteligência. Esta de fato já é em si mesma Dimensionalidade do atributo
uma propriedade do sistema ser humano.
Mas ela pode ser igualmente considerada Se os dois primeiros passos ante-
um subsistema complexo, apresentando riormente descritos possam parecer, para
várias propriedades específicas dela, tais muitos, um mero exercício acadêmico, o
Instrumentação psicológica 171

terceiro passo e os demais a seguir já não dar a compreensão verbal, não fico escu-
são tão simples, pois os problemas que eles sado de expor a teoria sobre a inteligência
apresentam são bem mais complexos. verbal em sua totalidade e, em seguida,
A dimensionalidade do atributo diz justificar minha decisão pelo estudo de
respeito à sua estrutura interna, semân- apenas um aspecto dela. Evidentemente,
tica. O atributo constitui uma unidade nessa justificativa pode ser e será sufi-
semântica única ou é ele uma síntese de ciente o meu interesse específico por tal
componentes distintos ou até indepen- aspecto da inteligência. Isto é, eu devo sa-
dentes? Deve ele ser concebido como ber o que estou fazendo, e demonstro isso
uma dimensão homogênea ou devem-se na exposição da teoria que faço sobre o
nele distinguir aspectos diferenciados? construto inteligência verbal.
A resposta a esse problema obviamente Nesses dois passos, propriedade e di-
deve vir da teoria sobre o construto e/ mensionalidade, entramos no ponto mais
ou dos dados empíricos disponíveis sobre crítico na caminhada para a elaboração
ele, sobretudo dados de pesquisas que uti- dos instrumentos psicológicos, porque
lizaram a análise fatorial na análise dos toda esta parte resulta essencialmente da
dados, pois o que está em jogo aqui é a teoria psicológica, que concebe, define
questão de decidir se o construto é uni ou e estrutura os construtos psicológicos. A
multifatorial. Os fatores que compõem o tarefa da construção da teoria psicológica
construto (o atributo) são o produto des- não é específica do psicometrista, mas do
se passo. Por exemplo: Tenho como obje- psicólogo teórico. O psicometrista deve-
to psicológico os processos cognitivos; a ria poder contar com essa teoria e, com
propriedade desse objeto psicológico que base nela, fundamentar a construção dos
estou interessado em estudar é a inteli- instrumentos de medida. A existência de
gência verbal. Pergunta-se: é esta inteli- teorias ou fantasias as mais variadas so-
gência verbal um construto único ou devo bre praticamente qualquer construto em
distinguir nele componentes diferentes? psicologia torna a tarefa do psicometrista
Os dados empíricos disponíveis me mos- quase uma tragédia quando quer construir
tram que a inteligência verbal é composta instrumentos para medir construtos sobre
por, pelo menos, dois fatores bem distin- os quais os psicólogos não se entendem.
tos e praticamente independentes, a sa- Dessa forma, o psicometrista acaba se de-
ber, compreensão verbal e fluência verbal. cidindo em construir um instrumento para
Consequentemente, se quiser pesquisar medir um construto concebido segundo al-
a inteligência verbal e construir para tal gum psicólogo. E ali você tem uma fauna
um instrumento de medida, não poderei enorme de psicólogos teóricos, desde os
prescindir de conhecer e levar em con- behavioristas até os dialéticos, que falam
ta o fato de que a inteligência apresenta linguagens quase totalmente estranhas
dois fatores distintos, cuja medida exige um em relação ao outro. Infelizmente esta
instrumentos diferentes. Claro, posso me é a situação da teoria psicológica atual.
decidir por estudar somente a inteligência Para caricaturar, imagine o seguinte: um
verbal compreendida sob seu aspecto de físico vai construir um instrumento para
compreensão verbal e prescindir de me medir o comprimento de objetos físicos.
preocupar com a fluência verbal. Porém, E se para poder efetuar tal empreendi-
nesse caso o meu atributo de interesse de mento, ele tivesse que decidir sobre "bem,
estudo não é mais a inteligência verbal, e comprimento entendido segundo quem?"
sim a compreensão verbal. Mesmo toman- Tal pergunta careceria de sentido e seria
do essa decisão de somente querer estu- ridícula fosse ela feita sobre comprimento
172 Luiz Pasquali & cols.

ou outras propriedades da matéria (pelo de, então já tenho um pé no chão e posso


menos, na sua grande maioria). Mas, no fazer as seguintes considerações:
caso do psicometrista, tal pergunta infe-
lizmente é corriqueira, qualquer que seja 1. Se quero medir o raciocínio verbal, en-

o construto que ele queira estudar e medir, tão sei que ele não é o objeto psicológi-
o que vem a mostrar o estado primitivo em co, porque a ciência não mede objetos,
que vive a teoria psicológica. Essa preca- mas sim propriedades dele. Assim, ra-
riedade da teoria psicológica é a principal ciocínio verbal é um atributo.
responsável pela fuga, por parte dos psi- 2. Se raciocínio verbal é um atributo, con-
cometristas, de basear a construção dos sequentemente ele é atributo de algum
instrumentos psicológicos em uma teoria objeto. Dessa forma, devo descobrir
prévia e testá-los em seguida por meio da qual é esse objeto do qual o raciocínio
metodologia científica. Essa fuga acarreta verbal é propriedade.
que o psicometrista parte de uma coleção 3. Se raciocínio verbal é um atributo de
atabalhoada de itens para em seguida ver algum objeto, é de se supor que esse
o que eles estão medindo, se alguma coisa objeto tenha mais do que um atributo.
psicológica relevante. Isto é, além de raciocínio verbal, o ob-
Este estado de coisas deveria e deve jeto tem outros atributos. Assim, devo
obrigar o psicometrista a expor ou elabo- descobrir quais são esses outros atri-
rar uma miniteoria sobre o que ele en- butos, de tal forma que, depois, possa
tende pelo construto que pretende medir. diferenciar (definir diferencialmente)
Felizmente, já existe razoável abundância o meu atributo de interesse o racio-
-

de dados empíricos sobre muitos cons- cínio verbal dos demais atributos do
-

trutos psicológicos, com base nos quais o objeto em questão.


psicometrista poderá desenvolver uma tal
miniteoria do construto, que irá guiar a Com base na literatura, em peritos
construção do seu instrumento de medi- e na minha reflexão, resolvo essa equa-
da. Os dados empíricos que serão coleta- ção da seguinte forma: Raciocínio verbal
dos mediante o instrumento assim cons- é atributo do processo cognitivo chama-
truído irá decidir se sua miniteoria tem ou do raciocínio. Por sua vez, raciocínio tem
não alguma consistência. Isso não é uma como atributos, além de raciocínio verbal,
tragédia, é a própria lógica da pesquisa também raciocínio numérico, raciocínio
empírica, isto é, a testagem empírica que abstrato, raciocínio espacial, raciocínio
pode ou não confirmar a validade de uma mecânico e, talvez, outros. Mas, a litera-
teoria: a verdade científica é sempre rela- tura na área certamente fala desses cinco
tiva, nunca será um dogma, e, portanto, atributos de raciocínio. Dessa forma, pos-
sempre reformável. so ilustrar essa minha descoberta da se-
guinte forma:
Uma pausa. Tipicamente, é nesses pas-
sos que o pesquisador (pós-graduando) se
Raciocínio verbal
sente perdido, porque não consegue ver Raciocínio numérico
direito o que é exatamente o seu tema de Raciocínio Raciocínio abstrato
Raciocínio espacial
pesquisa e como é que ele se enquadra no Raciocínio mecânico
campo teórico do tema. Por isso vamos
fazer um exercício. Vamos supor que eu
quero construir um instrumento para me- Pesquisando um pouco mais, verifi-
dir o raciocínio verbal. Sendo isso verda- co que raciocínio verbal não é unidimen-
Instrumentação psicológica 173

sional. De fato, a literatura distingue dois Definição constitutiva é a que tipicamen-


tipos de raciocínio verbal, a saber, com- te aparece como definição de termos em
preensão verbal e fluência verbal. Assim, dicionários e enciclopédias: os conceitos
a ilustração apresentada pode ser comple- são ali definidos em termos de outros con-
tada como segue: ceitos; isto é, os conceitos, que são reali-
dades abstratas, são definidos em termos
de realidades abstratas. Por exemplo, se
Raciocínio *
Compreensão verbal defino inteligência verbal como a capaci-
verbal * Fluência verbal dade de compreender a linguagem, estou
Raciocínio numérico diante de uma definição constitutiva, por-
Raciocínio Raciocínio abstrato
Raciocínio que capacidade de compreender constitui
espacial
Raciocínio mecânico uma realidade abstrata, um construto, um
conceito.
As definições constitutivas são de
Com isso, tenho o meio de campo extrema importância no contexto da
destrinchado. Agora falta definir diferen- construção dos instrumentos de medi-
cialmente todos esses atributos e estou da, porque elas situam o construto exa-
bem encaminhado para a elaboração do ta e precisamente dentro da teoria desse
meu instrumento de medida. Posso fazer construto, dando, portanto, as balizas
tudo isso com qualquer tema para o qual e os limites que ele possui. Enfim, essas

queira construir um instrumento de men- definições caracterizam o construto, dan-


do as dimensões que ele deve assumir no
suração. Boa sorte!
espaço semântico da teoria em que está
incluído. Assim, se defino assertividade
Definição dos construtos como a capacidade de dizer não, a capa-
cidade de expressar livremente sentimen-
Definida a propriedade e suas dimen- tos positivos e negativos, a capacidade de
sões, é preciso conceituar detalhadamen- expor ideias sem receio, etc., estou dando
te esses construtos, novamente baseando- os limites semânticos que esse conceito
-se na literatura pertinente, nos peritos da deve respeitar dentro da minha teoria de
área e na própria experiência. O problema assertividade. Definições dessa natureza
deste passo é, portanto, a conceituação põem limitações definidas sobre o que
clara e precisa dos fatores para os quais se devo explorar quando for medir o cons-
quer construir o instrumento de medida. truto, limitações não somente em termos
A tarefa aqui é dupla, tendo como resul- de fronteiras que não podem ser ultrapas-
tado dois produtos: as definições consti- sadas, mas mais ainda em termos de fron-
tutivas e as definições operacionais dos teiras que devem ser atingidas. De fato,
construtos. normalmente um instrumento que mede
um construto não chega a cobrir toda a
amplitude semântica de um conceito. As-
Definição constitutiva sim, boas definições constitutivas vão me
permitir em seguida avaliar a qualidade
Um construto definido por meio de do instrumento que mede o construto em
outros construtos representa uma defini- termos de quanto dessa extensão semân-
ção constitutiva. Nesse caso, o constru- tica dele é coberta pelo instrumento, sur-
to é concebido em termos de conceitos gindo daí instrumentos melhores e piores
próprios da teoria em que ele se insere. uma vez que medem mais ou medem me-
174 Luiz Pasquali & cols.

nos da extensão conceptual do construto, uma fórmula simples e perfeita para de-
extensão esta delimitada pela definição cidir se a definição é ou não operacional.
constitutiva desse mesmo construto. Ela é operacional se você puder dizer ao
sujeito "vá e faça...". Assim, se defino in-
teligência verbal como compreender uma
Definição operacional frase, o que devo pedir ao sujeito para fa-
zer? Pois "vá e compreenda..." não diz ao
Com as definições constitutivas nós sujeito nada que ele possa fazer. Ao passo
estamos ainda no terreno da teoria, do que dizer "vá e reproduza a frase" indi-
abstrato. Um instrumento de medida já ca claramente o que sujeito deve fazer,
o

é uma operação concreta, empírica. A como deve se comportar, e, portanto, esta


passagem do terreno abstrato para o con- última é uma definição operacional, pois
creto é precisamente viabilizada pelas ela define comportamentos que devem
definições operacionais dos construtos. ocorrer, enquanto compreender a frase
Este é, talvez, momento mais crítico na
o
não indica nenhum comportamento con-
construção de medidas psicológicas, pois creto específico a ser exibido por parte do
é aqui que se fundamenta a validade des-
sujeito.
ses instrumentos; é aqui que se baseia a Em segundo lugar, a definição ope-
legitimidade da representação empírica racional deve ser a mais abrangente pos-
(comportamental) dos traços latentes (os sível do construto. Nenhuma definição
construtos). Duas preocupações são rele- operacional esgota a amplitude semân-
vantes e decisivas neste momento: tica de um construto; assim, pode haver
definições operacionais mais ou menos
1. as definições operacionais dos constru- abrangentes do mesmo construto, e essa
tos devem ser realmente operacionais e grandeza de abrangência, evidentemente,
2. elas devem ser os mais abrangentes fala da boa, má ou pior qualidade da de-
possíveis dos construtos. finição operacional, o que vai obviamente
repercutir sobre o instrumento de medida
Primeiramente, as definições opera- do construto que será baseado nessa de-
cionais devem ser realmente operacionais. finição operacional do mesmo construto.
Esta tautologia é proposital, porque se Aliás, uma definição operacional pode ser
peca demais neste particular. Uma defini- perfeitamente operacional e também per-
ção de um construto é operacional quando feitamente equivocada ou errada, quan-
o mesmo construto é definido, não mais do não cobrir nada do espaço semântico
em termos de outros construtos, mas em próprio do construto. Assim, definir in-
termos de operações concretas, isto é, de teligência verbal como desenhar círculos
comportamentos físicos por meio dos quais na areia constitui uma definição perfeita-
o tal construto se expressa. Assim, se defi- mente operacional, pois todo mundo en-
no inteligência verbal como a capacidade tende quando se manda desenhar círculos
de compreender uma frase ou, mesmo, na areia; contudo, apesar de operacional,
compreender uma frase, estou diante de ela é uma definição perfeitamente equi-
uma definição constitutiva e não opera- vocada de inteligência verbal, pois o com-
cional. Isto porque compreender não é um portamento de desenhar círculos na areia
comportamento, mas um construto. não tem nada a ver com o construto em
Seria uma definição operacional de questão. Disso segue que as definições
compreensão da frase reproduzir a frase operacionais podem representar um cons-
com outras palavras. Mager (1981) dá truto em uma escala que expressa uma
Instrumentação psicológica 175

proporção de coincidência entre constru- portamentalmente a compreensão ver-


to e definição operacional que vai de O a bal? Seriam tais como reproduzir o tex-
1, sendo O quando a definição não cobre to, dar sinônimos e antônimos, explicar o
nada do construto e 1 quando ela cobre texto, sublinhar alternativas, etc. Quanto
100% do espaço semântico do construto. mais completa essa listagem de categorias
Como já dissemos, nenhuma definição comportamentais, mais próximo estou
operacional será capaz de cobrir 100% do da construção do instrumento, porque o
construto, mas quanto maior covariância passo seguinte será simplesmente expres-
existir entre construto e definição opera- sar essas categorias em tarefas unitárias
cional, maior qualidade se deve atribuir a e específicas (os itens), e o instrumento
essa definição do construto e, por conse- piloto está construído. Por isso, nunca é
quência, maior chance terá o instrumen- demais gastar tempo na implementação
to, que de tal definição resulta, de ser detalhada das definições operacionais do
superior em qualidade. Dizemos maior construto.
chance porque a qualidade do instrumen- Onde vou me inspirar para realizar
to não depende unicamente de boas de- adequadamente esta tarefa? Novamente,
finições operacionais, embora sem a boa os métodos a serem utilizados para resol-
qualidade destas o instrumento já começa ver o problema deste passo de construção
de saída a ser inferior. A Figura 8.3 deixa de medidas psicológicas são a literatura
visualizar a problemática da qualidade de pertinente sobre o construto, a opinião de
representação comportamental de dife- peritos na área, a experiência do próprio
rentes definições operacionais do constru- pesquisador, bem como a análise de con-
to compreensão verbal. teúdo do construto. Torna-se aqui, como
Para garantir melhor cobertura do se vê, indispensável o conhecimento apro-
construto, as definições operacionais de- fundado da literatura sobre o construto e
verão especificar e elencar aquelas cate- sobre as técnicas de análise de conteúdo.
gorias de comportamentos que seriam a É bom lembrar nesse contexto que
representação comportamental do cons- os instrumentos de medida psicológica
truto. Quanto melhor e mais completa for visam medir traços latentes. Mas como
essa especificação, melhor será a garantia medir traços latentes que são impérvios
de que o instrumento que resultar para a à observação empírica que é o método
medida do construto será válido e útil. Por da ciência? Estamos aqui nos defron-
exemplo, quais seriam as categorias de tando com o problema da representa-
comportamentos que expressariam com- ção: qual é a maneira adequada de se

Definição operacional Compreensão verbal


Extensão semântica total

Desenhar círculos
Dizer que compreendeu

Escrever a frase

Reproduzir a frase

Figura 8.3
Extensão semântica de definições operacionais de compreensão verbal.
176 Luiz Pasquali & cols.

representar esses atributos latentes para compõem outros instrumentos disponí-


que possam ser cientificamente aborda- veis no mercado e que medem o mesmo
dos? Embora o problema pareça, e é na construto no qual estou interessado. As-
verdade, grave, ele não é específico da sim, temos três fontes preciosas para a
psicometria; ele ocorre na própria físi- construção dos itens:
ca com a teoria quântica, por exemplo.
Como o comportamento representa es- e literatura: outros testes que medem o
ses traços latentes? É precisamente o construto;
problema que as definições operacionais
* entrevista: levantamento junto à popu-
precisam resolver. lação meta;
*
categorias comportamentais: definidas
no passo das definições operacionais.
Operacionalização do construto
É importante notar que, no proces-
Este é o passo da construção dos so de elaboração do instrumento como
itens, que são a expressão da representa- o temos exposto, os itens não são mais
ção comportamental do construto, a saber, coletados a esmo ou chutados; eles são
as tarefas que os sujeitos terão de execu- elaborados ou, pelo menos, selecionados
tar para que se possa avaliar a magnitude em função das definições operacionais
de presença do construto (atributo). de um construto que foi exaustivamente
analisado em seus fundamentos teóricos
e nas evidências (dados) empíricas dis-
Fontes dos itens poníveis. Então, não é qualquer item que
pareça medir o construto que é aceito,
Se os passos até aqui discutidos fo- mas somente aquele que corresponde às
ram adequadamente resolvidos, nós es- suas definições teóricas (constitutivas)
tamos agora diante das categorias com- e às suas definições operacionais. Não é
portamentais que expressam o construto mais a malfadada face validity que impe-
de interesse, que dão praticamente a res- ra na seleção dos itens, e sim a sua perti-
posta à construção dos itens. Além disso, nência (a esta altura, obviamente, ainda
podemos apelar para outras duas fontes teórica) ao contexto teórico do construto.
de itens: a entrevista e outros testes que Aliás, os itens não são inventados ou pes-
medem o mesmo construto. A entrevista cados, eles são construídos para represen-
consiste em pedir a sujeitos representan- tar comportamentalmente o construto de
tes da população para a qual se deseja interesse.
construir o instrumento para opinar em
que tipo de comportamentos tal construto
se manifesta. Por exemplo, se meu desejo Regras para construção de itens
é construir um instrumento sobre asserti-
vidade, posso me dirigir a representantes Dadas as fontes que baseiam a cons-
da população e perguntar "como é para trução dos itens, é preciso dar agora al-
você uma pessoa assertiva?". De uma gumas regras ou critérios fundamentais
pesquisa dessa natureza pode surgir uma para a elaboração adequada dos próprios
grande riqueza de comportamentos que itens. Essas regras se aplicam, em parte, à
expressam assertividade e que podem ser construção de cada item individualmen-
aproveitados como itens do instrumento. te, e em parte ao conjunto dos itens que
Ademais, posso me inspirar em itens que medem um mesmo construto. Ademais,
Instrumentação psicológica 177

dependendo do tipo de traço a ser medi- introduzem explicações de termos ou


do (se é de aptidão ou de personalidade), oferecem razões ou justificativas são
algumas das regras se aplicam e outras normalmente confusos porque intro-
não. duzem ideias variadas e confundem
o respondente. Por exemplo: "Gosto
de feijão porque é saudável". O sujei-
a) Critérios para a construção dos itens: to pode de fato gostar de feijão, mas
não porque seja saudável; assim, ele
1. Critério comportamental: o item deve não saberia como reagir a tal item: se
expressar um comportamento, não porque o feijão é gostoso ou porque é
uma abstração ou construto. Segundo saudável. O item exprime duas ideias.
Mager (1981), o item deve poder per- O mesmo vale para "a maçã é gostosa
mitir ao sujeito uma ação clara e preci- e saudável".
sa, de sorte que se possa dizer a ele "vá 4 . Critério da clareza: o item deve ser in-
e faça". Assim "reproduzir um texto" é teligível até para o estrato mais baixo
um item comportamental ("vá e repro- da população meta; daí utilizar frases
duza..."), ao passo que "compreender curtas, com expressões simples e ine-
um texto" não o é, pois o sujeito não quívocas. Frases longas e negativas
sabe o que fazer com "vá e compreen- incorrem facilmente na falta de clare-
da...". za. Com referência às frases negativas:
2. Critério de objetividade ou de desejabili- normalmente elas são mais confusas
dade: para o caso de escalas de aptidão, que as positivas; consequentemente, é
os itens devem cobrir comportamentos melhor afirmar a negatividade do que
de fato, permitindo uma resposta certa negar uma afirmação. Por exemplo:
ou errada. O sujeito respondente deve fica mais inteligível dizer "detesto ser
poder mostrar se conhece a respos- interrompido" do que "não gosto de ser
ta ou se é capaz de executar a tarefa interrompido", ou em vez de "não me
proposta. Assim, por exemplo, se você sinto feliz" é melhor dizer "sinto-me in-
quer saber se o sujeito entende o que feliz". Neste contexto, é preciso igual-
seja "abstêmio", faz mais sentido pedir mente ter atenção em não utilizar gí-
a ele que dê um sinônimo do que pedir rias, porque elas não são normalmente
que diga se entendeu ou não. Já para inteligíveis para todos os membros de
o caso das atitudes e de personalidade uma população meta do instrumento,
em geral, os itens devem cobrir com- além de tipicamente ofender o estrato
portamentos desejáveis (atitude) ou mais sofisticado da população, o que
característicos (personalidade). O res- pecaria contra o critério número 10.
pondente, nesse caso, deve poder con- Contudo, o linguajar típico da popula-
cordar ou discordar ou opinar sobre ção meta deve ser utilizado na formu-
se tal comportamento convém ou não lação dos itens. Assim, são admissíveis
para ele, isto é, os itens devem expres- e são mais apropriadas expressões co-
sar desejabilidade ou preferência. Não nhecidas por tal população, ainda que
existem neste caso respostas certas ou elas possam parecer linguisticamente
erradas; existem sim diferentes gostos, menos castiças. A preocupação aqui é
preferências, sentimentos e modos de a compreensão das frases (que repre-
ser. sentam tarefas a serem entendidas e se
3. Critério da simplicidade: um item deve possível resolvidas), não sua elegância
expressar uma única ideia. Itens que artística.
178 luiz Pasquali & cols.

5. Critério da relevância (pertinência, sa- drão reduzido. Em termos da TRI, este


turação, unidimensionalidade, corres- critério representa os parâmetros b (di-
pondência): a expressão (frase) deve ficuldade) e a (discriminação) e pode
ser consistente com o traço (atributo, realmente ser avaliado definitivamen-
fator, propriedade psicológica) defini- te somente após coleta de dados em-
do e com as outras frases que cobrem píricos sobre os itens. Por exemplo, na
o mesmo atributo. Isto é, o item não escala de Thurstone (ver Figura 8.4), o
deve insinuar atributo diferente do item El é muito preciso, enquanto o E2
definido. O critério diz respeito à sa- é impreciso.
turação que o item tem com o constru- 7 . Critério da variedade: dois aspectos es-
to, representada pela carga fatorial na pecificam este critério.
análise fatorial e que constitui a cova- e Deve-se variar a linguagem pois o
riância (correlação) entre o item e o uso dos mesmos termos em todos
fator (traço). Veja o seguinte exemplo: os itens confunde as frases e dificul-
seja o construto "compreensão verbal" ta diferenciá-las, além de provocar
definido como compreender o signi- monotonia, cansaço e aborrecimen-
ficado de palavras e frases. Dos três to. Exemplo: o EPPS (Edwards Per-
itens a seguir, um é pertinente, outro é sonal Preference Schedule) em in-
mais ou menos e um é impertinente: glês começa quase todas as suas 500
*
Reproduzir a frase com as próprias frases com a expressão "I like...".
palavras > pertinente. Depois de tantos "I like", qualquer
* Decorar uma sentença >
pouco per- sujeito deve se sentir saturado!
tinente. e No caso de escalas de preferências,
* Falar em voz alta > impertinente. deve-se formular a metade dos itens
6 . Critério da precisão: o item deve pos- em termos favoráveis metade em
e

suir uma posição definida no contínuo termos desfavoráveis, para evitar


do atributo e ser distinto dos demais erro da resposta estereotipada à es-
itens que cobrem o mesmo contínuo. querda ou à direita da escala de res-
Este critério supõe que o item possa posta. É a recomendação que Likert
ser localizado em uma escala de estí- já dava em 1932.
mulos; em termos de Thurstone, diría- 8. Critério da modalidade: formular frases
mos que o item deve ter uma posição com expressões de reação modal, isto
escalar modal definida e um desvio pa- é, não utilizar expressões extremadas,

8
2 3
o 7 9 10 1
1

4ET15 E2

Figura 8.4
Ilustração da precisão dos itens na escala de Thurstone.
Instrumentação psicológica 179

como "excelente", "miserável", etc. As-


66,
b) Critérios referentes ao conjunto
sim, ninguém é infinitamente inteligen- dos itens (o instrumento todo):
te, mas a maioria é bastante inteligente.
À intensidade da reação do sujeito é 11. Critério da amplitude: este critério
dada na escala de resposta. Se o pró- afirma que o conjunto dos itens re-
prio item já vem apresentado em forma ferentes ao mesmo atributo deve co-
extremada, a resposta na escala de res- brir toda a extensão de magnitude do
postas já está viciada. Assim, se pergun- contínuo desse atributo. Este critério
to ao sujeito se está pouco ou muito de é novamente satisfeito pela análise da
acordo (em uma escala, por exemplo, de distribuição dos parâmetros b da TRI.
sete pontos que vai de desacordo total a A razão disto é que um instrumento
acordo total), um item formulado extre- deve poder discriminar entre sujeitos
mado tal como "meus pais são a melhor de diferentes níveis de magnitude do
coisa do mundo" dificilmente receberia traço latente, inclusive entre os que
resposta 7 (totalmente de acordo) por possuem um traço alto quanto entre
parte da maioria dos sujeitos da popu- os que possuem um traço pequeno, e
lação meta, simplesmente porque for-a não somente entre os de traço alto e
mulação é exagerada. Se em lugar dela traço baixo.
eu usasse uma expressão mais modal, 12. Critério do equilíbrio: os itens do
tal como "eu gosto dos meus pais", as mesmo contínuo devem cobrir igual-
chances de respostas mais variadas e in- mente ou proporcionalmente todos
clusive extremadas (resposta 7) seriam os segmentos (setores) do contínuo,
de se esperar. devendo haver, portanto, itens fáceis,
9 . Critério da tipicidade: formar frases difíceis médios (para aptidões) ou
e

com expressões condizentes (típicas, fracos, moderados e extremos (no


próprias, inerentes) com o atributo. caso das atitudes). De fato, os itens
Assim, a beleza não é pesada, nem devem se distribuir sobre o contínuo
grossa, nem nojenta. em uma distribuição que se assemelha
10. Critério da credibilidade (face validity): à da curva normal: maior parte dos
O item deve ser formulado de modo itens de dificuldade mediana e dimi-
que não apareça sendo ridículo, des- nuindo progressivamente em direção
propositado ou infantil. Itens com esta às caudas (itens fáceis e itens difíceis
última caracterização fazem o adulto em número menor). A razão deste
se sentir ofendido, irritado ou coisa critério se encontra no fato de que a
similar. Enfim, a formulação do item grande maioria dos traços latentes se
pode contribuir e contribui (Nevo, distribui entre a população mais ou
1985; Nevo e Sfez, 1985) para uma menos dentro da curva normal, isto
atitude desfavorável para com o tes- é, a maioria dos sujeitos possui mag-
te e assim para o aumento dos erros nitudes medianas dos traços latentes,
(vieses) de resposta. Este tema, às ve- sendo que uns poucos possuem mag-
zes, é discutido sob o que se chama nitudes grandes e outros, magnitudes
de validade aparente (face validity), pequenas. Assim, a distribuição dos
que não tem nada a ver com a valida- itens em um instrumento deve ser
de objetiva do teste, mas pode afetar mais ou menos segundo a curva nor-
negativamente a resposta ao teste, ao mal, como mostrado na Figura 8.5 a
afetar o indivíduo respondente. seguir, onde se diz que 10% dos itens
180 Luiz Pasquali & cols.

devem ter dificuldade mínima ou má- isso, exige maior número de itens para se-
xima, 40% dificuldade mediana, etc. rem adequadamente representados.
Se o número final de itens, isto é,
depois que o instrumento passou por to-
Quantidade de itens das as fases de construção e validação,
deve ser em torno de 20, pergunta-se com
Para se cobrir a totalidade ou a quantos itens é preciso começar para que
maior parte ou, pelo menos, grande par- no final possamos salvar 20. A resposta
te da extensão semântica do construto, dada no contexto da psicometria tradi-
explicitada nas definições constitutivas, cional positivista é a de que se deve co-
normalmente se exige, no instrumento fi- meçar com, pelo menos, o triplo de itens
nal, um número razoável de itens. O que para se poder assegurar, no final, um ter-
é um número razoável? O bom senso de ço deles. Esta resposta se deve ao modo
quem trabalha nesta área sugere que um positivista ou ateórico de construir ins-
construto, para ser bem representado, ne- trumentos psicológicos. Nesse enfoque,
cessita de cerca de 20 itens. Há, evidente- os itens não são construídos a partir de
mente, construtos muito simples que difi- uma teoria; eles são coletados ou selecio-
cilmente necessitam de tal número, sendo nados de uma tal pool of items que parece
suficientes apenas uma meia dúzia ou medir um dado construto e, em seguida,
menos deles. Por exemplo, em relação à analisados estatisticamente para ver quais
satisfação com o salário. Quantas manei- deles se salvam. Quer dizer, os itens são
ras há de se verificar tal satisfação? Parece aqui simplesmente chutados; eles são se-
exagerado perguntar 20 vezes ao sujeito lecionados simplesmente porque parecem
se está satisfeito com o seu salário. Posso, medir o que quero medir.
sim, perguntar se ele está contente com Dentro da técnica de construção de
a quantia, com o poder de compra, com instrumentos baseada na teoria dos traços
a pontualidade de entrega, e mais alguns latentes que estamos expondo, para se
aspectos. Mas parece difícil descobrir salvar 20 itens no final de toda a elabo-
umas 20 maneiras de estar satisfeito com ração e validação do instrumento, não é
o salário. Entretanto, a grande maioria necessário iniciar com mais do que 10%
dos traços latentes normalmente possui de itens além dos 20 requeridos no instru-
uma gama bem maior de aspectos e, por mento final. Isso porque os itens incluídos

40%
0% 20%
10%
Faixa: II II] IV v

Figura 8.5
Distribuição percentual dos itens em cinco faixas de dificuldade.
Instrumentação psicológica 181

no instrumento piloto são itens que pos- para essa análise deve ser feita com
suem validade teórica real, e não simples- esse estrato;
mente que parecem ter validade. 2. para evitar deselegância na formula-
ção dos itens, a análise semântica deve-
rá ser feita também com uma amostra
Análise teórica dos itens mais sofisticada (de maior habilidade)
da população meta (para garantir a
Operacionalizado o construto por chamada "validade aparente" do teste).
intermédio dos itens, estou diante da hi-
pótese de que eles representam adequa- Entende-se por estrato mais baixo
damente o tal construto. Essa é a minha aquele segmento da população meta que
versão da hipótese a ser testada. Contu- apresenta menor nível de habilidades.
do, é importante avaliar a minha hipó- Assim, por exemplo, se meu teste se des-
tese contra a opinião de outros para me tina a uma população que congrega su-
assegurar de que ela apresenta garantias jeitos do ensino fundamental até univer-
de validade. Essa avaliação ou análise da sitários, obviamente o estrato mais baixo
hipótese (análise dos itens) é obviamen- nesse contexto são os sujeitos do ensino
te ainda teórica porque consiste simples- fundamental, e o mais sofisticado será
mente em pedir outras opiniões sobre representado pelos sujeitos de nível uni-
minha hipótese, sendo que os outros que versitário. De qualquer forma, a dificul-
a vão avaliar ainda não são uma amos- dade na compreensão dos itens não deve
tra representativa da população para a se constituir em fator complicador na res-
qual construí o instrumento. Essa análise posta dos indivíduos, uma vez que não se
teórica é feita por juízes e comporta dois quer medir a compreensão deles (a não
tipos distintos deles, segundo a análise ser, obviamente, que o teste queira medir
incida sobre a compreensão dos itens precisamente isso), mas sim a magnitude
(análise semântica) ou sobre a pertinên- do atributo a que os itens se referem. Que
cia dos itens ao construto que represen- técnica se deve utilizar para fazer essa
tam (propriamente chamada de análise análise? Há várias maneiras eficientes
dos juízes). Assim, antes de partir para para tal tarefa, como, por exemplo, apli-
a validação final do instrumento piloto, car o instrumento a uma amostra de uns
este é submetido a uma análise teórica 30 sujeitos da população meta e em se-
dos itens por meio da análise semântica e guida discutir com eles as dúvidas que os
da análise dos juízes. itens suscitarem. Entretanto, uma técnica
que se tem mostrado das mais eficazes na
avaliação da compreensão dos itens con-
Análise semântica dos itens siste em checá-los com pequenos grupos
de sujeitos (três ou quatro) em uma situa-
A análise semântica tem como objeti- ção de brainstorm. Essa técnica funciona
vo precípuo verificar se todos os itens são da seguinte forma: constitui-se um grupo
compreensíveis para todos os membros da de até quatro sujeitos, iniciando com su-
população a que o instrumento se destina. jeitos do estrato baixo da população meta,
Nela duas preocupações são relevantes: porque se supõe que, se tal estrato com-
preende os itens, a fortiori o estrato mais
1. verificar se os itens são inteligíveis para sofisticado também os compreenderá. A
o estrato mais baixo (de habilidade) da esse grupo apresenta-se item por item,
população meta e, por isso, a amostra pedindo que ele seja reproduzido pelos
182 Luiz Pasquali & cols.

membros do grupo. Se a reprodução do mas deve também parecer honesta! (Ver


item não deixar nenhuma dúvida, o item regra número 10 dos critérios de constru-
é corretamente compreendido. Se surgi- ção de itens.)
rem divergências na reprodução do item
ou se o pesquisador perceber que está
sendo entendido diferentemente do que Análise dos juízes
ele julga que deveria ser entendido, este
item tem problemas. Dada essa situação, Esta análise é, às vezes, chamada de
o pesquisador então explica ao grupo o análise de conteúdo, mas propriamente
que ele pretendia dizer com tal item. Nor- deve ser chamada de análise de construto,
malmente, neste caso, os próprios sujei- uma vez que precisamente procura veri-
tos do grupo irão sugerir como se deveria ficar a adequação da representação com-
formular o item para expressar o que o portamental do(s) atributo(s) latente(s).
pesquisador queria dizer com ele; e aí está Na análise de conteúdo, os juízes
o item reformulado como deve ser. Quan- devem ser peritos na área do construto,
tos grupos são necessários para proceder pois sua tarefa consiste em ajuizar se os
a essa análise semântica? Bem, itens que itens estão se referindo ou não ao traço
não ofereceram qualquer dificuldade de em questão. Uma tabela de dupla entra-
compreensão em uma ou no máximo duas da, com os itens arrolados na margem
sessões não necessitam de checagem ul- esquerda e os traços no cabeçalho, ser-
terior. Itens que continuam apresentando ve para coletar a informação. Uma con-
dificuldades após, digamos, no máximo de cordância de, pelo menos, 80% entre os
cinco sessões merecem ser simplesmente juízes pode servir de critério de decisão
descartados. Em seguida a essas sessões, sobre a pertinência do item ao traço a que
é importante pelo menos uma sessão de teoricamente se refere.
checagem dos itens com um grupo de su- A técnica exige que sejam dadas aos
jeitos mais sofisticados. O objetivo desta juízes duas tabelas: uma com as defini-
última verificação consiste em evitar que ções constitutivas dos construtos/fatores
os itens se apresentem demasiadamente para os quais se criaram os itens e outra
primitivos para estes sujeitos e que assim tabela de dupla entrada com os fatores e
percama validade aparente. É que os itens os itens, como no Quadro 8.1, em que são
devem também dar a impressão de serie- avaliados os itens que medem os dois fa-
dade como diz o ditado de que a mulher
- tores (compreensão verbal e fluência ver-
de César não somente deve ser honesta, bal) de raciocínio verbal. Normalmente é

QUADRO 8.1
Tabelas para a análise dos itens pelos juízes

Fatores Definição Itens Compreensão Fluência


verbal verbal

Compreensão verbal Éa capacidade de... 1 X


Fluência verbal É a capacidade de... 2 X
3 X

X
Instrumentação psicológica 183

necessária uma terceira tabela que elenca tarefa será iniciada com os procedimentos
os itens, uma vez que a tabela de dupla que seguirão, que consistem em coletar a
entrada geralmente não comporta a ex- informação empírica válida e submetê-la
pressão completa do conteúdo dos itens. às análises estatísticas pertinentes em psi-
Com base nessas tabelas, a função cometria, como veremos.
dos juízes consiste em colocar um X para o
item debaixo do fator ao qual o juiz julga
o item se referir. Uma meia dúzia de juízes PROCEDIMENTOS EXPERIMENTAIS
será suficiente para realizar a tarefa. Itens
que não atingirem uma concordância de Os procedimentos envolvidos nesta
aplicação aos fatores (cerca de 80%) ob- etapa fazem apelo direto ao conteúdo da
viamente apresentam problemas, e seria o disciplina ensinada nas instituições uni-
caso de descartá-los do instrumento pilo- versitárias sob o nome de delineamento
to. Isso vale, contudo, se o construto para ou planejamento de pesquisa, cujo conhe-
o qual se está construindo o teste apre- cimento é absolutamente necessário, uma
sentar fatores (particularmente quando vez que garante a tecnologia da coleta vá-
forem em maior quantidade) que se su- lida da informação empírica. Aqui serão,
põem ou se sabe que não são correlacio- por isso, explicitados apenas alguns pon-
nados. Quando os fatores se supõem que tos dessa tecnologia que têm mais a ver
sejam correlacionados, acontece que uma diretamente com o problema de elabora-
mesma tarefa (item) pode se referir, cer- ção de instrumentos psicológicos, mas o
tamente com níveis de saturação diferen- conhecimento aprofundado da citada dis-
te, mas de fato se referir simultaneamente ciplina é imprescindível.
a mais de um fator, o que implicaria que Dois passos são salientados nestes
os juízes iriam mostrar alguma discordân- procedimentos empíricos na validação do
cia quanto à aplicação do item a este ou instrumento piloto: o planejamento da
àquele fator. Nesse caso, a discordância aplicação e a própria coleta da informação
deve ser considerada como concordância. empírica, conforme detalha a Figura 8.6.
Uma outra solução seria instruir os juízes Com referência ao planejamento
a marcar, para cada item, não o fator, mas da aplicação do instrumento piloto, dois
aqueles fatores aos quais o item se refere.
Entretanto, com tal dica, você abre campo
Procedi-
para muita divagação por parte dos juí- mentos
EXPERIMENTAIS
zes, e você perde a utilidade prática des-
sa análise. Seria melhor instruir os juízes Fase VALIDAÇÃO DO INSTRUMENTO

para colocar, se possível, cada item sob um Literatura/Peritos Seguir


fator somente. Método /Experiência Planejamento

Com o trabalho dos juízes ficam Y Y


Planejamento Aplicação
completados os procedimentos teóricos Passo 7 da
Aplicação e Coleta
na construção do instrumento de medida, Amostra
Dados
que comportaram a explicitação da teo- Produto Instruções
(Matriz F)
Formato
ria do(s) construto(s) envolvido(s), bem
-

-
Sistemática
como a elaboração do instrumento piloto -Tarefa

que constitui a representação comporta-


mental destes mesmos construtos e que se
Figura 8.6
põe como a hipótese a ser empiricamente Procedimentos empíricos na elaboração de medida
testada (validação do instrumento). Esta psicológica.
184 Luiz Pasquali & cols.

pontos são particularmente relevantes: a meu instrumento mede dois fatores, ne-
definição da amostra e das instruções de cessito de 200 sujeitos na minha amostra.
como aplicar o instrumento. Estamos supondo aqui que a população
Quanto à amostra: um instrumento é meta seja homogênea em relação ao traço
tipicamente construído para um certo tipo latente que o instrumento mede. Se o tra-
de população. Esta, consequentemente, ço varia dentro da população, não somen-
deve ser claramente definida e delimita- te em termos de magnitude, o que é de se
da em termos de suas características es- esperar, mas em termos de estrutura, isto
pecíficas. Assim, é necessário se determi- é, ele se torna de fato um traço psicologi-
nar para que faixa etária o instrumento camente diferente para diferentes estratos
foi construído, para que nível socioeco- da mesma população, então estamos fa-
nômico, para que nível de escolaridade, lando não mais de um traço latente, mas
etc. Enfim, é preciso dizer qual é o tipo de dois ou mais. Nesse caso, estamos as-
de indivíduo, em termos de característi- sumindo que instrumentos diferentes são
cas biossociodemográficas, que constitui necessários para avaliar traços diferentes.
a população meta do instrumento. E é Mas se o traço se mantém qualitativamen-
dessa população que sairá a amostra de te (em termos de sua estrutura conceitual,
sujeitos para a testagem da qualidade psi- de sistema) o mesmo na população, então
cométrica do instrumento de medida. Ob- essa população é homogênea. Um exem-
viamente, aqui se deve recorrer à teoria e plo: um teste de inteligência para adultos
às técnicas de amostragem, ensinadas na não inclui crianças na sua população, pois
disciplina de planejamento de pesquisa a inteligência da criança é qualitativa-
ou similar. mente diferente da dos adultos, segundo
Salientamos aqui apenas alguns as- teorias (Piaget, Spearman, etc.) e dados
pectos relevantes da amostra para o caso empíricos. Assim, a amostra para vali-
específico de validação de instrumentos dação de um teste de inteligência para
psicológicos. Como estamos elaborando adultos deve ser selecionado de uma po-
um instrumento referente a construto, pulação de adultos exclusivamente, que,
tipicamente a análise estatística a seguir nesse sentido, se torna uma população
utilizada para a análise dos dados será a homogênea.
análise fatorial e as análises multivariadas Segunda dica: se houver dúvidas
da TRI. Essas técnicas estatísticas fazem sérias quanto ao número de dimensões
algumas exigências importantes dos da- ou fatores que o instrumento mede, cos-
dos, especificamente que eles produzam tuma-se dizer que são necessários para
suficiente variância para que a análise seja a amostra 10 sujeitos para cada item do
consistente. Essa afirmação normalmente instrumento. Assim, um instrumento com
implica, pelo menos, que as amostras uti- 100 itens demandaria 1.000 sujeitos. Isso
lizadas sejam grandes. Quanto grandes? equivaleria a supor que o instrumento es-
Há duas dicas úteis para responder a tivesse medindo cerca de 10 fatores. Esse
essa pergunta. Primeiro, se eu estiver se- modo de pensar está mais ligado ao siste-
guro de quantos fatores o meu instrumen- ma positivista de construir instrumentos,
to mede (o que foi teoricamente definido em que os itens não são construídos via
quando se discutiu o passo da dimensio- teoria e sim "pescados" aleatoriamente e
nalidade do objeto psicológico que o ins- em seguida analisados via análise fato-
trumento iria medir), então a dica é de rial para ver quantos fatores está medin-
que a amostra deve conter um mínimo de do. De qualquer forma, é uma dica ainda
100 sujeitos por fator medido. Assim, se útil, quando há dúvidas com respeito ao
Instrumentação psicológica 185

número de fatores. Geralmente, entre 5 sujeito com o que o item está afirmando.
e 10 sujeitos por item do instrumento se- Este último formato é o mais utilizado no
rão suficientes para responder à questão caso de testes de personalidade e escalas
do tamanho da amostra, com a ressalva de atitudes. Todos esses e outros formatos
de que qualquer análise fatorial e da TRI apresentam vantagens e desvantagens.
com menos de 200 sujeitos dificilmente Por exemplo, o caso da escolha forçada,
pode ser considerada adequada. em testes de atitudes e personalidade, pa-
Quanto às instruções: estas se refe- rece ser a maneira mais fácil de respon-
rem aos contornos da tarefa do sujeito der, pois o sujeito tem melhores condições
que vai responder ao instrumento. Aqui de escolher entre duas alternativas do que
são definidas a sistemática de aplicação dar uma resposta absoluta, como é o caso
do instrumento, o formato em que ele se nas escalas de Likert. Contudo, dois pro-
apresenta e o que o sujeito tem que fazer blemas graves existem com este formato
ao respondê-lo. No tocante à sistemática, de escolha forçada: primeiro, se você vai
serão definidas as condições de aplicação: comparar os itens do instrumento dois a
se será coletiva ou individual; se será pre- dois, o instrumento se torna muito rapida-
ciso ou não aviso prévio aos testandos; são mente de um comprimento incontrolável.
necessários contatos prévios com diretores, Por exemplo, um teste com apenas 10 itens
chefes dos sujeitos, etc. Enfim, devo saber terá n(n-1)/n questões, isto é, 45 questões,
em que estou "me metendo" e quais são e um de 100 itens terá 4.950! Além dessa
as dificuldades que vou encontrar ao que- dificuldade, existe o problema da chamada
rer aplicar o instrumento em uma amostra desejabilidade social, a saber, os dois itens
definida de sujeitos, pois eles normalmen- que estão sendo comparados devem pos-
te não estão gratuitamente disponíveis às suir mais ou menos o mesmo nível de atra-
minhas necessidades de pesquisador. Por tividade, do contrário a própria questão já
isso, tenho que elaborar uma estratégia de está dando a resposta ao sujeito se um dos
convencimento, para os responsáveis dos itens da questão é socialmente desejável e
sujeitos que entrarão na amostra, e uma o outro indesejável, como, por exemplo,
estratégia operacional para poder viabili- escolher entre "A sou uma pessoa simpá-
-

zar a aplicação do instrumento. tica" e "B sou uma pessoa fraca". Nesse
-

No referente ao formato do instru- caso, a maioria das pessoas iria escolher a


mento, deve-se decidir como a resposta alternativa A. Certo?
do sujeito será dada para cada item. Aqui No caso do formato de mútipla esco-
existe uma infinidade de formatos possí- lha, existem os problemas do número de
veis, como, por exemplo, o da escolha for- alternativas e da qualidade das alternati-
cada, em que dois itens são apresentados vas. Primeiramente, como se trata de res-
simultaneamente, sendo tarefa do sujei-
a
postas certas e erradas, apenas uma das
to escolher um deles como mais apropria- alternativas será a correta. Mas, quando
do, mais típico, ou mais o que seja, bas- o sujeito não sabe a resposta correta, ele
tante comuns em testes de personalidade tem a chance de "chutar" e acertar por
e mais ainda em testes de interesse; o das acaso; e isso é um problema, que é tan-
múltiplas alternativas, mais comuns em to mais grave quanto menor for o núme-
testes de aptidão, em que o sujeito deve ro de alternativas. Por exemplo, em um
escolher a alternativa correta; o das esca- item com duas alternativas, o sujeito tem
las tipo Likert, em que a cada item segue a chance de acertar por acaso em 50% das
uma escala de pontos (de 2 a mais de 10) vezes, ao passo que em um item com cin-
que exprimem intensidade de acordo do
a co alternativas essa chance cai para 20%,
186 Luiz Pasquali & cols.

mas ainda não é zero. Então, deve-se ter Esses e outros tipos de formatos não
maior do que menor número de alterna- parecem ter maior impacto sobre a resposta
tivas para diminuir o acerto aleatório. do sujeito, de sorte que o formato da escala
Mas, fazendo isso, você torna o teste cada depende mais do gosto pessoal do pesqui-
vez mais difícil de construir, porque não sador do que qualquer outra razão técnica.
é tarefa fácil inventar alternativas, uma Pessoalmente acho que quanto mais leve a
vez que elas devem de fato se apresentar escala, melhor, e a escala numérica e grá-
como alternativas plausíveis e atrativas (e fica me parece muito pesada; mas sua opi-
este é o segundo problema), isto é, elas nião é tão boa quanto a minha.
devem ter alguma aparência de serem Quanto ao número de pontos: nor-
respostas corretas, do contrário não são malmente as afirmações ou itens são res-
alternativas. Assim se você constrói o se- pondidos em uma escala de 3 ou mais
guinte item: pontos, isto é, o sujeito tem que dizer se
A camada mais externa da pele se concorda, está em dúvida ou discorda do
chama: que a frase afirma sobre o objeto psico-
lógico. O número de pontos na escala de
a) epiderme resposta varia de 3 a mais de 10, sendo
b) paquiderme as mais utilizadas as escalas de 5 e 7 pon-
c) dermatologia tos. O número de pontos utilizados nas
d) epidemia escalas Likert parece, novamente, ser algo
irrelevante. Na pesquisa de Matell e Jaco-
é claro que b, c, d não constituem alterna- by (1972), foram utilizadas escalas com
tivas plausíveis ou sérias. 2 até 19 pontos. Com exceção das escalas
Quanto às escalas tipo Likert, per- de 2 e 3 pontos (por oferecerem poucos
gunta-se frequentemente qual é o número graus de liberdade), em todas as outras a
ideal de pontos que a escala de resposta porcentagem de uso dos pontos e o tempo
deve ter e qual o formato ideal da escala. de resposta não foram afetados de modo
Com respeito ao formato das esca- significativo. Outros estudos já haviam
las: Existem os mais variados modos de descoberto que o número de pontos da
apresentar essas escalas, mas que final- escala e a existência ou não de um ponto
mente se reduzem a escalas verbais, nu- neutro não afetam a consistência interna
méricas ou gráficas, sendo estas últimas da escala Likert (Bendig, 1954; Komorita,
normalmente ancoradas, ou combinação 1963; Matell e Jacoby, 1971), nem a esta-
das três. bilidade teste-reteste (Jones, 1968; Van der
Vejamos: Veer, Howard e Austria, 1970; Goldsamt,

Escala Pontos
=

Verbal Sim Em dúvida Não


Numérica 1 2 3 4 5 6 7
Gráfica
Gráfica ancorada Acordo Desacordo

Numérica e gráfica 1 2 3 4 5 6 7
Instrumentação psicológica 187

1971; Matell e Jacoby, 1971) e nem a va- o aplicador deve ser competente para a
lidade concorrente e preditiva (Matell e tarefa, etc.
Jacoby, 1971; 1972).
As instruções que acompanham o
PROCEDIMENTOS ANALÍTICOS
instrumento têm a função única de tornar
a tarefa do respondente inambígua. Con- Esta parte da elaboração de instru-
sequentemente, elas devem poder deixar mentos psicológicos (ver Figura 8.7) é
absolutamente claro o que o sujeito tem aquela que mais atemoriza os psicólogos,
que fazer para responder corretamente o dada a sua sofisticação estatística. Ela
teste e, por isso, elas devem ser avaliadas comporta igualmente a parte mais volu-
na análise semântica. Algumas precau- mosa de qualquer livro sobre psicometria.
ções: as instruções devem informar em Entretanto, o conhecimento da estatística e
termos gerais sobre que é o teste; devem da psicometria não são aqui substituíveis.
ser as mais curtas possíveis, sem sacrificar Felizmente, o psicólogo pode apelar neste
a compreensão da tarefa por parte de to- particular para a ajuda de estatísticos ou
dos os sujeitos da população meta; devem, de psicometristas. A sofisticação nesta área
é tão grande que não é possível ser exposta
tipicamente, conter um ou mais exemplos
de como os itens devem ser respondidos; neste capítulo. Para tanto, são recomenda-
devem pôr o sujeito em um estado psico- das as obras que em seguida serão citadas,
sendo a exposição de conteúdo neste capí-
lógico livre de tensão e ansiedade.
tulo apenas exemplificativa.
Finalmente, no que se refere à pró-
pria coleta da informação (passo 8),
devem-se seguir todas as precauções exi-
gidas em qualquer aplicação de instru-
Algumas obras básicas
mentos psicológicos, a saber, os sujeitos
de análise psicométrica
devem ser postos em um ambiente con- Anastasi, A. (1988). Psychological testing (6th ed). New
dizente e livre de distrações e de tensão, York: Macmillan.

Procedi-
ANALÍTICOS
mentos

Fase VALIDAÇÃO DO INSTRUMENTO NORMATIZAÇÃO

Análise Análise empírica Consistência


Método dos itens (ICC) Grupos critério
Fatorial Interna
+ y y y
Dimensio- Análise Precisão do Estabelecimento
Passo 9 nalidade 10 dos Itens 1 1
Instrumento 12
de Normas

Fatores Dificuldade
Índices de Normas
-
Carga fatorial Discriminação
Produto Autovalor Precisão %,z
-

Chute
-
Comunalidade

Figura 8.7
Procedimentos analíticos na elaboração da medida psicológica.
188 Luiz Pasquali & cols.

Cronbach, L.J. (1990). Essentials ofpsychological testing fator, as análises estatísticas devem ser
(5th ed.). New York: Harper & Row. feitas independentemente para cada fator.
Gulliksen, H. (1987). Theory of mental tests. Hillsdale,
NJ: Erlbaum. Como inicialmente ainda não se sabe se
Hambleton, R.K., & Swaminathan, H. (1985). Item Re-
o instrumento que acaba de ser construí-
sponse Theory: Principles and applications. Norwell, MA: do e aplicado é ou não unidimensional,
Kluwer Nijhoff. a primeira análise que se impõe sobre os
Hambleton, R.K., Swaminathan, H., & Rogers, J. (1991). dados empíricos coletados é a verificação
Fundamentals of item response theory. Beverly Hills, CA:
Sage. da unidimensionalidade. Tipicamente,
Hambleton, R.K., & Zaal, J.N. (Eds.). (1991). Advances necessita-se proceder a uma análise fa-
in educational and psychological testing: Theory and ap- torial para definir a dimensionalidade do
Plications. Boston, MA: Kluwer Academic. instrumento. Essa análise vai determinar
Harman, H.H. (1967). Modem factor analysis. Chicago,
IL: University of Chicago Press. quantos fatores o instrumento está de fato
Hulin, C.L., Drasgow, E, & Parsons, C.K. (1983). Item
medindo. Essa exigência pode parecer um
Response Theory: Applications to psychological measure- tanto frustrante, uma vez que, se o ins-
ment. Homewood, IL: Dow Jones-Irwin. trumento foi construído para medir um
Lord, EM. (1980). Applications of Item Response Theory fator somente, por exemplo, então não se
to practical testing problems. Hillsdale, NJ: Erlbaum.
Muíiiz, J. (1990). Teoria de respuesta a los ítems. Ma- pode supor que esteja medindo somente
drid: Pirámide. este fator para o qual foi construído em
Muiiz, J. (1992). Teoria clássica de los tests. Madrid: primeiro lugar? É bom lembrar aqui que o
Pirámide. instrumento constitui uma hipótese; mas,
Muiiz, J. (1996). Psicometría. Madrid: Univérsitas.
agora estamos verificando essa hipótese
Nunnaliy, J.C., Jr. (1978). Psychometric theory. New
York: McGraw-Hill. empiricamente, então é necessário se de-
Pasquali, L. (2009). Psicometria: Teoria dos testes na psi-
monstrar, e não somente supor, que o ins-
cologia e na educação (3. ed). Rio de Janeiro, RJ: Vozes. trumento de fato mede um único fator ou
Pasquali, L. (2007). TRI- Teoria de resposta ao item: Teo- quantos e quais fatores ele está medindo.
ria, procedimentos e aplicações. Brasília, DF: LabPAM. Aliás, essa análise fatorial constitui a de-
Santisteban, C. (1990). Psicometría. Madrid: Norma.
monstração da própria validade do instru-
Thorndike, R.L. (1982). Applied psychometrics. Boston: mento e representa igualmente a análise
Hougton Mifflin.
Yela, M. (1987). Introducción a la teorta de los tests. preliminar dos próprios itens.
Madrid: Facultad de Psicologfa, Universidad Complu- Aandálise fatorial (ver Pasquali, 2009)
tense.
produz resultados importantes com os
quais se pode tomar decisões sobre a qua-
lidade dos itens, bem como do instrumen-
Algumas anotações sobre os to no seu todo. Na verdade, ela mostra o
procedimentos analíticos que o instrumento está medindo, isto é, os
fatores, bem como os itens que compõem
A dimensionalidade do cada fator. Ela produz, para cada item, a
instrumento (validade) carga fatorial (saturação) deste no fator,
e esta carga fatorial indica a covariância
As análises estatísticas que se fazem entre o fator e o item. Isso quer dizer que
de um instrumento psicológico, no seu a carga fatorial mostra a porcentagem que
todo e em cada item individual, fazem a existe de parentesco (covariância) entre o
suposição de que o instrumento seja uni- item e o fator, de forma que quanto mais
dimensional. Isso implica que todos os próximo de 100% de covariância item-
itens do instrumento estejam medindo fator, melhor será o item, pois ele assim
um e o mesmo construto. Dessa forma, es- se constitui em um excelente representan-
tando o instrumento medindo mais de um te comportamental do fator (do traço la-
Instrumentação psicológica 189

tente). Qual é o montante de covariância contrário, os 10 últimos itens possuem car-


entre o item e o fator necessário para se gas fortes no fator 2 e quase nada no fator
dizer que o item é um bom representan- 1. O item 10 não possui carga expressiva
te deste? As cargas fatoriais são expressas em nenhum dos dois fatores e será, por
similarmente aos índices de correlação e, isso, descartado do teste. Observe que as
portanto, podem ir de -1,00 a +1,00. Uma cargas fatoriais podem ser tanto positivas
carga de 0,00 significa que não há relação quanto negativas e, assim mesmo, perten-
alguma entre o item e o fator; nesse caso, cerem ao mesmo fator, contanto que elas
o item seria uma representação compor- sejam altas. É que o fato de elas serem po-
tamental totalmente equivocada do fator. sitivas e negativas no mesmo fator apenas
Então, que nível de magnitude de carga o indicam que um item está expressando o
item deve apresentar para ser um bom re- pólo positivo e o outro o pólo negativo
presentante do fator? Costuma-se apontar do fator. Por exemplo, os itens "gosto de
o valor 0,30 (positivo ou negativo) como meus pais" e "detesto meus pais", ambos
sendo uma carga mínima necessária para se referem à questão da filiação, apenas o
o item ser um representante útil do fator. primeiro item expressa o pólo positivo da
Obviamente, quanto maior de 0,30 for a filiação e o segundo, o pólo negativo.
carga, melhor o item. Uma carga de 0,30 Assim, o teste mede dois fatores, um
indica que há uma covariância de cerca com 9 itens e o outro com 10, mostrando-
de 10% (0,302 = 0,09) entre o item e o -se um item (o número 10) uma represen-
fator, o que já pode ser considerado não tação equivocada tanto do fator 1 quanto
negligível, embora não seja lá grande do fator 2. Os dois fatores explicam 47,73%
coisa. Obviamente, se todos os itens de
um fator apresentam cargas fatoriais em
torno de 0,30, este fator está muito mal TABELA 8.1 Matriz fatorial de
20 itens em dois fatores
representado, porque se esperam cargas
bem maiores (acima de 0,50) para se di- Item Fator 1 Fator 2 h2
zer que o fator foi bem representado com-
0,80 0,10 0,65
portamentalmente. Você vê, então, que as
1

2 0,78 -0,05 0,61


cargas fatoriais falam tanto da qualidade 3 0,78 0,20 0,65
de cada item como do conjunto deles, isto 4 0,70 0,15 0,51
é, do próprio fator. Assim, se você cons- 5 0,65 0,08 0,43
6 0,64 0,12 0,42
truiu 25 itens para representar o traço
7 -0,64 -0,10 0,42
latente e, destes 25 itens, 20 apresentam 8 0,60 0,03 0,36
cargas acima de 0,50 e 5 apresentam car- 9 -0,60 -0,23 0,41
10
gas em torno de 0,30, você irá eliminar -0,25 0,19 0,10
W 0,30 -0,83 0,78
estes últimos 5 itens e trabalhar somente 12 0,21 -0,83 0,68
com os 20 que apresentaram cargas fato- 13 0,04 -0,78 0,61
riais respeitáveis. Veja o exemplo (fictício) 14 0,16 -0,70 0,52
da Tabela 8.1. 15 -0,12 0,70 0,50
16 0,09 0,66 0,44
A Tabela 8.1 exemplifica uma típica 17 -0,00 -0,65 0,42
matriz fatorial com as informações essen- 18 0,12 -0,63 0,41
ciais sobre os itens e os fatores. Nela se vê 19 -0,03 0,56 0,31
20 0,21 0,50 0,29
que, dos 20 itens, 9 (com cargas fatoriais
em negrito) representam o fator 1, pois Autovalor 4,614 4,932
% Var. total 23,07 24,66
possuem cargas fatoriais altas neste fator % Var. comum 48,33 51,67
e praticamente cargas nulas no fator 2; ao
190 Luiz Pasquali & cols.

(= 23,07 + 24,66) da variância total do dentro de cada fator (os 9 itens no fator
teste, sendo o restante da variância irrele- 1 do nosso exemplo, e os 10 no fator 2) e
vante ao conteúdo que o teste mede (como normalmente se reduzem a duas: a dificul-
erros de medida e peculiaridades especiífi- dade e a discriminação. A dificuldade do
cas dos itens). O h? representa a comuna- item diz respeito à magnitude do traço la-
lidade que cada item possui com os dois tente que o sujeito deve possuir para poder
fatores e mostra a covariância de item com acertar (testes de aptidão) ou aceitar (tes-
os fatores e, por conseguinte, o tanto que o tes de personalidade) o item. Assim, quan-
item tem a ver com os fatores. Assim, para to maior for a magnitude do traço latente
o item 1, o h2 é 0,65, isto é, este item pos- exigida para acertar ou aceitar o item, mais
sui 65% de covariância (parentesco) com difícil este é dito ser. A discriminação do
os dois fatores, sendo 0,64% (0,802) com o item diz respeito ao fato de ele poder dife-
fator 1 e apenas 1% (0,10?) com fator 2;
o renciar sujeitos que possuem magnitudes
disso se deduz que o item 1 é uma excelen- diferentes do mesmo traço latente. Assim,
te representação comportamental do fator quanto mais próximas forem as magnitu-
1 e nada do fator 2. des do traço que o item puder diferenciar,
Nesta questão da validade do instru- mais discriminativo ele será.
mento, outras técnicas são utilizadas além A psicometria tradicional faz análi-
da análise fatorial, tais como a técnica da ses estatísticas para determinar esses dois
validação convergente-discriminante (Camp- parâmetros psicométricos dos itens de
bell e Fiske, 1967); a utilização da idade uma forma que pode ser hoje considerada
como critério para a validação de construto inferior diante dos avanços da psicome-
de um teste quando este mede traços que são tria mais moderna da TRI. A TRI intro-
intrinsecamente dependentes de mudanças duziu técnicas nesta área da análise dos
no desenvolvimento cognitivo/afetivo dos itens que, embora complicadas, devem
indivíduos, como é o caso, por exemplo, na ser as utilizadas neste passo da elabora-
teoria piagetiana do desenvolvimento dos ção de qualquer instrumento psicológico
processos cognitivos e da teoria de Spear- (ver Hambleton, Swaminathan e Rogers,
man sobre a inteligência; a correlação com 1991; Muiiiz, 1990; Pasquali, 2007). Um
outros testes que meçam o mesmo traço do exemplo ajudará a entender esses proce-
meu novo instrumento e o uso da interven- dimentos (ver Figura 8.6).
ção experimental (ver Pasquali, 2009). Primeiramente, deve-se atentar a
que existem vários modelos matemáticos
envolvidos na TRI. Na verdade, há três
A análise empírica dos itens deles principais, dependendo do núme-
ro de parâmetros que pretendem avaliar
Os itens que se mostraram ser repre- dos itens. Os parâmetros em questão são
sentantes satisfatórios do traço latente que a dificuldade, a discriminação e a respos-
o instrumento mede (no caso da Tabela ta aleatória (ou melhor, a resposta correta
3.2 seriam os 9 itens para o fator 1 e os 10 dada ao acaso). Assim, temos os modelos
do fator 2) devem ser submetidos a aná- logísticos de um, dois ou três parâmetros.
lises individuais ulteriores, com o objetivo Todos os modelos trabalham com
de verificar outras características que eles traços latentes, isto é, teorizam sobre as
devem apresentar dentro de um mesmo estruturas latentes. Entendem os sistemas
instrumento, além de serem legítimos re- psicológicos latentes como possuindo di-
presentantes do traço latente. Essas carac- mensões, isto é, propriedades de diferen-
terísticas dos itens devem ser analisadas tes magnitudes ou mensuráveis. Por isso,
Instrumentação psicológica 191

esta teoria também é conhecida como a Exemplificando com o modelo de


teoria do traço latente ou a teoria da cur- Lord: Os valores 6 são expressos em coor-
va característica do item ou item charac- denadas cartesianas, tendo na ordenada
teristic curve ICC, pelo fato de produzir
-
a probabilidade de resposta correta, isto
para cada item uma ogiva característica é, o P;(0), e na abscissa o traço latente,
dele. A teoria supõe que o sujeito possui o próprio 9. Este procedimento produz,
um certo nível de magnitude do traço la- para cada item, uma ogiva, chamada de
tente, designado por teta (0), que é deter- CCI como na Figura 8.8.
minado mediante a análise das respostas Na ilustração da Figura 8.8, os três
dos sujeitos, fazendo uso de diversas fun- parâmetros aparecem nas seguintes posi-
ções matemáticas. A função do modelo ções: o "a" é representado pela inclinação
completo de três parâmetros é: da curva na altura do ponto de inflexão,
isto é, onde a curva corta a linha que re-
e 23, (9-b,) presenta a probabilidade 0,50 de resposta
(0)=c+(1-c) correta (50%); quanto mais íngreme essa
amd) curvatura, isto é, quanto mais próxima de
um ângulo de incidência de 90º, mais dis-
A probabilidade de resposta corre- criminativo é o item. O "b" é representado
ta, que define a posição (0) do indivíduo pela distância na linha dos X (abscissa),
no traço medido, é função de três parâ- que corresponde ao ponto determinado
metros: "a" corresponde ao índice de dis- pela perpendicular que vem do ponto de
criminação do item e é determinado pela inflexão da curva. O "ce" é definido pela
inclinação da curva no ponto de inflexão; assíntota inferior da curva; quando essa
"b" é o parâmetro da dificuldade/pre- assíntota não atinge a abscissa há respos-
ferência e é expresso pelo valor no eixo tas dadas ao acaso, e o tamanho dessas
dos X no ponto de inflexão da curva; "e" respostas é definido pela distância que vai
é o parâmetro que determina as respostas do ponto O na abscissa até o ponto onde
acertadas por acaso, sendo o D uma cons- a ogiva corta a ordenada; por exemplo, o
tante usualmente com valor 1.7. item 2 tem cerca de 20% de resposta ao
Os três modelos de TRI mais conhe- acaso. Vê-se também nesta Figura 8.8 que
cidos são os seguintes: o item 3 é mais discriminativo do que os
outros itens; igualmente, que os três itens
1. O modelo logístico de um parâmetro possuem diferentes níveis de dificuldade,
ou o modelo Rasch (1966). Rasch faz sendo o item 3 o mais difícil deles. Os da-
a suposição de que os itens possuem dos oferecidos pela TRI são algebricamen-
o mesmo nível de discriminação e que te expressos em uma tabela como a que
não há respostas dadas ao acaso, fican- segue (onde aparecem os dados dos três
do como parâmetro a ser avaliado so- itens do exemplo da Figura 8.8):
mente a dificuldade dos itens.
2. O modelo logístico de dois parâmetros Item a b €
(Birnbaum, 1968), que avalia a dificul- 1 1,00 -0,10 0,00
dade e a discriminação dos itens, assu- 2 0,90 0,50 0,20
3 0,75 1,70 0,00
mindo que não haja respostas dadas ao
acaso.
3. O modelo de três parâmetros de Lord
(1980) em que os três parâmetros dos Nível ideal de ficuldade dos itens.
itens são avaliados. Pode-se perguntar, ainda, se existe um
192 Luiz Pasquali & cols.

1,00
0,90 + item 1

0,80+- item 2

o
0,70+-
item 3
0,60
o
o a
0,50 |

0,404
o) 0,30-+-

o) 0,20-
a 0,10-4-€,
b, b, b,
0
-4 -3 -2 -1 0 1 2 3 4
Aptidão (0)

Figura 8.8
CCI para três itens.

nível ideal de dificuldade para os itens Se, entretanto, o interesse consiste


de uma escala ou teste. Essa pergunta em avaliar a magnitude diferencial dos tra-
está relacionada com os critérios 11 e 12 ços nos sujeitos de uma população, como
(amplitude e equilíbrio dos itens no ins- geralmente é o caso em testes referentes
trumento) das regras de construção dos a construto, então uma distribuição mais
itens. A resposta a essa indagação depen- equilibrada dos itens em termos de difi-
de da finalidade do teste. Caso se deseje culdade é requerida. Em casos como esse,
um teste para selecionar os melhores ou o interesse se centra sobre o poder de um
para determinar se um determinado pata- teste em discriminar diferentes níveis de
mar de conhecimento foi atingido (como habilidades nos sujeitos e, por conseguin-
nos testes educacionais de referência te, os itens devem poder avaliar tanto os
a critério), então os itens devem todos que possuem pouca quanto muita habili-
apresentar o nível de dificuldade do pa- dade. Entretanto, é bom saber que itens
tamar que se quer como critério de sele- que todos os sujeitos acertam ou aceitam
ção ou acima dele. Assim, se a intenção e itens que ninguém acerta ou não aceitam
for de selecionar somente os 30% melho- são itens inúteis para fins de diferenciar
res candidatos, os índices de dificuldade indivíduos; de fato, tais itens não trazem
dos itens devem ser em torno de 30% (p nenhuma informação. Os itens que trazem
= 0,30) ou menos, isto é, somente 30% maior informação são aqueles cujo índice
dos sujeitos devem ter a probabilidade de dificuldade se situa em torno de 50%,
de acertar os itens. De fato, nesse caso, isto é, no valor O da escala dos sigmas, pois
existe o interesse em apenas discriminar neste caso 50% dos sujeitos acertam e 50%
entre sujeitos de alta aptidão, sendo sem erram, resultando 50x50 = 2.500 com-
interesse itens que apenas discriminas- parações possíveis, ao passo que um item
sem sujeitos de menor aptidão. com dificuldade de 30% teria 70% de erros
Instrumentação psicológica 193

e 30% de acertos, resultando em um nível 20 (sigma < -1,28), 20 a 0


(sigma entre
de 30x 70 = 2.100 bits de informação. Ob- -1,28 e -0,52), 40 a 60 (sigma entre -0,52 e
viamente, um item com dificuldade 100% +0,52), 60 a 80 (sigma entre 0,52 e 1,28)
ou 0% produzirá zero informação. Deve-se e 80 a 100 (sigma > 1,28), distribuindo os
concluir daí que todos os itens de um tes- itens assim: 10% deles em cada uma das
te devam ter dificuldade de 50%? Embora duas faixas extremas, 20% em cada uma
grande parte dos itens deva apresentar tal das duas faixas seguintes e 40% na faixa
índice de dificuldade, nem todos o deve- média (ver Figura 8.9).
rão, pois que assim se poderia discriminar Essa discussão sobre a dificuldade
apenas dois níveis da magnitude do traço ideal dos itens faz mais sentido dentro
medido, dado que itens com o mesmo ní- da teoria clássica dos testes. A TRI tem
vel de dificuldade terão altas intercorrela- maneiras bem mais condizentes e apro-
ções, determinadas pela circunstância de priadas para fazer essa análise por meio
que serão os mesmos sujeitos que sempre do uso do índice de informação do item
acertam ou sempre erram os itens todos. e do teste. Trabalhar com este último ín-
Isto vale dizer que a dificuldade média dice é bem mais complexo, mas existem
dos itens do teste deve ser em torno de p softwares apropriados em abundância no
= 0,50. Haveria, então, uma distribuição mercado para auxiliar nessa tarefa. Ade-
mais adequada dos itens de um teste em mais, para poder fazer uso inteligente de
termos de dificuldade? Considerando que tal procedimento é necessário um conhe-
eles devem cobrir toda a extensão de mag- cimento razoável da TRI. Por isso, o leitor
nitude do traço e que os itens de dificuldade deve se aprofundar no estudo de algum
50% são os que produzem maior informa- dos livros citados sobre a TRI.
ção, pode-se sugerir que uma distribuição
mais ou menos dentro de uma curva nor-
mal seria o ideal. Assim, se considerarmos Fidedignidade do instrumento
a amplitude de um atributo ou traço em
uma escala de 100 pontos, podemos divi- O problema que se enquadra sob o
di-la em cinco níveis de magnitudes: O a conceito de fidedignidade vem relatado

40%
20% 20%
10% 10%
Z -1,28 -0,52 0,52 1,28
Faixa |
II WI IV V

Figura 8.9
Distribuição percentual dos itens em cinco faixas de dificuldade.
194 Luiz Pasquali & cols.

sob uma série de outras expressões, como mento de medida qualquer, por exemplo,
precisão, fidedignidade, constância, con- os escores em um teste, produz uma va-
sistência interna, confiabilidade, estabili- riabilidade nos resultados que, em parte,
dade, confiança, homogeneidade. As mais é provocada pelas diferenças no próprio
genéricas e, por isso, mais utilizadas são traço medido entre diferentes sujeitos, e
as expressões precisão e fidedignidade. em parte pela imprecisão do próprio ins-
Essas diferentes expressões mostram trumento e em parte, ainda, por uma série
a variabilidade de conceitos que preci- de outros fatores aleatórios. A fidedigni-
são assume, dependendo do aspecto que dade da medida depende do tamanho da
esse parâmetro quer salientar do teste. variância erro, que é precisamente a varia-
Na verdade, fidedignidade cobre aspectos bilidade nos resultados provocada por es-
diferentes de um teste, mas todos eles se ses fatores aleatórios e pela imprecisão do
referem a quanto os escores de um sujeito instrumento. Expressa mais positivamen-
se mantêm idênticos em ocasiões diferen- te, a fidedignidade de um instrumento diz
tes; por exemplo, os escores obtidos num respeito ao montante de variância verda-
tempo 1 e num tempo 2 para os mesmos deira que ele produz vis-á-vis a variân-
sujeitos. Essa ocorrência (identidade dos cia erro, isto é, quanto maior a variância
escores) evidentemente supõe que o traço verdadeira e menor a variância erro, mais
que o teste mede se mantenha constan- fidedigno o instrumento: um escore pre-
te sobre essas diferentes ocasiões, como ciso é um escore que se aproxima do va-
é suposto ser o caso, por exemplo, na lor verdadeiro, expresso estatisticamente
maioria dos traços de personalidade e pelo erro padrão da medida (tratado mais
de aptidão. Não seria o caso em um teste adiante).
de humor, porque ele traço por natureza A definição estatística da fidedig-
varia de um momento para outro, e um nidade é feita mediante a correlação en-
teste válido de humor produziria escores tre escores de duas situações produzidos
necessariamente diferentes em ocasiões pelo mesmo teste. Se o teste é preciso,
diferentes. Assim, o conceito de fidedig- essa correlação deve ser não somente sig-
nidade, na verdade, se refere ao quanto nificativa, mas se aproximar da unidade
o escore obtido no teste se aproxima do (cerca de 0,90). De fato, uma correlação
escore verdadeiro do sujeito em um traço de 0,70, por exemplo, expressaria uma
qualquer; isto é, a fidedignidade de um comunalidade de apenas 49% entre as
teste está intimamente ligada ao concei- duas situações provocadas pelo mesmo
to da variância erro, sendo este definido teste nos mesmos sujeitos. Nesse caso, a
como a variabilidade nos escores produ- variância comum, digamos a variância
zida por fatores estranhos ao construto verdadeira, seria menor que a variância
que o teste mede. Aparece, assim, claro erro, demonstrando que o teste não pro-
que a fidedignidade de um teste depende duz resultados fidedignos, isto é, o teste
da questão do erro da medida, especifi- não possui precisão. Essa correlação, no
camente do erro produzido pelo próprio caso do parâmetro de fidedignidade ou
instrumento: quanto o escore produzido precisão, é referida como o coeficiente de
pelo teste se distancia do escore verdadei- precisão ou de fidedignidade.
ro do sujeito no traço em questão, isto é, a Dependendo da técnica utilizada
valor 6 individual na TRI. para cômputo da precisão de um teste,
Para melhor conceber esta proble- surgem vários tipos de precisão: teste-
mática, é preciso se referir à variância -reteste, formas paralelas, consistência
verdadeira e à variância erro. Um procedi- interna.
Instrumentação psicológica 195

1. A precisão teste-reteste consiste em cal- teste. A condição necessária para que


cular a correlação entre as distribuições essa análise seja válida se situa na de-
de escores obtidos em um mesmo teste monstração de que as amostras de con-
pelos mesmos sujeitos em duas oca- teúdo (de itens) em ambas as formas
siões diferentes de tempo. A correlação sejam equivalentes, isto é, que os itens
de 1,00 seria obtida se não houvesse possuam níveis equivalentes de dificul-
variância erro provocada pelo teste ou dade e de discriminação em ambas. Es-
outros fatores aleatórios, como fatores ses parâmetros podem ser facilmente
não controlados nos sujeitos ou na si- verificados por meio da TRI. Há, contu-
tuação de testagem. Quanto mais lon- do, algumas dificuldades neste tipo de
go o período de tempo entre a primei- análise da precisão: as duas formas são
ra e a segunda testagem, mais chances aplicadas em sucessão imediata, não
haverá de fatores aleatórios ocorrerem, eliminando assim totalmente o efeito
diminuindo o coeficiente de precisão. do intervalo de tempo, resultando na
Esse intervalo de tempo permite a ação possível introdução de efeitos da his-
dos fatores mencionados por Campbell tória e do treinamento (prática) obtido
e Stanley (1963) sob o tema de fontes ao responder à primeira das formas al-
de erro devido à história, à maturação, ternativas; aparece facilmente um efei-
à retestagem e às interações entre es- to repetitório, uma vez que os itens de
ses fatores, bem como ao próprio ins- ambas as formas são similares, produ-
trumento. Por isso, veem-se as graves zindo efeitos motivacionais negativos
dificuldades que apresenta esse tipo no respondente. Além disso, não é ta-
de análise da fidedignidade de um refa fácil construir formas alternativas,
teste; particularmente grave aparece quando a construção de um só teste já
aqui a questão da maturação, isto é, é uma tarefa dispendiosa, razão pela
se o próprio traço matura (se desen- qual poucos testes aparecem no mer-
volve, modifica), essa análise da pre- cado com formas alternativas.
cisão torna-se errônea, dada sobretudo 3. A precisão da consistência interna é
a eventualidade de que a maturação viabilizada por intermédio de várias
do traço se processe diferencialmen- técnicas estatísticas que visam verificar
te para os diversos sujeitos testados. a homogeneidade da amostra de itens
Além disso, e particularmente em tes- do teste, ou seja, a consistência inter-
tes de aptidão, a testagem constitui um na do teste. As técnicas mais utilizadas
treinamento, e provavelmente diferen- são duas metades, Kuder-Richardson
cial, para os sujeitos, o que provocará e alfa de Cronbach. Todas elas exigem
diferenças na retestagem entre eles, aplicação do teste em uma única oca-
reduzindo novamente o coeficiente de sião, evitando totalmente a questão da
precisão do teste. Para contornar essas constância temporal.
dificuldades, outros tipos de análises
foram elaborados, como a das formas No caso da precisão das duas me-
alternativas ou análise da consistência tades, os sujeitos respondem a um único
interna. teste em uma única ocasião. O teste é
2 . Na precisão de formas alternativas, os dividido em duas partes equivalentes e
sujeitos respondem a duas formas pa- a correlação é calculada entre os escores
ralelas do mesmo teste, e a correlação obtidos nas duas metades. Não é impor-
entre as duas distribuições de escores tante como teste é dividido em duas me-
o

constitui o coeficiente de precisão do tades, desde que estas sejam equivalentes.


196 Luiz Pasquali & cols.

Na prática, contudo, as duas formas mais ty é O coeficiente de precisão do teste,


normalmente utilizadas são a divisão do n, o número de itens do teste,
teste em primeira metade e segunda meta- DP2, o desvio padrão dos escores totais do
de ou em itens pares e itens ímpares. Para teste e
efetuar essa análise da precisão, de fato o Zpq é o somatório do produto da propor-
teste não precisa ser homogêneo, isto é, ção de sujeitos que passaram (p) e dos
no qual todos os itens medem o mesmo que não passaram (q) cada item.
traço (por exemplo, itens somente verbais
ou numéricos); o que é fundamental é que Cronbach (1951) mostrou que essa
as duas metades emparelhem itens homo- técnica produz um coeficiente de preci-
gêneos: verbal com verbal, numérico com são do teste que corresponde à média dos
numérico, etc. coeficientes de todas as metades em que
Neste tipo de precisão, é preciso no- o teste possa ser dividido, mas somen-
tar que o cálculo da correlação se baseia te quando se utiliza a fórmula de Rulon
somente na metade do teste. Assim, em (1939), que trabalha com as variâncias
um teste de 100 itens, a correlação se das diferenças entre as duas metades, e
basearia somente em 50 itens. Como o não a simples correlação com a correção
número de itens afeta o tamanho do co- de Spearman-Brown, segundo observaram
eficiente de correlação, é preciso corrigir Novick e Lewis (1967). Esta equivalência
esse coeficiente para que leve em conside- de coeficientes, contudo, ocorre em testes
ração a extensão total do teste e, assim, homogêneos, porque nos testes heterogê-
produzir um coeficiente de precisão mais neos os coeficientes de Kuder-Richardson
justo para o teste. Essa correção é feita são normalmente menores, dado que esta
pela fórmula de Spearman-Brown: técnica não trabalha com diferenças entre
pares de itens e sim com a variância de
Nr;2 todos os itens.
1+r O próprio Cronbach (1951) desen-
volveu uma técnica geral para estabele-
onde, r, é o coeficiente de precisão cal- cer a fidedignidade dos testes, o Alfa de
culado, r;, é o coeficiente de correlação Cronbach. Esta técnica constitui uma ex-
entre as duas metades do teste e n é o nú-
tensão da de Kuder-Richardson. Esta últi-
mero de vezes em que o teste foi dividi-
ma é aplicável somente quando a resposta
do. Assim, em um teste dividido em duas
ao item é dicotômica: certo e errado, por
metades, o n será 2, porque ele deve ser
exemplo. Entretanto, quando a resposta
aumentado 2 vezes para se obter a forma
ao item pode assumir mais de duas alter-
total do teste.
nativas, o valor Lpq é substituído por Ls3,
A técnica de Kuder-Richardson (Ku- a soma das variâncias de cada item. Esta
der e Richardson, 1937) para verificar a
fórmula genérica é a seguinte:
fidedignidade de um teste se baseia na
análise de cada item individual do teste.
n
Os autores desenvolveram várias fórmu- "=
0-1 s2
las, sendo a mais utilizada a fórmula 20,
que segue: em que, s? é a variância de todo o teste
e Ls, o somatório das variâncias de cada
n DP?-X pq item do teste.

n -1 DP? Um instrumento submetido à série de
onde, análises anteriormente mencionadas pode
Instrumentação psicológica 197

ser considerado um instrumento válido e Hambleton, R.K., & Swaminathan, H. (1985). Item Re-
sponse Theory: Principles and applications. Norwell, MA:
fidedigno e pronto para uso na pesquisa. Kluwer Nijhoff.
No caso de o instrumento ser orientado
Hambleton, R.K., Swaminathan, H., & Rogers, J.
para uso clínico (casos individuais), ele (1991). Fundamentals of Item Response Theory. Beverly
deve ser submetido à normatização para Hills, CA: Sage.
se poder interpretar os resultados que ele Hambleton, R.K., & Zaal, J.N. (Eds.). (1991). Advances
in educational and psychological testing: Theory and ap-
produz. Contudo, para fins de pesquisa, Plications. Boston, MA: Kluwer Academic Publishers.
que tipicamente trabalha com compara- Harman, H.H. (1967). Modern factor analysis. Chicago,
ções de grupos de sujeitos, a normatiza- LL: University of Chicago Press.

ção não é necessária. Aliás, ela não acres- Hulin, C.L., Drasgow, E, & Parsons, C.K. (1983). Item
Response Theory: Applications to psychological measure-
centa nada de novo e útil para a qualidade ment. Homewood, IL: Dow Jones-Irwin.
psicométrica do instrumento; apenas ela é Jackson, D.N., & Messick, S. (1967). Problems in human
útil para a interpretação dos resultados, assessment (Cap. 6). New York: McGraw-Hill.

pois constitui uma simples transformação Jones, R.R. (1968). Differences in response consistency
dos resultados brutos do instrumento em and subject's preferences for three personality inven-
tory response formats. Proceedings of the 67th Annual
resultados de alguma maneira padroniza- Convention of the American Psychological Association, 3,
dos e comparáveis. 247-248.
Komorita, S.S. (1963). Attitude content, intensity, and
the neutral point on a Likert scale. Journal of Social Psy-
chology, 61, 327-334.
REFERÊNCIAS
Kuder, G.E, & Richardson, M.W. (1937. The theory of
the estimation of test reliability Psychometrika, 2, 151-
Anastasi, A. (1988). Psychological testing (6th ed). New 160.
York: Macmillan.
Likert, R. (1932). A technique for the measurement of
Bendig, A.W. (1954). Reliability and the number of rat- attitudes. Archives of Psychology, 22(140), 1-55.
ing scale categories. Journal of Applied Psychology, 38,
38-40. Lord, EM. (1980). Applications of Item Response Theory
to practical testing problems. Hillsdale, NJ: Erlbaum.
Birmbaum, A. (1968). Some latent trait models and their
use in inferring a examinee's ability. In EM. Ford & M. Mager, R.E (1981). Medindo os objetivos de ensino ou
Novick, Statistical theories of mental test scores. Reading, "conseguiu um par adequado". Porto Alegre: Globo.
MA: Addison-Wesley. Matell, M.S., & Jacoby, J. (1971). Is there an optimal
number of Likert scale items? Study I: Reliability and
Campbell, D.T., & Fiske, D.W. (1959). Convergent and
discriminant validation by the multitrait-multimethod validity. Educational and Psychological Measurement, 31,
657-674.
matrix, Psychological Bulletin, 56, 81-105.
J. (1963). Matell, M.S., & Jacoby, J. (1972). Is there an optimal
Campbell, D.T., & Stanley, Experimental and
number of alternatives for Likert-scale items? Journal of
quasi-experimental designs for research. Chicago, IL:
Rand McNally. Applied Psychology, 56(6), 506-509.
Muniz, J. (1990). Teoria de respuesta a los ítems. Ma-
Campbell, D.T, & Stanley, J. (1973). Experimental and
drid: Pirámide.
quasi-experimental designs for research. Skokie, IL: Rand
McNally. Muiiz, J. (1992). Teoría clássica de los tests. Madrid: Pi-
Cronbach, L.J. (1951). Coefficient alpha and the inter- rámide, S.A.
nal structure of tests. Psychometrika, 16, 297-334. Muiiz, J. (1996). Psicometría. Madrid: Univérsitas.
Cronbach, L.J. (1990). Essentials of psychological testing Nevo, B. (1985). Face validity revisited. Journal of Edu-
(5th ed.). New York: Harper & Row. cational Measurement, 22, 287-293.
Embretson, S.E. (1984). A general latent trait model for Nevo, B., & Sfez, J. (1985). Examinees' feedback ques-
response processes. Psychometrika, 49, 175-186. tionnaires. Assessment and Evaluation in Higher Educa-
Embretson, S.E. (Ed.). (1985). Test design: Developments in
tion, 10, 236-249.
psychology and psychometrics. New York: Academic Press. Novick, M.R., & Lewis, C. (1967). Coefficient alpha and
the reliability of composite measurements. Psychomet-
Goldsamt, M.R. (1971). Effects of scoring method and
rating scale length in extreme response style measure- ricka, 32, 1-13.
ment. Tese de doutorado não publicada, University of Nunnally J.C., Jr. (1978). Psychometric theory. New
Maryland. York: McGraw-Hill.
Gulliksen, H. (1987). Theory of mental tests. Hillsdale, Pasquali, L. (Org.). (1996). Teoria e métodos de medida
NJ: Erlbaum. em ciências do comportamento. Brasília: INEP
198 Luiz Pasquali & cols.

Pasquali, L. (2004). Psicometria: Teoria dos testes na psi- Santisteban, C. (1990). Psicometría. Madrid: Norma.
cologia e na educação (2. ed). Rio de Janeiro, RJ: Vozes. Thorndike, R.L. (1982). Applied psychometrics. Boston:
Pasquali. L. (2006). Análise fatorial para pesquisadores. Hougton Mifflin.
Brasília, DF: LabPAM, Van der Veer, E, Howard, K.I., & Austria, AM. (1970).
Pasquali, L. (2007). TRI: Teoria de resposta ao item: Teo- Stability and equivalence scores based on three different
ria, procedimentos e aplicações. Brasília, DF: LabPAM. response formats. Proceedings of the 78th Annual Conven-
tion of the American Psychological Association, 5, 99-100.
Rulon, BJ. (1939). A simplified procedure for determin-
ing the reliability of a test by split-halves. Harvard Edu- Yela, M. (1987). Introducción a la teoria de los tests. Ma-
cational Review, 9, 99-103. drid: Facultad de Psicología, Universidad Complutense.

Você também pode gostar