Você está na página 1de 8

ARTIGO ORIGINAL

Psicometria

PSYCHOMETRICS

PSICOMETRA

Luiz Pasquali1

RESUMO ABSTRACT RESUMEN


A psicometria fundamenta-se na teoria da Psychometrics has foundations on the La Psicometra se fundamenta en la teora
medida em cincias para explicar o senti- theory of measurement in Sciences and is de la medida en las ciencias buscando ex-
do que tm as respostas dadas pelos sujei- aimed at explaining the meaning of res- plicar el sentido en las respuestas de los
tos a uma srie de tarefas e propor tcni- ponses provided by subjects submitted to que fueron sujetos a una serie de tareas,
cas de medida dos processos mentais. Nes- a series of tasks, and proposing techniques adems de proponerse tcnicas de medi-
te artigo so apresentados os conceitos e for the measurement of mental processes. da de sus procesos mentales. En este art-
modelos da psicometria moderna e discu- This article presents concepts and models culo son presentados los conceptos y mo-
tidos os parmetros de validade e preciso of modern psychometrics and discusses the delos de psicometra moderna, as como
dos testes. validity and reliability parameters of the son discutidos los parmetros de validez y
applied tests. precisin de los testes.

DESCRITORES KEY WORDS DESCRIPTORES


Psicometria. Psychometrics. Psicometra.
Reprodutibilidade dos testes. Reproducibility of results. Reproducibilidad de resultados.
Validade dos testes. Validity of tests. Validez de las pruebas.
Estudos de validao. Validation studies. Estudios de validacin.

1
Professor Pesquisador Associado do Departamento de Psicologia Social e do Trabalho do Instituto de Psicologia da Universidade de Braslia. Braslia, DF,
Brasil. luiz.pasquali@pq.cnpq.br

992
Rev Esc Enferm USP Recebido: 15/06/2008 PortugusPsicometria
/ Ingls
2009; 43(Esp):992-9 Aprovado: 15/12/2008 Pasquali L
www.scielo.br/reeusp
www.ee.usp.br/reeusp/
INTRODUO (TRI). A TCT foi axiomatizada por Gulliksen(3) e a TRI foi
inicialmente elaborada por Lord(4) e por Rasch(5) e, final-
mente, axiomatizada por Birnbaum(6) e por Lord(7).
A medida em cincias psicossociais
De um modo geral, a psicometria procura explicar o
Etimologicamente, psicometria representa a teoria e a
sentido que tm as respostas dadas pelos sujeitos a uma
tcnica de medida dos processos mentais, especialmente
aplicada na rea da Psicologia e da Educao. Ela se fun- srie de tarefas, tipicamente chamadas de itens. A TCT se
damenta na teoria da medida em cincias em geral, ou preocupa em explicar o resultado final total, isto , a soma
seja, do mtodo quantitativo que tem, como principal ca- das respostas dadas a uma srie de itens, expressa no
racterstica e vantagem, o fato de representar o conheci- chamado escore total (T). Por exemplo, o T em um teste de
mento da natureza com maior preciso do que a utiliza- 30 itens de aptido seria a soma dos itens corretamente
o da linguagem comum para descrever a observao acertados. Se for dado 1 para um item acertado e 0 para
dos fenmenos naturais. um errado, e o sujeito acertou 20 itens e errou 10, seu
escore T seria de 20. A TCT, ento, se pergunta o que signi-
Historicamente, a psicometria tem suas origens na fica este 20 para o sujeito? A TRI, por outro lado, no est
psicofsica dos psiclogos alemes Ernst Heinrich Weber interessada no escore total em um teste; ela se interessa
e Gustav Fechner. O ingls Francis Galton tambm contri- especificamente por cada um dos 30 itens e quer saber
buiu para o desenvolvimento da psicometria, criando tes- qual a probabilidade e quais so os fatores que afetam
tes para medir processos mentais; inclusive, ele consi- esta probabibilidade de cada item individualmente ser
derado o criador da psicometria. Foi, contudo, Leon Louis acertado ou errado (em testes de aptido) ou de ser aceito
Thurstone, o criador da anlise fatorial mltipla, que deu ou rejeitado (em testes de preferncia: personalidade, in-
o tom psicometria, diferenciando-a da psicofsica. Esta teresses, atitudes). Dessa forma, a TCT tem interesse em
foi definida como a medida de processos diretamente produzir testes de qualidade, enquanto a TRI se interessa
observveis, ou seja, o estmulo e a resposta do organis- por produzir tarefas (itens) de qualidade. No
mo, enquanto a psicometria consistia na final, ento, temos ou testes vlidos (TCT) ou
medida do comportamento do organismo itens vlidos (TRI), itens com os quais se
por meio de processos mentais (lei do julga- A psicometria procura podero construir tantos testes vlidos
mento comparativo). explicar o sentido
quantos se quiser ou o nmero de itens per-
A medida em cincias tem provocado que tm as respostas mitir. Assim, a riqueza na avaliao psico-
diatribes entre os pesquisadores, particu- dadas pelos sujeitos lgica ou educacional, dentro do enfoque da
larmente na rea das cincias sociais. Con- a uma srie de TRI, consiste em se conseguir construir ar-
tudo, a definio mais aceita de medida foi tarefas, tipicamente mazns de itens vlidos para avaliar os tra-
dada por Stanley Smith Stevens em 1946, chamadas de itens. os latentes, armazns estes chamados de
quando dizia que: medir consiste em assina- bancos de itens para a elaborao de um
lar nmeros a objetos e eventos de acordo com nmero sem fim de testes.
alguma regra(1). As regras de assinalar tais nmeros so
definidas na proposta do mesmo autor sobre os quatro O modelo da TCT foi elaborado por Spearman e deta-
nveis de medida ou escalas de medida: nominal, ordinal, lhado por Gulliksen(3), o modelo o seguinte:
intervalar e de razo. A medida nominal sendo aquela que T=V+E
aplica os nmeros aos fenmenos da natureza, salvando
somente os axiomas de identidade do nmero, ou seja, o Onde,
nmero utilizado somente como numeral ou smbolo
grfico. Ao utilizar o nmero, a escala ordinal j salva os T = escore bruto ou emprico do sujeito, que a soma
axiomas de ordem, ou seja, a caracterstica mais marcante dos pontos obtidos no teste;
do nmero, isto , a magnitude - um nmero por defini-
V = escore verdadeiro, que seria a magnitude real da-
o maior ou menor que outro, no somente diferente, ou
quilo que o teste quer medir no sujeito e que seria o pr-
melhor, um nmero diferente do outro precisamente por-
que maior ou menor que outro. As outras escalas sal- prio T se no houvesse o erro de medida;
vam tambm axiomas de aditividade. Essa histria dos E = o erro cometido nesta medida.
axiomas foi detalhada por Whitehead e Russell em 1910
a 1913 e 1965, no livro Principia Mathematica, onde des- Dessa forma, o escore emprico a soma do escore ver-
crevem os famosos 27 axiomas do nmero matemtico(2) . dadeiro e do erro e, conseqentemente, E = T - V, bem como,
V = T - E.
PSICOMETRIA: A Figura 1 mostra a relao entre estes vrios elemen-
CONCEITUAO E MODELOS tos do escore emprico, onde se v que este a unio do
escore verdadeiro (V) e do erro (E), ou seja, o escore
A psicometria moderna tem duas vertentes: a teoria emprico ou bruto do sujeito (T resultado no teste, co-
clssica dos testes (TCT) e a teoria de resposta ao item nhecido como o escore tau ) constitudo de dois com-

993
Psicometria Rev Esc Enferm USP
Pasquali L 2009; 43(Esp):992-9
www.ee.usp.br/reeusp/
ponentes: o escore real ou verdadeiro (V) do sujeito na-
1,00
quilo que o teste pretende medir e o erro (E) de medida,
0,90
este sempre presente em qualquer operao emprica. Em
0,80
outras palavras, estamos aqui assumindo que, diante do
0,70
fato de que o escore bruto do sujeito difere do seu escore
0,60
verdadeiro, esta diferena devida ao erro ou, melhor,
esta diferena o prprio conceito de erro. Pi q 0,50
0,40
0,30

T 0,20
0,10

0 1 2 3 4 5 6 7 8

Aptido q

Figura 2 A curva caracterstica do item

Concretamente, a TRI est dizendo o seguinte: voc

V E apresenta ao sujeito um estmulo ou uma srie de estmu-


los (tais como, itens de um teste) e ele responde aos mes-
mos. A partir das respostas dadas pelo sujeito, isto ,
analisando as suas respostas aos itens especificados,
pode-se inferir sobre o trao latente do sujeito,
hipotetizando relaes entre as respostas observadas
deste sujeito com o nvel do seu trao latente. Estas rela-
es podem ser expressas por meio de uma equao ma-
temtica que descreve a forma de funo que estas rela-
es assumem.
Figura 1 Os componentes do escore T
De fato, pode-se imaginar um nmero ilimitado de
modelos matemticos que podem expressar esta relao,
dependendo do tipo de funo matemtica utilizada e/ou
Assim, a grande tarefa da TCT consiste em elaborar do nmero de parmetros que se quer descobrir para o
estratgias (estatsticas) para controlar ou avaliar a mag- item. Uma preciosa vantagem sobre a teoria clssica que
nitude do E. Os erros so devidos a toda uma gama de a TRI tem quanto aos modelos que usa consiste em que os
fatores estranhos, detalhados por Campbell e Stanley(8), modelos utilizados pela TRI permitem desconfirmao.
tais como defeitos do prprio teste, esteretipos e vieses Na verdade, a demonstrao da adequao do modelo
do sujeito, fatores histricos e ambientais aleatrios. aos dados (model-data goodness-of-fit) um passo neces-
Por outro lado, o modelo da TRI trabalha com traos srio nos procedimentos desta teoria. Para trabalhar com
latentes e adota dois axiomas fundamentais: a TRI so necessrios pacotes estatsticos especializados,
que j existem em abundncia no mercado(a).
1) O desempenho do sujeito numa tarefa (item do tes-
te) se explica em funo de um conjunto de fatores ou OS PARMETROS DOS TESTES:
traos latentes (aptides, habilidades etc.). O desempe- VALIDADE E PRECISO
nho o efeito e os traos latentes so a causa;
2) A relao entre o desempenho na tarefa e o conjun-
to dos traos latentes pode ser descrita por uma equao Tanto na TCT quanto na TRI, os dois parmetros mais
monotnica crescente, chamada de CCI (Funo Caracte- importantes de legitimidade de uma medida ou teste so
rstica do Item ou Curva Caracterstica do Item) e exem- a validade e a preciso.
plificada na Figura 2, onde se observa que sujeitos com
aptido maior tero maior probabilidade de responder A validade dos testes
corretamente ao item e vice-versa (i a aptido e Pi() a
A validade constitui um parmetro da medida tipica-
probabilidade de resposta correta dada ao item).
mente discutido no contexto das cincias psicossociais.
Ela no corrente em cincias fsicas, por exemplo, embo-
ra haja nessas cincias ocasies em que tal parmetro se
(a) Dois muito utilizados so o BILOG para testes de aptido e o PARSCALE
para testes de personalidade.

994
Rev Esc Enferm USP Psicometria
2009; 43(Esp):992-9 Pasquali L
www.ee.usp.br/reeusp/
aplicaria. Nestas ltimas cincias, a preocupao princi- o fsica (o comportamento). No causa estranheza, por-
pal na medida se centra na questo da preciso, a dita tanto, que o problema de validade tenha tido, na histria
calibrao dos instrumentos. Esta importante tambm da Psicologia, uma posio central na teoria da medida,
na medida em cincias psicossociais, mas ela no tem constituindo-se, na verdade, no seu parmetro fundamen-
nada a ver, conceitualmente, com a questo da validade. tal e indispensvel.
A razo disto est no fato de que a validade diz respeito
ao aspecto da medida ser congruente com a propriedade Nos manuais de Psicometria, costuma-se definir a vali-
medida dos objetos e no com a exatido com que a men- dade de um teste dizendo que ele vlido se de fato mede o
surao, que descreve esta propriedade do objeto, feita. que supostamente deve medir. Embora esta definio pare-
Em Fsica, o instrumento um objeto fsico que mede pro- a uma tautologia, na verdade ela no , considerada a
priedades fsicas; ento parece fcil se ver que a proprie- teoria psicomtrica que admite o trao latente. O que se
dade do objeto mensurante ou no congruente com a quer dizer com esta definio que, ao se medirem os com-
propriedade do objeto medido. Tome, por exemplo, o caso portamentos (itens), que so a representao fsica do tra-
da propriedade comprimento do objeto. O instrumento que o latente, est-se medindo o prprio trao latente. Tal su-
mede esta propriedade (comprimento), isto , o metro, usa posio justificada se a representao comportamental
a sua propriedade de comprimento para medir a compri- for legtima. Esta legitimao somente possvel se existir
mento de outro objeto; ento estamos medindo compri- uma teoria prvia do trao que fundamente que a tal repre-
mento com comprimento, tomados estes termos univoca- sentao comportamental constitui uma hiptese dedutvel
mente. No h necessidade de provar que a propriedade desta teoria. A validade do teste (este constituindo a hip-
comprimento do metro seja congruente com a mesma pro- tese), ento, ser estabelecida pela testagem emprica da
priedade no objeto medido; os termos so unvocos, eles verificao da hiptese. Pelo menos, esta a metodologia
so conceitualmente equivalentes, alis, cientfica. Assim, fica muito estranha a prtica corrente na
idnticos. Psicometria de se agrupar intuitivamente uma
srie de itens e, a posteriori, verificar esta-
O caso j se torna menos claro quando, A validade diz respeito tisticamente o que eles esto medindo. A n-
por exemplo, o astrnomo mede a proprie- ao aspecto da medida fase na formulao da teoria sobre os traos
dade velocidade galctica de aproximao ser congruente com foi muito fraca no passado; com a influncia
ou afastamento via efeito Doppler, onde a a propriedade medida da Psicologia Cognitiva esta nfase felizmen-
aproximao/afastamento das linhas dos objetos e no te est voltando ou dever voltar ao seu devi-
espectrais da luz da galxia seria o instru-
mento da medida. Aqui j temos, na verdade,
com a exatido com do lugar na Psicometria.
um problema de validade do instrumento de que a mensurao, Alis, a Psicometria clssica entende
medida, a saber, verdade ou no que as que descreve esta por aquilo que supostamente deve medir
distncias das linhas espectrais tm a ver propriedade do como sendo o critrio, este representado por
com a velocidade das galxias? Pode-se fa- objeto, feita. teste paralelo. Assim, este aquilo que o
zer tal suposio, mas ela tem que ser de- trao latente na concepo cognitivista da
monstrada empiricamente, de alguma ma- Psicometria e o critrio (escore no teste
neira, isto , pelo menos em suas conseqncias, em hi- paralelo) na viso comportamentalista.
pteses dela derivadas ou derivveis e verificveis. Neste
caso especfico, o problema da preciso da medida diz O processo de validao de um teste
respeito quo exata pode ser feita a mensurao das
inicia com a formulao de definies detalhadas do trao
distncias entre as linhas espectrais no osciloscpio, ao
ou construto, derivadas da teoria psicolgica, pesquisa
passo que o de validade diz respeito a se esta medida das
anterior, ou observao sistemtica e anlises do domnio
distncias das linhas espectrais, por mais exata e perfei- relevante do comportamento. Os itens do teste so ento
ta que ela possa ser, tem algo a ver ou no com a velocida- preparados para se adequarem s definies do construto.
de de afastamento da galxia. Em outras palavras, a vali- Anlises empricas dos itens seguem, selecionando-se
dade em tal caso diz respeito demonstrao da adequa- finalmente os itens mais eficazes (i.., vlidos) da amostra
o (legitimidade) da representao ou da modelagem da inicial de itens(9).
velocidade galctica via distncias das linhas espectrais.
A validao da representao comportamental do tra-
Este caso da astronomia ilustra o que tipicamente acon- o, isto , do teste, embora constitua o ponto nevrlgico
tece com a medida em cincias psicossociais e, conse- da Psicometria, apresenta dificuldades importantes que
qentemente, torna a prova da validade dos instrumentos se situam em trs nveis ou momentos do processo de
nestas cincias algo fundamental e crucial, ou seja, uma elaborao do instrumento, a saber, ao nvel da teoria, da
condio sine qua non demonstrar a validade dos instru- coleta emprica da informao e da prpria anlise esta-
mentos nestas cincias. Isto particularmente o caso nos tstica da informao.
enfoques que, em Psicologia, trabalham com o conceito
de trao latente, onde se deve demonstrar a correspon- No nvel da teoria se concentram talvez as maiores
dncia (congruncia) entre trao latente e sua representa- dificuldades. Na verdade, a teoria psicolgica se encon-

995
Psicometria Rev Esc Enferm USP
Pasquali L 2009; 43(Esp):992-9
www.ee.usp.br/reeusp/
tra ainda em estado embrionrio, destituda quase que validity). Estas vrias terminologias demonstram a confu-
totalmente de qualquer nvel de axiomatizao, resultan- sa noo que construto possua. Embora tenham tentado
do disto uma pletora de teorias, muitas vezes at contra- clarear o conceito de validade de construto, Cronbach e
ditrias. Basta lembrar de teorias como behaviorismo, Meehl ainda o definem como a caracterstica de um teste
psicanlise, psicologia existencialista, psicologia dial- enquanto mensurao de um atributo ou qualidade, o qual
tica e outras, que, existindo simultaneamente, postulam no tenha sido definido operacionalmente(13). Reconhecem,
princpios irredutveis entre as vrias teorias e pouco entretanto, que a validade de construto reclamava por um
concatenados dentro de uma mesma teoria ou, ento, em novo enfoque cientfico. De fato, definir esta validade do
nmero insuficiente para se poder deduzir hipteses teis modo que eles a definiram parece um pouco estranho em
para o conhecimento psicolgico. Havendo esta confuso cincia, dado que conceitos no definidos operacional-
no campo terico dos construtos, torna-se extremamente mente no so suscetveis de conhecimento cientfico.
difcil para o psicometrista operacionalizar estes mes- Conceitos ou construtos so cientificamente pesquisveis
mos construtos, isto , formular hipteses claras e preci- somente se forem, pelo menos, passveis de representa-
sas para testar ou, ento, formular hipteses psicologi- o comportamental adequada. Do contrrio, sero con-
camente teis. Ainda quando a operacionalizao for um ceitos metafsicos e no cientficos. O problema est em
sucesso, a coleta da informao emprica no ser isenta que, sintetizando a atitude geral dos psicometristas da
de dificuldades, como, por exemplo, a definio inequvo- poca, para definir validade de construto, os autores par-
ca de grupos critrios onde estes construtos possam ser tiram do teste, isto , da representao comportamental,
idealmente estudados. Mesmo ao nvel das anlises esta- em vez de partir da teoria psicomtrica que se fundamen-
tsticas encontramos problemas. Pela lgica da elabora- ta na elaborao da teoria do construto (dos traos laten-
o do instrumento, a verificao da hiptese da legitimi- tes). O problema no descobrir o construto a partir de
dade da representao dos construtos se faz por anlises uma representao existente (teste), mas sim descobrir se
do tipo da anlise fatorial (confirmatria), que procura a representao (teste) constitui uma representao leg-
identificar, nos dados empricos, os construtos previa- tima, adequada, do construto. Este enfoque exige uma co-
mente operacionalizados no instrumento. Mas, acontece laborao, bem mais estreita do que existe, entre
que a anlise fatorial faz algumas postulaes fortes que psicometristas e Psicologia Cognitiva(14). A validade de
nem sempre se coadunam com a realidade dos fatos. Por construto de um teste pode ser trabalhada sob vrios n-
exemplo, a anlise fatorial assume que as respostas dos gulos: a anlise da representao comportamental do
sujeitos aos itens do instrumento so determinadas por construto, a anlise por hiptese, a curva de informao
uma relao linear destes com os traos latentes. H, ain- da TRI(15-16).
da, o grave problema da rotao dos eixos, a qual permite
a demonstrao de um nmero sem fim de fatores para o A validade de critrio de um teste consiste no grau de
mesmo instrumento(10). eficcia que ele tem em predizer um desempenho especfi-
co de um sujeito. O desempenho do sujeito torna-se, as-
Diante destas dificuldades, os psicometristas recor- sim, o critrio contra o qual a medida obtida pelo teste
rem a uma srie de tcnicas para viabilizar a demons- avaliada. Evidentemente, o desempenho do sujeito deve
trao da validade dos seus instrumentos. Fundamental- ser medido/avaliado por meio de tcnicas que so inde-
mente, estas tcnicas podem ser reduzidas a trs grandes pendentes do prprio teste que se quer validar.
classes (o modelo trinitrio): tcnicas que visam a vali-
dade de construto, validade de contedo e validade de Costuma-se distinguir dois tipos de validade de crit-
critrio(11-12). rio: (1) validade preditiva e (2) validade concorrente. A
diferena fundamental entre os dois tipos basicamente
A validade de construto ou de conceito considerada a uma questo do tempo que ocorre entre a coleta da infor-
forma mais fundamental de validade dos instrumentos mao pelo teste a ser validado e a coleta da informao
psicolgicos e com toda a razo, dado que ela constitui a sobre o critrio. Se estas coletas forem (mais ou menos)
maneira direta de verificar a hiptese da legitimidade da simultneas, a validao ser do tipo concorrente; caso
representao comportamental dos traos latentes e, por- os dados sobre o critrio sejam coletados aps a coleta
tanto, se coaduna exatamente com a teoria psicomtrica da informao sobre o teste, fala-se em validade preditiva.
aqui defendida. Historicamente, o conceito de construto O fato de a informao ser obtida simultaneamente ou
entrou na Psicometria por meio da American Psychological posteriormente do prprio teste no um fator tecnica-
Association Committee on Psychological Tests que traba- mente relevante validade do teste. Relevante, sim, a
lhou entre 1950 e 1954 e cujos resultados se tornaram as determinao de um critrio vlido. Aqui se situa precisa-
recomendaes tcnicas para os testes psicolgicos(12). mente a natureza central deste tipo de validao dos tes-
tes, a saber: (1) definir um critrio adequado e (2) medir,
O conceito de validade de construto foi elaborado com vlida e independentemente do prprio teste, este critrio.
o j clssico artigo de Cronbach e Meehl(13) Construct
validity in psychological tests, embora o conceito j tivesse Quanto adequao dos critrios, pode-se afirmar
uma histria sob outros nomes, tais como validade in- que h uma srie destes que so normalmente utilizados
trnseca, validade fatorial e at validade aparente (face quais sejam:

996
Rev Esc Enferm USP Psicometria
2009; 43(Esp):992-9 Pasquali L
www.ee.usp.br/reeusp/
1) Desempenho acadmico. Talvez seja ou foi o critrio critrio. utilizada esta tcnica, sobretudo, em testes de
mais utilizado na validao de testes de inteligncia. Con- personalidade, onde difcil encontrar avaliaes mais
siste na obteno do nvel de desempenho escolar dos objetivas. Assim, os sujeitos avaliam seus colegas em
alunos, seja atravs das notas dadas pelos professores, categorias ou do escores em traos de personalidade
seja pela mdia acadmica geral do aluno, seja pelas (agressividade, cooperao, etc.), baseados na convivn-
honrarias acadmicas que o aluno recebeu ou seja, mes- cia que eles tm com os colegas. Nem precisa mencionar
mo, pela avaliao puramente subjetiva dos alunos em as dificuldades enormes que tais avaliaes apresentam
termos de inteligente por parte dos professores ou cole- em termos de objetividade; contudo, a utilizao de um
gas. Embora seja amplamente utilizado, este critrio tem grande nmero de juizes poder diminuir os vieses subje-
igualmente sido muito criticado, no em si mesmo mas tivos nestas avaliaes.
pela deficincia que ocorre na sua avaliao. sobeja-
mente sabida a tendenciosidade por parte dos professo- 6) Outros testes disponveis. Os resultados obtidos por
res em atribuir as notas aos alunos, tendenciosidade nem meio de outro teste vlido, que prediga o mesmo desem-
sempre consciente, mas decorrente de suas atitudes e sim- penho que o teste a ser validado, servem de critrio para
patias em relao a este ou aquele aluno. Esta dificulda- determinar a validade do novo teste. Aqui fica a pergunta
de poderia ser sanada at com certa facilidade, se os pro- bvia: para que criar outro teste se j existe um que mede
fessores tivessem o costume de aplicar testes de rendi- validamente o que se quer medir? A resposta se baseia
mento que possussem validade de contedo, por exem- numa questo de economia, isto , utilizar um teste que
plo. Como esta tarefa dispendiosa, o professor tipica- demanda muito tempo para ser respondido ou apurado
mente no se d ao trabalho de validar (validade de con- como critrio para validar um teste que gaste menos tempo.
tedo) suas provas acadmicas. No caso deste tipo de validade, preciso atender a
Neste contexto, tambm utilizado como critrio de duas situaes bastante distintas. Primeiramente, quan-
desempenho acadmico o nvel escolar do sujeito: sujeitos do existem testes comprovadamente validados para a
mais avanados, repetentes e evadidos. A suposio sen- medida de algum trao, eles certamente constituem um
do de que quem continua regularmente ou est avanado critrio contra o qual se pode com segurana validar um
academicamente em relao sua idade possui mais ha- novo teste. Entretanto, quando no existem testes aceitos
bilidade. Evidentemente, nesta histria no entra somen- como definitivamente validados para avaliar algum tra-
te a questo da habilidade, mas muitos outros fatores o latente, a utilizao desta validao concorrente ex-
sociais, de personalidade, etc., tornando este critrio bas- tremamente precria. Esta situao infelizmente a mais
tante ambguo e esprio. comum. De fato, ns temos testes para medir praticamen-
te no importa o qu, como atestam os Buros Mental
2) Desempenho em treinamento especializado. Trata-se Measurement Yearbooks, que so publicados periodica-
do desempenho obtido em cursos de treinamento em situ- mente com centenas e milhares de testes psicolgicos exis-
aes especficas, como no caso de msicos, pilotos, ati- tentes no mercado. Neste caso, pode-se utilizar estes tes-
vidades mecnicas ou eletrnicas especializadas, etc. No tes como critrios de validao, mas o risco demasiada-
final deste treinamento h tipicamente uma avaliao, a mente grande, porque se est utilizando como critrio tes-
qual produz dados teis para servirem de critrio de de- tes cuja validade pelo menos duvidosa.
sempenho do aluno. As observaes crticas feitas ao pon-
to 1) valem tambm neste pargrafo. Pode-se concluir que a validade concorrente s faz
sentido se existirem testes comprovadamente vlidos que
3) Desempenho profissional. Trata-se, neste caso, de com- possam servir de critrio contra o qual se quer validar um
parar os resultados do teste com o sucesso/fracasso ou o novo teste e que este novo teste tenha algumas vantagens
nvel de qualidade do sucesso dos sujeitos na prpria situ- sobre o antigo (como, por exemplo, economia de tempo
ao de trabalho. Assim, um teste de habilidade mecnica etc.). Uma pergunta frustrante fica ao final desta exposi-
pode ser testado contra a qualidade de desempenho mec- o sobre validade de critrio. Se o pesquisador empre-
nico dos sujeitos na oficina de trabalho. Evidentemente gou toda a sua habilidade para construir um teste sob as
continua a dificuldade de levantar adequadamente a qua- condies de maior controle possvel, por que iria ele va-
lidade deste desempenho dos sujeitos em servio. lidar esta tarefa-teste contra medidas inferiores, repre-
4) Diagnstico psiquitrico. Muito utilizado para vali- sentadas pela medida dos vrios critrios aqui apresen-
dar testes de personalidade/psiquitricos. Os grupos-cri- tados. Justifica-se validar medidas supostamente superi-
trio so aqui formados em termos da avaliao psiqui- ores por medidas inferiores? (17). Com as crticas de
trica que estabelece grupos clnicos: normais vs. neurti- Thurstone em 1952 e sobretudo de Cronbach e Meehl em
cos, psicopatas vs. depressivos, etc. Novamente, a dificul- 1955(13,18), a validade de critrio deixou de ser a tcnica
dade continua sendo a adequao das avaliaes psiqui- panacia de validao dos testes psicolgicos em favor
tricas feitas pelos psiquiatras. da validade de construto. Contudo, estes critrios podem
ser considerados bons e teis para fins de validao de
5) Diagnstico subjetivo. Avaliaes feitas por colegas critrio. A grande dificuldade em quase todos eles se si-
e amigos podem servir de base para estabelecer grupos- tua na demonstrao da adequao da medida deles; isto

997
Psicometria Rev Esc Enferm USP
Pasquali L 2009; 43(Esp):992-9
www.ee.usp.br/reeusp/
, em geral, a medida dos mesmos precria, deixando, De qualquer forma, dentro da TCT o coeficiente de fidedig-
por isso, muita dvida quanto ao processo de validao nidade, rtt, definido estatisticamente como a correlao
do teste. Entretanto, h exemplos famosos de testes vali- entre os escores dos mesmos sujeitos em duas formas
dados atravs deste mtodo, como o caso do MMPI. paralelas de um teste, T1 e T2. Assim o coeficiente de fide-
dignidade se define como funo da covarincia
A validade de contedo de um teste consiste em verifi- [Cov(T1,T2)] entre as formas do teste pelas varincias
car se o teste constitui uma amostra representativa de um 2 2 SV2
universo finito de comportamentos (domnio). aplicvel ( ST e ST ) das mesmas, isto , rtt = 2
1 2
ST
quando se pode delimitar a priori e com clareza um uni-
verso de comportamentos, como o caso em testes de onde,
desempenho, que pretendem cobrir um contedo delimi-
tado por um curso programtico especfico(11) . rtt : coeficiente de fidedignidade
SV : Varincia verdadeira do teste
2

A preciso dos testes


2
ST : Varincia total do teste.
O parmetro da preciso ou da fidedignidade dos tes-
tes vem referenciado sob uma srie elevada e heterognea Praticamente, existem duas grandes tcnicas estatsti-
de nomes. Alguns destes nomes resultam do prprio con- cas para decidir a preciso de um teste, ou seja, a correla-
ceito deste parmetro, isto , eles procuram expressar o o e a anlise da consistncia interna.
que ele de fato representa para o teste. Estes nomes so,
principalmente, preciso, fidedignidade e confiabilidade. A tcnica da correlao utilizada no caso do teste
Outros nomes deste parmetro resultam mais diretamen- reteste e das formas paralelas de um teste. Nestes casos
te do tipo de tcnica utilizada na coleta emprica da infor- temos os resultados dos mesmos sujeitos submetidos ao
mao ou da tcnica estatstica utilizada para a anlise mesmo teste em duas ocasies diferentes ou responden-
dos dados empricos coletados. Entre estes nomes, pode- do a duas formas paralelas do mesmo teste. O ndice de
mos relacionar os seguintes: estabilidade, constncia, preciso, neste caso, consiste simplesmente na correla-
equivalncia, consistncia interna. o bivariada entre os dois escores dos mesmos sujeitos.
Para o caso da anlise da consistncia interna existe
A fidedignidade ou a preciso de um teste diz respeito uma parafernlia complexa de tcnicas estatsticas, que
caracterstica que ele deve possuir, a saber, a de medir finalmente se reduzem a duas situaes: a diviso do teste
sem erros, donde os nomes preciso, confiabilidade ou em parcelas - mais comumente em duas metades - com a
fidedignidade. Medir sem erros significa que o mesmo subseqente correo pela frmula de predio de
teste, medindo os mesmos sujeitos em ocasies diferen- Spearman-Brown, e as vrias tcnicas do coeficiente alfa,
tes, ou testes equivalentes, medindo os mesmos sujeitos sendo o mais conhecido o alfa de Cronbach. Nesses casos,
na mesma ocasio, produzem resultados idnticos, isto , existe a aplicao de somente um teste numa nica oca-
a correlao entre estas duas medidas deve ser de 1. En- sio; as anlises consistem em verificar a consistncia inter-
tretanto, como o erro est sempre presente em qualquer na dos itens que compem o teste. Trata-se, portanto, de
medida, esta correlao se afasta tanto do 1 quanto mai- uma estimativa da preciso, cuja lgica a seguinte: se os
or for o erro cometido na medida. A anlise da preciso itens se entendem, isto , covariam, numa dada ocasio,
de um instrumento psicolgico quer mostrar precisamen- ento iro se entender em qualquer ocasio de uso do teste.
te o quanto ele se afasta do ideal da correlao 1, deter-
minando um coeficiente que, quanto mais prximo de 1,
CONCLUSO
menos erro o teste comete ao ser utilizado.
O problema da fidedignidade dos testes era tema pre- Para assegurar que os testes apresentem os parmetros
ferido da psicometria clssica, onde a parafernlia esta- de qualidade cientificamente exigidos, a American
tstica de estimao deste parmetro mais se desenvol- Psychological Association (APA) estabeleceu os Standards
veu, mas ele perdeu muito em importncia dentro da for Educational and Psychological Testing, tendo vrias edi-
psicometria moderna em favor do parmetro de validade. es a partir de 1985.

REFERENCES

1. Stevens SS. On the Theory of Scales of Measurement. 3. Gulliksen H. Theory of mental tests. New York: Wiley;
Science. 1946;103(2684):677-80. 1950.
2. Whitehead AN, Russell B. Principia mathematica. 4. Lord FM. A theory of test scores. Iowa (IA): Psychometric
Cambridge: Cambridge University Press; 1910-1913, 1965. Society; 1952. (Psychometric Monograph, n. 7).
3 v.

998
Rev Esc Enferm USP Psicometria
2009; 43(Esp):992-9 Pasquali L
www.ee.usp.br/reeusp/
5. Rasch G. Probabilistic models for some intelligence and 12. American Psychological Association (APA).Technical
attainment tests. Copenhagen: Danish Institute for recommendations for psychological tests and diagnos-
Educational Research and St. Paul; 1960. tic techniques. Washington; 1954.

6. Birnbaum A. Some latent trait models and their use in 13. Cronbach LJ, Meehl PE. Construct validity in psychological
inferring and examinees ability. In: Loed FM, Lord MR. tests. Psychol Bull. 1955;52(4):281-302.
Novick, statistical theories of mental test scores. Read-
ing: Addison Wesley; 1968. p.17-20. 14. Pasquali L.Validade dos testes psicolgicos: ser pos-
svel reencontrar o caminho? Psicol Teor Pesq. 2007; 23
7. Lord FM. Applications of item response theory to practical (n.esp):99-107.
testing problems. Hillsdale: Erlbaum; 1980.
15. Pasquali L. Psicometria: teoria dos testes na psicolo-
8. Campbell DT, Stanley J. Experimental and quasi-experi- gia e na educao. Petrpolis: Vozes; 2004.
mental designs for research. Skokie: Rand McNally; 1973.
16. Pasquali L. TRI - Teoria de Resposta ao Item: teoria, pro-
9. Anastasi A. Evolving concepts of test validation. Ann Rev cedimentos e aplicaes. Braslia: LabPAM/UnB; 2007.
Psychol. 1986;37(1):1-15.
17. Ebel RL. Must all tests be valid? Am Psychol. 1961;16
10. Pasquali L, organizador. Instrumentos psicolgicos: ma- (10):640-7.
nual prtico de elaborao. Braslia: LabPAM/IBAPP;
1999. 18. Thurstone LL.The criterion problem in personality re-
search. Chicago: University of ChicagoPress; 1952.
11. Pasquali L. Anlise fatorial para pesquisadores. Porto
Alegre: Artmed; 2005.

999
Correspondncia: Luiz Pasquali
Psicometria Rev Esc Enferm USP
Pasquali
Campus L
Darci Ribeiro, ICC Sul 2009; 43(Esp):992-9
LabPAM, sala AI-096 www.ee.usp.br/reeusp/
Plano Piloto - Asa Norte
CEP 70910-900- Braslia, DF, Brasil

Você também pode gostar