Você está na página 1de 6

TRI

Bonifacio
TRI Introduo
Resultados de provas, expressos por escores brutos ou padronizados, tm sido
tradicionalmente utilizados nos processos de avaliao/seleo.
Tais resultados dependem do particular conjunto de itens (questes) do instrumento de
medida.
As anlises e interpretaes esto sempre associadas prova como um todo, que a
caracterstica principal da Teoria Clssica das Medidas (entender melhor).
Assim, torna-se invivel a comparao entre indivduos que no foram submetidos s
mesmas provas, ou pelo menos, ao que se denomina de formas paralelas de testes.
Para maiores detalhes sobre essa metodologia, incluindo sua fundamentao matemtica,
ver: Gulliksen (1950), Lord & Novick (1968) e Vianna (1987).
Atualmente, em vrias reas do conhecimento, particularmente em avaliao educacional,
vem crescendo o interesse na aplicao de tcnicas derivadas da TRI, que prope modelos
para os traos latentes (caractersticas no observveis diretamente ).
Esse tipo de varivel deve ser inferida a partir da observao de variveis secundrias que
estejam relacionadas a ela.
O que esta metodologia sugere so formas de representar a relao entre a probabilidade
de um indivduo dar uma certa resposta a um item e seus traos latentes, proficincias ou
habilidades na rea de conhecimento avaliada.
Uma das grandes vantagens da TRI sobre a Teoria Clssica que ela permite a comparao
entre populaes, desde que submetidas a provas que tenham alguns itens comuns, ou
ainda, a comparao entre indivduos da mesma populao que tenham sido submetidos a
provas totalmente diferentes.
Isto porque uma das principais caractersticas da TRI que ela tem como elementos centrais
os itens, e no a prova como um todo.


TRI Int.
Assim, vrias questes de interesse prtico na rea da Educao podem ser respondidas.
Exemplo: avaliar o desenvolvimento de uma determinada srie de um ano para outro ou
comparar o desempenho entre escolas pblicas e privadas.
Os primeiros modelos surgiram na dcada de 50 e consideravam que uma nica habilidade,
de um nico grupo, estava sendo medida por um teste onde os itens eram corrigidos de
maneira dicotmica.
Estes modelos foram primeiramente desenvolvidos na forma de uma funo ogiva normal e,
depois, foram descritos para uma forma matemtica mais conveniente, e que vem sendo
usada at ento: a logstica.
Lord (1952) foi o primeiro a desenvolver o modelo unidimensional de 2 parmetros, baseado
na distribuio normal acumulada (ogiva normal).
Aps algumas aplicaes desse modelo, Lord sentiu a necessidade da incorporao de um
parmetro que tratasse do problema do acerto casual. Assim, surgiu o modelo de 3
parmetros.
Anos mais tarde, Birnbaum (1968) substituiu, em ambos os modelos, a funo ogiva normal
pela funo logstica, matematicamente mais conveniente, pois uma funo explcita dos
parmetros do item e de habilidade e no envolve integrao.
Independentemente do trabalho de Lord, Rasch (1960) props o modelo unidimensional de 1
parmetro, expresso tambm como modelo de ogiva normal e, tambm mais tarde descrito
por um modelo logstico por Wright (1968).
TRI Int.
Samegima (1969) props o modelo de resposta gradual com o objetivo de obter mais informao
das respostas dos indivduos do que simplesmente se eles deram respostas corretas ou incorretas
aos itens.
Bock (1972), Andrich (1978), Masters (1982) e Muraki (1992) tambm propuseram modelos para
mais de duas categorias de resposta, assumindo diferentes estruturas entre essas categorias.
Bock & Zimowski (1997) introduziram os modelos logsticos de 1, 2 e 3 parmetros para 2 ou mais
populaes de respondentes. Isso trouxe novas possibilidades para comparaes de rendimentos
de 2 ou mais populaes submetidas a diferentes testes com itens comuns, conforme discutido em
Hedges & Vevea (1997) e Andrade (1999), por exemplo.
Um ponto crtico na TRI a estimao dos parmetros envolvidos nos modelos, em particular
quando necessita-se estimar tanto os parmetros dos itens quanto as habilidades. Inicialmente, a
estimao era feita atravs do mtodo da mxima verossimilhana conjunta que envolve um
nmero muito grande de parmetros a serem estimados simultaneamente e, consequentemente,
grandes problemas computacionais.
Em 1970, Bock & Lieberman introduziram o mtodo da mxima verossimilhana marginal para a
estimao dos parmetros em duas etapas. Na primeira etapa estimam-se os parmetros dos itens,
assumindo-se uma certa distribuio para as habilidades. Na segunda etapa, assumindo os
parmetros dos itens conhecidos, estimam-se as habilidades.
Apesar do avano que esse mtodo trouxe para o problema, ele requeria que todos os parmetros
dos itens fossem estimados simultaneamente. Em 1981, Bock & Aitkin propuseram uma
modificao no mtodo acima, utilizando o algoritmo EM de Dempster, Laird & Rubin (1977), de
modo a permitir que os itens pudessem ter seus parmetros estimados em separado, facilitando
em muito o aspecto computacional do processo de estimao.
TRI Int.
Mais recentemente, mtodos bayesianos foram propostos para, entre outras coisas, resolver o
problema de estimao dos parmetros dos itens respondidos corretamente ou incorretamente por
todos os respondentes, e tambm o problema da estimao das habilidades dos respondentes que
acertaram ou erraram todos os itens da prova.

TRI Referncias
Birnbaum, A. (1957). Efficient design and use of tests of a mental ability for
various decision-making problems, ( Series Report No. 58-16. Project No.
7755-23). USAF School of Aviation Medicine, Texas: Randolph Air Force Base.
Birnbaum, A. (1968). Some Latent Trait Models and Their Use in Infering an
Examinees Ability. In F.M. Lord & M.R. Novick. Statistical Theories of Mental
Test Scores. Reading, MA:Addison-Wesley.
Lord, F. M. (1952). A theory of test scores (No. 7). Psychometric Monograph.
Lord, F. M. (1968). An analysis of the verbal scholastic aptitude test using
Birnbaums three-parameter logistic model. Educational and Psychological
Measurement, 28, 989-1020.
Lord, F. M. (1974). Estimation of latent ability and item parameters when there
are omitted responses. Psychometrika, 39, 247-264.
Lord, F. M. (1975). Evaluation with artificial data of a procedure for estimating
ability and item characteristic curve parameters, (Research Bulletin RB-75-33).
Princeton, NJ: Educational Testing Service.
Lord, F. M. (1980). Applications of Item Response Theory to Practical Testing
Problems. Hillsdale: Lawrence Erlbaum Associates, Inc.
Lord, F. M. and Novick, M. R. (1968). Statistical Theories of Mental Test Scores.
Reading, MA: Addison-Wesley.

Você também pode gostar