Escolar Documentos
Profissional Documentos
Cultura Documentos
7
I – A TEORIA CLÁSSICA DOS TESTES E TEORIA DE RESPOSTA AO ITEM
7
maior será a homogeneidade do teste (SILVEIRA, 1983). O parâmetro de discriminação
de um item pode ser obtido pela correlação do item com o escore total menos o escore
do item (correlação item-total), que pode ser obtido através da correlação bisserial por
ponto.(PASQUALI, 2009).
Esses parâmetros dos itens podem ser facilmente observados em contextos de avaliação
do ensino e aprendizagem em sala de aula, ou mesmo em avaliações de larga escola e
concursos para seleção de candidatos em determinada área. A dificuldade dos itens
desejável pode variar de acordo com o objetivo da avaliação. Por exemplo, em
contextos de avaliação de sala de aula, é interessante que os itens apresentem
dificuldade média, no entanto, em contextos de seleção em que há vários candidatos
para poucas vagas, é importante que os itens tenham índice de dificuldade alta, de forma
que apenas os candidatos de alto desempenho consigam acertá-lo. Já a discriminação é
desejável que o item seja o mais discriminativo quando possível.
Para entendermos melhor essa definição, é importante tratarmos de alguns fatores nela
contidos. O primeiro a ser tratado é a habilidade (θ) ou proficiência do respondente, esta
refere-se ao nível de aptidão de um indivíduo para responder corretamente um conjunto
de itens. Essa habilidade é o traço latente que queremos medir desse indivíduo.
7
Sendo assim, a TRI procura medir variáveis não observáveis (traço latente) que
influenciam as respostas dadas aos itens, utilizando a aferição das variáveis observáveis
(respostas aos itens). Ou seja, estabelece uma relação entre a habilidade do respondente
e os parâmetros do item com a probabilidade de acerto no item, de tal forma que, quanto
maior a proficiência do indivíduo, maior é a sua probabilidade de responder
corretamente o item.
Natureza do item: refere-se à forma como os itens são corrigidos. Podem ser
itens dicotômicos (sim ou não) ou dicotomizados (corrigidos como certo ou
errado), ou itens não dicotômicos;
Quantidade de populações envolvidas: trata-se do número de populações que
responderão os testes. Podemos ter uma população ou mais de uma;
Número de traços latentes que estão sendo medidos: versa sobre a quantidade
de habilidades que o teste medirá. Pode ser uma habilidade (modelos
unidimensionais) ou mais de uma.
7
A TRI qualifica cada item com base em três parâmetros:
No Enem, por exemplo, quando um estudante acerta uma questão considerada ‘difícil’ e
erra uma ‘fácil’, a nota dele é impactada negativamente.
Cada item tem, portanto, características diferentes e fornece uma quantidade distinta de
informação sobre o conhecimento. Os valores mínimos e máximos de cada prova
dependerão dessas características.
7
4. Erros aleatórios (d): também denominado como desatenção, são os erros em
algumas questões por distratores externos.
Modelo de Dois Parâmetros (2PL): O Modelo de Dois Parâmetros (2PL) é um
modelo que leva em consideração a dificuldade do item e a capacidade do item
para discriminar entre indivíduos com habilidades diferentes. Portanto, o 2PL
permite a estimativa da habilidade do indivíduo e da dificuldade do item.
Modelo de Três Parâmetros (3PL): O Modelo de Três Parâmetros (3PL) é um
modelo que leva em consideração a dificuldade do item, a capacidade do item
para discriminar entre indivíduos com habilidades diferentes e a probabilidade
de acerto ao acaso.
Modelo de Quatro Parâmetros (4PL): O Modelo de Quatro Parâmetros (4PL)
é o modelo mais complexo de TRI e leva em consideração a dificuldade do item,
a capacidade do item para discriminar entre indivíduos com habilidades
diferentes, a probabilidade de acerto ao acaso e um parâmetro que controla a
taxa de acerto no nível superior da habilidade.
A seguir vamos ver um exemplo simples, porém didático sobre como a TRI pode ser
aplicada na área da educação (Frederic M. Lord 1912 - 2000).
Para aplicar a TRI neste teste, precisamos primeiro calibrar os itens. Isso envolve a
administração do teste para um grupo de estudantes representativo e a análise das
respostas para cada item. A análise pode ser realizada com a ajuda de um software
especializado em TRI (por exemplo na Academy utilizamos o Winsteps e R com pacote
IRT), que estima os parâmetros dos itens.
Suponha que as análises do teste resultaram nos seguintes parâmetros para um dos itens:
7
A dificuldade do item indica o nível de habilidade necessário para responder
corretamente ao item. Neste caso, um estudante com uma habilidade de 0,5 tem 50% de
chance de responder corretamente a este item.
7
CONCLUSÃO
Nas últimas duas décadas, os processos de avaliação em larga escala foram difundidos e
utilizados como forma de conhecer a realidade educacional brasileira, embasando,
assim, a criação de políticas públicas para ajudar no desenvolvimento educacional do
país. Para tanto, foi necessária a criação de processos para medir a qualidade.
A Teoria Clássica dos Testes apresenta algumas limitações como modelo estatístico:
não permite comparar indivíduos que tenham respondido a testes distintos e não permite
fazer o acompanhamento de um mesmo sujeito durante as várias etapas do processo de
construção do conhecimento.
Dentre os métodos designados para avaliação, foi criada nos anos 50 a Teoria de
Resposta ao Item TRI, por Frederic Lord, cuja ideia era estabelecer uma medida única e
comparável de avaliação, mesmo quando as populações são submetidas a avaliações
diferentes.
7
REFERÊNCIAS BIBLIOGRÁFICAS
Maia, J. (2009). Uso da Teoria Clássica dos Testes e da Teoria de Resposta ao Item na
Avaliação da Qualidade Métrica de Testes de Seleção. Programa de Pósgraduação em
Educação Brasileira. Universidade Federal do Ceará, Fortaleza, Brasil.
Borgatto, A. & Andrade, D. (2012) Análise Clássica de Testes com diferentes graus de
dificuldade. Estudos em Avaliação Educacional, São Paulo, 23 (52), 146-156.