Você está na página 1de 9

INTRODUÇÃO

A Psicometria é uma área da Psicologia que trata de atribuir significados às respostas de


um indivíduo a uma série de tarefas ou testes, através de processos mentais. Há duas
vertentes para a Psicometria: a Teoria Clássica dos Testes (TCT) e a Teoria de Resposta
ao Item (TRI). Nesta última, os testes recebem tratamento criterioso, uma vez que os
traços latentes são características não observáveis diretamente, tais como inteligência e
ansiedade.

De fato, a TRI se apresenta como um avanço da Psicometria em relação à TCT. As


vantagens da TRI sobre a T C T são importantes, por isso a TRI tem sido largamente
utilizada nas avaliações educacionais em seus diferentes contextos, assim como em
outros campos da atividade humana e demais ciências.

Segundo Rabelo (2013), as limitações da TCT estão relacionadas a:

[...] discriminação dos itens, fidedignidade dos testes e comparabilidade de


desempenho de indivíduos que se submeteram a testes diferentes. As estatísticas
clássicas são restritas a determinado momento, a determinado teste e ao grupo
que respondeu à prova, dificultando o acompanhamento pedagógico ao longo
dos anos. Além disso, na TCT, os parâmetros dos itens de um teste dependem
diretamente da amostra de indivíduos para os quais eles foram calculados.
Desse modo, a dificuldade de um item vai variar de pesquisa para pesquisa, em
função da amostra de respondentes, isto é, o parâmetro é dependente dos
sujeitos (RABELO, 2013, p. 45).
No entanto, apesar dessas restrições, a TRI não busca substituir a TCT, mas
complementar e aprofundar os métodos de análise das respostas a testes aplicados a um
número grande de respondentes. No momento, a TRI utiliza medidas da TCT para
considerar os resultados do grupo de modo a qualificar os itens do teste e melhor
interpretar o resultado de cada indivíduo avaliado.

Diante da importância das inúmeras aplicações da Psicometria, esta pesquisa objetiva


introduzir os principais conceitos da teoria clássica dos testes e teoria de resposta ao
item, enfatizando as premissas dos modelos matemáticos que as sustentam e algumas
aplicações na avaliação educacional.

7
I – A TEORIA CLÁSSICA DOS TESTES E TEORIA DE RESPOSTA AO ITEM

1.1. Conceito da Teoria Clássica dos Testes

A Teoria Clássica dos Testes (TCT) procura conhecer o comportamento que os


respondentes de um teste apresentam, por meio de seu resultado final, ou seja, de seu
escore total (Maia, 2009). A TCT baseia-se em parâmetros descritivos, que auxiliam na
interpretação da distribuição das respostas de acordo com cada alternativa. As
propriedades psicométricas dos itens de uma prova relacionam-se aos parâmetros a
seguir: índice de dificuldade, índice de discriminação e correlação bisserial (Borgatto &
Andrade, 2012).

O índice de dificuldade analisa o grau de dificuldade de cada item por meio da


porcentagem de acerto. Quanto menor for a porcentagem de acertos, maior será o grau
de dificuldade. O índice de discriminação mede a capacidade de um item de distinguir
os participantes com maior habilidade (27% dos respondentes com notas mais altas)
daqueles com menor habilidade (27% dos respondentes com notas mais baixas).
Corresponde à diferença entre a proporção de acertos do primeiro grupo (notas mais
altas) e a do segundo grupo (notas mais baixas). Já, o coeficiente de correlação bisserial
é uma medida que de associação entre o desempenho no item e o desempenho na prova
(Borgatto & Andrade, 2012).

1.2.1. Parâmetros dos itens: dificuldade e discriminação

Para a teoria clássica a dificuldade de um item é definida como a proporção de sujeitos


que respondem corretamente ao item (ANDRIOLA, 1998; VIANNA, 1976). A partir
disso, um item é mais fácil quando mais pessoas o acertam. Por isso, esse tipo de item,
que a resposta pode ser certa ou errada, ou seja dicotômica, é utilizado frequentemente
em testes de desempenho ou aptidão em determinada área (PASQUALI, 2009). Por
exemplo, um item que apenas 20% dos respondentes o acertam é mais difícil que um
item que 80% acertam.

A discriminação, para a teoria clássica, quando entendida no âmbito da avaliação de


desempenho escolar, é definida como a capacidade do item distinguir sujeitos de
desempenho diferentes, ou seja, aqueles de escores altos em relação àqueles de escores
baixos (PASQUALI, 2009; VIANNA, 1976). Este parâmetro também indica a coerência
do escore do item com o escore do teste, assim, quanto maior for o índice dos itens,

7
maior será a homogeneidade do teste (SILVEIRA, 1983). O parâmetro de discriminação
de um item pode ser obtido pela correlação do item com o escore total menos o escore
do item (correlação item-total), que pode ser obtido através da correlação bisserial por
ponto.(PASQUALI, 2009).

Esses parâmetros dos itens podem ser facilmente observados em contextos de avaliação
do ensino e aprendizagem em sala de aula, ou mesmo em avaliações de larga escola e
concursos para seleção de candidatos em determinada área. A dificuldade dos itens
desejável pode variar de acordo com o objetivo da avaliação. Por exemplo, em
contextos de avaliação de sala de aula, é interessante que os itens apresentem
dificuldade média, no entanto, em contextos de seleção em que há vários candidatos
para poucas vagas, é importante que os itens tenham índice de dificuldade alta, de forma
que apenas os candidatos de alto desempenho consigam acertá-lo. Já a discriminação é
desejável que o item seja o mais discriminativo quando possível.

1.2. O conceito da Teoria de Resposta ao Item

Segundo Andrade, Tavares e Valle (2000, p. 7),

a TRI é um conjunto de modelos matemáticos que procuram representar a


probabilidade de um indivíduo dar uma certa resposta a um item como função
dos parâmetros do item e da habilidade (ou habilidades) do respondente. Essa
relação é sempre expressa de tal forma que quanto maior a habilidade, maior a
probabilidade de acerto no item.

Para entendermos melhor essa definição, é importante tratarmos de alguns fatores nela
contidos. O primeiro a ser tratado é a habilidade (θ) ou proficiência do respondente, esta
refere-se ao nível de aptidão de um indivíduo para responder corretamente um conjunto
de itens. Essa habilidade é o traço latente que queremos medir desse indivíduo.

O segundo fator aborda os parâmetros do item, são eles:

1. Parâmetro de discriminação (a) – consiste na aptidão do item em distinguir


indivíduos com habilidades diferentes;
2. Parâmetro de dificuldade (b) – trata-se da habilidade mínima que um
respondente precisa para ter uma grande probabilidade de dar a resposta correta;
3. Parâmetro de acerto ao acaso (c) – é a probabilidade de um respondente com
baixa proficiência responder corretamente um item.

7
Sendo assim, a TRI procura medir variáveis não observáveis (traço latente) que
influenciam as respostas dadas aos itens, utilizando a aferição das variáveis observáveis
(respostas aos itens). Ou seja, estabelece uma relação entre a habilidade do respondente
e os parâmetros do item com a probabilidade de acerto no item, de tal forma que, quanto
maior a proficiência do indivíduo, maior é a sua probabilidade de responder
corretamente o item.

Como a TRI é um conjunto de modelos estatísticos, vale salientar a importância de


conhecer os principais modelos para saber escolher o mais adequado a ser utilizado. No
Brasil, o modelo predominantemente utilizado é o logístico unidimensional de 3
parâmetros. À vista disso, esse trabalho limitar-se-á na abordagem das principais
características desse modelo, utilizando-o no próximo capítulo para analisar a prova de
acesso ao PROFMAT (2012).

Entretanto, é importante conhecermos as variáveis que diferenciam os modelos entre si.


A escolha do modelo a ser empregado deve levar em consideração os três aspectos a
seguir:

 Natureza do item: refere-se à forma como os itens são corrigidos. Podem ser
itens dicotômicos (sim ou não) ou dicotomizados (corrigidos como certo ou
errado), ou itens não dicotômicos;
 Quantidade de populações envolvidas: trata-se do número de populações que
responderão os testes. Podemos ter uma população ou mais de uma;
 Número de traços latentes que estão sendo medidos: versa sobre a quantidade
de habilidades que o teste medirá. Pode ser uma habilidade (modelos
unidimensionais) ou mais de uma.

Princípio básico da Teoria de Resposta ao Item

O princípio básico da TRI é o de que a probabilidade de acerto de um item depende do


nível de domínio do aluno em um determinado assunto. Portanto, é esperado que ele
acerte os itens cujo grau de dificuldade é menor ou igual ao seu domínio, e erre aqueles
com um grau maior (ANDRADE, 2000).

7
A TRI qualifica cada item com base em três parâmetros:

 O grau de dificuldade, que é representado na mesma escala do nível de


conhecimento;
 O poder de discriminação, que é a capacidade do item de distinguir os alunos
que têm as habilidades e conhecimentos requisitados daqueles que não as possui;
 A possibilidade de acerto ao acaso (popularmente conhecido como ‘chute’).

O princípio básico da Teoria de Resposta ao Item pode ser comparado às provas de


corridas com obstáculos. Se um indivíduo é capaz de pular um obstáculo de 90 cm, é
esperado que o mesmo consiga pular um de 60 cm, e não consiga ter sucesso com
alturas maiores Rabelo (2013, p. 9).

No Enem, por exemplo, quando um estudante acerta uma questão considerada ‘difícil’ e
erra uma ‘fácil’, a nota dele é impactada negativamente.

Cada item tem, portanto, características diferentes e fornece uma quantidade distinta de
informação sobre o conhecimento. Os valores mínimos e máximos de cada prova
dependerão dessas características.

1.2.2. Modelos da Teoria de Resposta ao Item

A TRI apresenta diferentes modelos, cada um com suas próprias suposições e


propriedades matemáticas. A escolha do modelo de TRI depende do tipo de item que
está sendo avaliado e dos objetivos da avaliação.

Antes de descrevermos os principais modelos de TRI, precisamos ter em mente quatro


conceitos ou terminologias utilizadas na TRI:

1. Dificuldade (b): refere-se ao nível de habilidade necessário para responder


corretamente ao item. Quanto maior o valor de b, maior é a dificuldade do item.
2. Discriminação (a): refere-se à capacidade do item de discriminar entre
indivíduos com habilidades diferentes. Quanto maior o valor de a, maior é a
capacidade de discriminação do item.
3. Acerto ao acaso (c): refere-se ao grau de acerto do item pelos estudantes que
não possuem a habilidade necessária para respondê-lo corretamente. Quanto
menor o valor de c, menor é a chance de um estudante responder corretamente
ao item por “chute”.

7
4. Erros aleatórios (d): também denominado como desatenção, são os erros em
algumas questões por distratores externos.
 Modelo de Dois Parâmetros (2PL): O Modelo de Dois Parâmetros (2PL) é um
modelo que leva em consideração a dificuldade do item e a capacidade do item
para discriminar entre indivíduos com habilidades diferentes. Portanto, o 2PL
permite a estimativa da habilidade do indivíduo e da dificuldade do item.
 Modelo de Três Parâmetros (3PL): O Modelo de Três Parâmetros (3PL) é um
modelo que leva em consideração a dificuldade do item, a capacidade do item
para discriminar entre indivíduos com habilidades diferentes e a probabilidade
de acerto ao acaso.
 Modelo de Quatro Parâmetros (4PL): O Modelo de Quatro Parâmetros (4PL)
é o modelo mais complexo de TRI e leva em consideração a dificuldade do item,
a capacidade do item para discriminar entre indivíduos com habilidades
diferentes, a probabilidade de acerto ao acaso e um parâmetro que controla a
taxa de acerto no nível superior da habilidade.

A seguir vamos ver um exemplo simples, porém didático sobre como a TRI pode ser
aplicada na área da educação (Frederic M. Lord 1912 - 2000).

Suponha que estamos avaliando a habilidade em matemática de um grupo de estudantes


utilizando um teste de múltipla escolha. O teste consiste em 20 itens, cada um com
quatro opções de resposta.

Para aplicar a TRI neste teste, precisamos primeiro calibrar os itens. Isso envolve a
administração do teste para um grupo de estudantes representativo e a análise das
respostas para cada item. A análise pode ser realizada com a ajuda de um software
especializado em TRI (por exemplo na Academy utilizamos o Winsteps e R com pacote
IRT), que estima os parâmetros dos itens.

Suponha que as análises do teste resultaram nos seguintes parâmetros para um dos itens:

 Dificuldade do item: 0,5


 Discriminação do item: 0,8
 Probabilidade de acerto ao acaso: 0,25

7
A dificuldade do item indica o nível de habilidade necessário para responder
corretamente ao item. Neste caso, um estudante com uma habilidade de 0,5 tem 50% de
chance de responder corretamente a este item.

A discriminação do item indica o quanto o item é capaz de diferenciar entre estudantes


com habilidades diferentes. Neste caso, o item tem uma boa capacidade de
discriminação.

A probabilidade de acerto ao acaso indica a probabilidade de um estudante acertar o


item por acaso. Neste caso, a probabilidade é relativamente baixa.

As vantagens da TRI em relação à TCT

 A aplicação da TRI é mais vantajosa do que a TCT, pois permite a:


 Melhor avaliação das habilidades dos indivíduos;
 Elaboração de diferentes testes para um mesmo exame, com níveis de
dificuldade iguais;
 Construção de instrumentos de mensuração menores e igualmente confiáveis;
 Melhor compreensão do instrumento de mensuração.

7
CONCLUSÃO

Nas últimas duas décadas, os processos de avaliação em larga escala foram difundidos e
utilizados como forma de conhecer a realidade educacional brasileira, embasando,
assim, a criação de políticas públicas para ajudar no desenvolvimento educacional do
país. Para tanto, foi necessária a criação de processos para medir a qualidade.

A Teoria Clássica dos Testes apresenta algumas limitações como modelo estatístico:
não permite comparar indivíduos que tenham respondido a testes distintos e não permite
fazer o acompanhamento de um mesmo sujeito durante as várias etapas do processo de
construção do conhecimento.

Dentre os métodos designados para avaliação, foi criada nos anos 50 a Teoria de
Resposta ao Item TRI, por Frederic Lord, cuja ideia era estabelecer uma medida única e
comparável de avaliação, mesmo quando as populações são submetidas a avaliações
diferentes.

7
REFERÊNCIAS BIBLIOGRÁFICAS

RABELO, Mauro. Avaliação educacional: fundamentos, metodologia e aplicações no


contexto brasileiro. Rio de Janeiro: SBM, 2013.

Maia, J. (2009). Uso da Teoria Clássica dos Testes e da Teoria de Resposta ao Item na
Avaliação da Qualidade Métrica de Testes de Seleção. Programa de Pósgraduação em
Educação Brasileira. Universidade Federal do Ceará, Fortaleza, Brasil.

Borgatto, A. & Andrade, D. (2012) Análise Clássica de Testes com diferentes graus de
dificuldade. Estudos em Avaliação Educacional, São Paulo, 23 (52), 146-156.

ANDRIOLA, Wagner Bandeira. Psicometria Moderna:características e tendências.


Estudos em Avaliação Educacional, v. 20, n. 43, p. 319, 2009. DOI:
https://doi.org/10.18222/eae204320092052

ANDRIOLA, Waner Bandeira. Avaliação da aprendizagem: uma análise descritiva


segundo a teoria de resposta ao item (TRI). Educação em Debate, v. 20, n. 36, p. 93–
102, 1998.

SILVEIRA, Fernado Lang da. Consideraçóes sobre o índice de discriminação de itens


em testes educacionais. Educação & Seleção, v. 7, 1983. Disponível em:
http://publicacoes.fcc.org.br/ojs/index.php/edusel/article/view/2546 Acesso em: 06 jan.
2020

ARAUJO, E. A. C. ; ANDRADE, D. F. ; BORTOLOTTI, Silvana Ligia Vincenzi . Teoria


da Resposta ao Item. Revista da Escola de Enfermagem da USP (Impresso), v. 43, p.
1000-1008, 2009.

ANDRADE, D. F. ; VALLE, Raquel da Cunha; TAVARES, Heliton Ribeiro. Introdução


à teoria da resposta ao ítem: conceitos e aplicações. SINAPE, 2000.

KLEIN, RUBEN; ANDRADE, D. F. Utilização da Teoria de Resposta ao Item no


Sistema Nacional de Avaliação da Educação Básica (SAEB).

Você também pode gostar