Escolar Documentos
Profissional Documentos
Cultura Documentos
E
TEORIA DE RESPOSTA AO ITEM
Henrique Freire
PRA INÍCIO DE CONVERSA: O QUE É ESCORE Z?
Nas estatísticas, um Escore Z (ou escore padrão) de uma observação é o número de
desvios padrão acima ou abaixo da média da população.
Basicamente:
• Quando o escore Z é positivo isto indica que o dado está acima da média e
quando o mesmo é negativo significa que o dado está abaixo da média.
• Seus valores oscilam entre -3 < Z < +3 e isto corresponde a 99,72% da área sob a
curva da Distribuição Normal
ALGUNS PROBLEMAS...
Toda testagem se depara com o problema de sua medida.
Como medir corretamente a distância entre dois planetas que estão a anos-luz de
distância?
Essa medida pode ser entendida como a utilização de números e categorias para
representar comportamentos. Além disso, a psicometria moderna se interessa pelo
chamado Traço Latente, que pode ser definido como a habilidade, aptidão ou fator
hipotético que organizam e agem sobre o comportamento do sujeito.
Ela parte do pressuposto que: apesar do erro da medida, uma parte dos escores dos
examinandos é genuinamente verdadeira.
Ou seja:
➢ a dificuldade;
➢ a capacidade de discriminação; e
➢ a possibilidade de resposta ao chute.
A dificuldade de um item se baseia no cálculo da proporção de acerto.
Por exemplo:
Por esse motivo, tem-se dito que este parâmetro de dificuldade, na TCT, na verdade
é um indicador da facilidade do item.
O parâmetro Discriminação diz respeito à qualidade do item em separar os
examinandos em grupos conforme suas capacidades (ou escores).
Correlações negativas indicam que as respostas corretas ao item são mais frequentes
nos examinandos com os menores escores totais. Neste caso, há indícios de que o
item apresenta algum problema, normalmente relacionado à troca de gabarito.
Já a Possibilidade do acerto ao acaso (chute) é dada em função do número de
alternativas de resposta.
Exemplo:
O pressuposto é que o examinando que não tem a habilidade suficiente para dar a
resposta chutará cegamente, sem avaliar qual das respostas é a mais provável.
Esse pressuposto da TCT foi amplamente criticado, uma vez que, em geral, as
alternativas incorretas não têm a mesma atratividade lógica.
Imagine que um mesmo teste seja aplicado a dois grupos de pessoas com
características diferentes, e um dos grupos é bem mais habilidoso do que o outro.
E também
Além disso, outro avanço é que o item pode ser considerado individualmente em vez
do teste como um todo. Finalmente, a fidedignidade do teste pode ser avaliada
para diferentes níveis de habilidade, gerando indicadores mais precisos.
A TRI também é conhecida como a Teoria do Traço Latente, pois considera que as
respostas observadas de um teste estão embasadas em traços latentes ou
habilidades não observáveis, sendo as habilidades representadas pelo θ (theta), o
maior foco da teoria.
Neste modelo teórico, adota-se uma escala padronizada para mensuração deste
valor. Essa escala possui distribuição semelhante ao escore z, podendo assumir
valores entre - (infinito) e + .
Importante dizer que esta relação não é linear, como mostra a figura do próximo
slide:
Por meio da curva de CCI, também é possível identificar os parâmetros de
dificuldade (b), discriminação (a) e acerto ao acaso (c) dos itens.
O valor do parâmetro “b” representa o tamanho de θ necessário para que o item
seja respondido corretamente ou endossado.
Por esse motivo, o parâmetro “a” também é conhecido como slope (inclinação).
Baixos valores de “a” indicam que o item tem pouco poder para diferenciar
examinandos com habilidades θ semelhantes
Nos testes de múltipla escolha, é esperado que algumas pessoas, mesmo com
habilidades muito baixas, lhes respondam corretamente devido ao acaso (ou
“chute”). Para indicar o tamanho deste efeito, utiliza-se o parâmetro “c”, que se
refere simplesmente à probabilidade de acerto ao acaso.
Na CCI, esse valor corresponde ao valor no qual a curva intercepta o eixo das
ordenadas “Y” (eixo da probabilidade de acerto, neste caso).
Ou seja, uma pessoa, mesmo com habilidade muito baixa, possui cerca de 10% de
chances de responder corretamente ao item devido ao acaso.
Uma das vantagens da TRI, em comparação com a TCT, refere-se à estimação dos
parâmetros de itens e da habilidade do examinando.
Na parte inferior da Figura 2, são indicadas as distribuições de habilidades dos
grupos A e B.
Caso este item fosse analisado pela TCT, a proporção de questões respondidas
corretamente seria maior para o grupo B.
Ambas são definidas como a quantidade de informação fornecida pelo item (ou
teste) para avaliação de uma habilidade θ.
Por meio dela, é possível avaliar para quais intervalos de habilidade o item é mais
útil, considerando a maior quantidade de informação, bem como para qual faixa
eles agregam mais erro do que informação.
Ressalta-se que cada item de um teste possui uma CII, contribuindo para a CIT
geral do teste.
Alguns aspectos podem impactar na informação de um teste:
(a) Quanto maior a discriminação dos itens (parâmetro a), maior será a
informação;
Para resolver este paradoxo, alguns autores têm ressaltado que a presença de um
traço latente dominante é o suficiente para satisfazer este pressuposto.
Outro pressuposto importante é o da independência local. Ele visa a garantir que
os itens sejam respondidos exclusivamente em função da habilidade θ dominante.
Em geral, o pressuposto da independência local pode ser assumido uma vez que o
pressuposto da unidimensionalidade é satisfeito.
O TAMANHO DA AMOSTRA
Na TRI, não há consenso sobre o seu tamanho ideal, ainda que alguns autores sugiram
um número mínimo entre cem e trezentos participantes.
• Construção de instrumentos
Alguns testes que passaram por isso no Brasil: WISC-IV, BPR-5, Bateria Fatorial de
Personalidade (BFP)...
PRINCIPAIS APLICAÇÕES DA TRI
• Equalização
• Linking designs
No primeiro, são construídos dois ou mais testes distintos que contenham alguns itens
iguais (âncoras) em comum, por meio dos quais serão linkados.
Por um lado, a aplicação de itens de inteligência muito difíceis, por exemplo, pode
facilmente desestimular um examinando com baixas habilidades cognitivas.
Por outro lado, itens muito fáceis podem ser ridicularizados por pessoas com altas
habilidades cognitivas. Sendo assim, a aplicação de itens de dificuldade condizentes
com a habilidade θ do participante pode aumentar a confiabilidade dos escores e
diminuir o tempo de aplicação.
PRINCIPAIS APLICAÇÕES DA TRI
• Enem