Slides Atualizados

Uma visão geral da TRI
Franzé Costa
Fundamentos
 Na Teoria Clássica da Medida (TCM), o nível (ou, em outras
palavras, a intensidade) de um construto latente mensurado
por múltiplos itens é estimado a partir da soma dos escores
(ponderados ou não) desse conjunto de itens
o Pela ‘teoria da amostra de domínio’, se houver
adequação de validade e confiabilidade, qualquer item
pode ser substituído por outro ou excluído, sem que isso
represente impacto na mensuração
o Não são considerados, portanto, maiores aspectos
específicos dos itens.
1
Fundamentos
 No entanto,
o há itens que variam de forma diferenciada a depender da
maior ou menor presença/manifestação do construto
latente.
• Ex: uma ‘variação unitária’ de nível de qualidade de
serviço pode gerar um efeito maior em um item que
em outros
o há ainda itens que requerem maior presença ou
manifestação do construto para que o sujeito alcance um
‘escore’ elevado
o e há escores que podem ser indicados de forma
totalmente aleatória
Fundamentos
 Nesses termos, parece razoável crer que certos itens, por suas
características, não são substituíveis por outros sem alteração
na medida do construto,
o E, também, que a exclusão de diferentes itens tenha efeitos
variados na aferição da magnitude de um construto latente
 Ou seja, em lugar de recepcionar uma pressuposição de que a
métrica final de um construto poderá ser obtida a partir da escala
somada dos itens, podemos considerar as características
específicas dos itens
o E em lugar de verificar um item por seu escore como
sinalizador (refletivo) da magnitude do construto, tomamos
o escore como manifestação empírica associada à
intensidade do fator latente E às características do item
2
Fundamentos
 A Teoria da Resposta ao Item (TRI) redireciona a visão do conjunto de
itens para os item em particular, a partir de uma lógica conceitualmente
simples (embora matematicamente complexa):
o Definimos um modelo probabilístico...
• Ou seja, adotamos um modelo matemático baseado no conceito de
probabilidades
o ... que associa a intensidade do construto latente, juntamente com
outras potenciais características específicas...
• Admitimos, portanto, que o construto latente tem intensidade
variável e que os itens têm especificidades
o ... com a probabilidade de uma ‘dada resposta’ em um item específico
• Temos a suposição de que, por exemplo, a presença de mais
conhecimento gera mais respostas corretas; que o nível de
maturidade tecnológica gera mais respostas ‘sim’ (entre sim ou não)
na pergunta “a organização conhece as novas tecnologias?”
Fundamentos
 VEJA BEM: a resposta ‘certa’ NÃO depende APENAS da intensidade
do construto latente.
 A TRI toma como princípio fundamental que a probabilidade de um
respondente apontar a presença de uma dimensão latente (uma
resposta certa, a posse de uma habilidade, a presença de um
competência...) em um item é função de ao menos quatro elementos:
o O nível do traço latente do respondente, representado por 𝜃 (theta)
o Um parâmetro de discriminação entre detentores de diferentes níveis
do traço latente, representado por a (normalmente chamado de
parâmetro de declividade – slope)
o Um parâmetro de dificuldade associada ao item, representado por b
(normalmente chamado de parâmetro de locação)
o Um parâmetro de ‘indicação aleatória’, associado à evidência da
presença do traço latente mesmo em sua ausência, associado ao item,
representado por c (também chamado de assíntota inferior)
3
Fundamentos
 Na modelagem da TRI, a expressão de probabilidade é, em geral,
definida pela função de distribuição logística, e tem formulação a partir
da quantidade de parâmetros associados ao item admitidos
o Relevante: esta função é uma escolha de modelagem.
o Poderia ser outra, mas essa tem sentido e funciona bem
 Temos, para o modelo de resposta binária com três parâmetros,
considerando p itens e n sujeitos, a formulação, chamada ‘item response
function - IRF’, é a seguinte:
1
𝑃 𝑈 = 1 𝜃 , 𝑎 , 𝑏 , 𝑐 = 𝑐 + (1 − 𝑐 ) ( )
1+𝑒
Em que 𝑖 = 1, 2, … , 𝑝 são os itens, e 𝑗 = 1, 2, … , 𝑛, e D = 1,0 ou 1,7
 Interpretamos 𝑃 𝑈 = 1 𝜃 , 𝑎 , 𝑏 , 𝑐 como a probabilidade de o sujeito j

demonstrar a posse da habilidade (no caso indicado por 1) no item i,
dados a sua habilidade (𝜃 ), e as características do item (𝑎 , 𝑏 e 𝑐 )
Fundamentos: interpretando
parâmetros
 O parâmetro de discriminação (a) indica o quanto um item é
capaz de distinguir uma pessoa que possui um dado nível de traço
latente de outra com um nível maior ou menor
o Valores mais elevados de a indicam que o item discrimina
mais
o Deste modo, a variação unitária de habilidade em um item
com maior poder de discriminação gera um incremento mais
elevado de probabilidade de manifestação do construto
o Noutras palavras, este parâmetro indica, naquele item
específico, o quanto quem sabe mais consegue se diferenciar
de quem sabe menos
4
parâmetros
 O parâmetro de dificuldade (b) indica a intensidade de presença
do traço latente necessária para a probabilidade de 50% (fora a
indicação aleatória) de manifestação do traço latente
o Valores mais elevados de b indicam itens mais difíceis,
pois se requer mais domínio do traço para que tenhamos a
chance de 50% (afora o acerto aleatório) de demonstrar
presença do traço latente
o Este parâmetro é o reflexo ‘matemático-estatístico’ da lógica
da dificuldade
• De fato, se um item é mais difícil, menor é a chance de que
as pessoas acertem, ou seja, manifestem possuir o traço
latente
• Para efeito de modelagem, a medida de probabilidade de
referência é 50% de chance de acertar
parâmetros
 O parâmetro de acerto aleatório (c), que está associado à chance
de um sujeito sinalizar que possui a presença do traço latente,
mesmo que não o possua.
o No caso de provas de conhecimento, concerne à probabilidade
de o sujeito acertar no ‘chute’
o Observe que esse parâmetro tem mais sentido ‘lógico’ em
avaliações educacionais, mas não há problema em avaliar em
outros construtos
10
5
Fundamentos: exemplos
• Exemplo de um item com a=1,0, b=0,0 e c=0,25.
• Nesse caso, a probabilidade associada b é de 0,625 (0,25 +(1,00-0,25)/2)
• A forma da curva de probabilidade de acerto em função de teta se define
por esses parâmetros.
• Essa é a Curva Característica do Item - CCI
11
Fundamentos: exemplos
• Exemplo de dois itens com diferentes valores de b
• Veja que o item 2 requer uma intensidade de traço latente maior que o
item 1 para uma probabilidade de demonstração de acerto de 0,5, afora
o acerto aleatório
12
6
Interpretando parâmetros: um exemplo
13
Interpretando parâmetros: exemplo

 Consideremos um item com três parâmetros (tomemos D=1) ou seja,:
(1 − 𝑐)
𝑃 𝑈 = 1 𝜃 , 𝑎, 𝑏, 𝑐 = 𝑐 +
1+𝑒 ( ))
 Nos slides seguinte simularemos adequadamente variações desses

parâmetros, para verificar que (em cada caso, fixos os demais
parâmetros):
o A probabilidade de manifestação do traço aumenta (diminui) na
medida em que 𝜃 cresce (diminui)
o O efeito da variação unitária da intensidade do traço latente sobre a
probabilidade de sua manifestação cresce quando a cresce
o A probabilidade de manifestação do traço latente diminui na medida
em que b cresce
o A probabilidade de manifestação do traço diminui na medida em
que c cresce
14
7
para o traço latente
 Mantenhamos fixos os valores de a em 1, b em -1 e de c em 0,20 e
oscilemos os valores de 𝜃. Teremos que
Valor de 𝜃 𝑃(𝑼 = 𝟏)
0,0 0.785
-2,0 0,415
-4,0 0,238
-6,0 0,205
 Conforme se observa, quanto menor o nível de presença do traço latente,

mais se reduz a probabilidade de sua manifestação (veja que a
probabilidade tende ao parâmetro de indicação aleatória)
o Esse resultado tem sentido prático. Por exemplo, em uma prova, se
houver chance de acerto aleatório, mesmo sem qualquer domínio de
conteúdo, é esperado que haja acerto 'no chute’
15

para o parâmetro a
 Mantenhamos agora fixos os valores de b em 0, c em 0.2, D=1, e
oscilemos os valores de a e de 𝜃. Teremos que:
Valor do 𝑷 𝑼𝒋 = 𝟏 𝐜𝐨𝐦 𝜽 de -1 a 0 𝑷 𝑼𝒋 = 𝟏 𝐜𝐨𝐦 𝜽 de 1 a 2
parâmetro a
-1 0 ‘Salto’ 1 2 ‘Salto’
0,50 0,502 0,600 0,098 0,698 0,785 0,087
1,50 0,346 0,600 0,254 0,854 0,962 0,108
2,50 0,261 0,600 0,339 0,939 0,995 0,055
 Conforme se observa, para maiores valores de a, os saltos em

probabilidade de manifestação do traço latente tendem a ser maiores
para variações unitárias de sua intensidade (afora os extremos de prob.)
o Exemplo: em uma prova, a variação unitária no nível de conhecimento gera
efeitos maiores na probabilidade de acerto para valores maiores de a
o Níveis de discriminação maior geram um prêmio para quem detém mais
habilidade
16
8
para o parâmetro a
Valor do 𝑷 𝑼𝒋 = 𝟏 𝐜𝐨𝐦 𝜽 de -1 a 0 𝑷 𝑼𝒋 = 𝟏 𝐜𝐨𝐦 𝜽 de 1 a 2
parâmetro a
-1 0 ‘Salto’ 1 2 ‘Salto’
0,50 0,502 0,600 0,098 0,698 0,785 0,087
1,50 0,346 0,600 0,254 0,854 0,962 0,108
2,50 0,261 0,600 0,339 0,939 0,995 0,055
 Aproveitando a tabela anterior/acima, veja que, quando 𝑏 = 0 e 𝜃 = 0,

𝑃 𝑈 = 1 = 0,600
De fato, descontado os 20% de chance de acerto aleatório, restam 80%
para variar pela competência. Lembremos que o parâmetro de dificuldade,
na fórmula, corresponde ao nível de conhecimento necessário para uma
chance de 50% de acerto pela competência (sobram 80%, logo, metade é
40%; mas como começa já em 20%, a temos 𝑃 𝑈 = 1 = 0,600)
 Quando temos chances elevadas de acerto, a variação positiva de a pode não
implicar aumento do salto, dependendo dos demais parâmetros
17

para o parâmetro b
 Mantenhamos fixos os valores de a em 1 e c em 0,20, e oscilemos os
valores de b. Teremos, para um sujeito com nível de traço latente de
zero (𝜃=0), o seguinte:
Valor de b 𝑃(𝑼 = 𝟏)
-1 0,785
0 0,600
1 0,415
2 0,295
 Evidentemente, mantidos os demais parâmetros, quanto maior a
dificuldade, menor será a probabilidade de acerto.
o Esse resultado tem sentido prático, pois, efetivamente, itens mais
difíceis geram uma probabilidade de ‘acerto’ menor
o Na estimação, b fica padronizado com média 0 e desvio padrão 1.
Normalmente, b oscila entre -3 e 3 (por quê?)
18
9
Interpretando parâmetros : exemplo
para o parâmetro c
 Mantenhamos agora fixos os valores de a em 1 e b em -1, e oscilemos os
valores de c. Teremos, para um sujeito com nível de traço latente de
zero (𝜃=0), o seguinte:
Valor de c 𝑃(𝑼 = 𝟏)
0,00 0,731
0,10 0,758
0,20 0,785
0,25 0,798
 E conforme se observa, quanto maior a probabilidade de acerto

aleatório, mantidos os demais parâmetros, maior será a probabilidade
de acerto.
o Esse resultado tem sentido prático, pois mais pessoas sem a
competência acertarão mais ‘no chute’, o que eleva a chance global
de acerto.
19
COMPLEMENTO
20
10
TRI com mais de 3 parâmetros
 Assim como se define o termo c, que representa uma assíntota
inferior e que define o nível de probabilidade de acerto mesmo
para níveis muito baixos de domínio do traço latente, é
possível definir um nível máximo de probabilidade, sob a
suposição de que, mesmo para níveis muito elevados de
presença do traço latente, ainda assim não é dado como certo o
acerto.
o Por exemplo, o nível de depressão induz a uma
manifestação de predisposição (sim ou não) ao suicídio.
o Mas ainda assim, mesmo para níveis muito elevados de
depressão, não é certo que o suicida aponte que tem essa
predisposição (ou que suicídio ocorra).
21

 Temos então uma assíntota superior chamada de d, entre 0 e 1,
que dará à formulação a seguinte configuração
1
𝑃 𝑈 = 1 𝜃 , 𝑎, 𝑏, 𝑐, 𝑑 = 𝑐 + (𝑑 − 𝑐)
1+𝑒 ( ))
 Obviamente, se 𝜃 cresce, a probabilidade convergirá para d.

o Simule!
o Por óbvio, o modelo torna-se mais complexo
o Mas não para por aí!
 Também é possível definir um quinto parâmetro, chamado de
assimetria, para alongar a curva de probabilidade por domínio.
22
11
 Teríamos nesse caso um valor f, maior que zero, que serve de
expoente do denominador da expressão principal, e que dará à
formulação a seguinte configuração
1
𝑃 𝑈 = 1 𝜃 , 𝑎, 𝑏, 𝑐, 𝑑, 𝑓 = 𝑐 + (𝑑 − 𝑐)
1+𝑒 ( ))
 Simule os resultados para diferentes valores de f.

 Em geral, os modelos e os softwares são implementados para
somente três parâmetros
 Por isso, seguiremos com esse modelo nos slides que seguem.
23
Dimensão processual
24
12
Dimensão processual: fundamentos e
ideias - retomando
 Na Teoria Clássica, o foco é o escore total (somado; ver provas da
ANPAD, por exemplo), e na TRI é nas características do item
 Na TRI é tomada a referência da probabilidade de o sujeito apresentar o
traço latente. Por exemplo:
o acertar uma questão quando tem ‘conhecimento do conteúdo’;
o adotar uma prática ativista quanto tem ‘engajamento com uma
causa’
o adotar uma prática de gestão de dados quando tem ‘maturidade
gerencial’
 Ou seja, o traço latente concerne ao construto latente de interesse
 Pela formulação adotada, teremos que a probabilidade da resposta certa
a um item é definida em função da presença do fator latente, assim como
dos parâmetros do item
25

ideias
 Veja que, dadas as características do item, a probabilidade de
manifestação do traço latente dependerá, portanto, do nível da
intensidade do traço.
o E, como é lógico, quanto mais um aluno sabe a matéria, mais
acerta os itens em uma prova; quanto mais engajado um sujeito
em uma causa, mais participa das ações relacionada à causa
o Logicamente, maior probabilidade de acerto não garante que o
sujeito sempre manifeste acerto em um item específico
o Por outro lado, tomando um conjunto de itens, o nível de
domínio da competência gerará um efeito cumulativo que tem
´reflexo’ correspondente ao nível de presença do fator latente
o Ou seja, precisamos de um conjunto de ‘indicadores’ para
termos uma boa estimativa do nível de domínio do fato
26
13
ideias
 Do ponto de vista processual, são duas as etapas:
1. Com base nas respostas de uma amostra de respondente a um
conjunto de itens, estimamos os parâmetros de cada item (este
é o chamado ‘processo de calibração’)
2. Com base nas características dos itens, considerando as
respostas de cada pessoa, estimamos suas proficiências
individuais
 A variável final, criada a partir das proficiências individuais, é
utilizada como medida do construto para efeito de análise de dados
 Pela metodologia de estimação dos pacotes estatísticos, essa métrica
em geral é estimada em uma escala com média 0 e desvio padrão 1
o Logo, para mudar para outra escala, é necessário definir uma
fórmula de transformação, algo fácil, por sinal
27
Dimensão processual: operacionalização

estatística
 Como informado, do ponto de vista estatístico, nosso desafio é, primeiro,
especificar cada item, ou seja, dada a amostra de itens e as respostas de
n respondentes, estimamos inicialmente os parâmetros (a, b e c), e
definimos uma caracterização estimada de cada um deles
 Para tanto, são lançados quatro pressupostos (há variações por
autores):
o Monotonicidade: quanto maior o ‘traço’, maior a probabilidade de
manifestação no ‘acerto’ do item, ou manifestação do construto latente
o Unidimensionalidade: dado um conjunto k de itens, é pressuposto que
há apenas um único construto subjacente
• Aqui, aplica-se a AFE clássica para verificar se há um só fator
o Independência local: a correlação entre os itens é nula se for isolado o
traço latente (ou seja, a correlação existente deriva do efeito do
construto latente)
o Invariância: os parâmetros dos itens não variam entre diferentes
populações
28
14
estatística
 Esses pressupostos são necessários para os procedimentos de
estimação de parâmetros
 O pressuposto da invariância é especialmente relevante porque
permite supor que os parâmetros, por serem independentes da
população, devem ser os mesmos para quaisquer amostras
o Isso permite envolver diferentes escalas, desde que tenham
alguns itens iguais
o Permite ainda comparar diferentes respondentes, mesmo que
tenham respondido a ‘provas’ diferentes
o E esta é, portanto, uma das grandes vantagens da TRI, pois:
• Mantidos alguns itens iguais em diferentes provas, é possível
‘equalizar’ as notas de diferentes grupos de respondentes
• Embora seja possível proceder da mesma forma na TC, a TRI
oferta uma maior segurança na equalização
29

estatística
 Calibração dos itens: a partir da estimação dos parâmetros (a, b
e c), definimos uma caracterização estimada de cada item
o O método de estimação convencional é aquele baseado no
princípio de máxima verossimilhança
o Os processos da estimação são numéricos e
computacionalmente complexos
o A potência computacional atual permite rapidez suficiente
para uso da técnica em diversas pesquisas, razão pela qual a
TRI tem crescido em uso
o O número de parâmetros é pré-especificado pelo pesquisador,
podendo, se houver sentido, analisar a calibração com
diferentes números
30
15
estatística
 Após a extração são analisados os indicadores de qualidade dos
itens segundo os parâmetros da TRI
o Há uma variação de referenciais dependendo da área, do
autor, do tipo de pesquisa...
o Algumas referência convencionais:
• Parâmetro a – varia, normalmente, entre 0 e 3, sendo
adequados acima de 0,7 (menos que isso indica que o item
discrimina muito pouco)
• Parâmetro b – varia entre, normalmente, entre -3 e 3, sendo
aceitáveis entre -2 e 2 (nem muito fáceis e nem muito
difíceis)
• Parâmetro c – não há referência bem definida, e varia de
acordo com a natureza do construto sob análise
31

estatística
 Os parâmetros são analisados por seus valores e levando em conta
quadro gráficos:
o A curva características do item (CCI): permite visualizar o
comportamento dos itens individualmente e em conjunto
o A curva características do teste (CCT, a soma das CCIs): traz uma
visão global do teste
o A curva de informação dos itens (CII):
• Sinaliza os níveis de informação psicométrica por faixas de
intensidade do traço latente
• Seu máximo é no nível de proficiência igual ao parâmetro b, e
depende de a (maior a indica maior concentração de
informação) e c (maior c indica menor concentração de
informação)
o A curva de informação do teste (CIT, a soma das CIIs)
32
16
estatística
 Sobre as curvas de informação
o Intuitivamente, dizemos que temos mais informação quando o item
consegue ser mais preciso na indicação do nível do traço latente
o Em TRI, como a probabilidade de acerto varia com o traço latente,
temos, portanto, um ‘montante de informação’ que varia com 𝜃
• Ou seja, temos níveis de ‘intensidade de informação’ dependendo
do nível do traço latente
o A finalidade da curva de informação do item é avaliar o
comportamento de ‘contribuição de informação’ do item para o
teste ao longo de 𝜽
• Essa curva tem, em geral, a forma de sino e permite ‘mapear’ as
intensidades do traço latente nas quais o item é mais informativo
e preciso
• Indica também, portanto, as faixas que o item é pouco ‘confiável’
o Comparando diferentes itens, observaremos que estes possuem
diferentes ‘níveis de informação’ a depender de seus parâmetros
33

estatística
o Por definição, para um item i, teremos as seguintes formulações para, os
itens com 1, 2 ou 3 parâmetros (em cada caso, 𝐼 𝜃 é o nível de informação
do item i em função de 𝜃; 𝑄 𝜃, 𝑏 = 1 − 𝑃 𝜃, 𝑏 ; e 𝑃 𝜃, 𝑏 = 𝑃(𝑈 =
1/𝜃, 𝑏 )):
• Para um parâmetro (b):
𝐼 𝜃 = 𝑃 𝜃, 𝑏 𝑄 𝜃, 𝑏
 Veja que o máximo de 𝐼 𝜃 ocorre no valor de 𝜃 =b (P θ, b = 0,5).
• Para dois parâmetros (a e b):

𝐼 𝜃 = 𝑎 𝑃 𝜃, 𝑏 𝑄 𝜃, 𝑏
 Veja que, fixados os demais parâmetros, aumentando a, 𝐼 𝜃 cresce
• Para dois parâmetros (a, b e c):

𝑄 𝜃, 𝑏 𝑃 𝜃, 𝑏 − 𝑐
𝐼 𝜃 =𝑎
𝑃 𝜃, 𝑏 1−𝑐
 Veja que, fixados os demais parâmetros, diminuindo c, 𝐼 𝜃 cresce
34
17
estatística
o Além da informação de cada item, teremos o total de informação do
teste
o A função de informação do teste será definida a partir da soma das
funções de informação dos itens particulares
• Ou seja, para um teste com k itens, teremos
𝐼 𝜃 = 𝐼 𝜃
o Veja que o nível de informação do teste é também função do nível do

traço latente
o Isso sugere, portanto, que há níveis de traço latente em que o
conjunto de itens tem melhor precisão
• Retomando o conceito de confiabilidade, a CIT indica os níveis de
traço latente em que o conjunto de itens é mais confiável
35
18

Slides Atualizados

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Slides Atualizados

Enviado por

Direitos autorais:

Formatos disponíveis

Uma visão geral da TRI

 Interpretamos 𝑃 𝑈 = 1 𝜃 , 𝑎 , 𝑏 , 𝑐 como a probabilidade de o sujeito j

Interpretando parâmetros: exemplo

 Nos slides seguinte simularemos adequadamente variações desses

 Conforme se observa, quanto menor o nível de presença do traço latente,

Interpretando parâmetros: exemplo

 Conforme se observa, para maiores valores de a, os saltos em

 Aproveitando a tabela anterior/acima, veja que, quando 𝑏 = 0 e 𝜃 = 0,

Interpretando parâmetros: exemplo

 E conforme se observa, quanto maior a probabilidade de acerto

TRI com mais de 3 parâmetros

 Obviamente, se 𝜃 cresce, a probabilidade convergirá para d.

 Simule os resultados para diferentes valores de f.

Dimensão processual: fundamentos e

Dimensão processual: operacionalização

Dimensão processual: operacionalização

Dimensão processual: operacionalização

Dimensão processual: operacionalização

• Para dois parâmetros (a e b):

• Para dois parâmetros (a, b e c):

o Veja que o nível de informação do teste é também função do nível do

Você também pode gostar