Você está na página 1de 13

Alguns pré-requisitos conceituais para se entender a TRI:

• Média e desvio padrão:

Essa daqui vocês devem conhecer. Dado um grupo de números qualquer, a média é todo
mundo somado e dividido pela quantidade total de itens. Já o desvio padrão é o quão
“dispersos” estão esses números. Ele é definido como a raiz quadrada da variância. Eu não vou
entrar aqui em como se calcula porque não acho necessário; ao invés disso, vou dar um
exemplo.

Imagina que temos dois grupos de cinco pessoas e perguntamos a idade de cada uma.

No grupo A temos: [ 10, 10, 8, 12, 11], com média de 10.2 anos.

No grupo B temos: [ 25, 4, 11, 9, 2], com média também de 10.2 anos.

Perceba que o grupo A [e bem mais uniforme que o grupo B, ou seja, todo mundo tem idades
parecidas. Por isso, no grupo A, o desvio padrão vai ser de 1,48. Já no grupo B, as idades estão
mais “espalhadas” na reta numérica. Nele, o desvio padrão é de aproximadamente 9.

• A distribuição normal ou Gaussiana:

É uma distribuição inventada por Gauss (oooh), que diz que se você pegar um número
suficiente de dados quaisquer, eles vão se distribuir em uma curva em formato de sino. Cada
curva gaussiana tem duas variáveis muito importantes. São justamente elas: sua média (µ) e
seu desvio padrão (σ).
Algumas propriedades dessa curva:

- Ela é sempre simétrica;

- Ela tem uma elevação no meio, que corresponde a média e a mediana, e vai se abrindo para
os lados, no que chamamos de cauda da curva;

- A média determina para que lado a curva vai ficar: veja que na curva verde, com média -2, ela
fica para a esquerda. Já as outras curvas de média 0 ficam mais à direita.

- O desvio padrão determina o quão “aberta” é a curva. Perceba que as curvas azul, amarela e
vermelha tem a mesma média, mas desvios padrão diferentes. Quanto maior o desvio padrão,
mais aberta a curva.

• A teoria do limite central:

É uma teoria na estatística que diz que para a maioria das coisas estudadas que tem variáveis
independentes, a distribuição dos resultados vai tender a ser dada por uma curva normal.

Traduzindo: as coisas no mundo tendem a ter distribuição normal. Por quê? Porque sim.

• Escore Z:
Lembra que uma propriedade da curva normal a média e a outra era o desvio padrão? Pois
bem. O escore Z é simples: ele mede a quantos desvios padrão alguma coisa está da média.

Suponhamos, por exemplo, que você pergunta a idade de mil pessoas e sai com uma média de
20 anos e desvio padrão de 10. Agora você vai e escolhe uma pessoa e pergunta a idade dela, e
ela te diz que tem 50 anos.

Qual sua média? 20 anos.

A quantos anos essa pessoa está da média? 30 anos.

Qual o desvio padrão? 10 anos.

Então a quantos desvios padrão essa pessoa está da média? 30/10 = 3 desvios padrão. Como
ela está acima e não abaixo da média, são desvios padrão positivos.

Daí falamos que essa pessoa tem um escore Z = +3.

Vamos dar uma olhadinha na curva outra vez e falar das probabilidades:

Em termos de área sob a curva, a idéia é simples: cerca de 95% das pessoas estão a 2 desvios
padrões da média.

Isso quer dizer, voltando no nosso exemplo de média 20 e desivo padrão de 10, que 95% dos
entrevistados tem entre 10 e 30 anos. Colocando em outras palavras, 95% das pessoas tem
escore Z entre -2 e +2.

Pois muito que bem. Faça uma pausa, tome uma água, e vamos agora pras coisas mais complexas.
Primeiramente, o que é o TRI?

TRI significa “teoria de resposta ao item”, sendo que “item” corresponde a uma questão de múltipla
escolha. O TRI tem como objetivo relacionar as respostas das pessoas aos itens com alguma habilidade
ou competência.

Oooh, onde foi que você já ouviu “habilidades e competências” antes?

Aqui mesmo, no ENEM.

É importante ressaltar que o TRI é um modelo apenas em parte matemático; ele é também
psicométrico. Isso quer dizer que quando falamos de “habilidades e competências”, falamos de coisas
subjetivas. “Construir significados para os números naturais” não é um parâmetro como “idade”, que
respondemos com um número simples (20 anos).

Ao contrário, é algo abstrato e não precisamente quantificável. O que o TRI visa é justamente estimar
essa capacidade latente. Aqui usamos ele no ENEM, nos Estados Unidos usam no SAT, na Inglaterra
usam no TOEFL, mas o TRI não está exclusivamente restrito a provas e avaliações.

Usamos ele na medida de outras coisas subjetivas. Na medicina, por exemplo, eu posso usá-lo para
tentar estimar por meio de questionários coisas como “nível de dor que o paciente está sentindo” ou “o
quanto ficar paraplégico afetou na vida desse paciente”.

E como funciona o bendito?

O TRI parte do princípio que podemos estimar a habilidade de alguém com um número que
chamaremos de “nível de habilidade”. Se você tem um nível de habilidade de 2, pressupomos que você
é melhor naquilo que alguém que tem nível de 0,5.

O ponto chave aqui é que os itens (as questões) vão tentar medir seu nível de habilidade, partindo do
princípio de que se ele é maior, então você tem mais chance de acertar. Isso é feito por meio de uma
fórmula, que segue:
AAAAAAAAAAAAAHHHHHHH

Tudo bem. Vamos com calma. Temos vários parâmentros, que são:

• P(ϴ, a, b, c) → probabilidade que a pessoa acerte a questão;


• ϴ = o nível de habilidade.
• a = conhecido como “fator de discriminação”, está relacionado com a inclinação da curva.
• b = parâmetro de dificuldade da questão.
• c = probabilidade de uma resposta correta quando a habilidade se aproxima de menos infinito;
traduzindo: probabilidade de você acertar a questão ao acaso.
• e = uma constante matemática de valor aproximado 2,71.

Falaremos deles um por um, na ordem que eu julgo mais didática:

O fator ϴ, ou “nível de habilidade”:

É o que estamos querendo medir. Voltamos lá naquela habilidade do ENEM que eu peguei de exemplo:
“Construir significados para os números naturais”. Bem, nós vamos tentar medir isso.

Mas como raios vamos fazer isso, Sofia?

Partindo de alguns princípios básicos:

- As habilidades tem níveis de domínio diferentes, que variam do menor para o maior;

- Segundo a teoria do limite central, dado um espaço amostral grande o suficiente, as pessoas tem níveis
de habilidade diferentes que vão se distribuir numa curva normal.

- Essa curva, como toda curva normal, vai ter um nível de habilidade médio e um desvio padrão.

- O nível de habilidade de cada indivíduo pode ser dado em relação ao nível médio, por meio de um
escore Z.

- A vasta maioria das pessoas (95%) estará entre os escores -2 e +2.

- O intervalo entre os escores -4 e +4 abrange praticamente 100% das pessoas.

- O fator ϴ, portanto, vai ser dado em escore Z e terá valor entre -4 e 4.


Perceba que o fator ϴ não é por si um número absoluto; ao contrário, ele é relativo e dependente da
média e do desvio padrão.

Exemplifico:

Volta lá no nosso primeiro exemplo de média e desvio padrão, em que temos dois grupos:

Grupo A: [ 10, 10, 8, 12, 11], média = 10.2 anos, desvio padrão= 1.48.

Grupo B: [ 25, 4, 11, 9, 2], média = 10.2 anos, desvio padrão = 9.

Se formos calcular o escore Z da pessoa de 11 anos no grupo A, teremos que:

11 (a idade) - 10.2 (média) = 0.8


0.8/ 1.48 (o desvio padrão) = 0.54

E se formos calcular o escore Z da pessoa com 11 anos no grupo B, teremos que:

11 - 10.2 = 0.8

0.8/9 = 0.088

O que isso nos mostra é que o mesmo valor absoluto (11 anos) pode ter escores Z completamente
diferentes apenas mudando o grupo em que está inserido.

Se você se perdeu aqui, recomendo que volte lá em cima nos textos e releia os conceitos básicos. Se
você ainda está me acompanhando, faça uma pausa, beba uma água, respire fundo que ainda tem mais.

O fator b, ou “fator de dificuldade”:

Em poucas palavras, o fator b mede o quão difícil é o item (a questão). Observem o gráfico:
No eixo X nós temos ϴ, ou seja, o nível de habilidade da pessoa. No eixo Y, temos p(ϴ), ou seja, a
probabilidade que alguém com aquela habilidade acerte a questão.

Veja que cada uma das curvas tem B diferente, e quanto maior o b, mais para a direita ela está. Vamos
testar umas hipóteses nessa curva. Suponhamos que três pessoas vão fazer o ENEM. Uma delas é o
senhor George Rash, o matemático dinamarquês que inventou o TRI mas infelizmente não fala
português pra fazer a prova (fator ϴ = -4), outra sou eu (fator ϴ = 0) e a outra é Albert Einstein , cuja
prova veio em alemão (fator ϴ = +4).

O nosso enem tem 4 questões, com fatores de dificuldade -2, -1, 0 e 1. Vamos ver como ficaria pra cada
um de nós, marcando nossos níveis de habilidade com uma linha roxa:

Observe que Rash, como não conseguia entender nada da prova, tem menos de 20% de probabilidade
de acertar qualquer questão. Já o Einstein tem mais de 90% de chance de acertar cada uma delas. Por
outro lado eu, com meu nível intermediário de conhecimento, tenho mais de 80% de probabilidade de
acertar a questão fácil (b =-2), mas menos de 30% de chance de acertar a questão mais difícil (b= +1).

Mas Sofia, o que determina o fator b?

Um processo prévio chamado “calibração”, em que as questões são levadas a um grupo controle e suas
respostas são registradas. Calcula-se então a probabilidade de ter o padrão de resposta, em termos de
fatores a, b, c, e escolhe-se os valores de cada item de modo que essa possibilidade seja maximizada. Eu
não vou entrar no mérito dessa fórmula para não ficar aqui até amanhã, mas resumidamente:
- O fator b de dificuldade é determinado pelo fator ϴ necessário para que a probabilidade de acerto seja
de 0.5.

- Em outras palavras: pegue a questão. Calcule qual o fator ϴ necessário para que a pessoa tenha 50%
de chance de acertar. Esse fator ϴ será seu b.

- Olhe para a imagem. A imagem ajuda. Sério.

- As questões do ENEM são pré-calibradas. (http://educacao.estadao.com.br/noticias/geral,enem-


exige-que-questoes-sejam-pre-testadas-com-grupos-pequenos-de-alunos,790975)

O fator “a” ou fator de discriminação:

Está relacionado com a inclinação da curva, dado um mesmo nível de dificuldade. Observe a imagem:
- Perceba que a curva azul e a curva preta possuem o mesmo fator b, ou seja, você precisa ter o mesmo
fator ϴ (no caso -1) para ter 50% de chance de acertar essa questão.

- Porém, a inclinação da curva azul é maior que a da curva preta. Isso porque o fator a da curva azul é
maior que o da preta.

- Por outro lado, a curva verde e a preta, apesar de terem a mesma inclinação (o mesmo fator a),
possuem níveis de dificuldade diferente (fator b diferente).

- Em termos práticos, a capacidade de discriminação da curva azul é maior, ou seja, apesar de terem a
mesma dificuldade, a questão da curva azul consegue separar melhor os níveis de ϴ diferente.

-Voltando no nosso exemplo: Rash, Einstein e eu fazemos a questão azul e a questão preta, ambas
igualmente fáceis (b=-1). Nossas probabilidades de acerto serão:

Rash: próximo de 0 na azul, próximo de 20% na preta.

Sofia: próximo de 80% na azul, próximo de 70% na preta.

Einstein: próximo de 100% na azul, próximo de 90% na preta.

Perceba que na questão azul, é mais provável que alguém que não domina a habilidade de fato erre.

- Tal como o fator b, o fator a das questões é pré-calibrado.

(Eu juro que tá acabando)

O fator c ou assíntota horizontal:

Até agora vínhamos falando da probabilidade de que alguém acerte uma questão baseada
exclusivamente na habilidade da pessoa. Nos exemplos que venho usando, pessoas com o fator ϴ
próximo de menos infinito ficariam com probabilidade próxima de 0 de acertar a questão.

Na prática, porém, a gente sabe que não é bem assim. Ora, se você não sabe a questão, você chuta.
Rash, o dinamarquês que tá fazendo a prova sem saber ler português, tem no mínimo 20% de chance de
acertar cada questão, simplesmente porque só tem 5 alternativas.

O fator c quantifica exatamente isso: a probabilidade de uma resposta certa quando o nível de
habilidade se aproxima de menos infinito. Observe a imagem:
- Perceba que agora a extremidade esquerda da curva não chega mais no 0, sendo que a curva se
horizontaliza aproximadamente no 0.2, que é exatamente os 20% de chance de acertar a questão na
sorte.

A constante matemática de Euler (e):

É igual a aproximadamente 2,71828. Aceitem.

Conclusões:

- O TRI é um sistema que visa estimar habilidades subjetivas que não são quantificáveis de forma direta.

- Tal habilidade é dada por meio de um parâmetro chamado nível de habilidade.

- O nível de habilidade é relativo à média de habilidade.

- As questões são pré-calibradas para determinar sua dificuldade e capacidade de discriminação.

- O TRI é capaz de medir a probabiliade de acerto ao acaso.

“Mas Sofia, por quê você sempre fala que quanto mais difícil a prova, maior a nota de corte?”

- Partimos do princípio de que quanto mais difícil a prova, menor a média.

- Partimos do princípio de que por mais que a prova esteja fácil, sempre existirá numero substancial de
baixos acertos.

- Partimos também do princípio de que por mais difícil que a prova esteja, sempre existirá número
substancial de altos acertos.
Vamos fazer uma prova com dez questões para medir a habilidade X, criar dois grupos-teste de cinco
pessoas e analisar:

Prova fácil: [ 3, 6, 7, 9, 8], média 6,6; desvio padrão 2,3.

Prova difícil: [3, 3, 5, 9, 7], média: 5,4; desvio padrão: 2,6.

Observe que ambos os grupos possuem notas altas e baixas, mas a média na prova fácil é maior.
Observe também que na prova difícil, o desvio padrão aumenta. Isso porque quanto mais difícil a prova,
mais discrepante é a nota alta da média.

Agora vamos calcular o escore Z da pessoa que tirou 9 nos dois grupos:

Prova fácil: 9 (a nota) – 6.6 (a média) = 2.4

2.4/2.3 (o desvio padrão) = 1.04

Prova difícil: 9 – 5.4 = 3.6

3.6/2.6 = 1.38

Lembre-se que sua nota no TRI é relativa e que o fator ϴ de habilidade é calculado em desvios padrões.
Na prova difícil, o escore Z de quem acertou 9 questões é significativamente maior do que na prova fácil.
Isso quer dizer que quanto menor a média, mais extremo o extremo superior.

Em tese, o seu 9 numa prova difícil mostra um nível de habilidade maior que seu 9 numa prova fácil, e é
isso que o TRI vai ler.

Me seguindo até aqui? Pois bem. Voltemos agora para nossa curva de Gauss:
Veja que é esperado que aproximadamente 0,13% das pessoas estejam no extremo superior da curva,
ou seja, a mais de 3 desvios padrões da média. Determinamos agora a pouco que se a prova for mais
difícil, as pessoas que invariavelmente acertarem mais vão ser mais valorizadas em suas habilidades.

Pois bem, o SISU irá selecionar, obrigatoriamente, a cauda direita da curva, ou seja, as notas mais altas.
Quantas pessoas será que estão na cauda superior?

0,13% de 9.2 milhões = 11.960

Número de vagas para medicina no sisu = aproximadamente 5000.

Veja que nós temos mais escores altos do que vagas, e esses escores altos são precisamente os
selecionados.

Se ainda assim não estiver convencido, pense apenas que o ano em que a prova de matemática subiu de
dificuldade foi exatamente o mesmo ano que alunos tiraram mais que 1000. Pense no quanto esse 1008
sobe a média de alguém. Agora pense que as pessoas selecionadas pelo SISU são justamente as com as
maiores notas, que são poucas mas não tão poucas assim.

Por isso que de uma forma geral, se o curso é muito concorrido, a prova difícil tende a aumentar o corte,
e não o contrário.

É ISSO AÍ POR HOJE É SÓ PESSOAL

PS: eu não curso matemática nem estatística; se você cursa matemática ou estatística, leu essa
porqueira até o final e viu um erro, provavelmente você está certo, e nesse caso me mande uma
mensagem que eu corrijo.

PS (2) : EPIDEMIOLOGISTA É MÉDICO SIM

https://www.metheval.uni-jena.de/irt/VisualIRT.pdf

https://prezi.com/rzwf4bgvhn0q/irt-for-dummies/