Escolar Documentos
Profissional Documentos
Cultura Documentos
Reviso de textos
Estatstico da Fundac
ao Carlos Chagas (FCC). e-mail: rvalle@fcc.gov.br
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
ii
Para
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
Apresentac
ao
A avaliac
ao educacional passou a ser, embora tardiamente, um dos pontos privilegiados das polticas educacionais. Ja sao in
umeros os projetos de
avaliac
ao conduzidos por org
aos respons
aveis pelos destinos da Educac
ao em
nosso pas. Reclamava-se, porem, por uma metodologia mais sofisticada e precisa, que permitisse nao so a avaliac
ao pontual mas, sobretudo, a construc
ao de
escalas de habilidades que pudessem levar a um acompanhamento do progresso
do conhecimento adquirido pelos alunos ao longo do tempo.
A Teoria Cl
assica, baseada em resultados obtidos em provas atraves de
escores brutos ou padronizados, largamente utilizada ate ent
ao, padece de
v
arias limitac
oes, como, por exemplo, ser dependente do conjunto de itens que
compoem o instrumento de medida, limitando assim, a sua aplicabilidade.
A Teoria da Resposta ao Item (TRI), que vem sendo progressivamente introduzida em nosso meio, e um instrumento poderoso nos processos quantitativos de avaliac
ao educacional, pelo fato de permitir, inclusive, a construc
ao
de escalas de habilidade calibradas. No entanto, a aplicabilidade da TRI tem
encontrado algumas dificuldades, tanto do ponto de vista teorico, devido a
problemas de difcil soluc
ao no campo da estimac
ao, como do ponto de vista
computacional.
O livro de Dalton F. Andrade, Heliton R. Tavares e Raquel C. Valle, vem ao
encontro de uma real necessidade dos pesquisadores clarificando alguns pontos
essenciais da teoria, trazendo um exemplo pr
atico de aplicac
ao em larga escala,
como e o caso do Sistema de Avaliac
ao do Rendimento Escolar do Estado de
S.Paulo (SARESP).
Escrito de forma extremamente did
atica, nao requerendo do leitor conhecimentos muito aprofundados do ponto de vista matem
atico-estatstico, com
excec
ao de algumas partes dos captulos de estimac
ao, aborda os principais
http://www.keimelion.com.br
Keimelion
Reviso de textos
iv
Apresenta
c
ao
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
Pref
acio
http://www.keimelion.com.br
Keimelion
Reviso de textos
vi
Pref
acio
Estado da Educac
ao de Sao Paulo, pela utilizac
ao de parte dos resultados do
SARESP.
Devido a enorme abrangencia da TRI, procuramos detalhar os pontos que
achamos mais interessantes para um texto introdutorio e fornecer o maior
n
umero possvel de referencias bibliograficas que cobrissem os outros pontos.
Este trabalho foi parcialmente financiado pelo CNPq, pela CAPES, pelo
Projeto Tem
atico da FAPESP no. 96/01741-7 e pelo PRONEX no. 76.97.1081.00.
Fevereiro 2000
Dalton Francisco de Andrade
Heliton Ribeiro Tavares
Raquel da Cunha Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
Conte
udo
Apresenta
c
ao
iii
Pref
acio
Lista de Figuras
1 Introdu
c
ao
2 Modelos Matem
aticos
2.1 Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Modelos envolvendo um u
nico grupo . . . . . . . . . . .
2.2.1 Modelos para itens dicotomicos ou dicotomizados
2.2.2 Modelos para itens nao dicotomicos . . . . . . .
2.3 Modelos envolvendo duas ou mais populac
oes . . . . .
3 Estima
c
ao: uma u
nica popula
c
ao
3.1 Introduc
ao . . . . . . . . . . . . . . . . . . . . .
3.2 Estimac
ao dos parametros dos itens . . . . . . .
3.2.1 Aplicac
ao do algoritmo Newton-Raphson
3.2.2 Aplicac
ao do metodo Scoringde Fisher .
3.2.3 Erro-padrao . . . . . . . . . . . . . . . . .
3.2.4 Escore nulo ou perfeito . . . . . . . . . . .
3.2.5 Estimativas iniciais . . . . . . . . . . . . .
3.3 Estimac
ao das habilidades . . . . . . . . . . . .
3.3.1 Aplicac
ao do algoritmo Newton-Raphson
3.3.2 Aplicac
ao do metodo Scoringde Fisher .
3.3.3 Erro-padrao . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
http://www.keimelion.com.br
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
8
8
18
25
.
.
.
.
.
.
.
.
.
.
.
27
27
31
37
41
42
43
43
44
46
47
47
Keimelion
Reviso de textos
viii
3.4
3.5
3.6
3.7
Conte
udo
3.3.4 Escore nulo ou perfeito . . . . . . . . . . . . . . .
3.3.5 Estimativas iniciais . . . . . . . . . . . . . . . . .
Estimac
ao conjunta: parametros dos itens e habilidades
Maxima verossimilhanca marginal . . . . . . . . . . . .
3.5.1 Abordagem de Bock & Lieberman . . . . . . . .
3.5.2 Metodos iterativos . . . . . . . . . . . . . . . . .
3.5.3 Metodos de quadratura . . . . . . . . . . . . . .
3.5.4 Abordagem de Bock & Aitkin . . . . . . . . . . .
3.5.5 Aplicac
ao do algoritmo EM . . . . . . . . . . . .
Estimac
ao bayesiana . . . . . . . . . . . . . . . . . . .
3.6.1 Estimac
ao dos parametros dos itens . . . . . . .
3.6.2 Estimac
ao das habilidades . . . . . . . . . . . . .
Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Equaliza
c
ao
4.1 Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Diferentes tipos de equalizac
ao . . . . . . . . . . . . . . . . . . .
4.2.1 Um u
nico grupo fazendo uma u
nica prova . . . . . . . . .
4.2.2 Um u
nico grupo fazendo duas provas totalmente distintas
4.2.3 Um u
nico grupo fazendo duas provas parcialmente distintas
4.2.4 Dois grupos fazendo uma u
nica prova . . . . . . . . . . .
4.2.5 Dois grupos fazendo duas provas totalmente distintas . . .
4.2.6 Dois grupos fazendo duas provas parcialmente distintas .
4.3 Diferentes problemas de estimac
ao . . . . . . . . . . . . . . . .
4.3.1 Quando todos os itens sao novos . . . . . . . . . . . . . .
4.3.2 Quando todos os itens ja estao calibrados . . . . . . . . .
4.3.3 Quando alguns itens sao novos e outros ja estao calibrados
4.4 Equalizac
ao a posteriori . . . . . . . . . . . . . . . . . . . . . . .
5 Estima
c
ao: duas ou mais popula
c
oes
5.1 Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Notac
oes e definic
oes . . . . . . . . . . . . . . . . . . .
5.3 Estimac
ao dos parametros dos itens . . . . . . . . . . .
5.4 Estimac
ao dos parametros populacionais . . . . . . . .
5.4.1 Estimac
ao conjunta: aplicac
ao do algoritmo EM
Andrade, Tavares & Valle
http://www.keimelion.com.br
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
48
48
48
51
52
57
59
61
64
67
68
73
76
79
79
81
81
81
82
83
83
84
85
85
85
86
87
93
93
94
96
99
102
SINAPE 2000
Keimelion
Reviso de textos
ix
5.5 Estimac
ao bayesiana dos parametros dos itens
5.6 Estimaca
o das habilidades . . . . . . . . . . .
5.6.1 Estimac
ao por MV . . . . . . . . . . . .
5.6.2 Estimac
ao por MAP . . . . . . . . . . .
5.6.3 Estimac
ao por EAP . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
104
105
105
106
106
.
.
.
.
.
.
.
109
109
109
112
113
114
115
118
7 Recursos computacionais
7.1 Introduc
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Recursos computacionais . . . . . . . . . . . . . . . . . . . . . .
7.2.1 Os programas BILOG for Windows v. 3.09 e BILOG-MG
v. 1.0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2.2 Metodos para a calibrac
ao dos itens . . . . . . . . . . . .
7.2.3 Metodos implementados para a estimac
ao das habilidades
7.3 A equalizac
ao nos programas BILOG e BILOG-MG . . . . . . .
7.3.1 O BILOG e o BILOG-MG frente a populac
oes e/ou provas
distintas . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.3.2 O BILOG e o BILOG-MG frente ao conjunto de itens a
ser calibrado . . . . . . . . . . . . . . . . . . . . . . . . .
7.3.3 O uso do BILOG-MG quando desejamos fixar parte dos
itens e calibrar o restante, e ha mais de uma populac
ao
envolvida . . . . . . . . . . . . . . . . . . . . . . . . . . .
123
123
123
8 Considera
c
oes gerais
135
A
A.1
A.2
124
126
126
128
128
130
131
139
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
Conte
udo
A.3
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
Refer
encias Bibliogr
aficas
http://www.keimelion.com.br
147
SINAPE 2000
Keimelion
Reviso de textos
Lista de Figuras
2.1
11
2.2
14
2.3
Representac
ao grafica dos modelos de escala gradual e de resposta gradual . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
Representac
ao grafica de 6 situac
oes quanto ao n
umero de grupos e de tipos de provas . . . . . . . . . . . . . . . . . . . . . .
80
Grafico de dispersao das estimativas do parametro de dificuldade - b dos itens comuns da prova de Lngua Portuguesa da
8.a serie entre o RN e o SAEB . . . . . . . . . . . . . . . . . .
89
90
4.1
4.2
4.3
6.1
6.2
Esquema da composic
ao da prova de ligac
ao . . . . . . . . . . . 116
6.3
Representac
ao grafica da distribuic
ao a posteriori das habilidades em Lngua Portuguesa dos alunos da 3.a serie . . . . . . . . 117
6.4
Representac
ao grafica da distribuic
ao a posteriori das habilidades em Lngua Portuguesa dos alunos da 4.a serie . . . . . . . . 118
7.1
Esquematizac
ao dos itens comuns entre as provas . . . . . . . . 132
http://www.keimelion.com.br
Keimelion
Reviso de textos
http://www.keimelion.com.br
Keimelion
Reviso de textos
Captulo 1
Introduc
ao
http://www.keimelion.com.br
Keimelion
Reviso de textos
Introdu
c
ao
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
5
metodo da maxima verossimilhanca conjunta que envolve um n
umero muito
grande de parametros a serem estimados simultaneamente e, consequentemente, grandes problemas computacionais. Em 1970, Bock & Lieberman introduziram o metodo da maxima verossimilhanca marginal para a estimac
ao
dos parametros em duas etapas. Na primeira etapa estimam-se os par
ametros
dos itens, assumindo-se uma certa distribuic
ao para as habilidades. Na segunda etapa, assumindo os parametros dos itens conhecidos, estimam-se as
habilidades. Apesar do avanco que esse metodo trouxe para o problema, ele
requeria que todos os par
ametros dos itens fossem estimados simultaneamente.
Em 1981, Bock & Aitkin propuseram uma modificac
ao no metodo acima, utilizando o algoritmo EM de Dempster, Laird & Rubin (1977), de modo a permitir
que os itens pudessem ter seus parametros estimados em separado, facilitando
em muito o aspecto computacional do processo de estimac
ao. Mais recentemente, metodos bayesianos foram propostos para, entre outras coisas, resolver
o problema de estimac
ao dos par
ametros dos itens respondidos corretamente
ou incorretamente por todos os respondentes, e tambem o problema da estimacao das habilidades dos respondentes que acertaram ou erraram todos os
itens da prova.
Nas u
ltimas decadas, a TRI vem tornando-se a tecnica predominante no
campo de testes em v
arios pases. Aqui no Brasil, a TRI foi usada pela primeira
vez em 1995 na an
alise dos dados do Sistema Nacional de Ensino Basico SAEB. A introduc
ao da TRI permitiu que os desempenhos de alunos de 4a.
e 8a. series do Ensino Fundamental e de 3a. serie do Ensino Fundamental
pudessem ser comparados e colocados em uma escala u
nica de conhecimento.
A partir dos resultados obtidos no SAEB, outras avaliac
oes em larga escala,
como por exemplo o Sistema de Avaliac
ao de Rendimento Escolar do Estado
de Sao Paulo - SARESP, tambem foram planejadas e implemementadas de
modo a serem analisadas atraves da TRI. Uma lista das principais aplicac
oes
da TRI no Brasil em avaliac
oes educacionais pode ser encontrada em Andrade
& Klein (1999).
O objetivo desse livro e introduzir os principais conceitos, modelos e resultados que podem ser obtidos a partir da aplicac
ao da TRI. No Captulo 2
sao apresentados os modelos, com suas interpretac
oes e suposic
oes basicas.
No Captulo 3 discute-se o processo de estimac
ao dos parametros dos itens
e das habilidades dos respondentes pertencentes a uma u
nica populac
ao. O
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
Introdu
c
ao
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
Captulo 2
Modelos Matem
aticos
2.1 Introduc
ao
A TRI e um conjunto de modelos matematicos que procuram representar a
probabilidade de um indivduo dar uma certa resposta a um item como func
ao
dos parametros do item e da habilidade (ou habilidades) do respondente. Essa
relacao e sempre expressa de tal forma que quanto maior a habilidade, maior
a probabilidade de acerto no item. Os varios modelos propostos na literatura
dependem fundamentalmente de tres fatores:
http://www.keimelion.com.br
Keimelion
Reviso de textos
Modelos Matem
aticos
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
ou errado) quanto para a analise de itens abertos (de resposta livre), quando
avaliados de forma dicotomizada.
Na pratica, os modelos logsticos para itens dicotomicos sao os modelos de
resposta ao item mais utilizados, sendo que h
a basicamente tres tipos, que se
diferenciam pelo n
umero de parametros que utilizam para descrever o item.
Eles sao conhecidos como os modelos logsticos de 1, 2 e 3 par
ametros, que
consideram, respectivamente:
(i) somente a dificuldade do item;
(ii) a dificuldade e a discriminac
ao;
(iii) a dificuldade, a discriminac
ao e a probabilidade de resposta correta dada
por indivduos de baixa habilidade.
Neste livro, daremos maior enfase `a explicac
ao do modelo logstico de 3
par
ametros, uma vez que e o mais completo e portanto os outros dois podem
ser facilmente obtidos a partir dele.
O modelo logstico de 3 par
ametros (ML3)
Definic
ao
Dos modelos propostos pela TRI, o modelo logstico unidimensional de 3
par
ametros (ML3) e atualmente o mais utilizado e e dado por:
P (Uij = 1|j ) = ci + (1 ci )
1
1+
eDai (j bi )
(2.1)
com i = 1, 2, , I, e j = 1, 2, , n, onde:
Uij e uma vari
avel dicotomica que assume os valores 1, quando o indivduo j
responde corretamente o item i, ou 0 quando o indivduo j n
ao responde
corretamente ao item i.
j representa a habilidade (traco latente) do j-esimo indivduo.
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
10
Modelos Matem
aticos
ai
e o parametro de discriminac
ao (ou de inclinac
ao) do item i, com valor
proporcional `a inclinac
ao da Curva Caracterstica do Item CCI no
ponto bi .
ci
Interpretac
ao e representaca
o gr
afica
Note que P (Uij = 1|j ) pode ser vista como a proporc
ao de respostas corretas ao item i dentre todos os indivduos da populac
ao com habilidade j . A
relac
ao existente entre P (Uij = 1|j ) e os parametros do modelo e mostrada
na Figura 2.1, que e chamada de Curva Caracterstica do Item CCI.
O modelo proposto baseia-se no fato de que indivduos com maior habilidade
possuem maior probabilidade de acertar o item e que esta relac
ao nao e linear.
De fato, pode-se perceber a partir do grafico acima que a CCI tem forma
de Scom inclinac
ao e deslocamento na escala de habilidade definidos pelos
parametros do item.
A escala da habilidade e uma escala arbitr
aria onde o importante sao as
relac
oes de ordem existentes entre seus pontos e nao necessariamente sua
magnitude. O par
ametro b e medido na mesma unidade da habilidade e o
parametro c nao depende da escala, pois trata-se de uma probabilidade, e
como tal, assume sempre valores entre 0 e 1.
Na realidade, o par
ametro b representa a habilidade necessaria para uma
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
11
0.6
0.4
0.2
0.0
-4.0
iiiiiiii
-3.0
-2.0
-1.0
0.0
1.0
2.0
3.0
4.0
habilidade
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
12
Modelos Matem
aticos
Func
ao de Informac
ao do Item
Uma medida bastante utilizada em conjunto com a CCI e a func
ao de informac
ao do item. Ela permite analisar quanto um item (ou teste) contem de
informac
ao para a medida de habilidade. A func
ao de informac
ao de um item
e dada por:
h
Ii () =
i2
d
d Pi ()
Pi ()Qi ()
onde,
Ii ()
e a informac
aofornecida pelo item i no nvel de habilidade ;
Pi () = P (Xij = 1|)
Qi () = 1 Pi ().
Qi () h Pi () ci i2
.
Pi ()
1 ci
Esta equac
ao mostra a importancia que tem os tres parametros sobre o
montante de informac
ao do item. Isto e, a informac
ao e maior:
(i) quando bi se aproxima de ;
(ii) quanto maior for o ai ;
(iii) e quanto mais ci se aproximar de 0.
Func
ao de Informac
ao do Teste
A informac
ao fornecida pelo teste e simplesmente a soma das informac
oes
fornecidas por cada item que compoe o mesmo:
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
I() =
I
X
13
Ii ().
i=1
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
14
Modelos Matem
aticos
1,00
1,00
0,80
0,80
0,60
0,60
0,40
0,40
0,20
0,20
0,00
-3,00
-2,00
-1,00
0,00
1,00
2,00
3,00
0,00
-3,00
-2,00
-1,00
habilidade
1,00
2,00
3,00
1,00
1,00
0,80
0,80
0,60
0,60
0,40
0,40
0,20
0,00
-3,00
0,00
habilidade
0,20
-2,00
-1,00
0,00
1,00
2,00
3,00
0,00
-3,00
habilidade
-2,00
-1,00
0,00
1,00
2,00
3,00
habilidade
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
15
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
16
Modelos Matem
aticos
2. b = 40 b + 200,
3. a = a/40,
4. P (Ui = 1|) = P (Ui = 1| ).
P (U1 = 1| = 1) = 0, 20 + (1 0, 20)
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
17
1
1+
eDai (j bi )
(2.2)
com i = 1, 2, , I, e j = 1, 2, , n.
Se alem de nao existir resposta ao acaso ainda tivermos todos os itens com
o mesmo poder de discriminac
ao, tem-se o chamado modelo logstico unidimensional de 1 par
ametro (ML1), tambem conhecido como modelo de Rasch.
Este modelo e dado por:
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
18
Modelos Matem
aticos
P (Uij = 1|j ) =
1
1+
eD(j bi )
(2.3)
com i = 1, 2, , I, e j = 1, 2, , n.
eai,k (j bi,k )
Pi,k (j ) = P
mi
ai,h (j bi,h )
h=1 e
(2.4)
com i = 1, 2, , I, j = 1, 2, , n, e k P
= 1, 2, , mi . Em cada j , a soma
mi
das probabilidades sobre as mi opc
oes,
e 1. As quantidades
k=1 Pi,k (j ),
+
+
(bi,k ; ai,k ) sao parametros do item i relacionados a k-esima opc
ao. O modelo
assume que n
ao h
a nenhuma ordenac
ao a priori das opc
oes de resposta.
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
19
1
1+
eDai (j bi,k )
(2.5)
com i = 1, 2, , I, j = 1, 2, , n, e k = 0, 1, , mi , onde:
bi,k
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
20
Modelos Matem
aticos
+
+
Samejima tambem define Pi,0
(j ) e Pi,m
(j ) de modo que:
i +1
+
Pi,0
(j ) = 1
e
+
Pi,m
(j ) = 0.
i +1
Portanto,
+
+
+
Pi,0 (j ) = Pi,0
(j ) Pi,1
(j ) = 1 Pi,1
(j )
e
+
+
+
Pi,m (j ) = Pi,m
(j ) Pi,m
(j ) = Pi,m
(j ).
i +1
1
1+
eDai (j bi,k )
1
1+
eDai (j bi,k+1 )
(2.6)
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
21
1
1+
eDai (j bi +dk )
1
1+
eDai (j bi +dk+1 )
(2.7)
com i = 1, 2, , I, j = 1, 2, , n, e k = 0, 1, , m, onde:
bi e agora o parametro de locac
ao do item i e
dk e o parametro de categoria.
+
+
(j ) Pi,k+1
(j ) 0, ent
ao, dk dk+1 0. Ou seja, devemos ter:
Como Pi,k
d1 d2 dm .
Note que a maior distinc
ao entre o modelo de resposta gradual e o modelo
de escala gradual est
a na hipotese de nesse u
ltimo os escores das categorias
de resposta devem ser equidistantes. Assim, no modelo de escala gradual o
par
ametro bi,k e decomposto em um par
ametro bi de locac
ao do item e num
parametro de categoria dk , isto e:
bi,k = bi dk .
Cabe ressaltar que os par
ametros de categoria dk nao dependem do item,
isto e, sao comuns a todos os itens do teste. Logo, se os itens que comp
oem
a prova tiverem suas proprias categorias de resposta, que podem diferir no
n
umero, ent
ao este modelo nao e adequado.
Em um teste composto por itens com (m + 1) categorias de resposta cada
um, m par
ametros de categoria necessitam ser estimados, alem dos par
ametros
de inclinac
ao e de locac
ao de cada item. Logo, se o teste tiver I itens, teremos
[2I + m] parametros de item a serem estimados.
Na Figura 2.3 temos a representac
ao grafica do modelo de escala gradual e
do modelo de resposta gradual para alguns itens com 4 categorias de resposta.
Em todos os itens, o par
ametro ai foi mantido igual a 1,0. Dessa maneira,
podemos verificar a import
ancia dos parametros de categoria bi,k . Os itens 1
e 4, por terem os par
ametros de categoria igualmente espacados, podem ser
representantes do modelo de escala gradual. J
a o modelo de resposta gradual
poderia ser representado por qualquer um dos itens acima.
Observando o item 1, podemos notar que indivduos com habilidade ate 2,0 tem maior probabilidade de responder apenas a categoria 0. J
a indivduos
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
22
Modelos Matem
aticos
Item 2:
P0
0,8
P1
P3
P2
0,6
0,4
0,2
0,0
-6,0
1,0
prob. de resposta correta
1,0
-4,0
-2,0
0,0
2,0
4,0
P0
0,6
0,4
0,2
-4,0
-2,0
habilidade
1,0
Item 4:
P3
P1
0,6
0,4
P2
0,2
-4,0
2,0
4,0
6,0
1,0
0,8
0,0
-6,0
0,0
habilidade
Item 3:
P3
P2
0,0
-6,0
6,0
P1
0,8
-2,0
0,0
2,0
4,0
6,0
P0
P3
0,8
0,6
0,4
P1
0,2
0,0
-6,0
habilidade
-4,0
P2
-2,0
0,0
2,0
4,0
6,0
habilidade
com habilidades entre -2,0 e 0,0, tem mais chance de alcancarem a categoria 1.
Para habilidades entre 0,0 e 2,0, a maior probabilidade e que os indivduos
respondam ate a categoria 2. Finalmente, indivduos com habilidade acima de
2,0, devem alcancar a u
ltima categoria de resposta (que devera representar o
acerto total).
Note que do item 1 para o 2, a distancia entre bi,2 e bi,3 tornou-se menor. A
consequencia disto e que aumenta a faixa de habilidade em que os indivduos
dever
ao responder somente ate a categoria 1: de -2,0 a 0,0 no item 1 para
-2,0 a 0,5 no item 2. Em outras palavras, a categoria 2 ficou mais difcil de
ser alcancada, uma vez que no item 1 indivduos com habilidades entre 0,0 e
2,0 tem maior probabilidade de conseguir responder `a essa categoria do que
indivduos com habilidades entre 0,5 e 2,0 no item 2.
No item 3, praticamente nao ha chance dos indivduos responderem ate a
categoria 2: indivduos com habilidade entre -2,0 e 0,0 tem mais chance de
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
23
b
)
j
i,u
u=0
hP
i,
(2.8)
Pi,k (j ) = P
mi
u
u=0 exp
v=0 (j bi,v )
com i = 1, 2, , I, j = 1, 2, , n, k = 0, 1, , mi e bi,0 0, onde:
Pi,k (j ) e a probabilidade de um indivduo com habilidade j escolher a categoria k, dentre as (mi + 1) categorias do item i.
bi,k e o parametro de item que regula a probabilidade de escolher a categoria k em vez da categoria adjacente (k 1) no item i. Cada parametro
bi,k corresponde ao valor de habilidade em que o indivduo tem a mesma
probabilidade de responder `a categoria k e `a categoria (k 1), isto e,
onde Pi,k (j ) = Pi,k1 (j ).
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
24
Modelos Matem
aticos
Assim, para itens com (mi + 1) categorias de resposta, sera necessario estimar mi parametros de item. Note que para itens com apenas 2 categorias de
resposta, este modelo fica an
alogo ao modelo de Rasch para itens dicot
omicos.
Modelo de Cr
edito Parcial Generalizado (Generalized Partial Credit
Model)
O modelo de credito parcial generalizado MCPG foi formulado por Muraki (1992), que se baseou no modelo de creditos parciais de Masters, relaxando
a hip
otese de poder de discriminac
ao uniforme para todos os itens. O modelo
de credito parcial generalizado e dado por:
hP
i
k
exp
Da
(
b
)
i
j
i,u
u=0
hP
i,
Pi,k (j ) = P
mi
u
u=0 exp
v=0 Dai (j bi,v )
(2.9)
com i = 1, 2, , I, j = 1, 2, , n, e k = 0, 1, , mi .
Se o n
umero de categorias de respostas e (mi + 1), somente mi parametros
de categoria do item podem ser identificados. Qualquer um dos (mi + 1)
par
ametros de dificuldade das categorias pode ser arbitrariamente definido
com qualquer valor. A raz
ao e que o termo incluso no parametro e cancelado
no numerador e no denominador do modelo. Em geral, definimos bi,0 0.
Os par
ametros de categoria do item, bi,k , sao os pontos na escala de j em
as curvas de Pi,k1 (j ) e Pi,k (j ) se interceptam. Essas duas func
oes se interceptam somente uma vez, e a intersecc
ao pode ocorrer em qualquer ponto da
escala j . Ent
ao, sob a hipotese de que ai > 0,
se
j = bi,k
ent
ao
Pi,k (j ) = Pi,k1 (j ),
se
j > bi,k
ent
ao
se
j < bi,k
ent
ao
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
25
bi,k = bi dk .
Mas, e importante ressaltar que, diferentemente do modelo de escala gradual, aqui os valores de dk n
ao s
ao necessariamente ordenados sequencialmente
dentro de um item. O par
ametro dk e interpretado como a dificuldade relativa
da categoria k em comparac
ao com as outras categorias do item ou o desvio
da dificuldade de cada categoria em relac
ao `a locac
ao do item, bi .
Assim, em testes compostos por itens com (mi + 1) categorias de resposta,
mi parametros de categoria necessitam ser estimados, alem dos parametros de
inclinac
aho e de locac
ao ide cada item. Logo, se tivermos um teste com I itens,
PI
teremos
ametros de item a serem estimados.
i=1 mi + 2I par
1
1+
eDai (jk bi )
(2.10)
com i = 1, 2, , I, j = 1, 2, , nk , e k = 1, 2, , K, onde:
Uijk e uma vari
avel dicotomica que assume os valores 1, quando o indivduo j
da populac
ao k responde corretamente ao item i, ou 0 quando o indivduo
n
ao responde corretamente ao item.
jk representa a habilidade do j-esimo indivduo da populac
ao k.
P (Uijk = 1|jk ) e a probabilidade de um indivduo j da populac
ao k, com
habilidade jk , responder corretamente ao item i.
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
26
Modelos Matem
aticos
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
Captulo 3
Estima
c
ao: uma u
nica populac
ao
3.1 Introduc
ao
Uma das etapas mais importantes da TRI e a estimac
ao dos parametros dos
itens e das habilidades dos respondentes. Como foi visto no captulo anterior,
a probabilidade de uma resposta correta a um determinado item depende
somente da habilidade do indivduo e dos parametros que caracterizam o item.
Mas, em geral, ambos sao desconhecidos. Apenas as respostas dos indivduos
aos itens do teste sao conhecidas.
Assim, nos modelos de resposta ao item temos um problema de estimac
ao
que envolve dois tipos de parametros, os parametro dos itens e as habilidades
dos indivduos. Ent
ao, do ponto de vista te
orico, podemos dividir o problema
em tres situac
oes, quando ja conhecemos os parametros dos itens, temos apenas
que estimar as habilidades; se j
a conhecemos as habilidades dos respondentes,
estaremos interessados apenas na estimac
ao dos parametros dos itens e, por
fim, a situac
ao mais comum, em que desejamos estimar os parametros dos
itens e as habilidades dos indivduos simultaneamente. Na TRI, o processo de
estimac
ao dos parametros dos itens e conhecido como calibrac
ao.
Em qualquer uma das situac
oes citadas acima, geralmente a estimac
ao e feita
pelo Metodo da Maxima Verossimilhanca atraves da aplicac
ao de algum processo iterativo, como o algoritmo Newton-Raphson (ver Issac & Keller (1966),
por exemplo) ou Scoringde Fisher (ver Rao (1973), por exemplo). Alguns
procedimentos bayesianos tambem sao aplicados com bastante freq
uencia (ver
Mislevy (1986a), por exemplo).
Na situac
ao em que desejamos estimar tanto os parametros dos itens, quanto
as habilidades, ha duas abordagens usuais: estimac
ao conjunta, parametros dos
itens e habilidades, ou em duas etapas, primeiro a estimac
ao dos parametros
dos itens e, posteriormente, das habilidades. No caso da estimac
ao conjunta,
http://www.keimelion.com.br
Keimelion
Reviso de textos
28
Estima
c
ao: uma u
nica popula
c
ao
o n
umero de par
ametros a serem estimados simultaneamente pode ser extremamente grande (3I + n, para o ML3), levando a uma enorme exigencia
computacional que envolve a invers
ao de matrizes dessa ordem. Para contornar esse problema, Birnbaum (1968) prop
os um processo vai e volta (backand-forth), que e iniciado com estimativas grosseiras das habilidades (escores padronizados, por exemplo) e envolve a estimac
ao dos parametros dos
itens considerando as habilidades conhecidas; ap
os a obtenc
ao das estimativas dos parametros dos itens, as estimac
oes das habilidades sao feitas considerando conhecidos os parametros dos itens. Esses passos s
ao repetidos ate
que algum criterio de parada do processo seja alcancado. A grande vantagem
desse metodo e que ele permite, a partir da Independencia Local discutida
no Captulo 2, que os itens sejam estimados individualmente, o que exige o
tratamento de matrizes 3 3 para o ML3. De forma similar, a partir da independencia entre as respostas oriundas de indivduos diferentes, as habilidades
tambem sao estimadas individualmente, e com isso a exigencia computacional diminui drasticamente. Entretanto, esse procedimento tem um problema
serio: sabe-se que, para os parametros dos itens conhecidos, os Estimadores de
M
axima Verossimilhanca (EMV) das habilidades convergem (ver Sen & Singer (1993), por exemplo) para os seus verdadeiros valores quando o n
umero de
itens cresce; com as habilidades conhecidas, os EMV dos par
ametros dos itens,
b , convergem para os seus verdadeiros valores quando o n
u
mero
de indivduos
i
cresce. Na estimac
ao conjunta, as habilidades s
ao denominadas de par
ametros
incidentais, pois o n
umero destes parametros (j ) cresce com o n
umero de
indivduos; os parametros dos itens sao denominados de par
ametros estruturais, e o n
umero desses parametros nao se altera quando a amostra cresce.
Essas denominac
oes sao devidas a Neyman & Scott (1948), que notaram, em
um contexto diferente ao da TRI, que na presenca de parametros incidentais o EMV dos par
ametros dos itens pode ser assintoticamente viesado. Esse
problema de falta de consistencia dos parametros dos itens (ou habilidades)
na presenca de um n
umero muito grande de indivduos (ou itens) foi notado
por Andersen (1973) e demonstrado para o modelo de Rasch (ML1). Porem,
quando o n
umero de itens e o n
umero de indivduos crescem, os EMV dos
par
ametros dos itens e das habilidades podem ser nao-viciados, como sugerido
por Lord (1968) e demonstrado apenas para o modelo de Rasch por Haberman (1975). Resultados numericos obtidos por Lord (1975) e Swaminathan &
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.1 Introdu
c
ao
29
Gifford (1983) reforcam a conjectura de que os EMV dos parametros dos itens
e das habilidades sao nao-viciados, quando o n
umero de itens e o n
umero de
indivduos crescem.
O problema de possvel inconsistencia dos estimadores obtidos em uma etapa
levou ao desenvolvimento da estimac
ao em duas etapas por Bock & Lieberman (1970). Este metodo baseia-se na existencia de uma distribuic
ao (latente)
associada `a habilidade dos indivduos da populac
ao em estudo (ver Andersen (1980) para maiores detalhes). Isso possibilita que a estimac
ao dos itens
seja feita pelo Metodo da M
axima Verossimilhanca Marginal, ou seja, considerando uma determinada distribuic
ao para a habilidade dos indivduos de
, cuja func
ao densidade de probabilidade (f dp) e g(|), onde e o conjunto de par
ametros associados `a , e integrando a func
ao de verossimilhanca
com relac
ao a . Apos a estimac
ao dos parametros dos itens, as habilidades
sao estimadas individualmente por maxima verossimilhanca ou pela moda ou
media da distribuic
ao condicional de j dado uj. = (uj1 , , ujI ), o vetor
de respostas do indivduo j, j = 1, , n, com i = (ai , bi , ci ), o vetor de
parametros do item i, i = 1, , I, conhecidos. Embora este metodo tenha a
vantagem de envolver, na primeira etapa, apenas a estimac
ao dos parametros
dos itens, a estimac
ao e feita atraves de aplicac
ao de metodos numericos que
dependem das derivadas segundas da log-verossimilhanca com relac
ao a i e
k , i, k = 1, , I, que podem ser nao nulas para i 6= k. Com isso, h
a a necessidade da invers
ao de matrizes de ordem 3I 3I para o ML3, o que ainda
pode ser bastante exigente do ponto de vista computacional. Para contornar
esse problema, Bock & Aitkin (1981) fizeram uma modificac
ao no modelo de
Bock & Lieberman adicionando a suposic
ao de independencia entre os itens,
de forma que as derivadas segundas citadas acima para i 6= k sejam nulas.
Com isso, a matriz 3I 3I (no ML3) de derivadas segundas torna-se blocodiagonal, o que possibilita que os (parametros dos) itens sejam estimados individualmente. Adicionalmente, Bock & Aitkin prop
oem que a obtenc
ao das
estimativas de maxima verossimilhanca seja feita com a aplicac
ao do algoritmo
EM introduzido por Dempster, Laird & Rubin (1977).
Embora existam outras propostas de estimac
ao para os parametros dos itens
e habilidades, as citadas acima podem ser consideradas as mais importantes
e, portanto, ser
ao exploradas nesse texto. Na Sec
ao 3.2 consideraremos o caso
da estimac
ao dos parametros dos itens quando as habilidades s
ao conhecidas.
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
30
Estima
c
ao: uma u
nica popula
c
ao
Na Sec
ao 3.3 consideraremos a situac
ao contr
aria: estimac
ao das habilidades
com os parametros dos itens conhecidos. Em complemento a essas duas sec
oes,
na Sec
ao 3.4, trataremos da estimac
ao conjunta: parametros dos itens e habilidades, em uma etapa. Na Sec
ao 3.5 tambem consideraremos a estimacao
conjunta dos par
ametros dos itens e habilidades, mas agora em duas etapas
atraves da maxima verossimilhanca marginal. Na Sec
ao 3.6 complementaremos a etapa de estimac
ao considerando a abordagem bayesiana, tanto dos
parametros dos itens quanto das habilidades. Recomenda-se a leitura de Baker (1992) para maiores detalhes das ideias e resultados que serao apresentados
nesse captulo.
Em todos os metodos de estimac
ao descritos a seguir, algumas notac
oes e
suposic
oes serao necessarias para o desenvolvimento do modelo. Em particular,
sejam j a habilidade e Uji a variavel aleatoria que representa a resposta
(bin
aria) do indivduo j ao item i, com
1, resposta correta,
Uji =
0, resposta incorreta.
Sejam U j. = (Uj1 , Uj2 , , UjI ) o vetor aleatorio de respostas do indivduo j
e U .. = (U 1. , , U n. ) o conjunto integral de respostas. De forma similar, representaremos as observac
oes por uji , uj. e u.. . Ainda, = (1 , , n ) representar
a o vetor de habilidades dos n indivduos e = ( 1 , , I ) o conjunto
de parametros dos itens.
As duas principais suposic
oes que usaremos em todo o restante deste texto,
sao as seguintes:
(S1) as respostas oriundas de indivduos diferentes sao independentes,
(S2) os itens s
ao respondidos de forma independente por cada indivduo (Independencia Local), fixada sua habilidade.
A suposic
ao (S2) necessita de uma discussao um pouco mais detalhada: ela
garante que, para cada valor de , se tomarmos um conjunto de indivduos
com habilidade , as covari
ancias entre as respostas para cada par de itens
ser
ao nulas. Entretanto, se for considerado um conjunto de indivduos com
habilidades variadas, estas covariancias nao necessariamente ser
ao nulas. Na
verdade, elas serao positivas (ver Lord & Novick (1968, p
ag. 361)).
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.2 Estima
c
ao dos par
ametros dos itens
31
3.2 Estimac
ao dos par
ametros dos itens
Nesta sec
ao trataremos da estimac
ao dos parametros dos itens pelo metodo
da maxima verossimilhanca, quando as habilidades sao conhecidas. Embora
qualquer modelo descrito no Captulo 2 possa ser adotado para fins de aplicac
ao,
o ML3 tem sido amplamente empregado e, por isso, o usaremos para efeito
de exemplificac
ao. Os modelos ML1 e ML2 sao casos particulares do ML3; a
escolha desse u
ltimo leva a resultados que servem para os dois primeiros.
Pela independencia entre as respostas de diferentes indivduos (S1) e a independencia local (S2), podemos escrever a verossimilhanca, L() = P (U .. =
u.. |, ), como
L() =
n
Y
P (U j. = uj. |j , )
j=1
n Y
I
Y
P (Uji = uji |j , i ),
j=1 i=1
onde na u
ltima igualdade usamos que a distribuic
ao de Uji so depende de
atraves de i . Usando a notac
ao Pji = P (Uji = 1|j , i ) e Qji = 1 Pji , temos
que
P (Uji = uji |j , i ) = P (Uji = 1|j , i )uji P (Uji = 0|j , i )1uji
u
1uji
= Pjiji Qji
(3.1)
Portanto,
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
32
Estima
c
ao: uma u
nica popula
c
ao
L() =
n Y
I
Y
1uji
Pjiji Qji
(3.2)
j=1 i=1
log L() =
n X
I
X
{uji log Pji + (1 uji ) log Qji }.
(3.3)
j=1 i=1
Os Estimadores de M
axima verossimilhanca (EMV) de i , i = 1, , I, sao
os valores que maximizam a verossimilhanca, ou equivalente, sao as soluc
oes
da equac
ao
log L()
= 0,
i
i = 1, , I.
Notemos que
log L()
i
=
=
=
=
n
X
(log Pji )
(log Qji )
uji
+ (1 uji )
i
i
j=1
n
X
Pji
Pji
1
1
(1 uji )
uji
Pji i
Qji i
j=1
n
X
Pji
1
1
uji
(1 uji )
Pji
Qji
i
j=1
n
X
uji Pji
Pji
.
Pji Qji
i
(3.4)
j=1
http://www.keimelion.com.br
(3.5)
SINAPE 2000
Keimelion
Reviso de textos
3.2 Estima
c
ao dos par
ametros dos itens
33
onde
Pji = {1 + eDai (j bi ) }1
Qji = 1 Pji .
(3.6)
log L()
i
n
X
j=1
Wji
(uji Pji )
Pji Qji
Pji
i
(3.7)
Pji
ai
Pji
bi
Pji
ci
(3.8)
(3.9)
= Qji .
(3.10)
log L()
ai
n
X
j=1
n
X
j=1
(uji Pji )
Pji
ai
Wji
Pji Qji
Wji
(uji Pji )D(1 ci )(j bi )Pji Qji
Pji Qji
n
X
= D(1 ci )
(uji Pji )(j bi )Wji .
(3.11)
j=1
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
34
Estima
c
ao: uma u
nica popula
c
ao
log L()
bi
n
X
j=1
n
X
(uji Pji )
j=1
Pji
bi
Wji
Pji Qji
Wji
(uji Pji )(1)Dai (1 ci )Pji Qji
Pji Qji
= Dai (1 ci )
n
X
(3.12)
j=1
Para o par
ametro de acerto ao acaso, temos de (3.7) e (3.10) que
log L()
ci
n
X
j=1
n
X
j=1
n
X
(uji Pji )
Pji
ci
(
(uji Pji )Qji
(
(uji Pji )
j=1
Wji
Pji Qji
)
Wji
Pji Qji
)
Wji
Pji
(3.13)
Em resumo, as equac
oes de estimac
ao para os parametros ai , bi e ci sao,
respectivamente,
ai :
D(1 ci )
n
X
(uji Pji )(j bi )Wji = 0,
(3.14)
j=1
bi :
Dai (1 ci )
n
X
(uji Pji )Wji = 0,
(3.15)
j=1
ci :
n
X
j=1
(uji Pji )
Wji
= 0.
Pji
(3.16)
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.2 Estima
c
ao dos par
ametros dos itens
35
q Y
I
Y
fki
rki fki rki
L() =
P Q
,
rki ki ki
k=1 i=1
e a log-verossimilhanca,
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
36
Estima
c
ao: uma u
nica popula
c
ao
log L() = C +
q X
I
X
(3.17)
k=1 i=1
ki
P
P
onde C = qk=1 Ii=1 log frki
e constante com relac
ao a . Tomando a derivada de (3.17) com relac
ao a i , teremos
q
X
1
Pki
1
Qki
=
rki
+ (fki rki )
Pki i
Qki i
k=1
q
X
1
Pki
=
(rki fki Pki )
Pki Qki
i
k=1
q
X
Pki
Wki
,
=
(rki fki Pki )
Pki Qki i
log L()
i
k=1
onde a u
ltima igualdade e devida a (3.5). Usando as expressoes (3.8) a (3.10),
temos que as equac
oes de estimac
ao para os parametros ai , bi e ci sao, respectivamente,
ai :
D(1 ci )
q
X
(rki fki Pki )(k bi )Wki = 0,
(3.18)
k=1
bi :
Dai (1 ci )
q
X
(3.19)
k=1
ci :
q
X
Wki
(rki fki Pki ) = 0.
Pki
(3.20)
k=1
Estas equac
oes, bem como (3.14) a (3.16), nao possuem soluc
ao explcita e
por isso precisaremos de algum metodo iterativo para a obtenc
ao das estimativas de maxima verossimilhanca dos parametros dos itens. A seguir, damos
uma breve descric
ao do algoritmo Newton-Raphson e do metodo Scoringde
Fisher.
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.2 Estima
c
ao dos par
ametros dos itens
37
3.2.1 Aplicac
ao do algoritmo Newton-Raphson
Seja l() = log L() a log-verossimilhanca, onde = ( 1 , , I ), com i =
b(0) = (a(0) , b(0) , c(0) )0 podem ser encontrados
(ai , bi , ci )0 . Se valores iniciais
i
b(1) =
b(0) +
b(0) , ou seja,
para i , ent
ao uma estimativa atualizada ser
a
i
i
i
(1)
(0)
(0)
(1)
ci
(0)
ci
(0)
ci ,
a
i
= a
i +
ai ,
(1)
(0)
(0)
b
= bi + bi ,
i
=
(3.21)
(0)
(0)
(0)
onde
ai , bi e
ci s
ao erros de aproximac
ao. Usando a expansao em
(0)
b , teremos
serie de Taylor de l()/ em torno de
i
l()
ai
l()
bi
l()
ci
2 b(0)
2 b(0)
2 b(0)
b(0) )
l(
(0) l( i )
(0) l( i )
(0) l( i )
i
b(0) ),
+
ai
+ bi
+
ci
+ Rai (
i
2
ai
ai bi
ai ci
ai
2 b(0)
2 b(0)
2 b(0)
b(0) )
l(
(0) l( i )
(0) l( i )
(0) l( i )
i
b(0) ),
+ bi
+
ci
+ Rbi (
+ bi
i
2
bi
bi ai
bi ci
bi
2 b(0)
2 b(0)
2 b(0)
b(0) )
l(
(0) l( i )
(0) l( i )
(0) l( i )
i
b(0) ),
+
ai
+
ci
+ Rci (
+ bi
i
2
ci
ci ai
ci bi
ci
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
38
Estima
c
ao: uma u
nica popula
c
ao
(0)
b )
l(
i
L1 =
ai
L11
b(0) )
2 l(
i
=
a2i
L21
b )
2 l(
i
=
bi ai
L31
b )
2 l(
i
=
ci ai
(0)
(0)
L12
L22
b(0) )
2 l(
i
=
2
bi
L32
b(0) )
2 l(
i
=
ci bi
(0)
b )
l(
i
L2 =
bi
(0)
b )
l(
i
L3 =
ci
(0)
b )
2 l(
i
=
ai bi
(0)
L13
b )
2 l(
i
=
,
ai ci
L23
b(0) )
2 l(
i
,
=
bi ci
L33
b(0) )
2 l(
i
=
,
2
ci
(0)
(0)
(0)
e desprezando os restos Rai (bi ), Rbi (bi ) Rci (bi ), teremos
(0)
(0)
(0)
0 = L1 + L11
ai + L12 bi + L13
ci ,
(0)
(0)
(0)
0 = L2 + L12
a + L22 b + L23
c ,
0 = L3 +
i
(0)
L13
ai
i
(0)
L23 bi
i
(0)
L33
ci .
a
L1
L11 L12 L13
i
L2 = L21 L22 L23 b(0)
.
i
(0)
L3
L31 L32 L33
ci
(0)
b , teremos
Resolvendo o sistema para
i
(0)
ai
L11 L12 L13
L1
(0)
bi = L21 L22 L23 L2 ,
(0)
L31 L32 L33
L3
ci
e finalmente, por (3.21)
(1) (0)
1
a
i
a
i
L11 L12 L13
L1
(1) (0)
bi = bi L21 L22 L23 L2 .
(1)
(0)
L31 L32 L33
L3
ci
ci
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.2 Estima
c
ao dos par
ametros dos itens
39
2
n
X
uji Pji
uji Pji
Pji 0
Pji
+
=
i
Pji Qji
i
Pji Qji
i 0i
j=1
2
n
X
vji
Pji 0
Pji
+ vji
,
(3.22)
=
i
i
i 0i
j=1
onde
vji =
uji Pji
Pji Qji
(3.23)
uji Pji
vji
=
=
i
i
Pji Qji
Pji
Pji Qji
1
(uji Pji )
=
Pji Qji
(Pji Qji )2
i
i
Pji
Pji
Pji
1
+ (uji Pji )
2Pji
=
Pji Qji
(Pji Qji )2
i
i
i
Pji
1
=
{Pji Qji + (uji Pji )(1 2Pji )}
(Pji Qji )2
i
Pji
1
,
=
(uji Pji )2
2
(Pji Qji )
i
Pji
2
.
(3.24)
= vji
i
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
40
Estima
c
ao: uma u
nica popula
c
ao
Au
ltima igualdade segue do fato que uji = u2ji .
(t)
b a estimativa de na iterac
Considerando
ao t, ent
ao na iterac
ao t + 1
i
i
do algoritmo Newton-Raphson teremos que
b(t+1) =
b(t) [H(
b(t) )]1 h(
b(t) ).
i
i
i
i
(3.25)
log L()
i
(
)
n
X
Wji
=
(uji Pji ) (Pji Qji )hji
Pji Qji
h( i )
j=1
n
X
(3.26)
j=1
H( i )
=
=
log L()
i 0i
(
n
X
uji Pji
j=1
n
X
Pji Qji
(Pji Qji )H ji
uji Pji
Pji Qji
)
(Pji Qji )2 hji h0ji
(3.27)
j=1
com
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.2 Estima
c
ao dos par
ametros dos itens
Pji
i
41
D(1 ci )(j bi )
= Dai (1 ci ) ,
1
Pji
2 Pji
=
i 0i
D2 (1 ci )(j bi )2 (1 2Pji )
.
.
= D(1 ci ){1 + Dai (j bi )(1 2Pji )} D2 a2i (1 ci )(1 2Pji ) . .
D(j bi )
Dai
0
(Pji Qji )1
h( i ) =
q
X
k=1
H( i ) =
q
X
(rki fki Pki )Wki H ki (rki fki Pki )Wki hki h0ki .
k=1
3.2.2 Aplicac
ao do m
etodo Scoringde Fisher
Para aplicac
ao do metodo Scoringde Fisher, devemos substituir os componentes da matriz de derivadas segundas usadas no processo iterativo de
Newton-Raphson pelos seus valores esperados. Notando que a vari
avel Uji so
pode assumir dois valores: 1, com probabilidade Pji e 0 com probabilidade
Qji , ent
ao Uji tem distribuic
ao Bernoulli(Pji ). Segue que E(Uji ) = Pji e
E(Uji Pji )2 = V ar(Uji ) = Pji Qji . Logo, de (3.27), temos que
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
42
Estima
c
ao: uma u
nica popula
c
ao
( i ) E(H( i ))
=
N
X
N
X
N
X
(3.28)
j=1
( i ) =
q
X
Pki
Qki Wki hki h0ki .
k=1
i
i
i
i
3.2.3 Erro-padr
ao
Os estimadores de m
axima verossimilhanca gozam de propriedades assint
oticas conhecidas, tais como vcio nulo e eficiencia. Sob algumas condic
oes
de regularidade (ver Sen & Singer (1993), por exemplo) a distribuic
ao asb , e normal com vetor de
sint
otica do estimador de maxima verossimilhanca,
i
media i e matriz de covari
ancias dada pela inversa da matriz de informacao
I( i ) = E
2 log L()
i 0i
= ( i ),
(3.29)
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.2 Estima
c
ao dos par
ametros dos itens
43
(3.30)
i = bi T,Ui ,
(3.31)
onde e a func
ao de distribuic
ao associada `a N(0,1). Vale notar que no caso de
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
44
Estima
c
ao: uma u
nica popula
c
ao
usar a func
ao Logstica para a FRI, o fator D = 1, 702 torna os modelos Normal
e Logstico muito proximos (ver Halley (1952)) de forma que as express
oes
(3.30) e (3.31) produzem bons resultados para o modelo logstico.
3.3 Estimac
ao das habilidades
Nesta sec
ao vamos tratar da estimac
ao das habilidades quando os par
ametros dos itens sao conhecidos. Na pratica, essa situac
ao ocorre quando os itens
j
a foram calibrados (estimados) em outros testes. Como a calibrac
ao dos itens
deve ser feita com um n
umero grande de indivduos, a estimac
ao das habilidades de um grupo pequeno de indivduos e mais confiavel se forem utilizados
itens j
a calibrados.
Pela independencia entre as respostas de diferentes indivduos (S1) e a independencia local (S2), podemos escrever a log-verossimilhanca como em (3.3),
agora como func
ao de e nao de , ou seja,
log L() =
n X
I
X
(3.32)
j=1 i=1
log L()
= 0,
j
j = 1, , n.
(3.33)
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.3 Estima
c
ao das habilidades
log L()
j
45
I
X
(log Pji )
(log Qji )
uji
+ (1 uji )
(3.34)
j
j
i=1
I
X
Pji
Pji
1
1
uji
(1 uji )
Pji j
Qji j
i=1
I
X
Pji
1
1
(1 uji )
uji
Pji
Qji
j
i=1
I
X
uji Pji
Pji
(3.35)
Pji Qji
j
i=1
(
)
I
X
Wji
Pji
(uji Pji )
,
(3.36)
Pji Qji
j
=
=
=
=
=
i=1
onde a u
ltima igualdade segue de (3.5). Como
Pji
j
(3.37)
obtem-se
log L()
j
I
X
i=1
= D
Wji
(uji Pji )Dai (1 ci )Pji Qji
Pji Qji
I
X
(3.38)
i=1
I
X
(3.39)
i=1
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
46
Estima
c
ao: uma u
nica popula
c
ao
3.3.1 Aplicac
ao do algoritmo Newton-Raphson
(t)
De forma similar ao que foi feito na Sec
ao 3.2.1, e considerando bj a
estimativa de j na iterac
ao t, ent
ao na iterac
ao t + 1 do algoritmo NewtonRaphson teremos que
(t+1)
(t)
(t)
(t)
bj
= bj [H(bj )]1 h(bj )
(3.40)
h(j )
i=1
I
X
i=1
e
2 log L()
j2
(
)
2
I
X
uji Pji
u
P
ji
ji
=
(Pji Qji )Hji
(Pji Qji )2 h2ji
Pji Qji
Pji Qji
H(j )
i=1
I
X
(3.41)
i=1
com
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.3 Estima
c
ao das habilidades
47
hji =
(Pji Qji )1
Pji
j
= Dai (1 ci )
(3.42)
(3.43)
Hji =
(Pji Qji )1
2 Pji
j2
3.3.2 Aplicac
ao do m
etodo Scoringde Fisher
Para aplicac
ao do metodo Scoringde Fisher, devemos substituir os componentes da matriz de derivadas segundas usadas no processo iterativo de
Newton-Raphson pelos seus valores esperados. Por (3.41) temos que
(j ) E(H(j ))
=
I
X
I
X
(3.44)
i=1
3.3.3 Erro-padr
ao
Sob algumas condic
oes de regularidade (ver Sen & Singer (1993), por exemplo) a distribuic
ao assint
otica do estimador de m
axima verossimilhanca, bj , e
normal com media j e vari
ancia dada pela inversa da matriz de informac
ao
I(j ) = E
2 log L()
j2
!
= (j ),
(3.45)
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
48
Estima
c
ao: uma u
nica popula
c
ao
3.4 Estimac
ao conjunta: par
ametros dos itens e habilidades
Nesta etapa trataremos do caso mais comum, em que nem os parametros
dos itens e nem as habilidades sao conhecidos. As Sec
oes 3.2 e 3.3 compoem as
partes basicas da estimac
ao conjunta. Nas expressoes (3.14) a (3.16) e (3.39)
temos as equac
oes de estimac
ao para os parametros dos itens e habilidades.
Entretanto, estas equac
oes nao apresentam express
oes explicitas para os respectivos EMV. Por conta disso, algum processo iterativo deve ser aplicado
no processo de maximizac
ao e, como conseq
uencia, algumas quantidades ou
suposic
oes podem ser adicionadas ao modelo.
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.4 Estima
c
ao conjunta: par
ametros dos itens e habilidades
49
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
50
Estima
c
ao: uma u
nica popula
c
ao
para i 6= l.
(3.46)
para j 6= l.
(3.47)
para i = 1, , I e j = 1, , n.
(3.48)
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.5 M
axima verossimilhan
ca marginal
51
Est
agio 1: Comecando com estimativas iniciais para as habilidades (escores
padronizados, por exemplo) e tratando estas habilidade como conhecidas, estimamos i , i = 1, , I.
Est
agio 2: Comecando com estimativas iniciais (obtidas no Estagio 1) para
e tratando estes parametros como conhecidos, estimamos as habilidades
j , j = 1, , n.
No Estagio 1, os itens sao estimados empregando o desenvolvimento da
Sec
ao 3.2. No Estagio 2 as habilidades sao estimadas com a teoria desenvolvida
na Sec
ao 3.3. Este processo de dois est
agios e repetido ate a convergencia das
habilidades e dos parametros dos itens.
Coment
arios
b , i = 1, , I, e bj , j = 1, , n, continuam sendo
Os erros-padr
ao para
i
obtidos com o uso das express
oes (3.29) e (3.45). Alem disso, a estimac
ao
conjunta apresenta os mesmos problemas ja citados anteriormente, ou seja,
quando algum item e respondido corretamente, ou incorretamente, por todos
os indivduos, ou quando algum indivduo responde corretamente, ou incorretamente, a todos os itens. Mais adiante, nesse captulo e no Captulo 7,
veremos como tratar destes casos.
3.5 M
axima verossimilhanca marginal
O metodo da Maxima Verossimilhanca Marginal, proposto por Bock & Lieberman (1970 apresenta algumas vantagens em relac
ao ao metodo da Maxima
Verossimilhanca Conjunta. A proposta desse metodo e fazer a estimac
ao em
duas etapas: primeiro os parametros dos itens e, posteriormente, as habilidades. Como as habilidades n
ao sao conhecidas, precisaremos usar algum artifcio
de forma que a verossimilhanca nao seja mais func
ao das habilidades. Anderson (1980) argumenta que se considerarmos uma populac
ao composta por n
indivduos com habilidades j , j = 1, , n, e construirmos a distribuic
ao de
frequencia acumulada G()=(n
umero de j : j )/n, ent
ao, se n for suficientemente grande os j estar
ao bastante proximos de forma que G() pode ser
aproximada por uma distribuic
ao contnua. A densidade g(), relativa `a G(),
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
52
Estima
c
ao: uma u
nica popula
c
ao
onde na u
ltima igualdade usamos que a distribuic
ao de U j. n
ao e func
ao de
e IR representa o conjunto dos n
umeros reais. Usando a independencia entre as
respostas de diferentes indivduos, podemos escrever a probabilidade associada
ao vetor de respostas U .. como
P (u.. |, ) =
n
Y
P (uj. |, ).
(3.50)
j=1
Embora a verossimilhanca possa ser escrita como (3.50), tem sido freq
uente
utilizar a abordagem de Padr
oes de Resposta. Como temos I itens no total,
com 2 possveis respostas para cada item (0 ou 1), h
a S = 2I possveis respostas
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.5 M
axima verossimilhan
ca marginal
53
rj = n.
(3.51)
j=1
L(, ) = Qs
n!
j=1 rj !
s
Y
[P (uj. |, )]rj ,
(3.52)
j=1
e, portanto, a log-verossimilhanca e
(
n!
log L(, ) = log Qs
j=1 rj !
s
X
rj log P (uj. |, ).
j=1
As equac
oes de estimac
ao para os parametros dos itens sao dadas por
log L(, )
= 0,
i
i = 1, , I,
(3.53)
com
log L(, )
i
rj log P (uj. |, )
i
j=1
s
X
j=1
rj
P (uj. |, )
1
.
P (uj. |, )
i
(3.54)
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
54
Estima
c
ao: uma u
nica popula
c
ao
Mas
P (uj. |, )
i
P (uj. |, )g(|)d
i IR
P (uj. |, ) g(|)d
=
IR i
!
Z
I
Y
P (ujl |, l ) g(|)d
=
i
IR
(3.55)
l=1
P (uj. |, )
i
P (uji |, i ) g(|)d
i
IR
l6=i
Z
P (uji |, i )/ i
=
P (uj. |, )g(|)d,
(3.56)
P (uji | i )
IR
Z
I
Y
P (ujl |, l )
P (uji |, i ) =
P i Qi
i
i
1u
u
u 1 Pi
u
Qi ji + (1 uji )Qi ji
Pi Pi ji
= uji Pi ji
i
i
P
u 1 1u
u
u
i
.
=
uji Pi ji Qi ji (1 uji )Qi ji Pi ji
i
Notemos agora que o termo entre parenteses vale 1 quando uji = 1 e vale -1
quando uji = 0, portanto podemos reescreve-lo como (1)uji +1 . Com isso,
P (uji |, i ) = (1)uji +1
i
http://www.keimelion.com.br
Pi
i
(3.57)
SINAPE 2000
Keimelion
Reviso de textos
3.5 M
axima verossimilhan
ca marginal
55
(
=
Qi
Pi
se uji = 1
se uji = 0,
(3.58)
podemos reescrever este termo como uji Pi . Segue que (3.56) pode ser escrita
como
P (uj. |, )
i
Z
=
IR
(uji Pi )
Pi Qi
Pi
i
P (uj. |, )g(|)d
(3.59)
Wi =
Pi Qi
,
Pi Qi
(3.60)
onde
Pi = {1 + eDai (bi ) }1
Qi = 1 Pi .
(3.61)
Z
IR
(uji Pi )
Pi
i
Wi
P (uj. |, )g(|)d.
Pi Qi
(3.62)
Usando a notac
ao
gj () g(|uj. , , ) =
P (uj. |, )g(|)
,
P (uj. |, )
(3.63)
s
X
j=1
Z
rj
IR
(uji Pi )
Pi
i
Wi
g ()d.
Pi Qi j
(3.64)
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
56
Estima
c
ao: uma u
nica popula
c
ao
log L(, )
=
ai
Z
s
X
Pi
Wi
(uji Pi )
=
rj
Q gj ()d
a
P
i
IR
i
i
j=1
Z
s
X
Wi
=
rj
(uji Pi )D(1 ci )( bi )Pi Qi gj ()d
Pi Qi
I
R
j=1
Z
s
X
= D(1 ci )
rj
[(uji Pi )( bi )Wi ] gj ()d.
(3.65)
IR
j=1
Para o par
ametro de dificuldade, bi , temos que
log L(, )
=
bi
Z
s
X
Pi
Wi
=
rj
(uji Pi )
Q gj ()d
b
P
i
IR
i
i
j=1
Z
s
X
Wi
=
rj
(uji Pi )(1)Dai (1 ci )Pi Qi gj ()d
Pi Qi
IR
j=1
Z
s
X
= Dai (1 ci )
rj
[(uji Pi )Wi ] gj ()d.
(3.66)
j=1
IR
Para o par
ametro de acerto ao acaso, ci , temos que
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.5 M
axima verossimilhan
ca marginal
57
Z
Pi
Wi
(uji Pi )
Q gj ()d
c
P
i
IR
i
i
j=1
Z
s
X
Wi
=
rj
(uji Pi )Qi gj ()d
Pi Qi
IR
j=1
Z
s
X
Wi
=
rj
(uji Pi ) gj ()d.
(3.67)
Pi
IR
log L(, )
ci
s
X
rj
j=1
Em resumo, as equac
oes de estimac
ao para os parametros ai , bi e ci s
ao,
respectivamente,
ai
D(1 ci )
s
X
Z
rj
j=1
bi
ci
:
:
Dai (1 ci )
s
X
j=1
Z
rj
IR
s
X
j=1
IR
rj
IR
Wi
(uji Pi ) gj ()d = 0,
Pi
(3.69)
(3.70)
3.5.2 M
etodos iterativos
Para aplicac
ao do algoritmo Newton-Raphson, precisaremos das derivadas
segundas de log L(, ). Quando desenvolvemos as express
oes para a estimac
ao
de i na Sec
ao 3.2, a propriedade de independencia local foi suficiente para garantir que os (parametros dos) itens pudessem ser estimados individualmente,
pois a derivada segunda de log L() com relac
ao a i e l , para l 6= i, era
nula. Entretanto, na estimac
ao por maxima verossimilhanca marginal isso n
ao
acontece, levando `a necessidade da estimac
ao dos I itens conjuntamente. As
expressoes para as derivadas segundas s
ao obtidas a partir de
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
58
Estima
c
ao: uma u
nica popula
c
ao
log L(, ) 0
2 log L(, )
=
l
i
l 0i
0
s
X
P (uj. |, )
1
rj
=
l
P (uj. |, )
i
j=1
s
X
P (uj. |, )/( l 0i )
P (uj. |, )/ l
P (uj. |, )/ i 0
=
rj
.
P (uj. |, )
P (uj. |, )
P (uj. |, )
j=1
(3.71)
para i, l = 1, , I.
b(t) a estimativa de na iterac
Considerando
ao t, ent
ao na iterac
ao t + 1
teremos que
b(t+1) =
b(t) [H P I (
b(t) )]1 hP I (
b(t) )
(3.72)
onde
h( 1 )
hP I () = ...
h( I )
com
H( 1 , 1 )
..
..
H P I () =
.
.
H( I , 1 )
log L(, )
i
s
X Z
=
rj
(uji Pi )Wi hi gj ()d,
H( 1 , I )
..
,
.
H( I , I )
h( i ) =
j=1
(3.73)
IR
e
2 log L(, )
l 0i
s
n
o
X
=
rj H il(j) hi(j) h0l(j) .
H( i , l ) =
(3.74)
j=1
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.5 M
axima verossimilhan
ca marginal
59
( i , l ) = E[H( i , l )] =
s
X
rj [hi(j) hi(j) ].
j=1
3.5.3 M
etodos de quadratura
Antes de prosseguir, vamos discutir um problema importante encontrado
na implementac
ao da estimac
ao dos parametros dos itens. Podemos notar que
as equac
oes (3.68) a (3.70), por exemplo, envolvem integrais que n
ao apresentam soluc
ao analtica. Por conta disso, algum meio deve ser encontrado para
a soluc
ao (aproximac
ao) numerica de uma integral. Embora existam muitos
metodos de aproximac
oes de integrais, na TRI tem sido freq
uente a aplicac
ao
do metodo Hermite-Gauss, usualmente denominado de metodo de quadratura
gaussiana. Se g(|) e uma func
ao contnua com integral finita, ela pode ser
aproximada, para qualquer grau de precisao, por uma outra func
ao que assume
um n
umero finito de pontos. Dessa forma, o problema de obter a integral de
uma func
ao contnua e substitudo pela obtenc
ao da soma das area de um
n
umero finito, digamos q, de retangulos. Os pontos medios de cada retangulo,
k , k = 1, , q, s
ao denominados de n
os (ou pontos de quadratura). Cada
no tem um peso Ak A(k ) associado que leva em conta a altura g(k |) e a
largura (k ) do respectivo intervalo, tal como Ak = g(k |) k . Os valores
k e Ak sao obtidos resolvendo-se um conjunto de equac
oes que envolvem a
func
ao g(|) e o n
umero de nos (ver Hildebrand (1956), paginas 327-330).
Uma tabela para k e Ak relativa a func
ao gaussiana pode ser encontrada em
Stroud & Sechest (1966). Para adaptar essa tabela para o caso em que g(|)
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
60
Estima
c
ao: uma u
nica popula
c
ao
Equa
c
oes de estima
c
ao em forma de quadratura
Consideremos conhecidos os nos k e os pesos, Ak , k = 1, , q, com Ak =
g(k |) k . Com isso, podemos escrever
I
Y
u
1u
P (uj. |k , ) =
[Pkiji Qki ji ],
i=1
q
X
q
X
P (uj. |k , )Ak .
k=1
k=1
(3.75)
= D(1 ci )
' D(1 ci )
s
X
Z
rj
IR
j=1
q
s X
X
j=1 k=1
(3.76)
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.5 M
axima verossimilhan
ca marginal
ai : D(1 ci )
q
s X
X
61
(3.77)
j=1 k=1
De forma an
aloga, temos que as equac
oes de estimac
ao em forma de quadratura para os parametros bi e ci s
ao, respectivamente,
bi : Dai (1 ci )
ci :
q
s X
X
rj
j=1 k=1
q
s X
X
(3.78)
j=1 k=1
Wki
(uji Pki ) gj (k ) = 0.
Pki
(3.79)
para i 6= l.
(3.80)
Essa suposic
ao modifica a matriz H P I () tornando-a bloco diagonal, uma
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
62
Estima
c
ao: uma u
nica popula
c
ao
situac
ao similar `a da Sec
ao 3.4 onde eram estimados os par
ametros dos itens
e as habilidades conjuntamente. Naquele caso, a independencia local foi suficiente para garantir (3.80) e, assim, possibilitar que os itens fossem estimados
individualmente, fixadas as habilidades. A proposta de Bock & Aitkin foi adotar a independencia entre os itens de forma a possibilitar que os itens sejam
estimados individualmente. Vale notar que as suposic
oes de independencia local e a suposic
ao de independencia dos itens sao completamente diferentes. A
primeira esta relacionada `as respostas dos indivduos, enquanto a segunda se
refere apenas aos itens.
Com esta construc
ao, a estimac
ao pode ser feita adotando as mesmas expressoes desenvolvidas na sec
ao anterior, fazendo a adaptac
ao devida a (3.80).
Entretanto, Bock & Aitkin sugerem que a obtenc
ao das estimativas de maxima
verossimilhanca seja feita atraves do algortimo EM, introduzido por Dempster, Laird & Rubin (1977), e por isso algumas alterac
oes nas expressoes da
sec
ao anterior ser
ao necessarias.
De (3.68) temos que
log L(, )
ai
= D(1 ci )
= D(1 ci )
s
X
j=1
s
X
Z
rj
IR
Z
rj
j=1
log L(, )
ai
Z
= D(1 ci )
IR
IR
( bi ) uji gj () Pi gj () Wi d
s
s
X
X
rj uji gj () Pi
rj gj () Wi d
( bi )
j=1
Z
= D(1 ci )
IR
j=1
( bi ) [ri () Pi fi ()] Wi d,
(3.81)
onde
ri () =
s
X
rj uji gj (),
fi () =
j=1
http://www.keimelion.com.br
s
X
rj gj ().
j=1
SINAPE 2000
Keimelion
Reviso de textos
3.5 M
axima verossimilhan
ca marginal
63
log L(, )
bi
= Dai (1 ci )
log L(, )
ci
IR
[ri () Pi fi ()] Wi d,
(3.82)
Z
IR
[ri () Pi fi ()] Wi d.
(3.83)
Equa
c
oes de estima
c
ao em forma de quadratura
Considerando conhecidos os n
os k e os pesos, Ak , k = 1, , q, temos que
as equac
oes de estimac
ao em forma de quadratura para os parametros ai , bi e
ci sao, respectivamente,
ai
q
X
: D(1 ci )
(k bi ) [rki Pki fki ] Wki = 0,
(3.84)
k=1
bi : Dai (1 ci )
q
X
(3.85)
Wki
= 0.
Pki
(3.86)
k=1
ci :
q
X
k=1
onde
rki =
s
X
rj uji gjk
,
j=1
fki =
s
X
rj gjk
e gjk
= gj (k ).
(3.87)
j=1
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
64
Estima
c
ao: uma u
nica popula
c
ao
3.5.5 Aplicac
ao do algoritmo EM
O algoritmo EM e um processo iterativo para determinac
ao de estimativas
de m
axima verossimilhanca de parametros de modelos de probabilidade na
presenca de vari
aveis aleatorias nao observadas. Cada iterac
ao deste processo
e feita em dois passos: Esperanca (E) e Maximizac
ao (M ). No caso da TRI,
o objetivo e obter estimativas de na presenca das vari
aveis nao observadas
. Neste caso, u.. representa o vetor de dados incompletos e (u.. , ) o vetor de
dados completos. Seja f (u.. , |) a densidade conjunta do dados completos.
b(k) e uma estimativa de na iterac
Se
ao t, ent
ao os passos EM para obtencao
b(k+1) s
de
ao
b(k) ]
Passo E: Calcular E[log f (u.. , |)|u.. ,
b(k+1) que maximiza a func
Passo M: Obter
ao do Passo E.
No passo M a maximizac
ao pode ser feita pelo algoritmo Newton-Raphson
ou Scoringde Fisher. Com a suposic
ao de que os itens s
ao independentes,
(3.80), a matriz de derivadas segundas torna-se bloco diagonal, possibilitando
que os (par
ametros dos) itens sejam estimados individualmente, eliminando o
problema de trabalhar com matrizes de ordem 3I 3I e passando a operar
com matrizes 3 3.
Ha tres formas do algoritmo EM, distinguidas pela relac
ao entre a func
ao
(densidade) de probabilidade e a forma da famlia exponencial. A primeira
forma se aplica quando a func
ao e um membro regular da famlia exponencial;
a segunda, quando a func
ao n
ao e um membro regular da famlia exponencial,
mas um membro da famlia exponencial curvada (formada por distribuic
oes
em que ha restric
oes no espaco parametrico) e a terceira, quando a func
ao nao
tem nenhuma relac
ao com a famlia exponencial.
Se a FRI e um membro regular da famlia exponencial, o procedimento
torna-se relativamente simples. Embora o modelo logstico de 1 parametro
(modelo de Rasch) seja membro da famlia exponencial, os modelos de 2 e
3 par
ametros nao sao. Portanto, a terceira forma do algoritmo EM deve ser
aplicada nestes casos.
Para descrever brevemente o algoritmo EM aplicado `a TRI, comecemos supondo que as habilidades est
ao restritas a um conjunto de q valores, k , k =
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.5 M
axima verossimilhan
ca marginal
65
respondendo
de indiv
duos
com
habilidade
ao
item
i,
f
=
(f
,
, fqi )0 ,
1i
k
i
Pq
com k=1 fki = N , f = (f 1 , , f I ). Similarmente, seja rki o n
umeros de indivduos com habilidade k respondendo corretamente ao item i, r i = (r1i , ,
rqi )0 e r = (r 1 , , r I ). Estas definic
oes se assemelham bastante com as da
Sec
ao 3.2, quando tratamos da estimac
ao dos par
ametros dos itens com as
habilidades conhecidas e agrupadas em q categorias. Veremos que, de fato,
os resultados sao muito similares. Entretanto, na Sec
ao 3.2 as freq
uencias fki
e rki eram conhecidas, e no caso atual estas quantidades sao desconhecidas.
Essa e a grande vantagem do algoritmo EM, onde fki e rki podem ser tratadas
como quantidades n
ao observadas.
Se os n indivduos que responderao ao item i sao selecionados ao acaso da
populac
ao, a probabilidade conjunta que os fki indivduos tenham habilidades
k , k = 1, , q, e dada pela distribuic
ao multinomial:
P (f i |) = Qq
n!
k=1 fki !
q
Y
jfki ,
i = 1, , I.
k=1
P (f , r|, ) = P (f |, )P (r|f , , )
= P (f |)P (r|h, )
)
( I
)( I q
Y
YY
=
P (f i |)
P (rki |fki , k )
i=1
i=1 k=1
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
66
Estima
c
ao: uma u
nica popula
c
ao
q
I X
X
i=1 k=1
q
I X
X
log
i=1 k=1
= C+
q X
I
X
fki
+ rki log Pki + (fki rki ) log Qki
rki
k=1 i=1
f
onde C = log P (f |) + i=1 k=1 log ki e constante com relac
ao a . Terki
mos que (f , r) sao nao-observ
aveis, mas tomando a esperanca da log-verossimilhanca, condicional em u.. e , e usando a notac
ao
PI
Pq
obtemos,
E[log L()] = C +
q
I X
X
gj (k ) e, posteriormente, rki e f ki , i = 1, , I e k = 1, , q.
Passo M Com r e f obtidos no Passo E, resolver as equac
oes de estimacao
para i , i = 1, , I, usando o algoritmo Newton-Raphson ou Scoringde Fisher atraves das expressoes da Sec
ao 3.2.
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.6 Estima
c
ao bayesiana
67
3.6 Estimac
ao bayesiana
A estimac
ao por maxima verossimilhanca apresenta problemas na estimac
ao
de itens que sao respondidos corretamente, ou incorretamente, por todos os
indivduos, e tambem das habilidades de indivduos que responderam corretamente, ou incorretamente, a todos os itens. Alem disso, ha a possibilidade
de que as estimativas dos parametros dos itens caiam fora do intervalo esperado, tal como valores de ai negativos, ou valores de ci fora do intervalo [0, 1].
A metodologia bayesiana apresenta uma soluc
ao em que estes problemas sao
contornados.
H
a varias propostas para a estimac
ao bayesiana dos parametros de interesse
na TRI. A mais utilizada e a Estimac
ao Bayesiana Marginal proposta por Mislevy (1986a), que e uma generalizac
ao da proposta de Bock & Aitkin (1981).
Basicamente, a estimac
ao bayesiana consiste em estabelecer distribuic
oes a
priori para os parametros de interesse, construir uma nova func
ao denominada distribuic
ao a posteriori e estimar os parametros de interesse com base
em alguma caracterstica dessa distribuic
ao. Consideremos que as componentes de s
ao variaveis aleatorias independentes e contnuas, com distribuic
oes
especificadas. Por estarmos tratando de uma extens
ao da proposta de Bock
& Aitkin, a estimac
ao e feita por maxima verossimilhanca marginal, em duas
etapas.
Para tornar o tratamento mais geral, vamos considerar que a distribuic
ao
da habilidade e func
ao de um vetor de parametros , com densidade g(|), e
que a distribuic
ao de i , i = 1, , I, e func
ao de um vetor de parametros ,
com densidade g(| ). Podemos, ainda, estabelecer distribuic
oes a priori para
os parametros e , digamos f ( ) e g(). Para definir a metrica, digamos
(0,1), em que os parametros dos itens (e, posteriormente, as habilidades) ser
ao
estimados, podemos adotar uma distribuic
ao degenerada para em (0,1) ou
uma distribuic
ao que tenha vetor de medias (0,1) e vari
ancias muito pequenas.
A primeira opc
ao equivale a eliminar a func
ao g(), mas para tornar o trataAndrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
68
Estima
c
ao: uma u
nica popula
c
ao
( I
) n
Y
Y
=
f ( i | )
g(j |) f ( )g().
i=1
j=1
(3.89)
3.6.1 Estimac
ao dos par
ametros dos itens
Para fazer inferencias com relac
ao aos parametros dos itens, e conveniente
marginalizara posteriori integrando com relac
ao a e , obtendo a distribuic
ao a posteriori de e :
Z Z
f (, |u.. ) = C
= Cg()
f (| )f ( )d
P (u.. ; , )g(|)d
L(, )f ()g(),
(3.90)
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.6 Estima
c
ao bayesiana
69
sendo que as mais adotadas sao a media e a moda. No que segue vamos considerar a moda da posteriori como o estimador de , ou seja, o valor de que
maximiza a posteriori marginal. Temos que
log f (, |u.. ) = Const + log L(, ) + log f () + log g(),
onde o primeiro termo representa uma constante. Pela suposic
ao de independencia entre os itens, a estimac
ao sera feita um item por vez. Notando
que a u
ltima parcela nao e funcao de i , temos que as equac
oes de estimac
ao
para os parametros dos itens i , i = 1, , I, sao dadas por
log L(, ) log f ()
f (, |u.. )
=
+
= 0.
i
i
i
(3.91)
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
70
Estima
c
ao: uma u
nica popula
c
ao
a estimac
ao de i ao inves de ai e sugerem a utilizac
ao da propriedade de
invari
ancia do estimador de m
axima verossimilhanca para a obtenc
ao de b
ai
pela trasformac
ao b
ai = exp(b
i ). Entretanto, para uniformidade desse texto,
vamos continuar apresentando a equac
ao para o par
ametro ai .
Como a distribuic
ao de ai e log-normal, sua densidade e
f (ai |a , a2 )
1
1
2
=
exp 2 (log ai a ) .
2a
2ai a
log f (ai |a , a2 )
1
log ai a
1+
.
=
ai
ai
a2
(3.92)
Distribui
c
ao a priori para bi
Como os par
ametros de dificuldade estao na mesma escala da habilidade,
em geral, sup
oem-se que cada bi s tem distribuic
ao Normal com vetor de
parametros = (b , b2 ). Desta forma, a segunda parcela de (3.91) pode ser
escrita como
log f (bi |b , b2 )
(bi b )
.
=
bi
b2
(3.93)
Distribui
c
ao a priori para ci
Como ci so pode pertencer ao intervalo [0; 1], uma priori Beta foi proposta
por Swaminathan & Gifford (1986). A func
ao densidade da distribuic
ao Beta
com parametros s + 1 e t + 1 e dada por
f (ci |s, t) =
(s + t + 2) s
c (1 ci )t ,
(s + 1)(t + 1) i
(3.94)
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.6 Estima
c
ao bayesiana
71
Z
(d) =
xd1 ex dx.
= mp + 1
= m(1 p) + 1,
e t = 2.
f (ci |, ) =
( + 2) 2
c
(1 ci )2 .
( 1)( 1) i
(3.95)
(3.96)
Consequentemente,
2
2
log f (ci |, )
.
=
ci
ci
1 ci
(3.97)
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
72
Estima
c
ao: uma u
nica popula
c
ao
1
log ai a
1+
= 0,
: D(1 ci ) ( bi ) [ri () Pi fi ()] Wi d
ai
a2
IR
(3.98)
Z
(bi b )
= 0,
: Dai (1 ci )
[ri () Pi fi ()] Wi d
(3.99)
b2
IR
Z
2
2
Wi
= 0.
:
[ri () Pi fi ()] d +
(3.100)
P
c
1
ci
i
IR
i
Z
ai
bi
ci
2 log f (ai |a , a2 )
a2i
2 log f (bi |b , b2 )
b2i
2 log f (ci |, )
c2i
1 2
a + log ai a 1 ,
2
ai a
1
,
b2
2
2
.
2
(1 ci )2
ci
(3.101)
Equa
c
oes de estima
c
ao em forma de quadratura
Considerando conhecidos os n
os k e os pesos Ak , k = 1, , q, temos que
as equac
oes de estimac
ao em forma de quadratura para os par
ametros ai , bi e
ci sao, respectivamente,
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.6 Estima
c
ao bayesiana
ai : D(1 ci )
q
X
k=1
73
1
log ai a
1+
= 0,
(k bi ) [rki Pki fki ] Wki
ai
a2
(3.102)
bi : Dai (1 ci )
q
X
k=1
ci :
q
X
k=1
(bi b )
= 0,
b2
(3.103)
2
Wki 2
= 0.
+
Pki
ci
1 ci
(3.104)
3.6.2 Estimac
ao das habilidades
Tal como na estimac
ao por maxima verossimilhanca marginal, a estimac
ao
bayesiana das habilidades e feita em uma segunda etapa, considerando os
par
ametros dos itens fixos. Atraves da suposic
ao de independencia entre as
habilidades de diferentes indivduos, podemos fazer as estimac
oes em separado
para cada indivduo.
Vamos assumir que a distribuic
ao a priori para j , j = 1, , n, e Normal
2
com vetor de parametros = (, ) conhecidos. A posteriori para a habilidade
do indivduo j pode ser escrita como
gj (j ) g(j |uj. , , ) P (uj. |j , )g(j |).
(3.105)
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
74
Estima
c
ao: uma u
nica popula
c
ao
(3.106)
i=1
Portanto,
log P (uj. |j , )
j
I
X
log P (uji | i , j )
=
j
i=1
I
X
i=1
P (uji | i , j )/j
.
P (uji | i , j )
1uji
(3.107)
e usando o desenvolvimento de
X
log P (uj. |j , )
=D
ai (1 ci )(uji Pji )Wji .
j
(3.108)
i=1
(3.109)
I
X
i=1
http://www.keimelion.com.br
(j )
= 0.
2
(3.110)
SINAPE 2000
Keimelion
Reviso de textos
3.6 Estima
c
ao bayesiana
75
H(j ) =
I
X
i=1
1
(uji Pji )Wji Hji (uji Pji )Wji h2ji 2 ,
(3.111)
(j ) =
I
X
i=1
1
.
2
(3.112)
Estima
c
ao pela m
edia da posteriori - EAP
A estimac
ao de j pela media da posteriori (ou EAP: expected a posteriori)
consiste em obter a esperanca da posteriori, que pode ser escrita como
g(|uj. , , ) =
P (uj. |, )g(|)
.
P (uj. |, )
(3.113)
(3.114)
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
76
Estima
c
ao: uma u
nica popula
c
ao
3.7 Resumo
A seguir, faremos um sntese das vantagens e desvantagens dos metodos
citados neste livro. Vale ressaltar que existem ainda outros metodos de estimac
ao propostos na literatura.
Na sntese abaixo, o smbolo representar
a uma caracterstica positiva,
enquanto representar
a uma caracterstica negativa.
Estimac
ao dos Par
ametros dos Itens
M
axima Verossimilhan
ca Marginal - MVM :
Possui propriedades assint
oticas: as estimativas dos par
ametros ai , bi
e ci s
ao consistentes;
Uma vez estimados os parametros dos itens, pode-se estimar as habilidades atraves do metodo da Sec
ao 3.3 ou 3.6.2;
Nao esta definido para itens com acerto total ou erro total;
bastante trabalhoso computacionalmente;
E
Necessidade do estabelecimento de uma distribuic
ao para ;
Apresenta problemas na estimac
ao do parametro ci em alguns casos;
deve ser usado somente com um n
umero suficientemente grande de
respondentes.
Bayesiano :
Definido para qualquer padrao de resposta;
Uma vez estimados os parametros dos itens, pode-se estimar as habilidades atraves do metodo da Sec
ao 3.3 ou 3.6.2;
mais trabalhoso computacionalmente do que o MVM;
E
Necessidade de distribuic
oes a priori para os par
ametros dos itens.
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
3.7 Resumo
77
Estimac
ao das habilidades
M
axima Verossimilhan
ca - MV :
Para testes longosproduz estimadores nao viciados;
N
ao esta definido para alguns padroes de resposta.
Bayesiano - EAP :
Definido para qualquer padrao de resposta;
Possui o menor erro medio;
Viciado;
Exige calculos mais complexos do que o metodo de MV;
Necessidade de uma distribuic
ao a priori para .
Bayesiano - MAP :
Definido para qualquer padrao de resposta;
Viciado.
Exige calculos mais complexos do que o metodo de MV;
Necessidade de uma distribuic
ao a priori para .
Estimac
ao dos par
ametros dos itens e das habilidades
M
axima Verossimilhan
ca Conjunta - MVC :
Serve como base para outros procedimentos;
Apresenta problemas de indeterminac
ao;
N
ao possui propriedades assint
oticas, pois o aumento do n
umero de
respondentes aumenta o n
umero de parametros a serem estimados;
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
78
Estima
c
ao: uma u
nica popula
c
ao
Apresenta problemas na estimac
ao do parametro ci em alguns casos;
deve ser usado somente com um n
umero suficientemente grande de
respondentes;
Nao esta definido para alguns padroes de resposta.
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
Captulo 4
Equalizac
ao
4.1 Introduc
ao
No captulo anterior, apresentamos os metodos de estimac
ao mais utilizados
quando todos os parametros dos itens de uma u
nica prova devem ser estimados.
No entanto, esta e apenas uma das possveis situac
oes que na pratica iremos
encontrar. A seguir, listaremos os 6 casos possveis, quanto ao n
umero de
grupos e de tipos de prova envolvidos. Esses casos est
ao esquematizados na
Figura 4.1.
1. Um u
nico grupo fazendo uma u
nica prova.
2. Um u
nico grupo, dividido em dois subgrupos, fazendo duas provas, totalmente distintas (nenhum item comum).
3. Um u
nico grupo, dividido em dois subgrupos, fazendo duas provas, apenas parcialmente distintas, ou seja, com alguns itens comuns.
4. Dois grupos fazendo uma u
nica prova.
5. Dois grupos fazendo duas provas, totalmente distintas (nenhum item
comum).
6. Dois grupos fazendo duas provas, apenas parcialmente distintas, ou seja,
com alguns itens comuns.
Note que para simplificar, listamos os casos acima utilizando apenas duas
provas e duas populac
oes, mas as situac
oes envolvendo um n
umero maior de
provas e/ou de populac
oes sao analogas.
Alem disso, os problemas de estimac
ao tambem podem diferir dependendo
do conjunto de itens que necessita ser estimado, ou seja, se nosso conjunto de
itens e composto de:
http://www.keimelion.com.br
Keimelion
Reviso de textos
80
Equaliza
c
ao
(a) apenas itens novos (ou seja, itens que ainda nao foram calibrados);
(b) apenas itens ja calibrados;
(c) itens novos e itens calibrados.
Em primeiro lugar, e importante definir o conceito de Equalizac
ao (ver Kolen
& Brennan (1995), por exemplo), que e um dos mais importantes da TRI e um
dos grandes objetivos das Avaliacoes Educacionais. Equalizar significa equiparar, tornar comparavel, o que no caso da TRI significa colocar parametros de
itens vindos de provas distintas ou habilidades de respondentes de diferentes
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
81
grupos, na mesma metrica, isto e, numa escala comum, tornando os itens e/ou
as habilidades comparaveis.
Existem dois tipos de equalizac
ao: a equalizac
ao via populac
ao e a equalizac
ao via itens comuns. Isto significa que h
a duas maneiras de colocar parametros, tanto de itens quanto de habilidades, numa mesma metrica: na primeira
usamos o fato de que se um u
nico grupo de respondentes e submetido a provas
distintas, basta que todos os itens sejam calibrados conjuntamente para termos
a garantia de que todos estar
ao na mesma metrica. Ja na equalizac
ao via itens
comuns, a garantia de que as populac
oes envolvidas ter
ao seus parametros
em uma u
nica escala sera dada pelos itens comuns entre as populac
oes, que
servirao de ligac
ao entre elas.
4.2.1 Um u
nico grupo fazendo uma u
nica prova
Este e o caso trivial, em que se aplicam diretamente os modelos matematicos e os metodos de estimac
ao descritos nos captulos anteriores. Foi
o caso considerado ate agora, nos Captulos 2 e 3, e pela propria natureza do
problema, nao e necess
ario nenhum tipo de equalizac
ao.
Um exemplo para ilustrar este caso seria uma prova de 30 itens aplicada
`a 4.a serie diurna do Ensino Fundamental da rede p
ublica estadual de S
ao
Paulo.
4.2.2 Um u
nico grupo fazendo duas provas totalmente distintas
Este e um caso classico do que chamamos de equalizac
ao via populac
ao.
Para resolve-lo, basta que todos os itens de ambas as provas sejam calibrados
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
82
Equaliza
c
ao
4.2.3 Um u
nico grupo fazendo duas provas parcialmente distintas
Este caso e bastante semelhante ao caso anterior, e aqui tambem podemos
fazer a equalizac
ao via populac
ao. Assim, valem os mesmos coment
arios da
Sec
ao 4.2.2.
Um exemplo dessa situac
ao seria a aplicac
ao de duas provas (tipo A e tipo
B), com 30 itens cada e com 10 itens comuns entre elas, aos alunos da 4.a
serie diurna do Ensino Fundamental da rede p
ublica estadual de Sao Paulo.
Aqui, o n
umero total de itens a serem calibrados seria 50 (= 30 + 30 - 10).
Analogamente ao exemplo anterior, ao final dos processos de estimac
ao todos
os resultados obtidos ser
ao comparaveis, nao importando a qual prova cada
aluno tenha sido submetido.
Outro exemplo bastante interessante para este caso, seria a aplicac
ao do
SAEB Sistema Nacional de Avaliac
ao da Educac
ao Basica. Nesse estudo,
uma das populac
oes alvo e a 3.a serie do Ensino Medio. Como a aplicac
ao e
de carater nacional, alunos de varios estados do pas sao avaliados, mas todos
s
ao considerados como respondentes vindos da mesma populac
ao, ou seja,
como um u
nico grupo. Alem disso, o SAEB procura cobrir a grade curricular
de forma completa, e para tanto, e considerado um grande n
umero de itens
distintos em cada disciplina. Como seria inviavel a aplicac
ao de todos os itens
a um u
nico aluno, as provas sao montadas segundo um esquema BIB Blocos
Incompletos Balanceados no qual os itens sao divididos em blocos, que por
sua vez sao reunidos em cadernos, e estes cadernos que nada mais sao do
que diferentes provas , e que sao aplicados aos alunos. No caso da 3.a serie
do Ensino Medio, os itens foram divididos em 13 blocos com 13 itens distintos
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
83
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
84
Equaliza
c
ao
tidos, uma vez que eles estarao em metricas diferentes. Neste caso, nao faz
sentido comparar os resultados destes dois grupos, assim como n
ao faz sentido
comparar diretamente 40o C com 40o F . Assim como essas duas temperaturas est
ao em escalas de medida diferentes, os parametros obtidos nestas duas
provas tambem estarao. A diferenca e que, no caso das temperaturas, h
a uma
relac
ao conhecida entre as duas escalas, e assim, e possvel colocarmos uma
das temperaturas na mesma escala que a outra, possibilitando ent
ao, a comparac
ao. Ja no caso das provas, n
ao existe nenhuma relac
ao entre elas e nem
entre os dois grupos, que torne possvel a comparac
ao.
Um exemplo que ilustra esta situac
ao seria a elaborac
ao de duas provas
distintas: uma, composta de 30 itens, seria aplicada `a 4.a serie diurna (populac
ao 1) e a outra prova, composta de 40 itens, seria aplicada `a 5.a serie
diurna (populac
ao 2) do Ensino Fundamental da rede p
ublica estadual de Sao
Paulo. Estas duas provas poderiam ser calibradas separadamente e seus resultados poderiam ser interpretados isoladamente dentro de cada serie, mas nao
poderamos comparar os resultados dos itens e nem das habilidades estimadas
para os indivduos das duas series.
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
85
2). Entre elas poderiam haver 10 itens comuns (por exemplo, 10 itens da matriz curricular da 3.a serie). Desta maneira, no final do processo de estimac
ao
teramos todos os 50 itens numa mesma metrica, possibilitando comparac
oes
entre alunos de 3.a e 4.a series, e tambem possibilitando a criac
ao de uma
a
a
escala de conhecimentoda 3. e da 4. serie nesta dada disciplina. Como veremos no Captulo 6, esta escala possibilitaria a verificac
ao dos conte
udos que
os alunos destas duas series dominam, dos conte
udos onde ha falhas, acompanhar a evoluc
ao do conhecimentode uma serie para outra, etc.
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
86
Equaliza
c
ao
s
ao conhecidos, ou seja, assumimos que conhecemos os verdadeiros valores
dos par
ametros desses itens e assim, sempre que desejarmos, podemos aplicar
novamente alguns desses itens do banco a outros indivduos (ou ate mesmo a
um u
nico indivduo) e poderemos ent
ao estimar apenas suas habilidades, que
estarao sempre na mesma metrica dos parametros dos itens.
A quest
ao da metrica e um ponto que deve ser considerado com bastante
cuidado numa situac
ao como esta. Quando se constr
oium banco de itens,
uma informac
ao fundamental e a escala em que aqueles itens foram calibrados.
Isto porque as habilidades de indivduos que serao estimadas futuramente
a partir daqueles itens estarao nesta mesma metrica e portanto, quaisquer
comparac
oes diretas so poderao ser feitas com outro sujeitos que tambem
tenham suas habilidades nesta escala.
Assim, para resolver este problema, basta utilizar um dos processos de estimac
ao das habilidades dos indivduos quando os parametros dos itens ja sao
conhecidos, que foram descritos na Sec
ao 3.3 do Captulo 3.
Um exemplo para este tipo de situac
ao seria a aplicac
ao de uma prova, composta de 30 itens de 4.a serie que ja foram calibrados numa aplicac
ao anterior
(por exemplo, numa aplicac
ao de nvel nacional como o SAEB), aos alunos da
4.a serie da rede p
ublica estadual de Sao Paulo. Este tipo de procedimento
e bastante comum, e nesse caso, o objetivo seria comparar a rede p
ublica
paulista com o desempenho nacional.
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
4.4 Equaliza
c
ao a posteriori
87
4.4 Equalizac
ao a posteriori
Ate aqui discutimos formas de equalizac
ao entre 2 ou mais populac
oes
feitas durante o proprio processo de estimac
ao dos par
ametros. Mas, tambem e
possvel fazer a equalizac
ao a posteriori, isto e, depois de terminado o processo
de calibrac
ao dos itens. Basicamente, a equalizac
ao a posteriori e feita da
seguinte maneira: calibra-se separadamente os dois conjuntos de itens, que
foram submetidos `
as duas populac
oes de interesse. Obviamente, a condic
ao
necessaria e que hajam itens comuns entre os dois conjuntos. Assim, para os
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
88
Equaliza
c
ao
e aG1 =
1
aG2 ,
(4.1)
onde bG1 e bG2 sao os valores do parametro de dificuldade e aG1 e aG2 sao
os valores do parametro de discriminac
ao nos grupos 1 e 2, respectivamente.
Uma vez determinados os coeficientes e , as estimativas dos parametros
dos itens do grupo 2 podem facilmente ser colocados na mesma escala das
estimativas do grupo 1.
Varios metodos, que se baseiam nessas relac
oes lineares existentes entre os
par
ametros de um mesmo item medidos em escalas diferentes, poderiam ser
entao utilizados para determinar os coeficientes e . A soluc
ao mais natural
pelo proprio tipo de relac
ao existente entre os parametros seria determinar esses coeficientes atraves de uma regressao linear simples. No entanto, a
crtica feita `a utilizac
ao desse metodo e que ele n
ao e simetrico, ou seja, uma
regress
ao de x por y e diferente de uma regressao de y por x.
Um dos metodos de equalizac
ao a posteriori existentes que nao apresenta
esse problema, ou seja, e invariante (simetrico) em relac
ao `as vari
aveis utilizadas, e denominado Media-Desvio (Mean-Sigma). O metodo Media-Desvio
utiliza:
=
SG1
SG2
e = MG1 MG2 ,
(4.2)
onde SG1 e SG2 sao os desvios-padrao e MG1 e MG2 as medias amostrais das
estimativas dos parametros de dificuldade dos itens comuns nos grupos 1 e 2,
respectivamente. Da mesma forma, as habilidades dos respondentes do grupo
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
4.4 Equaliza
c
ao a posteriori
89
(4.3)
1
onde G2
e o valor da habilidade G2 na escala do grupo 1. Maiores detalhes
sobre este e outros metodos de equalizac
ao, como por exemplo Media-Desvio
Robusto e Curva Caracterstica, podem ser encontrados em Kolen & Brennan
(1995).
Exemplificando, uma avaliacao feita no estado do Rio Grande do Norte
(ver Fundac
ao Carlos Chagas (1997)) utilizou alguns itens do SAEB 95, com
o intuito de colocar os resultados obtidos na mesma metrica do SAEB. As
Fuguras 4.2 e 4.3 mostram as relac
oes entre as estimativas dos parametros a
e b nas duas avaliac
oes, para a disciplina Lngua Portuguesa da 8.a serie do
Ensino Fundamental.
Figura 4.2 Gr
afico de dispers
ao das estimativas do par
ametro de dificuldade - b dos
itens comuns da prova de Lngua Portuguesa da 8.a serie entre o RN e o SAEB
5
4
8 srie - SAEB 95
3
2
1
0
-3
-2
-1
-1
-2
-3
8 srie - RN
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
90
Equaliza
c
ao
Figura 4.3 Gr
afico de dispers
ao das estimativas do par
ametro de discriminac
ao - a
dos itens comuns da prova de Lngua Portuguesa da 8.a serie entre o RN e o SAEB
8 srie - SAEB 95
0
0
8 srie - RN
SSAEB
1, 614
= 1, 462,
=
SRN
1, 104
1
1
aRN =
aRN ,
1, 462
OV O
bN
= bRN + = 1, 462bRN 0, 126,
RN
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
4.4 Equaliza
c
ao a posteriori
91
N OV O
RN
= RN + = 1, 462RN 0, 126.
Uma u
ltima observac
ao sobre equalizac
ao deve ser feita com relac
ao `
a quantidade de itens comuns. Certamente, quanto maior o n
umero de itens comuns,
melhor sera a qualidade da equalizac
ao. Assim, o melhor caso de equalizac
ao
entre dois grupos distintos e a situac
ao da Sec
ao 4.2.4, ou seja, quando trata-se
exatamente da mesma prova. No entanto, ja sabemos que nao e necessario que
todos os itens sejam comuns. O n
umero mnimo de itens comuns necessario
para uma boa equalizac
ao entre duas populac
oes depende basicamente de dois
fatores: do tipo de equalizac
ao que sera feita e da qualidadedesses itens
comuns.
Equalizac
oes feitas durante o processo de calibrac
ao, com os modelos para
duas ou mais populac
oes que serao discutidos no proximo captulo, sao mais
eficazese portanto, exigem um n
umero menor de itens comuns do que equalizac
oes feitas a posteriori. Alem disso, se os itens comuns utilizados na equalizac
ao tiverem nveis de dificuldade baixos ou altos demais com relac
ao `as populacoes envolvidas, ou ent
ao se apresentarem baixo poder de discriminac
ao,
havera necessidade de um n
umero maior de itens.
Alguns autores tem sugerido pelo menos 6 itens comuns entre 2 provas de
30 itens, quando a equalizac
ao e feita durante a calibrac
ao. Um estudo de simulac
ao considerando diferentes situac
oes de equalizac
ao pode ser encontrado
em Andrade (1999).
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
http://www.keimelion.com.br
Keimelion
Reviso de textos
Captulo 5
Estima
c
ao: duas ou mais populac
oes
5.1 Introduc
ao
Como descrito no captulo anterior, e freq
uente a situac
ao em que temos
duas ou mais populac
oes envolvidas na analise. Estas populac
oes podem ser
caracterizadas por diferentes graus de escolaridade, regi
ao, sexo, tipo de escola,
etc. O primeiro passo para que os resultados relativos `as varias populac
oes
possam ser compar
aveis e a exigencia de itens comuns nos testes aplicados a
estas populac
oes, criando uma estrutura de ligac
ao entre as mesmas. Nessa
situac
ao, o procedimento usual e fazer a estimac
ao para cada populac
ao e
utilizar uma das tecnicas de equalizac
ao descritas na Sec
ao 4.3.
Um abordagem alternativa e o Modelo para Varias Populac
oes proposto
por Bock & Zimowski (1997), introduzido na Secc
ao 2.3, que representou um
grande avanco na TRI. Nesse modelo considera-se que h
a K populac
oes independentes em estudo e e feita uma an
alise conjunta das respostas amostrais dessas populac
oes. Considera-se que a distribuic
ao da habilidade dos
indivduos da populac
ao k segue uma determinada distribuic
ao com vetor de
par
ametros k . Frequentemente adota-se a distribuic
ao Normal com k =
(k , k2 )0 , sendo que estes par
ametros representam, respectivamente, a media
e a vari
ancia das habilidades da populac
ao k, k = 1, , K.
A grande vantagem da abordagem de Bock & Zimowski esta no fato que a
equalizac
ao e feita automaticamente no proprio processo de estimac
ao. Desta
forma, nao estamos mais sujeitos a diferencas nas estimativas dos par
ametros
devidas ao metodo de equalizac
ao escolhido. Alem disso, na presenca de varias
populac
oes (digamos, K 5), com as equalizac
oes sendo feitas entre os testes
k e k + 1, temos erros (relativos `a regressao, por exemplo) associados a cada
equalizac
ao entre duas populac
oes, que serao acumulados para a estimac
ao de
2 ), podendo levar a uma m
(2 ,22 ), (3 ,32 ), , e principalmente de (K ,K
a
http://www.keimelion.com.br
Keimelion
Reviso de textos
94
Estima
c
ao: duas ou mais popula
c
oes
estimac
ao destes par
ametro. Alem disso, essa abordagem requer um n
umero
menor de itens comuns, em comparac
ao com outros metodos, para produzir
resultados similares, conforme discutido no captulo anterior.
Sejam ukji a resposta (binaria) ao item i oriunda do j-esimo indivduo do
grupo k, e kj a habilidade do j-esimo indivduo do grupo k. (Por grupo k
entenderemos a amostra relativa `a populac
ao k.) Embora no desenvolvimento
que segue a func
ao de resposta possa assumir qualquer uma das formas descritas no Captulo 2, para fins de aplicac
ao utilizaremos a func
ao ML3, que
tem sido a func
ao mais utilizada pelos pesquisadores da
area, dada abaixo
P (ukji = 1|kj ) = ci + (1 ci )
1
1+
eDai (kj bi )
Algumas suposic
oes serao necessarias para a construc
ao do modelo. Alem
da independencia local, assumiremos que as respostas oriundas de indivduos
diferentes serao independentes. Vamos considerar a mesma func
ao de resposta
para todos os itens.
5.2 Notaco
es e definic
oes
Embora tenhamos K testes, devemos notar que alguns itens estar
ao em
dois ou mais testes. Por conta disso vamos fazer uma ordenac
ao nos I itens
que compoem o conjunto dos K testes, representando-os por = ( 1 , , I )
e denotando por I k o conjunto dos ndices dos itens aplicados P
ao grupo k.
Considerando Ik o n
umero de itens no teste k, teremos que I K
k=1 Ik . Sejam nk o n
umero de indivduos do grupo k e n o n
umero total de indivduos
na amostra. Sejam ainda, U kj. = (Ukj1 , Ukj2 , , UkjIk ) o vetor aleatorio de
respostas do indivduo j do grupo k; U k.. = (U 1.. , U 2.. , , U nk .. ) o vetor
aleatorio de respostas do grupo k e U ... = (U 1.. , U 2.. , , U n.. ) o vetor total de respostas. De forma similar, representaremos as respostas observadas
por ukji , ukj. , uk.. e u... . Com esta notac
ao e a independencia local, podemos
escrever a probabilidade associada ao vetor de respostas U kj. como
Y
P (ukji |kj , i ).
P (ukj. |kj , ) =
iI k
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
5.2 Nota
c
oes e defini
c
oes
95
Como comentado no Captulo 3, o metodo da Maxima Verossimilhanca Marginal, bem como o Bayesiano, tem sido preferidos ao metodo da Maxima Verossimilhanca Conjunta para a estimac
ao dos parametros de interesse. Alem
disso, o fato de podermos associar distribuic
oes para a habilidade da populac
ao
em estudo nos permite criar estruturas para os par
ametros das respectivas
func
oes densidade de probabilidade, que serao fundamentais nesse modelo. De
forma geral, consideremos que as habilidades dos indivduos da populac
ao k,
jk , j = 1, , nk , sao realizac
oes de uma variavel aleatoria, k , com distribuic
ao contnua e func
ao densidade de probabilidade g(| k ), duplamente
diferenci
avel, com as componentes de k conhecidas e finitas. Para o caso em
que k tem distribuic
ao Normal, temos k = (k , k2 ), onde k e a media e k2
a vari
ancia das habilidades dos indivduos da populac
ao k, k = 1, , K.
Na situac
ao em que temos uma u
nica populac
ao em estudo, nao ha necessidade de estimac
ao dos parametros populacionais. Isso ocorre porque a
metrica e estabelecida fixando-se os parametros populacionais, geralmente em
= 0 e = 1, onde e a media e e o desvio-padrao das habilidade da
populac
ao considerada. Na presenca de varias populac
oes, temos mais um
conjunto de parametro a estimar: = ( 1 , , K ), que ser
ao referidos como
Par
ametros Populacionais. Entretanto, ainda ha a necessidade do estabelecimento da metrica e isso pode ser resolvido fixando-se os parametros relativos
a qualquer uma das populac
oes. Neste livro adotaremos a seguinte referencia:
1 = 0,
1 = 1.
(5.1)
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
96
Estima
c
ao: duas ou mais popula
c
oes
5.3 Estimac
ao dos par
ametros dos itens
Embora as equac
oes de estimac
ao a serem desenvolvidas nesta sec
ao tenham como prioridades compor o conjunto das equac
oes para estimac
ao conjunta dos parametros dos itens e populacionais, cabe notar que elas tambem
poderao ser adotadas na situac
ao em que os par
ametros populacionais sao conhecidos. Uma situac
ao dessas ocorre quando tais par
ametros populacionais
foram estimados em outra an
alise, talvez com um n
umero de indivduos bem
maior, de forma que nao ha interesse na reestimac
ao desses parametros.
Com as notac
oes definidas acima, temos que a probabilidade marginal de
U kj. e dada por
Z
P (ukj. |, k ) =
IR
P (ukj. |, , k )g(| k )d
Z
=
IR
onde na u
ltima igualdade usamos que a distribuic
ao de U kj. n
ao e func
ao de
k .
Usando a independencia entre as respostas de diferentes indivduos, podemos escrever a probabilidade associada ao vetor de respostas U ... como
P (u... |, ) =
nk
K Y
Y
P (ukj. |, k ).
(5.2)
k=1 j=1
Embora a verossimilhanca possa ser escrita como (5.2), tem sido freq
uente
utilizar a abordagem de Padr
oes de Resposta. Como temos Ik itens no teste
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
5.3 Estima
c
ao dos par
ametros dos itens
97
rkj = nk .
(5.3)
j=1
L(, ) =
K
Y
sk
Y
k=1
j=1
n !
Qsk k
j=1 rjk !
[P (ujk. |, k )]rjk
(5.4)
E, portanto, a log-verossimilhanca e
log L(, ) =
K
X
(
log
k=1
n !
Qsk k
j=1 rjk !
)
+
sk
K X
X
(5.5)
k=1 j=1
As equac
oes de estimac
ao para os parametros dos itens sao dadas por
log L(, )
= 0,
i
i = 1, , I,
(5.6)
com
log L(, )
i
sk
K X
i
k=1 j=1
sk
K X
X
k=1 j=1
sk
K X
X
k=1 j=1
rjk
P (ukj. |, k )
1
P (ukj. |, k )
i
Z
Wi
Pi
rkj
(ukji Pi )
Q gkj ()d,
P
IR
i
i
i
(5.7)
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
98
Estima
c
ao: duas ou mais popula
c
oes
onde
gkj
() g(|ukj. , , k ) =
P (ukj. |, )g(| k )
.
P (ukj. |, k )
(5.8)
As equac
oes especficas para cada parametro do vetor i = (ai , bi , ci )0 podem
ent
ao ser obtidas de (5.7). Para o parametro de discriminac
ao ai , usando
tambem (3.8), obtem-se
log L(, )
=
ai
Z
sk
K X
X
Wi
Pi
g ()d
=
rkj
(ukji Pi )
ai Pi Qi kj
IR
k=1 j=1
Wi
rkj
(ukji Pi )D(1 ci )( bi )Pi Qi gkj
()d
Pi Qi
IR
sk
K X
X
k=1 j=1
= D(1 ci )
sk
K X
X
Z
rkj
k=1 j=1
IR
Para o par
ametro de dificuldade bi , usando tambem (3.9), obtem-se
log L(, )
=
bi
Z
sk
K X
X
Pi
Wi
=
rkj
(ukji Pi )
Q gkj ()d
b
P
i
IR
i
i
k=1 j=1
sk
K X
X
k=1 j=1
Z
rkj
IR
= Dai (1 ci )
sk
K X
X
k=1 j=1
Wi
g ()d
Pi Qi kj
Z
rkj
IR
Por u
ltimo, para o parametro de acerto ao acaso ci , usando tambem (3.10),
obtem-se
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
5.4 Estima
c
ao dos par
ametros populacionais
log L(, )
ci
sk
K X
X
Z
rkj
(ukji Pi )
k=1 j=1
IR
sk
K X
X
Z
rkj
(ukji
k=1 j=1
IR
sk
K X
X
Z
rkj
IR
k=1 j=1
99
Pi
ci
Pi )Qi
Wi
g ()d
Pi Qi kj
Wi
g ()d
Pi Qi kj
Wi
(ukji Pi ) gkj ()d.
Pi
Em resumo, as equac
oes de estimac
ao para ai , bi e ci sao, respectivamente,
ai : D(1 ci )
sk
K X
X
Z
rkj
k=1 j=1
bi : Dai (1 ci )
sk
K X
X
k=1 j=1
ci :
sk
K X
X
k=1 j=1
Z
rkj
IR
IR
Z
rkj
IR
Wi
(ukji Pi ) gkj ()d = 0,
Pi
(5.10)
(5.11)
5.4 Estimac
ao dos par
ametros populacionais
Novamente, embora as equacoes de estimac
ao a serem desenvolvidas nesta
sec
ao tenham como prioridades compor o conjunto das equac
oes para estimacao conjunta dos parametros dos itens e populacionais, cabe notar que
elas tambem poderao ser adotadas na situac
ao em que os parametros dos
itens sao conhecidos.
Considerando a log-verossimilhanca obtida em (5.5), as equac
oes de estimacao para as habilidades medias e vari
ancias das populac
oes sao obtidas
por
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
100
Estima
c
ao: duas ou mais popula
c
oes
log L(, )
=0
k
log L(, )
= 0,
k2
k = 2, , K.
Mas,
log L(, )
k
sk
X
j=1
sk
X
1
rjk
P (ukj. |, k )
Z
IR
P (ukj. |, )
g(| k )
k
Z
1
log g(| k )
g(| k )d
=
rjk
P (ukj. |, )
P (ukj. |, k ) IR
k
j=1
Z
sk
X
log g(| k )
gkj
=
rjk
()d.
k
IR
j=1
Se utilizarmos a distribuic
ao N (k , k2 ) para k , teremos que
k
log g(| k )
=
k
k2
k2 ( k )2
log g(| k )
.
=
k2
2k4
Assim, as formas finais das equac
oes de estimac
ao sao
k :
k2
(k2 )1
(2k4 )1
sk
X
j=1
sk
X
Z
rkj
IR
Z
rkj
j=1
IR
( k )gkj
()d = 0,
(5.12)
2
k ( k )2 gkj
()d = 0.
(5.13)
2
kj
ZIR
IR
gkj
()d,
(5.14)
( kj )2 gkj
()d,
(5.15)
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
5.4 Estima
c
ao dos par
ametros populacionais
101
0 =
j=1
sk
X
j=1
sk
X
Z
rkj
IR
gkj
()d
bk
sk
X
Z
rkj
IR
j=1
rkj
bkj
bk
sk
X
gkj
()d
rkj
j=1
rkj
bkj nk
bk ,
j=1
bk =
sk
1 X
rkj
bkj .
nk
(5.16)
j=1
0 =
sk
X
Z
rkj
bk2
j=1
bk2
sk
X
IR
rkj
j=1
nk
bk2
gkj
()d
sk
X
Z
rkj
j=1
sk
X
sk
X
Z
rkj
j=1
(
IR
IR
(
bk )2 gkj
()d
bkj )2 gkj
d
+
IR
(b
kj
bk )2 gkj
()d
bkj + (b
kj
bk )2 ,
rkj
j=1
bk2 =
sk
2
1 X
rkj
bkj + (b
kj
bk )2 .
nk
(5.17)
j=1
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
102
Estima
c
ao: duas ou mais popula
c
oes
2k.
j=1
sk
1 X
2
rkj kj
=
nk
2
k.
j=1
sk
1 X
rkj (kj k )2 ,
=
nk
j=1
bk =
2
b2k. + c
e
bk2 =
k. ,
k = 2, , K.
(5.18)
5.4.1 Estimac
ao conjunta: aplicac
ao do algoritmo EM
De forma similar ao que foi feito na Sec
ao 3.5.5, podemos escrever a equac
ao
de estimac
ao para i como
K Z
X
k=1
IR
Pi
i
http://www.keimelion.com.br
Wi
d = 0,
Pi Qi
(5.19)
SINAPE 2000
Keimelion
Reviso de textos
5.4 Estima
c
ao dos par
ametros populacionais
103
onde
fki () =
sk
X
j=1
sk
X
j=1
representam, respectivamente, o n
umeros de indivduos do grupo k com habilidade respondendo ao item i e o n
umeros destes indivduos que respondem
corretamente ao item i. Novamente, as integrais sao aproximadas atraves de
quadratura Gaussiana. Fixados os q n
os kl e os pesos Akl , l = 1, , q, k =
b , i = 1, , I,
1, , K, e com estimativas iniciais dos par
ametros dos itens,
i
as equac
oes (5.18) podem ser resolvidas diretamente para obtenc
ao das estimativas desejadas. A estimac
ao e feita em separado para cada item, e por isso
poderemos utilizar o desenvolvimento da Sec
ao 3.2. Reformulando-se os passos
do algoritmo EM descritos na Sec
ao 3.5.3, para a situac
ao de duas ou mais
populac
oes, teremos
Passo E
1. Usar os pontos de quadratura kl , os pesos Akl , l = 1, , q e
estimativas iniciais dos parametros dos itens , i , i = 1, , I, e
dos par
ametros populacionais, k e k2 , k = 1, , K, para gerar
( ) e, posteriormente, r
gkj
kl
kli e f kli , i = 1, , I e k = 1, , q.
( ) para obter
2 por
2. Usar os pontos de quadratura e gkj
bkj e
bkj
kl
(5.14) e (5.15), e poteriormente,
bk e
bk2 por (5.18).
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
104
Estima
c
ao: duas ou mais popula
c
oes
q
K X
X
h( i ) =
(rkli fkli Pkli )Wkli hkli ,
H( i ) =
k=1 l=1
q
K X
X
(rkli fkli Pkli )Wkli H kli (rkli fkli Pkli )Wkli hkli h0kli ,
k=1 l=1
( i ) =
q
K X
X
Pkli Qkli Wkli hkli h0kli .
k=1 l=1
5.5 Estimac
ao bayesiana dos par
ametros dos itens
Como podemos perceber no caso da estimac
ao por MVM, as equac
oes
de estimac
ao quando temos varias populac
oes em estudo sao bastante similares ao caso em que temos apenas uma populac
ao em estudo, com algumas modificac
oes das componentes devidas `a presenca de outras populac
oes.
Isso tambem se reflete no caso da estimac
ao bayesiana, onde sao utilizadas as
equac
oes de estimac
ao obtidas por MVM, com o incremento de parcelas relativas `
as distribuic
oes a priori adotadas para os parametros dos itens. Neste
captulo, vamos adotar as mesmas distribuic
oes a priori consideradas na Secao
3.6.1.
Com isso, as equac
oes de estimac
ao podem ser escritas como
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
5.6 Estima
c
ao das habilidades
ai : D(1 ci )
K Z
X
k=1
bi : Dai (1 ci )
ci :
K Z
X
k=1
IR
IR
105
K Z
X
k=1
IR
1
log ai a
1+
= 0,
ai
a2
(bi b )
= 0,
b2
2
2
Wi
d +
= 0.
Pi
ci
1 ci
5.6 Estimac
ao das habilidades
Uma etapa que pode ser considerada opcional e a estimac
ao das habilidades. Talvez o interesse da an
alise se concentre apenas na estimac
ao dos
parametros dos itens e populacionais, sem relevar a estimac
ao das habilidades. Em caso contr
ario, as habilidades podem ser estimadas por MV, como
descrito na Sec
ao 3.3, ou de forma bayesiana, como descrito na Sec
ao 3.6.2.
Devido a presenca de varios grupos na analise, as expressoes para obtenc
ao das
habilidades sao ligeiramente modificadas, e por isso as apresentaremos nesta
sec
ao.
Vale ressaltar que em todos os metodos de estimac
ao descritos abaixo, consideraremos fixos os parametros dos itens e os populacionais.
5.6.1 Estimac
ao por MV
Neste caso, a estimac
ao das habilidades e feita iterativamente pelo algo(t)
ritmo Newton-Raphson ou metodo Scoringde Fisher. Considerando bkj uma
estimativa de kj na iterac
ao t, ent
ao na iterac
ao t + 1 teremos que
(t+1)
(t)
(t)
(t)
bkj = bkj [H(bkj )]1 h(bkj ),
(5.20)
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
106
Estima
c
ao: duas ou mais popula
c
oes
onde
H(kj ) =
iI k
Pkji
Qkji Wkji h2kji .
iI k
5.6.2 Estimac
ao por MAP
A estimac
ao pelo maximo da posteriori (MAP) tambem e obtida iterativamente pela aplicac
ao de (5.20), com
H(kj ) =
X
iI k
1
(ukji Pkji )Wkji Hkji (ukji Pkji )Wkji h2kji 2 , (5.21)
k
(kj ) =
Pkji
Qkji Wkji h2kji
iI k
1
.
k2
(5.22)
5.6.3 Estimac
ao por EAP
A estimac
ao de kj pela media da posteriori (EAP) consiste em obter a
esperanca da posteriori, que pode ser escrita como
g(|ukj. , , k ) =
P (ukj. |, )g(| k )
.
P (ukj. |, k )
http://www.keimelion.com.br
(5.23)
SINAPE 2000
Keimelion
Reviso de textos
5.6 Estima
c
ao das habilidades
107
(5.24)
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
http://www.keimelion.com.br
Keimelion
Reviso de textos
Captulo 6
6.1 Introduc
ao
Neste captulo vamos descrever os procedimentos para a construc
ao de escalas de habilidade e em seguida iremos ilustrar como e feita sua interpretac
ao
atraves de uma aplicac
ao pratica da TRI na
area de avaliac
ao da aprendizagem.
6.2 Construc
ao e interpretac
ao de escalas de habilidade
Uma vez que todos os par
ametros dos itens e que todas as habilidades dos
respondentes tanto individuais como populacionais de todos os grupos
avaliados est
ao numa mesma metrica, ou seja, quando todos os parametros
envolvidos sao comparaveis, pode-se ent
ao construir escalas de conhecimento
interpret
aveis.
Devido `a natureza arbitraria das estimativas dos parametros dos itens e
das habilidades, j
a comentada anteriormente, sabemos que podemos comparar
entre si as habilidades obtidas para os diferentes respondentes, mas que no
entanto, elas nao possuem de per si qualquer significado pratico em termos
pedag
ogicos. Assim, a menos que efetue-se uma ligac
ao desses valores com os
conte
udos envolvidos na avaliac
ao, pode-se dizer apenas que um indivduo com
habilidade 1,80 na escala (0,1) deve possuir um conhecimento muito maior do
conte
udo avaliado do que um indivduo com habilidade -0,50, e tambem que
o primeiro indivduo tem uma habilidade 1,80 desvios-padrao acima da media
da populac
ao avaliada enquanto que o segundo tem habilidade 0,50 desvios-
http://www.keimelion.com.br
Keimelion
Reviso de textos
110
ancora, que por sua vez sao caracterizados por conjuntos de itens denominados itens
ancora. Nveis ancora sao pontos selecionados pelo analista na escala
da habilidade para serem interpretados pedagogicamente. Ja os itens ancora
s
ao itens selecionados, segundo a definic
ao dada abaixo, para cada um dos
nveis ancora.
Definic
ao de item
ancora: Considere dois nveis ancora consecutivos Y e Z
com Y < Z. Dizemos que um determinado item e
ancora para o nvel Z se e
somente se as 3 condic
oes abaixo forem satisfeitas simultaneamente:
1. P (U = 1| = Z) 0, 65
2. P (U = 1| = Y ) < 0, 50
3. P (U = 1| = Z) P (U = 1| = Y ) 0, 30
Em outras palavras, para um item ser
ancora em um determinado nvel
ancora da escala, ele precisa ser respondido corretamente por uma grande
proporc
ao de indivduos (pelo menos 65%) com este nvel de habilidade e
por uma proporc
ao menor de indivduos (no m
aximo 50%) com o nvel de
habilidade imediatamente anterior. Alem disso, a diferenca entre a proporcao
de indivduos com esses nveis de habilidade que acertam a esse item deve ser
de pelo menos 30%. Assim, para um item ser
ancora ele deve ser um item
tpicodaquele nvel, ou seja, bastante acertado por indivduos com aquele
nvel de habilidade e pouco acertado por indivduos com um nvel de habilidade
imediatamente inferior.
Como u
ltimo coment
ario, podemos dizer que e bastante comum fazer uma
transformac
ao linear em todos os par
ametros envolvidos antes da construc
ao
das escalas. Tal procedimento tem como u
nico objetivo facilitar a construc
ao
e utilizac
ao da escala, uma vez que procura transformar valores negativos ou
decimais em n
umeros positivos e inteiros.
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
6.2 Constru
c
ao e interpreta
c
ao de escalas de habilidade
111
a0 = 1, 52 ,
b0 = 0, 47
e c0 = 0, 13
a2 = 1, 97 ,
b2 = 1, 50 e c2 = 0, 13.
1,0
0,9
0,8
0,7
Item 2
Item 0
0,6
0,5
0,4
0,3
0,2
0,1
0,0
-3
-2
-1
habilidade
(i) P (U0 = 1| = 0) = 0, 80 0, 65
(ii) P (U0 = 1| = 1) = 0, 31 < 0, 50
(iii) P (U0 = 1| = 0) P (U0 = 1| = 1) = 0, 80 0, 31 = 0, 49 0, 30
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
112
e
(i) P (U2 = 1| = 2) = 0, 86 0, 65
(ii) P (U2 = 1| = 1) = 0, 27 < 0, 50
(iii) P (U2 = 1| = 2) P (U2 = 1| = 1) = 0, 86 0, 27 = 0, 59 0, 30.
A priori, n
ao se pode ter certeza de quantos itens ancoras serao selecionados
para cada nvel ancora e nem se existirao no teste aplicado itens ancoras para
todos os nveis ancora determinados. Por isto, e fundamental que os nveis
ancoras sejam escolhidos nao muito proximos uns dos outros e tambem que
o n
umero de itens aplicados seja bastante grande de modo a possibilitar a
construc
ao e interpretac
ao da escala de habilidade. No SAEB por exemplo,
foram aplicados 130 itens para cada uma das disciplinas avaliadas na 4.a serie
do Ensino Fundamental e 169 itens de cada uma das disciplinas da 8.a serie
do Ensino Fundamental e tambem da 3.a serie do Ensino Medio. Como ja
foi comentado anteriormente, essa quantidade de itens foi aplicada visando
cobrir amplamente a grade curricular de cada uma das series nas disciplinas
avaliadas e tambem propiciou a identificac
ao e caracterizac
ao de diversos nveis
ancora para a construc
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
113
Series e perodos
avaliados
1996
1996
1997
1997
1998
1998
Provas compostas
pelas Disciplinas
1-Lngua Portuguesa e 2-Matem
atica
1-Lngua Portuguesa, 2-Matem
atica,
3-Ciencias e 4-Hist
oria e Geografia
1-Lngua Portuguesa e 2-Matem
atica
1-Lngua Portuguesa, 2-Matem
atica,
3-Ciencias e 4-Hist
oria e Geografia
1-Lngua Portuguesa e 2-Matem
atica
1-Lngua Portuguesa, 2-Matem
atica,
3-Ciencias e 4-Hist
oria e Geografia
Como as avaliac
oes sao sempre realizadas no incio do ano letivo, as provas
de cada uma das series-alvo sao baseadas em conte
udos abordados no ano
anterior. Exemplificando, em 1996, as provas dos alunos da 3.a e 7.a series
foram elaboradas com base nos conte
udos relativos ao Ciclo Basico e `a 6.a
serie, respectivamente.
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
114
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
115
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
116
3. srie de 1996
4. srie de 1997
28 itens
30 itens
11 itens
21 itens
prova de ligao
3. srie de 1997
ligac
ao foi a 3.a serie de 1997, pois como ja foi dito, os itens das provas da 3.a
serie de 96 e da 4.a serie de 97 foram elaboradas com base nos conte
udos dos
anos anteriores, ou seja, eram referentes aos conte
udos do Ciclo Basico e da
3.a serie, respectivamente. Como a prova de ligac
ao foi aplicada no final do
ano letivo de 1997, a serie mais indicada para ser submetida a tal prova era,
portanto, a 3.a serie.
Todos os 58 itens, respondidos pelos alunos das 3 populac
oes envolvidas
foram ent
ao calibrados simultaneamente, atraves do modelo de 3 populac
oes
discutido no Captulo 5. Foram utilizados procedimentos bayesianos para a
estimac
ao dos parametros dos itens e das habilidades. Assim, foram consideradas distribuic
oes a priori para cada um dos par
ametros dos itens e tambem
distribuic
oes normais padrao a priori, para cada uma das populac
oes envolviAndrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
117
-4,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
3,0
4,0
5,0
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
118
-4,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
3,0
4,0
5,0
6.3.4 Interpretac
ao dos resultados
Podemos observar que o grafico da 4.a serie encontra-se deslocado para a
direita, com relac
ao ao grafico da 3.a serie. Houve um aumento na media da 4.a
serie em relac
ao `a 3.a (representada pela linha tracejada). Tambem podemos
observar que os alunos da 4.a serie parecem ser mais homogeneos do que os
alunos da serie anterior, com relac
ao `a habilidade em Lngua Portuguesa.
Foi feita uma transformac
ao linear nas estimativas dos parametros dos itens
e das habilidades dos alunos, visando um melhor entendimento dos resultados. Ap
os essa transformac
ao, a media e o desvio-padr
ao das habilidades dos
a
alunos da 3. serie de 1996 em Lngua Portuguesa foram fixados em 50 e 16,
respectivamente. Para a 4.a serie os valores obtidos foram 62 e 13.
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
119
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
120
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
121
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
http://www.keimelion.com.br
Keimelion
Reviso de textos
Captulo 7
Recursos computacionais
7.1 Introduc
ao
Sem d
uvida alguma, o crescimento e a divulgac
ao da TRI sempre estiveram
intimamente ligados ao desenvolvimento paralelo de recursos computacionais
que viabilizassem sua utilizac
ao. Isto porque as ferramentas matematicas necessarias para sua aplicac
ao sao muito mais complexas do que as tecnicas
empregadas na Teoria Classica de Medidas.
Desde suas primeiras aplicac
oes, pesquisadores tem desenvolvido seus pr
oprios programas computacionais, mas e certo que sua utilizac
ao em larga escala
depende diretamente da disponibilidade de programas computacionais comerciais no mercado. Na Europa e nos Estados Unidos, desde a decada de 70
foram lancados varios programas especficos para analise via TRI. Aqui no
Brasil, onde a utilizac
ao da TRI e bem mais recente, ha uma variedade bem
menor de programas computacionais comerciais sendo usados.
Neste captulo, vamos comentar os programas computacionais comerciais
mais usados atualmente no Brasil e que se prop
oem a resolver, na pratica,
muitos dos problemas abordados pela TRI e que foram descritos nos captulos
anteriores.
http://www.keimelion.com.br
Keimelion
Reviso de textos
124
Recursos computacionais
o caso dos itens, quando sao considerados como certo ou errado), est
ao implementados neste programa. Uma delas e a analise fatorial feita a partir da
matriz de correlac
ao tetrac
orica, que e um tipo especial de correlac
ao, utilizada quando as vari
aveis assumem apenas os valores 0 ou 1 (ver Divgi (1979)).
A outra tecnica implementada e a analise fatorial plena, baseada no metodo
de maxima verossimilhanca (ver Mislevy (1986b)).
Para a an
alise de itens nao dicotomicos, podemos citar o programa PARSCALE (ver Muraki & Bock (1997)), que tem implementados os modelos de
Resposta Gradual e de Creditos Parciais, descritos no Captulo 2. Em sua
vers
ao mais recente, e possvel fazer analises para mais de um grupo de respondentes.
Dos programas disponveis no mercado, os que sao atualmente mais utilizados nas analises envolvendo a TRI - aqui no Brasil - sao o BILOG (ver Mislevy
& Bock (1990) e o BILOG-MG (ver Zimowski et al. (1996)). Estes dois programas s
ao especficos para analises via TRI de itens dicot
omicos ou dicotomizados e ambos tem implementados os modelos unidimensionais logsticos de 1,
2 e 3 par
ametros. A diferenca basica entre eles e que o BILOG-MG permite a
analise de mais de um grupo de respondentes, enquanto que o BILOG permite
apenas analisar respondentes considerados como provenientes de uma u
nica
populac
ao.
Vamos comentar a seguir quais dos metodos de estimac
ao descritos nos
Captulos 3 e 5 estao implementados nestes dois programas e tambem dar
uma enfase especial ao desempenho deles perante as diversas situac
oes que
envolvem equalizac
oes, descritas no Captulo 4.
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
125
programa ir
a interpretar 1 como acerto e 0 como erro. No caso de esquemas
amostrais complexos, pode-se fornecer ao programa pesos diferentes para cada
um dos indivduos. Essas informac
oes devem estar em arquivos do tipo ASCII.
Os arquivos de sada, fornecidos ao usuario, tambem estarao neste formato.
Nessa fase e feita acorrec
aoda prova de cada respondente (no caso de ter
sido fornecido o arquivo com as respostas originais) e sao calculadas algumas
estatsticas descritivas, tais como: n
umero de indivduos submetidos a cada
item, n
umero e porcentagem de acerto em cada item e algumas correlac
oes de
interesse, como as correlac
oes bisserial e ponto bisserial (ver Lord & Novick
(1968), por exemplo), usadas na Teoria Classica de Medida. A importancia
dessa etapa do processamento, alem da verificac
ao de que a leitura dos dados
foi feita corretamente, e que estas estatsticas sao utilizadas posteriormente
como valores iniciais para os processos de estimac
ao realizados nas fases seguintes. Alem disso, estatsticas como a correlac
ao bisserial, fornecem um diagn
ostico preliminar dos itens, servindo por exemplo, na identificac
ao de itens
com problemas no gabarito.
A fase 2 e a fase da calibrac
ao dos itens. Nesta fase, sao estimados os
par
ametros dos itens, com seus respectivos erros-padrao. Os metodos de estimac
ao disponveis serao comentados na pr
oxima sec
ao. O BILOG fornece
ainda graficos contendo algumas informac
oes de interesse, tais como as curvas
caractersticas e as curvas de informac
ao de cada item e do teste. No BILOGMG esses gr
aficos tambem podem ser obtidos, mas com uma resoluc
ao bastante
baixa. Isto se deve ao fato de que o programa BILOG ja esta disponvel para
o sistema Windows, enquanto que o BILOG-MG ainda s
o tem vers
oes para
o sistema operacional DOS. Junto com a curva caracterstica de cada item e
fornecido tambem um teste de ajuste do modelo utilizado.
A fase 3 e a fase da estimac
ao das habilidades dos respondentes. Aqui sao
estimadas as habilidades de cada um dos indivduos, a partir dos resultados
obtidos na fase anterior. Essas habilidades inicialmente sao estimadas na escala
dos parametros dos itens. No entanto, pode-se especificar alguns tipos de mudancas na escala, que serao feitas tanto nas habilidades como nos par
ametros
estimados na fase anterior. Maiores detalhes quanto aos metodos de estimac
ao
realizados nesta fase que estao disponveis nesses programas serao fornecidos
na proxima sec
ao.
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
126
Recursos computacionais
7.2.2 M
etodos para a calibrac
ao dos itens
Como foi dito na sec
ao anterior, esses dois programas realizam inicialmente
a calibrac
ao (estimac
ao dos parametros) dos itens e depois a estimac
ao das habilidades dos respondentes. Dois metodos de estimac
ao para os parametros dos
itens estao implementados, tanto no BILOG, como no BILOG-MG: maxima
verossimilhanca marginal e um metodo bayesiano de estimac
ao por maximizac
ao da distribuic
ao marginal a posteriori.
Assim, como foi descrito nos Captulos 3 e 5, para que os parametros dos
itens possam ser estimados atraves de qualquer um desses dois metodos, e
necess
aria a utilizac
ao de distribuic
oes de probabilidade para as habilidades
dos respondentes. Esses programas assumem que os respondentes representam
uma amostra aleatoria de uma populac
ao de habilidades que pode ser assumida
como tendo ou uma distribuic
ao normal padrao, ou uma distribuic
ao discreta
arbitrariamente especificada pelo usu
ario, ou ainda uma distribuic
ao emprica,
a ser estimada conjuntamente com os parametros dos itens. Esta distribuic
ao
emprica e representada na forma de uma distribuic
ao discreta, atraves de
pontos de quadratura.
No caso de mais de um grupo de respondentes, quando usamos o BILOGMG, ao final do processo de calibrac
ao dos itens sao fornecidas tambem estimativas da media e desvio-padrao da distribuic
ao de habilidades a posteriori
para cada populac
ao.
Tambem, como ja foi citado nos captulos sobre estimac
ao, na estimac
ao
por maximizac
ao da distribuic
ao marginal a posteriori, distribuic
oes a priori
s
ao definidas para os parametros dos itens. No caso desses dois programas,
o usuario pode especificar prioris normais para o parametro de dificuldade,
prioris log-normais para os parametros de discriminac
ao e prioris beta para o
par
ametro de acerto casual.
O BILOG e o BILOG-MG utilizam duas formas de resolver as equac
oes de
verossimilhanca marginal: o algoritmo EM e o metodo Scoringde Fisher.
7.2.3 M
etodos implementados para a estimac
ao das habilidades
Uma vez terminada a calibrac
ao dos parametros, sera feita a estimac
ao
das habilidades dos respondentes. O BILOG e o BILOG-MG tem implementados os metodos de estimac
ao por maxima verossimilhanca, por esperanca a
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
127
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
128
Recursos computacionais
7.3 A equalizac
ao nos programas BILOG e BILOGMG
Quando desejamos que a equalizac
ao seja feita durante o processo de calibrac
ao dos itens, o uso de programas computacionais especificamente desenvolvidos para esse fim sao uma ferramenta bastante importante. O BILOG-MG
e um bom exemplo de um programa que pode ser utilizado na maioria dos
casos descritos no Captulo 4. Nesta sec
ao, vamos ent
ao descrever quando e
possvel sua utilizac
ao em cada um daqueles casos e em quais deles o BILOG
tambem pode ser usado. Os casos 1 a 6 tratam, respectivamente, das situac
oes
descritas nas Sec
oes 4.2.1 a 4.2.6 do Captulo 4. Ja os casos (a) a (c) tratam,
respectivamente, das situac
oes descritas nas Sec
oes 4.3.1 a 4.3.3.
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
7.3 A equaliza
c
ao nos programas BILOG e BILOG-MG
129
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
130
Recursos computacionais
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
7.3 A equaliza
c
ao nos programas BILOG e BILOG-MG
131
sao os proprios valores dos parametros que desejamos fixar e cujos desviospadr
ao sao tao pequenos que a distribuic
ao torna-se praticamente degenerada
naquele ponto. O que ocorre na pr
atica e que todos os parametros sao estimados novamente, mas a convergencia daqueles itens conhecidos e artificialmente
induzida para os valores que desejamos. Pode-se tambem reforcarainda mais
a convergencia utilizando-se outro recurso do programa, que e a definic
ao, por
parte do usuario, de valores iniciais convenientes. Mas, o uso deste tipo de procedimento pode acarretar alguns problemas. Por exemplo, se n
ao utilizarmos
novamente o mesmo grupo de respondentes da calibrac
ao inicial, poderemos ter
problemas para obter a convergencia nessa segunda calibrac
ao. E, na pratica,
muitas vezes nao dispomos do conjunto original de respondentes para juntarmos aos respondentes da nova aplicac
ao. E devemos ressaltar que estamos nos
referindo ao caso em que h
a uma u
nica populac
ao sendo submetida a uma
u
nica prova. O problema se torna ainda mais complexo, no caso de termos
mais de uma populac
ao envolvida (comentaremos essa situac
ao a seguir).
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
132
Recursos computacionais
pulac
ao 1, 1 desvio-padrao acima da media da populac
ao 1 (e portanto, e
relativamente difcil para este grupo) e 1 desvio-padr
ao abaixo da media da
populac
ao 2 (e portanto, e relativamente facil para este grupo). Suponha agora
que temos outras duas provas C e D, que ser
ao submetidas, respectivamente,
a amostras das populac
oes 3 e 4. Ambas as provas sao compostas de 30 itens,
sendo que ha 10 itens comuns entre elas. Suponha ainda que alem disso, ha
10 itens na prova C que sao comuns com a prova B e, portanto, que ja foram
calibrados anteriormente.
Figura 7.1 Esquematizac
ao dos itens comuns entre as provas
!
Desejamos ent
ao fixar os parametros desses 10 itens obtidos na calibracao
anterior e estimar todos os restantes. O motivo para isto seria que, procedendo
desta maneira, faramos uma equalizac
ao entre as populac
oes 1, 2, 3 e 4, tornando possvel qualquer comparac
ao entre elas. Mas, o que aconteceria se,
para tanto, utiliz
assemos apenas as populac
oes 3 e 4? Para comecar, teramos
que definir uma populac
ao de referencia, digamos a populac
ao 3. Logo, essa
populac
ao sera definida como tendo parametros (0,1), para que a populac
ao 4
seja posicionada com relac
ao a ela. Supondo que aquele item i, cujo valor de b
e 1, foi um dos 10 itens que tiveram seus par
ametros fixados, que interpretacao
deveramos ter sobre a relac
ao desse item com a populac
ao 3? A mesma que
j
a tivemos com relac
ao `a populac
ao 1: que ele esta 1 desvio-padrao acima da
media da populac
ao 3 e portanto, e relativamente difcil para este grupo. O
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
7.3 A equaliza
c
ao nos programas BILOG e BILOG-MG
133
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
http://www.keimelion.com.br
Keimelion
Reviso de textos
Captulo 8
Considerac
oes gerais
http://www.keimelion.com.br
Keimelion
Reviso de textos
136
Considera
c
oes gerais
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
137
penho de um mesmo respondente e acompanhado ao longo do tempo. Esses
u
ltimos modelos deveriam permitir a incorporac
ao de possveis estruturas de
covari
ancia entre as habilidades dos indivduos avaliados ao longo do tempo.
Estes modelos poderiam ser aplicados, por exemplo, nas an
alises dos dados
gerados pelo projeto AVEJU, da Secretaria de Estado da Educac
ao do Estado
de Sao Paulo, que acompanhou um grupo de alunos da escola p
ublica estadual
da 1a. serie (1992) ate a 3a. serie (1994) do Ensino Fundamental, e do projeto
FUNDESCOLA em implementac
ao pelo INEP/MEC, que dever
a acompanhar
um grupo de alunos de escolas p
ublicas de 6 estados, desde a 4a. serie (1999)
ate a 8a. serie (2003) do Ensino Fundamental.
Para finalizar, gostaramos de ressaltar dois outros pontos. O primeiro diz
respeito a disseminac
ao do uso da TRI em avaliac
oes educacionais brasileiras, que sem d
uvida alguma dependera muito da integrac
ao de especialistas
das areas de estatstica e educacao. A criac
ao de programas de pos-graduac
ao
envolvendo departamentos de estatstica e de medidas em educac
ao em algumas de nossas universidades, seria de fundamental import
ancia. A primeira
aplicac
ao da TRI no Brasil foi na analise do SAEB 95. Desde ent
ao, os org
aos
governamentais, atraves do MEC e algumas Secretarias da Educac
ao, vem valorizando e incentivando o uso dessa teoria nas suas avaliac
oes. No entanto, o
mercado de trabalho ainda esta bastante deficiente de profissionais com tais
qualificac
oes. O segundo ponto diz respeito a disseminac
ao do uso da TRI em
outras
areas do conhecimento.
Um ponto importante dessa metodologia e que tanto os itens, atraves de seus
parametros, quanto o traco latente associado sao medidos em uma mesma
metrica, permitindo com isso uma operacionalizac
ao dessa caracterstica latente que esta sendo medida, bem como a adequac
ao e a contribuic
ao de
cada um dos itens aplicados nessa operacionalizac
ao. Essa propriedade tem
levado pesquisadores de diferentes areas a aplicarem o modelo de Rasch, modelo com um u
nico parametro (o parametro b de dificuldade), na analise e
interpretac
ao de varios instrumentos de avaliac
ao (medida). Tres exemplos recentes seriam os trabalhos de DeRoos & Allen-Meares (1998), Tennant et. al.
(1996) e Granger et. al. (1998). O primeiro em psiquiatria e os dois u
ltimos em
reabilitac
ao medica. O modelo de Rasch e tambem descrito em Marcoulides
(1998) como um dos metodos modernos mais importantes para a pesquisa na
area de negocios. Sugerimos aos leitores mais interessados a participac
ao nas
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
138
Considera
c
oes gerais
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
Apendice A
A.1 Express
oes da p
agina 40
Para chegarmos `
as expressoes de H( i ) e h( i ) usadas em (3.25), notemos
que de (3.22),
(
)
2
n
X
uji Pji
uji Pji 2 Pji
Pji
Pji 0
log L()
.
=
Pji Qji
Pji Qji
i
i
i 0i
i 0i
j=1
(A.1)
Porem,
Pji Qji
i
2 Pji
a2i
2 Pji
ai bi
2 Pji
ai ci
2 Pji
b2i
2 Pji
bi ci
2 Pji
c2i
= (1 2Pji )
Pji
,
i
i {ai , bi , ci },
(A.2)
(A.3)
(A.4)
(A.5)
(A.6)
Qji
= 0.
ci
http://www.keimelion.com.br
(A.7)
Keimelion
Reviso de textos
140
Com estas expressoes obtemos 2 Pji /( i 0i ). Sejam
Pji
i
D(1 ci )(j bi )
= Dai (1 ci ) ,
1
Pji
2 Pji
=
i 0i
D2 (1 ci )(j bi )2 (1 2Pji )
.
.
= D(1 ci ){1 + Dai (j bi )(1 2Pji )} D2 a2i (1 ci )(1 2Pji ) . .
D(j bi )
Dai
0
H ji
(Pji Qji )1
h( i )
j=1
n
X
(A.8)
j=1
Retornando a (A.1),
H( i )
=
log L()
i 0i
(
n
X
uji Pji
j=1
n
X
Pji Qji
(Pji Qji )H ji
uji Pji
Pji Qji
)
(Pji Qji )2 hji h0ji
(A.9)
j=1
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
A.2
141
A.2 Express
oes da p
agina 46
Para chegarmos `
as expressoes de H(j ) e h(j ) usadas em (3.40), notemos
que de (3.35),
(
2 !)
I
X
uji Pji
Pji
uji Pji
Pji
2 log L()
=
+
2
j
Pji Qji
j
Pji Qji
j
j2
i=1
(
2 !
)
I
X
uji Pji
Pji
uji Pji 2 Pji 2
=
(. A.10)
2
Pji Qji
Pji Qji
j
j
i=1
A segunda parcela em (A.10) e obtida por (3.37). Com relac
ao `a primeira,
temos
2 Pji
j2
(A.11)
Sejam
hji =
(Pji Qji )1
Pji
j
2 Pji
j2
= Dai (1 ci ),
(A.12)
(A.13)
h(j )
i=1
I
X
i=1
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
142
Retornando a (A.10),
log L()
j2
(
)
I
X
uji Pji
uji Pji 2 2 2
=
(Pji Qji )Hji
(Pji Qji ) hji
Pji Qji
Pji Qji
H(j )
i=1
I
X
=
(uji Pji )Wji Hji (uji Pji )Wji h2ji .
(A.14)
i=1
A.3 Express
oes da p
agina 59
b e hP I ( ) usadas em (3.72), coPara chegarmos `as expressoes de H P I ()
i
mecemos adotando a notac
ao
vji = (uji Pi )
(uji Pi )
Wi
=
.
Pi Qi
Pi Qi
vji
Pi
i
P (uj. |, ).
(A.15)
hi(j)
P (uj. |, )/ i
P (uj. |, )
Z
Pi
gj ()d.
=
vji
i
IR
(A.16)
Com relac
ao `a primeira parcela de (3.71), notemos que
Z
2 P (uj. |, )
Pi 0
=
P (uj. |, )g(|)d
vji
i
i
i 0i
IR
Pi 0
vji
P (uj. |, ) g(|)d.
=
i
IR i
Andrade, Tavares & Valle
http://www.keimelion.com.br
(A.17)
SINAPE 2000
Keimelion
Reviso de textos
A.3
143
Pi 0
vji
P (uj. |, ) =
i
P (uj. |, )
Pi 0
Pi 0
vji
P (uj. |, ) + vji
=
i
i
i
i
Pi
Pi
Pi
Pi
Pi 0
2
2
P (uj. |, ) + vji P (uj. |, )
+ vji
= vji
i
i
i
i
i 0i
2
Pi
P (uj. |, )
= vji
i 0i
Z
IR
vji
2 Pi
i 0i
P (uj. |, )g(|)d.
H ii(j)
2 P (uj. |, )/( i 0i )
P (uj. |, )
Z
=
IR
vji
2 Pi
i 0i
gj ()d. (A.18)
2 P (uj. |, )
Pi 0
=
P (uj. |, )g(|)d
vji
l
i
l 0i
IR
Z
P (uj. |, )
Pi 0
g(|)d
=
vji
l
i
IR
Z
Pi 0
Pl
P (uj. |, )g(|)d
=
vji vjl
l
i
IR
Portanto, para l 6= i, a primeira parcela em (3.71) pode ser escrita como
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
144
H il(j)
2 P (uj. |, )/( l 0i )
P (uj. |, )
=
IR
vji vjl
Pl
l
Pi
i
gj ()d
(A.19)
hi = (Pi Qi )1
Pi
i
D(1 ci )( bi )
= Dai (1 ci ) ,
1
Pi
2 Pi
=
i 0i
D2 (1 ci )( bi )2 (1 2Pi )
.
.
= D(1 ci ){1 + Dai ( bi )(1 2Pi )} D2 a2i (1 ci )(1 2Pi ) .
D( bi )
Dai
0
H ii
(Pi Qi )1
e, para i 6= l,
H il =
=
hi h0l
(Pi Qi )1 (Pl Ql )1
D2 (1 c )(1 c )( b )( b )
i
D2 ai (1
ci )(1 cl )( bl )
D(1 cl )( bl )/Pi
Pi
i
Pl
l
D2 al (1 ci )(1 cl )( bi )
D2 ai al (1 ci )(1 cl )
Dal (1 cl )/Pi
D(1 ci )( bi )/Pl
Dai (1 ci )/Pl
[Pi Pl ]1
Retornando a (A.18), temos que a primeira parcela de (3.71) pode ser reescrita como
Z
H ii(j) =
IR
e, para i 6= l,
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
A.3
145
Z
H il(j) =
IR
(A.20)
2 log L(, )
l 0i
s
o
X n
=
rj H il(j) hi(j) h0l(j) .
(A.21)
H( i , l ) =
j=1
h( 1 )
hP I () = ...
h( I )
H( 1 , 1 )
..
..
H P I () =
.
.
H( I , 1 )
H( 1 , I )
..
.
.
H( I , I )
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
http://www.keimelion.com.br
Keimelion
Reviso de textos
Refer
encias Bibliogr
aficas
[1] Andersen, E. B. (1973). Conditional inference in multiple choice questionnaires. British Journal of Mathematical and Statistical Psychology, 26,
31-44.
[2] Andersen E. B. (1980). Discrete Statistical Models with Social Science
Applications. New York: North-Holand Publishing Company.
[3] Andrade, D. F. (1999). Comparando o Desempenho de Grupos (Populaco
es) de Respondentes Atraves da Teoria da Resposta ao Item. Tese
apresentada ao Departamento de Estatstica e Matematica Aplicada da
UFC para o concurso de professor titular.
[4] Andrade, D. F. e Klein, R. (1999). Metodos estatsticos para avaliac
ao
educacional : teoria da resposta ao item. Boletim da ABE, 43, 21-28.
[5] Andrade, D. F. e Valle, R. C. (1998). Introduc
ao `a teoria da resposta
ao item: conceitos e aplicac
oes. Estudos em Avaliaca
o Educacional, 18,
13-32.
[6] Andrich, D. (1978). A rating formulation for ordered response categories.
Psychometrika, 43, 561-573.
[7] Baker,F. B. (1992). Item Response Theory - Parameter Estimation Techniques. New York: Marcel Dekker, Inc.
[8] Batista, J.R. (1999). Valores Plausveis para Estimac
ao de Par
ametros
Populacionais em Modelos da Teoria da Resposta ao Item. Dissertac
ao
de Mestrado. Belo Horizonte: ICEX/UFMG.
[9] Beaton, A. E. and Allen, N. L. (1992). Interpreting scales through scale
anchoring. Journal of Educational Statistics, 17, 191-204.
http://www.keimelion.com.br
Keimelion
Reviso de textos
REFERENCIAS
BIBLIOGRAFICAS
148
[10] Birnbaum, A. (1957). Efficient design and use of tests of a mental ability
for various decision-making problems, ( Series Report No. 58-16. Project
No. 7755-23). USAF School of Aviation Medicine, Texas: Randolph Air
Force Base.
[11] Birnbaum, A. (1968). Some Latent Trait Models and Their Use in Infering
an Examinees Ability. In F.M. Lord & M.R. Novick. Statistical Theories
of Mental Test Scores. Reading, MA:Addison-Wesley.
[12] Bock, R. D. (1972). Estimating item parameters and latent ability when
responses are scored in two or more nominal categories. Psychometrika,
37, 29-51.
[13] Bock, R. D. and Aitkin, M. (1981). Marginal maximum likelihood estimation of item parameters: An application of a EM algorithm. Psychometrika, 46, 433-459.
[14] Bock, R. D. and Lieberman, M. (1970). Fitting a response model for n
dichotomously scored items. Psychometrika, 35, 179-197.
[15] Bock, R. D. and Zimowski, M. F. (1997). Multiple Group IRT. In Handbook of Modern Item Response Theory. W.J. van der Linder e R.K. Hambleton Eds. New York: Spring-Verlag.
[16] Chow, Y.S. and Teicher, H. (1978). Probability Theory: Independence,
Interchangeability, Martingales. New York: Springer-Verlag.
[17] Dempster, A. P. , Laird, N. M. and Rubin, D. B. (1977). Maximum likelihood from incomplete data via the EM algorithm (with discussion).
Journal of the Royal Statistical Society, Series B, 39, 1-38.
[18] DeRoos, Y. and Allen-Meares, P. (1998). Applications of rasch analysis:
exploring differences in depression between african-american and white
children. Journal of Social Service Research, 23, 93-107.
[19] Divgi, D. R. (1979). Calculation of the tetrachoric correlation coefficient.
Psychometrika, 44, 169-172.
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
REFERENCIAS
BIBLIOGRAFICAS
149
[20] Fundac
ao Carlos Chagas (1997). Avaliac
ao das Escolas Estaduais de Ensino Fundamental e Ensino Medio do Rio Grande do Norte, 4v. Sao Paulo
: Fundac
ao Carlos Chagas.
[21] Fundac
ao Carlos Chagas (1998). Programa de Aceleraca
o da Aprendizagem: avaliac
ao final, avaliac
ao do material did
atico e apendice, 3v. Sao
Paulo : Fundac
ao Carlos Chagas / Instituto Ayrton Senna.
[22] Genz, A. C. and Malik, A. A. (1980). An adaptive alghorithm for numerical integration over a N -retangular region. J. Comput. Appl. Math., 6,
295-302.
[23] Goldstein, H. (1994). Recontextualizing mental measurement. Educational Measurement : Issues and Practice, 13, 16-43.
[24] Goldstein, H. and Wood, R. (1989). Five decades of item response modelling. British Journal of Mathematical and Statistical Psychology, 42,
139-167.
[25] Granger, C. V., Deutsch, A. and Linn, R. T. (1998). Rasch analysis of
the functional independence measure (FIMTM) mastery test. Arch. Phys.
Med. Rehabil., 79, 52-57.
[26] Graybill, F. A. (1969). Introduction to Matrices with Aplications in Statistics. Belmont, CA: Wadsworth Publishing Company, Inc.
[27] Gulliksen, H. (1950). Theory of Mental Tests. New York : John Wiley
and Sons.
[28] Haberman, S. (1975). Maximum Likelihood Estimates in Exponential Response Models, (Technical Report) Chicago, IL: University of Chicago.
[29] Haley, D. C. (1952). Estimation of the dosage mortality relationship when
the dose is subject to error, (Technical Report, 15) Stanford, Calif.: Stanford University, Applied Mathematics and Statistics Laboratory.
[30] Hambleton, R.K. and Cook, L.L. (1997). Latent trait models and their
use in the analysis of educational test data. Journal of Educational Measurement, 14, 75-96.
Andrade, Tavares & Valle
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
REFERENCIAS
BIBLIOGRAFICAS
150
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
REFERENCIAS
BIBLIOGRAFICAS
151
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
REFERENCIAS
BIBLIOGRAFICAS
152
[57] Muraki, E. and Bock, R. D. (1997). PARSCALE : IRT Based Test Scoring
and Item Analysis for Graded Open-Ended Exercices and Performance
Tasks. Chicago : Scientific Software, Inc.
[58] Nelder, J. A. (1961). The fitting of a generalization of the logistic curve.
Biometrika, 17 , 89-100.
[59] Nelder, J. A. (1962). An alternative form of a generalized logistic equation.
Biometrics, 18 , 614-616.
[60] Neyman, J. and Scott, E. L. (1948). Consistent estimates based on partially consistent observations. Econometrika, 16 (1), 1-32.
[61] Novick, M. R. (1966). The axioms and principal results of classical test
theory. Journal of Mathematical Psycology, 3,1-18.
[62] Rao, C. R. (1973). Linear Statistical Inference and Its Applications. New
York: Wiley & Sons.
[63] Rasch, G. (1960). Probabilistic Models for Some Intelligence and Attainment Tests. Copenhagen : Danish Institute for Educational Research.
[64] Richardson, M. W. (1936). The relationship between difficulty and the
differential validity of a test. Psychometrika, 1, 33-49.
[65] Samejima, F. A. (1969). Estimation of latent ability using a response
pattern of graded scores. Psychometric Monograph, 17.
[66] Secretaria de Estado da Educac
ao de Sao Paulo (1996). Sistema de Avaliac
ao de Rendimento Escolar do Estado de S
ao Paulo - SARESP : relat
orio final dos resultados, 3v. Sao Paulo : SEE.
[67] Secretaria de Estado da Educac
ao de Sao Paulo (1997). Sistema de Avaliac
ao de Rendimento Escolar do Estado de S
ao Paulo - SARESP : relat
orio final dos resultados, 4v. Sao Paulo : SEE.
[68] Sen, P. K., Singer, J. M. (1993). Large Sample Methods in Statistics: An
Introduction With Applications. New York: Chapman & Hall.
Andrade, Tavares & Valle
http://www.keimelion.com.br
SINAPE 2000
Keimelion
Reviso de textos
REFERENCIAS
BIBLIOGRAFICAS
153
SINAPE 2000
http://www.keimelion.com.br
Keimelion
Reviso de textos
REFERENCIAS
BIBLIOGRAFICAS
154
http://www.keimelion.com.br
SINAPE 2000