Ensaio Da Ferramenta DIA Diagnóstico e Informação Do Aluno

Universidade do Estado do Rio de Janeiro
Centro de Tecnologia e Ciências

Instituto de Matemática e Estatística
Renata Cardoso Pires de Abreu
Ensaio da Ferramenta DIA – Diagnóstico e Informação do aluno.
Rio de Janeiro
2012
Dissertação apresentada, como

requisito parcial para obtenção do
título de Mestre ao Programa de
Pós-Graduação em Ciências
Computacionais, da Universidade
do Estado do Rio de Janeiro
Orientadora: Profª. Dra. Patrícia Nunes da Silva
Coorientador: Prof. Dr. Carlos Frederico F. B. Vasconcellos
Rio de Janeiro
2012
CATALOGAÇÃO NA FONTE
UERJ/REDE SIRIUS/CBB
A162 Abreu, Renata Cardoso Pires de.

Ensaio da ferramenta DIA: diagnóstico e informação do aluno /
Renata Cardoso Pires de Abreu. - 2012.
98f.:il.
Orientadora: Patrícia Nunes da Silva.
Coorientador: Carlos Frederico F. de B. e Vasconcellos.
Dissertação (Mestrado) – Universidade do Estado do Rio de
Janeiro. Instituto de Matemática e Estatística.
1. Matemática - Estudo e ensino. 2. Avaliação educacional -

Teses. 3. Aprendizagem - Teses. I. Silva, Patrícia Nunes da. II.
Vasconcellos, Carlos Frederico F. de B. e III.Universidade do
Estado do Rio de Janeiro. Instituto de Matemática e Estatística. IV.
Título.
CDU 51.07
Autorizo, apenas para fins acadêmicos e científicos, a reprodução total ou parcial desta
dissertação, desde que citada a fonte.
__________________________________ ____________________________
Assinatura Data
Dissertação apresentada, como requisito

parcial para obtenção do título de Mestre
ao Programa de Pós-Graduação em
Ciências Computacionais, da
Universidade do Estado do Rio de Janeiro
Aprovada em 6 de agosto de 2012
Banca examinadora:
______________________________________________
Profª Dra. Patrícia Nunes da Silva (Orientadora)
Instituto de Matemática e Estatística – UERJ
_______________________________________________
Prof. Dr. Carlos Frederico F. B. Vasconcellos (Coorientador)
_________________________________________________
Prof. Dr. Carlos Antonio de Moura
________________________________________________
Profª Dra. Gilda Helena Bernardino de Campos
Pontifícia Universidade Católica – PUCRio
_______________________________________________________
Prof. Dr. Gerson Pastre de Oliveira

Pontifícia Universidade Católica – PUCSP
___________________________________________
Profª Dra. Chang Kuo Rodrigues
Universidade Severino Sombra
Rio de Janeiro
2012
AGRADECIMENTOS
Essa dissertação é o resultado de um investimento pessoal, mas que só foi possível devido ao
esforço, em diferentes formas, de várias pessoas que me abriram a mente e que merecem ser
reconhecidas. Não imaginei que um desejo pessoal me conduzisse por um caminho tão rico .
Por isso, agradeço:
a Deus,
à minha família, especialmente às minhas filhas, Maria Fernanda e Maria Gabriela e ao meu
marido Nicola pela compreensão nos momentos de muita inquietação e ansiedade,
à Profª Patrícia, minha orientadora, por cumprir a função de orientação de uma forma
brilhante, completa, exigente, me dando sempre muito incentivo nessa travessia que parecia
sem fim,
ao Prof. Frederico, meu coorientador, que nas primeiras etapas para participar deste mestrado
me recebeu e me entrevistou, com muita seriedade,
ao Prof. Moura, coordenador do mestrado e participante da banca, que com seu carinho e
dedicação, não me permitiu desistir,
à amiga e Profª Gilda, participante da banca, pelo apoio que sempre me deu na vida
acadêmica, durante todo um percurso que já vem de longa data,
ao amigo e Prof. Jano, que me apresentou como canditada a uma vaga desse mestrado, me
abrindo as portas para um novo mundo,
aos professores do mestrado, por me mostrarem tantos conhecimentos novos,
ao Prof.Gerson e a Profª Chang, também membros da banca, pela participação e comentários

que enriqueceram essa dissertação nos momentos finais.
À todos vocês meu muito obrigado.

RESUMO
ABREU, Renata Cardoso Pires de. Ensaio da Ferramenta DIA: Diagnóstico e Informação do
aluno. 2012. 98 f.:il. Dissertação de mestrado em Ciencias Computacionais - Instituto de
Matemática e Estatística, Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2012.
Apresentamos os resultados de nossa pesquisa para concepção, execuçãoo e avaliação

de uma ferramenta adaptativa informatizada, denominada DIA, que permita tanto avaliar
como fornecer feedback a estudantes sob uma perspectiva de avaliação formativa. Na
primeira etapa, usamos os PCN: Ciências da Natureza, Matemática e suas Tecnologias
(BRASIL, 1998) e as Matrizes Curriculares de Referência do Instituto Nacional de Estudos e
Pesquisas Educacionais - INEP, para o Sistema de Avaliação para a Educação Básica- SAEB
(BRASIL, 2005), para construir uma escala, em que os objetivos estão em ordem crescente,
de acordo com o desenvolvimento vertical da construção do conhecimento em Matemática.
Entrelaçamos os objetivos propostos para criar um Banco de Itens (BI), que foi usado em
nossas simulações. Analisamos os resultados obtidos em nosso ensaio para avaliar o diálogo
entre o BI e a escala sob a perspectiva de oferecer um diagnóstico de lacunas na construção do
conhecimento matemático. Em nosso ensaio, simulamos o funcionamento da ferramenta DIA
através de um teste adaptativo informatizado baseado na Teoria de Resposta ao Item (TRI).
Também estamos interessados em determinar um perfil de um Banco de Itens, que seja capaz
de forma significativa de dialogar com nossa escala através de TRI. A escala e o banco de
itens a ela associado devem viabilizar um feedback construtivo que ajude os alunos a
desenvolverem competências metacognitivas.
Palavras-chave: Avaliação. Teste Adaptativo Informatizado (TAI). Teoria da Resposta ao

Item (TRI).
ABSTRACT
We´ve presented the results of our research for the conception, execution and
evaluation of an informatized adaptive tool, known as DIA (in portuguese), that allows
evaluate and give a feedback to the student under the perspective of formative evaluation. At
the first stage, we used the PCN: Sciency of the Nature, Mathematics and its Technologies
(BRASIL, 1998) and the Curriculum Matrices of Reference from the Instituto Nacional de
Estudos e Pesquisas Educacionais -INEP, to the Sistem of Evaluation for Basic Education -
SAEB (BRASIL, 2005) to build a scale in wich the objectives are in increasing order,
according to the vertical development of the knowledge construction in Mathematics. We
linked the proposed objectives to create a Data Bank (BI, in portuguese) that was used in our
simulations. We´ve analized the results of our essay to evaluate the comunication between the
data bank and the scale under the perspective of giving a diagnosis of the construction of the
mathematics knowledge. In our essay, we simulated the functionning of the DIA tool through
an adaptive informatized test based on the "Teoria de Resposta ao Item" (TRI). We were also
interested on determing a profile of a Data Bank (BI) that is able to significantly dialogue
with our scale through the TRI. The scale and the associated data bank should provide a
constructive feedback that will help the stundents develop their metacognitives competencies.
Keywords: Evaluation. Computerized Adaptive Testing (CAT). Item Response Theory

(IRT).
LISTA DE FIGURAS
Figura 1 – Curva Característica do Item................................................................... 23
Figura 2 – Curva Característica de um Item com “discriminação perfeita”............. 24
Figura 3 – Curva Característica do Item................................................................... 25
Figura 4 – Invariância da Curva Característica de um Item .................................... 29
Figura 5 – Octógono inscrito em quadrado ............................................................. 40
Figura 6 – Etapa 1 .................................................................................................... 71
Figura 7 – Etapa 2 .................................................................................................... 72
Figura 8 – Etapa 3 .................................................................................................... 73
Figura 9 – Objetivo 194............................................................................................ 74
Figura 10 – Etapa 4 .................................................................................................... 75
Figura 11 – Etapa 5 .................................................................................................... 76
Figura 12 – Objetivo 159............................................................................................ 76
Figura 13 – Etapa 6 .................................................................................................... 77
Figura 14 – Conjunto de objetivos testados ............................................................... 78
Figura 15 – Diagnóstico.............................................................................................. 79
Figura 16 – Gráfico da Função de Informação com os parâmetros ,a e c fixados . 97
Figura 17 – Gráfico do ML3P com os parâmetros ,a e c fixados............................ 98

LISTA DE TABELAS
Tabela 1 – Descrição dos Objetivos................................................................................ 47
Tabela 2 – O entrelaçamento dos objetivos..................................................................... 51
Tabela 3 – Questões geradas a partir do objetivo O118 ................................................. 53
Tabela 4 – Questões geradas a partir do objetivo O120 .................................................. 53
Tabela 5 – Questões geradas a partir do objetivo O159 .................................................. 54
Tabela 6 – Objetivos do 6º ao 8º ano utilizados no entrelaçamento................................. 59
Tabela 7 – estimados dos 23 respondentes do ensaio da ferramenta DIA..................... 64
Tabela 8 – Exemplo grupo Respostas............................................................................... 65
Tabela 9 – Objetivos respondidos incorretamente .......................................................... 66
Tabela 10 – Objetivos respondidos corretamente ............................................................. 66
Tabela 11 – Objetivos Diagnosticados .............................................................................. 66
Tabela 12 – Objetivos Testados ......................................................................................... 66
Tabela 13 – Objetivos testados e não diagnosticados ........................................................ 67
Tabela 14 – Calibração ...................................................................................................... 67
Tabela 15 – Descrição dos objetivos ................................................................................. 68
Tabela 16 – Questões respondidas incorretamente ............................................................ 69
Tabela 17 – Descriçao dos objetivos.................................................................................. 69
Tabela 18 – Tabela de Respostas ....................................................................................... 71
Tabela 20 – Tabela Comparativa ....................................................................................... 79

LISTA DE QUADROS
Quadro 1 – Espaço e Forma 44
Quadro 2 – Grandezas e Medidas 45
Quadro 3 – Descritores do Tema I. Espaço e Forma 46
Quadro 4 – Descritores do Tema II. Grandezas e Medidas 46
Quadro 5 – Descritores do Tema III. Números e Operações 47

LISTA DE ABREVIATURAS E SIGLAS
TAI Testes Adaptativos Informatizados
DIA Diagnóstico e Informação do Aluno
PCN Parâmetros Curriculares Nacionais
INEP Instituto Nacional de Estudos e Pesquisas Educacionais
SAEB Sistema de Avaliação da Educação Básica
IDEB Indice de Desenvolvimento da Educação Básica
PDE Plano de Desenvolvimento da Escola
TRI Teoria da Resposta ao Item
CCI Curva Característica do Item
MLP3 Modelo Logístico de Três Parâmetros
MMV Método de Máxima Verocimilhança

SUMÁRIO
INTRODUÇÃO............................................................................................. 13
1 ASPECTOS TEÓRICOS E METODOLÓGICOS.................................... 15
1.1 Avaliação........................................................................................................ 15
1.1.1 Avaliações Somativa e Formativa................................................................... 16
1.1.2 Avaliação em Larga Escala............................................................................. 20
1.2 Teoria da Resposta ao Item (TRI)................................................................ 22
1.2.1 Modelo Logístico de três Parâmetros.............................................................. 24
1.2.2 Calibração dos Parâmetros.............................................................................. 26
1.2.2.1 Método da Máxima Verossimilhança – MMV ............................................... 26
1.2.3 Invariância da Estimativas............................................................................... 28
1.3 Testes Adaptativos Informatizados ............................................................. 29
1.3.1 TAI baseados na Teoria da Resposta ao Item................................................. 32
1.3.1.1 Banco de Itens ............................................................................................... 32
1.3.1.2 Critério de seleção de itens ............................................................................ 33
1.3.1.3 Estimativas da habilidade .............................................................................. 34
1.3.1.4 Critério de parada do teste ............................................................................. 36
1.4 Aspectos Metodológicos ............................................................................... 36
2 FERRAMENTA DIA ................................................................................... 38

2.1 Construção da Escala .................................................................................. 41
2.1.1 A importância dos objetivos............................................................................ 42
2.1.2 A Escala........................................................................................................... 42
2.1.3 O entrelaçamento dos objetivos ..................................................................... 50
2.2 Banco de Itens .............................................................................................. 51
2.3 Algoritmo ....................................................................................................... 56
3 ENSAIO DA FERRAMENTA DIA............................................................. 58

3.1 Protótipo da ferramenta DIA ...................................................................... 58
3.1.1 A Escala .......................................................................................................... 58
3.1.2 Banco de Itens................................................................................................. 58
3.1.3 O critério de seleção dos itens ........................................................................ 60
3.1.4 O estimador do parâmetro de habilidade  ................................................... 60
3.1.5 O critério de parada ...................................................................................... 60
3.2 Experimentos ................................................................................................ 61
3.2.1 Simulação de Respostas ................................................................................. 61
3.3 Algoritmo ....................................................................................................... 61
3.3.1 Algoritmo ....................................................................................................... 62
4 ANÁLISE....................................................................................................... 64
4.1 Dados da Análise c  2, 25 ................................................................. 65
4.1.1 Grupo de Respostas ........................................................................................ 65
4.1.2 Grupo de Diagnósticos ................................................................................... 66
4.2 Diagnóstico DIA c  2, 25 ....................................................................... 67
4.3 Etapas ............................................................................................................ 70
4.4 Diagnóstico .................................................................................................... 77
5 CONSIDERAÇÕES FINAIS........................................................................ 82
5.1 Trabalhos Futuros......................................................................................... 83
REFERÊNCIAS............................................................................................. 85
APÊNDICE A – Objetivos ........................................................................... 90
APÊNDICE B – O ML3P e o Critério da Máxima Informação .................... 95
13
INTRODUÇÃO
Esta pequisa foi movida e motivada pelas inquietações suscitadas por muitos anos de
trabalho com alunos que apresentam dificuldades na aprendizagem da matemática e pela busca
(incessante!) por soluções que pudessem minimizá-las. Com isso, surgiu a ideia de construir
uma ferramenta capaz de diagnosticar e fornecer informações ao aluno – DIA – informações
essas extraı́das, principalmente, dos erros cometidos nos testes por eles praticados. O estudo
do erro em qualquer disciplina e, especialmente na Matemática, pode contribuir para tornar a
avaliação mais produtiva no processo de aprendizagem, tendo, como consequência, a facilitação
da aquisição dos conhecimentos. Segundo Miranda e Silva (2011), o estudo sobre o erro con-
tribui para diagnosticar dificuldades de aprendizagem, revelar o desenvolvimento cognitivo dos
alunos, evidenciar o desenvolvimento da aprendizagem individual do aluno, revelar indı́cios
de obstáculos didáticos e, ainda, abrir espaço para a reflexão docente quanto aos seus próprios
erros. A motivação para o desenvolvimento do projeto dessa pesquisa é dupla: há o anseio de
contribuir na superação de problemas de baixo rendimento no processo de aprendizagem da ma-
temática e também há a expectativa de ajudar os alunos a exercer mais controle e refletir sobre
seu próprio processo de aprendizagem. O papel que as estratégias de aprendizagem desempe-
nham, tanto para uma aprendizagem efetiva, quanto para a autorregulação, tem sido cada vez
mais reconhecido pelos educadores (BROWN, 1978 apud BORUCHOVITCH, 1999). Além
desses teóricos, Zimmerman (apud FRISON, 2007) e Teixeira (2004) encaminham seus depoi-
mentos para o entendimento de que a autorregulação é uma teoria com ênfase na estimulação
de processos especı́ficos que visam criar, implementar e ajustar estratégias de ensino às apren-
dizagens dos alunos. Dentre as fases do processo de autorregulação, nós nos detemos nessa
pesquisa à que se refere à autorreflexão: processo que influencia o aluno impulsionando-o
a refletir sobre sua aprendizagem. Nas pesquisas feitas por Frison (2007), ao investigar es-
tratégias de autorregulação da aprendizagem desenvolvidas em ambientes educativos não esco-
lares, constatou-se que “a participação autônoma, ativa e planejada do aprendiz nos processos
de ensino e de aprendizagem são componentes indispensáveis para que a aprendizagem seja
mais produtiva, comprometida e efetiva”. O ponto de vista que vamos desenvolver nessa pes-
quisa é o de que intervenções pedagógicas utilizadas para a construção desse processo devem
ser ajustadas às necessidades e caracterı́sticas do aluno, proporcionando a ele uma reflexão
sobre a sua aprendizagem. No que se refere às estratégias de autorreflexão da aprendizagem
levantamos as seguintes questões: Como o aluno as desenvolve? Que tipo de ajuda individua-
lizada e adequada ao seu nı́vel de dificuldade pode ser oferecida? Neste trabalho, entendemos
a aprendizagem como o resultado de uma construção individual. Uma das estratégias pen-
sadas para alimentar o processo de autorregulação da aprendizagem é a utilização de testes de
autoavaliação que, através dos erros apresentados, apontem e identifiquem as dificuldades a eles
subjacentes e associadas. O conhecimento de suas próprias dificuldades é um valioso ponto de
14
partida para a autorregulação da aprendizagem.
Havendo o interesse em personalizar e individualizar a avaliação, os chamados testes

adaptativos informatizados (TAI) apresentam-se como ferramentas de grande potencial. Nes-
ses testes, cada aluno se depara com um conjunto de perguntas que é adequado ao seu nı́vel
de habilidade. Dessa forma, para cada aluno, as questões são dinamicamente selecionadas,
levando em conta seu desempenho individual. Para a implementação de um TAI, , existem ba-
sicamente, mas não unicamente, dois principais elementos: a construção de um banco de itens
e o desenvolvimento de um algoritmo para seleção adaptativa dos itens. Subjacente a esses
elementos, encontra-se a construção de uma escala que permitirá a interpretação dos resulta-
dos. Para o propósito de diagnóstico da ferramenta DIA, conjugar a análise de erros com TAI
revelou-se uma alternativa promissora. No entanto, como o uso do TAI na ferramenta DIA não
é classificatório nem de determinação do nı́vel de habilidade do aluno para a interpretação dos
resultados, associamos ao TAI, não uma escala classificatória, mas sim, uma escala na qual os
objetivos são ordenados de acordo com o desenvolvimento vertical na construção do conhe-
cimento da matemática. Para tanto, utilizamos os Parâmetros Curriculares Brasileiros (PCN)
para o ensino de matemática e as Matrizes de Competências e Habilidades de Matemática do
Instituto Nacional de Estudos e Pesquisas Educacionais - INEP.
O propósito dessa pesquisa foi apresentar um protótipo da ferramenta DIA e realizar

um ensaio a fim de verificar se, a partir da escala proposta e do banco de itens, o algoritmo
desenvolvido provê um diagnóstico com informações das dificuldades apresentadas pelo aluno
testado.
Este trabalho está estruturado em capı́tulos: o Capı́tulo 1 apresenta os aspectos teóricos

e metodológicos da pesquisa, nele foram destacados os três temas considerados centrais: a
avaliação, a teoria da resposta ao item (TRI) e os testes adaptativos informatizados (TAI). O
Capı́tulo 2 descreve a construção essencial da ferramenta DIA (diagnóstico e Informação do
aluno), mostrando a importância do trabalho com objetivos, do banco de itens e do algoritmo
que, juntos, viabilizam o diagnóstico. O terceiro capı́tulo apresenta o ensaio da ferramenta DIA,
onde foram descritos o protótipo da ferramenta, os experimentos e o algoritmo necessários ao
ensaio. A análise do ensaio foi descrita no Capı́tulo 4. As considerações finais e os trabalhos
futuros encerram o trabalho. Encontram-se ao final as referências e os apêndices, utilizados no
decorrer da pesquisa.
15
1 ASPECTOS TEÓRICOS E METODOLÓGICOS
Pesquisar significa, de forma bem simples, procurar respostas para indagações pro-
postas. Esta é uma pesquisa aplicada, pois os conhecimentos adquiridos são utilizados para
aplicação prática, voltados para a solução de problemas, no caso, na educação, mais especifica-
mente, na avaliação.
Nossa investigação sobre viabilidade e desenvolvimento de uma ferramenta de avaliação

de caráter formativo que “diagnostique” algumas possı́veis lacunas na construção do conheci-
mento matemático congrega, naturalmente, dois aportes teóricos. Do ponto de vista didático,
ela exige um referencial teórico sobre a temática da avaliação. Nessa vertente, usaremos o
conceito de avaliação formativa e associaremos esse tema aos PCN, às matrizes de referência
de conteúdos. Do ponto de vista computacional, ela envolve, além dos aspectos técnicos da
implementação em si, o conhecimento e a apropriação de modelos estatı́sticos (a Teoria da Res-
posta ao Item) e de modelos que sustentem a realização de processos de avaliação com o uso
do computador (Testes Adaptativos Informatizados).
Neste capı́tulo, apresentaremos aspectos teóricos relativos à faceta educacional deste

trabalho e à faceta de caráter mais computacional. Cabe ressaltar que alguns deles se mesclam
nessas duas facetas. Ao final do capı́tulo, aprensentaremos alguns aspectos da metodologia
empregada nesta pesquisa.
1.1 Avaliação
A avaliação faz parte do processo de aprendizagem de qualquer área do conhecimento.

No entanto, não podemos deixar de pensar em questões fundamentais, como: Por que avalia-
mos? O que avaliamos? Como avaliamos?
O significado atribuı́do à avaliação tem sido diverso. O processo de avaliação está relaci-
onado à produção de informações sobre determinada realidade. Tradicionalmente, na avaliação
escolar, os professores aferem a aprendizagem de seus alunos através de diferentes instrumentos
que quantificam (provas) ou qualificam (observações e informações) esses alunos, indicando o
que deve ser feito para que eles tenham condições de avançar no processo escolar.
Há anos, discute-se como avaliar na Educação. Segundo Moran e Masetto (2007) é pre-
ciso: “Rever o processo de avaliação, compreendendo-o como processo integrado ao processo
de aprendizagem, como elemento motivador e incentivador da aprendizagem, com feedbacks
contı́nuos, oferecendo novas oportunidades de aprendizagem ao aluno, incentivando-o a crescer
e se desenvolver.”
Dois conceitos que devem caminhar sempre de mãos dadas: avaliação e aprendizagem.
A principal função da primeira é apoiar a segunda. Propostas governamentais têm sido apre-
16
sentadas como a introdução dos Parâmetros Curriculares Nacionais (PCN), ligados à aprendi-
zagem, ou ainda, o Sistema de Avaliação da Educação Básica (SAEB)e a Prova Brasil. Ainda
como exemplo de propostas relacionadas à avaliação, encontramos a eliminação da reprovação
e a introdução de uma promoção automática dos alunos. De nada adianta decretar o fim da
repetência, se as escolas continuam a avaliar seus alunos de forma quantitativa e não recebem
meios de reorganizarem seu trabalho pedagógico e planejarem seu sistema de avaliação. O
planejamento de uma avaliação deve servir para que o professor possa tomar decisões sobre
suas estratégias pedagógicas e para que o aluno possa conhecer suas capacidades, habilidades e
desempenho no contexto considerado.
1.1.1 Avaliações Somativa e Formativa
O termo avaliação normalmente se refere a julgamento e constitui um processo que

permeia grande parte das nossas vidas. Mas, se o processo de avaliação se refere a julgamento,
como se chega a esse julgamento?
Na citação de Scriven (1967) feita por Taras (2010) encontramos uma possı́vel resposta
a esse questionamento:
A avaliação é uma atividade metodológica que consiste simplesmente na jun-

ção e combinação de dados de desempenho com um conjunto ponderado de
escalas de objetivos para gerar listas comparativas ou numéricas, com base
a) nos instrumentos de coleta de dados, b) nas ponderações e c) na seleção dos
objetivos. (SCRIVEN, 1967 apud TARAS, 2010)
Armstrong (2004) acrescenta que “a avaliação é o único meio que temos para distinguir
ensino de aprendizado.” Todo professor ensina mas isso não dá garantia a ele de que o aluno
aprendeu. As escolas usam avaliação para selecionar e classificar, não há como negar isso.
Mas “avaliar também é oferecer um retorno aos alunos, mostrando-lhes como eles estão se
saindo. Quanto mais retorno nós damos ao estudante, quanto mais nós conseguimos envolvê-lo
no processo da avaliação.”
Já há alguns anos, muitas pesquisas de avaliação para a aprendizagem fazem a distinção
de duas formas de avaliação: avaliação somativa e avaliação formativa.
Vergani (2010) faz referência ao pesquisador Benjamin Bloom como o primeiro pes-
quisador que utilizou essas denominações: avaliação somativa e avaliação formativa em dois
textos que causaram impacto nos meios educacionais: “Taxonomia e Objetivos no Domı́nio
Cognitivo” e “O manual de avaliação formativa e somativa do aprendizado escolar”. Esses
textos apresentam técnicas de avaliação, estruturadas na organização hierárquica de objetivos
educacionais.
A definição de Sadler (1989), citada por Taras (2010) de avaliação formativa está rela-
cionada ao “modo como os julgamentos sobre a qualidade das respostas dos alunos (desempe-
17
nho, trabalhos) podem ser usados para moldar e aprimorar a competência destes por meio de
um rompimento com o caráter aleatório e a ineficiência da aprendizagem baseada na tentativa
e erro” (SADLER, 1989 apud TARAS, 2010, p. 120). Dessa forma, ela mostra que, quando os
julgamentos são usados, trata-se de avaliação formativa. Se, ao contrário, não se faz nenhum
uso do julgamento, resta apenas a avaliação somativa.
Novamente Armstrong (2004) acrescenta que ambas são essenciais para o processo
de aprendizado. Uma delas, a avaliação formativa, é principalmente uma avaliação para o
aprendizado. Enquanto a outra, avaliação somativa, é uma avaliação do aprendizado. Taras
situa uma diferença entre os dois tipos de avaliação no modo como o feedback produzido
pela avaliação é utilizado: “fazer um julgamento com base em parâmetros especı́ficos é uma
avaliação, ou avaliação somativa. Essa avaliação produz o feedback, que pode permanecer um
julgamento implı́cito na mente do indivı́duo”. No entanto, se houver “qualquer manifestação
ou comunicação desse julgamento”, ele fornecerá informações. “As informações produzidas
fornecem o feedback necessário para a melhoria do trabalho.” Nesse caso, temos a avaliação
formativa. “O uso do feedback formativo pelo aprendiz resulta na avaliação formativa e apro-
xima o trabalho do ideal.”
No Brasil, a perspectiva de avaliação somativa é predominante. Para Mendes (2005),

adaptamo-nos a uma rotina: “nossas práticas podem diversificar-se quanto à escolha dos instru-
mentos a serem utilizados, mas, geralmente, o tratamento com os resultados não costuma variar
muito, ou seja, o nosso procedimento metodológico resume-se em transmitir o conteúdo, marcar
a data da ‘prova’, aplicar a atividade avaliativa, corrigir, entregar o resultado e depois, recomeçar
mais uma vez o nosso trabalho acadêmico e pedagógico”. Normalmente, as avaliações não pro-
duzem nenhum tipo de informação que resulte em uma melhoria do trabalho. Ela ressalta,
ainda, que “tal prática consiste em mera verificação de resultados”.
Quais as implicações de uma prática avaliativa centrada no conteúdo, que pressupõem

uniformidade no processo de aprendizagem e sintetizam seus resultados em notas? Há ou não
diferenças entre dois alunos a que foram atribuı́das notas 5.0? Utilizar a prática de avaliação so-
mativa sem indicar a cada aluno quais objetivos de aprendizagem já foram alcançados nem suas
possı́veis lacunas de conhecimento, não favorece que o aluno se reconheça como responsável
pelo seu processo de aprendizagem. O professor não coleta elementos de redirecionamento de
sua prática pedagógica a fim de favorecer a aprendizagem.
As perspectivas somativa e formativa não são excludentes. Mas para Rios (2005) “O
conceito de avaliação formativa se opõe à avaliação somativa enfatizando a importância do
processo e não do produto”. É preciso, portanto, ampliar a dimensão da avaliação, atribuindo
cada vez mais importância ao aluno, dando atenção à regularidade de seu esforço e à sua forma
de construir as atividades. Conforme Pacheco (1998),
a avaliação formativa ultrapassa a perspectiva da medição para propor a da

descrição e a compreensão, aliada a uma abordagem ampla que contempla
a utilização de instrumentos e a consideração das estratégias do ensino e da
18
aprendizagem. (PACHECO, 1998, p. 116)
Esse trabalho direcionou os estudos para pesquisas que levantam os desafios da avaliação
formativa, utilizando, principalmente, os pesquisadores Hadji (2001) e Perrenoud (1999). O pri-
meiro descreve a avaliação formativa como sendo “a avaliação que se situa no centro da ação
de formação”, e explica que “a sua função principal é contribuir para uma boa regulação da ati-
vidade de formação. Trata-se de levantar informações úteis à regulação do processo de ensino-
aprendizagem”. A observação é formativa quando permite guiar e otimizar as aprendizagens
em andamento. E é sua virtude informativa que é seu caráter essencial. “A partir do momento
em que informa, ela é formativa, quer seja instrumentalizada ou não, acidental ou deliberada,
quantitativa ou qualitativa.” Perrenoud (1999) complementa afirmando que “a avaliação for-
mativa auxilia o aluno a aprender e a se desenvolver, ou seja, colabora para a regulação das
aprendizagens e do desenvolvimento no sentido de um projeto educativo”.
Os méritos da avaliação formativa impõem seus maiores desafios. Como fornecer um

feedback para que o aluno o utilize na melhoria de sua aprendizagem? Como acompanhar
o processo de aprendizagem? Uma das exigências da avaliação formativa é a condução de
um processo de avaliação contı́nuo. Caldeira (2004) alerta que a continuidade por si só não
garante uma avaliação formativa. “A verdadeira avaliação formativa é a que contribui para a
individualização dos processos de aprendizagem, e não apenas as que são realizadas em vários
momentos do processo de aprendizagem.” Não se trata somente de uma questão quantitativa,
para Cerny (2001), se, em uma avaliação contı́nua, é conservada “uma concepção de igualdade,
que consiste em fazer as mesmas questões, ao mesmo tempo e nas mesmas condições a todos
os alunos, partindo da concepção de que as aprendizagens acontecem ao mesmo tempo e da
mesma forma para todos”, temos, na verdade, uma forma de treinamento e não uma avaliação
formativa.
A avaliação formativa é uma utopia?
Algum dia teria havido, na história da escola, consenso sobre a maneira de avaliar de
forma contı́nua, permitindo que o aluno identifique, nos resultados das avaliações, os seus pro-
gressos e suas dificuldades quando comparadas aos objetivos avaliados?
Para Perrenoud (1999), “mesmo nos sistemas escolares tradicionais, certas equipes pe-
dagógicas, e certos professores isolados, seduzidos pelas pedagogias diferenciadas, tentam apli-
car a avaliação formativa à sua escola e, com os meios que têm, procuram contribuir para me-
lhorar a aprendizagem de seus alunos”.
Não é tarefa fácil, para o aluno, identificar, nos seus resultados, os progressos ou difi-
culdades encontradas no desenvolvimento da sua aprendizagem; é importante, então, desviar a
atenção da única medida (nota), que atua, por vezes, como um fator inibidor e desestimulador
dessa aprendizagem. Muitas vezes, é necessário remodelar as formas de avaliar, criando meca-
19
nismos capazes de identificar lacunas que impedem a aprendizagem e, assim, criar novas opor-
tunidades de aprender, como afirmam Barnsford, Brown e Cocking (apud PIMENTEL; OMAR,
2006).
Segundo Hadji (2001), medir significa atribuir um número a um acontecimento ou a

um objeto, de acordo com uma regra logicamente aceitável. Isso implica que o objeto, ou o
acontecimento, possa ser apreendido sob uma única dimensão, isolável, capaz de receber uma
escala numérica. Mas avaliação é somente isso? Um erro sempre possı́vel de ocorrer é o
devido às imperfeições dos instrumentos de “medir” o trabalho de um aluno. Podemos retirar
do pensamento de Hadji (2001) a exigência que essa possibilidade impõe: “se a avaliação é
realmente uma operação de medida, o instrumento de medida merece confiabilidade”.
É necessário pensar melhor na natureza da relação avaliador (professor)/ avaliação/ ava-

liado (aluno). Segundo Hadji (2001), as práticas avaliativas apresentam-se fundamentalmente
como trocas de questões e de respostas, no decorrer das quais se instaura certo número de mal-
entendidos sobre, no que diz respeito ao aluno, o sentido das questões e sobre o que o professor
espera.
Dessa forma, uma metodologia do ensino e da aprendizagem deveria pensar na medida

(nota) como parte da avaliação da aprendizagem. No momento em que a medida fornece uma
informação, ela passa a fazer parte de um processo de ensino e de aprendizagem. A proposta
de um feedback (informação) regular (junto ou não as notas) para os alunos podem começar a
desenvolver competências de autoavaliação e de autorregulação de suas aprendizagens e, assim,
a avaliação passa a ter sentido e a ajudá-lo na formação integral.
A estrutura vigente na maioria das instituições de ensino faz com que os estudantes se
mostrem mais preocupados em saber quais as questões da prova do que propriamente com a
aprendizagem. A avaliação deve ser contı́nua, preocupando-se em como suprir o que falta ao
aluno aprender, ou seja, como instituir um processo efetivo de ensino pautado nas necessidades
individuais de aprendizagem. Com essa forma de avaliação, há possibilidade de identificação do
que o aluno já sabe e do que ele ainda não sabe, possibilitando, assim, a recuperação das lacunas
durante o processo de aprendizagem e não apenas em momentos finais. Moran e Masetto (2007)
confirma esse pensamento afirmando que é
preciso repensar o processo de avaliação, compreendendo-o como processo

integrado ao processo de aprendizagem, como elemento motivador e incenti-
vador da aprendizagem, com feedbacks contı́nuos, oferecendo novas oportuni-
dades de aprendizagem ao aluno, incentivando-o a crescer e a se desenvolver.
(MORAN; MASETTO, 2007)
Os alunos também são responsáveis pelo aperfeiçoamento e crescimento da sua apren-

dizagem. Desse modo, deve-se caminhar para criar formas que ajudem os alunos a determinar,
analisar e compreender seus erros e a se direcionarem na busca de informações que possibilitem
a recuperação desses erros. Perrenoud (1999) destaca a importância em formar o aluno para a
regulação de seus próprios processos de pensamento e aprendizagem.
20
O conhecimento sobre o seu próprio conhecimento é um dos aspectos da metacognição.

Segundo Brown (apud RIBEIRO, 2003), reconhecer a dificuldade na compreensão de uma ta-
refa, ou tornar-se consciente de que não compreendeu algo, é uma habilidade de grande im-
portância para o desenvolvimento da aprendizagem. Outro aspecto importante da metacognição,
no domı́nio educacional, é a autorregulação – capacidade para avaliar a execução de uma tarefa
e fazer correções quando necessário. Apostar na autorregulação, em um sentido mais restrito,
consiste, aqui, em reforçar as capacidades do aluno para gerir ele próprio seus projetos, seus
trabalhos, suas estratégias diante das tarefas e dos obstáculos. Segundo Perrenoud (1999), uma
avaliação é mais formativa quando dá menos importância à classificação e mais à regulação das
aprendizagens.
Dentre os pontos já apresentados, um outro problema que acontece no processo de

avaliação é a aplicação de avaliações sem particularidades, ou seja, todos os alunos são tratados
do mesmo modo, ignorando suas reais necessidades e seus conhecimentos. Esse problema seria
contornado se fossem oferecidas condições para que o professor desse um tratamento individu-
alizado aos alunos.
Para viabilizar a realização de uma avaliação de caráter formativo, é preciso desenvolver

mecanismos para contornar as dificuldades apresentadas. Uma possibilidade de se ampliar o
alcance da “nota” é adotar uma métrica que seja capaz de capturar traços latentes (habilidades)
do aluno. Uma métrica que acesse suas habilidades e potencialidades sem ser dependente do
teste aplicado. Com tal escolha, não somos confrontados, por exemplo, com a situação de obter
resultados diferentes em avaliações de um mesmo grupo sobre a mesma temática. Isso se deve
aos resultados estarem em escalas diferentes que dependem de cada um dos testes aplicados.
Para evitar esse problema, é preciso considerar métricas em que não haja confusão entre as
caracterı́sticas dos indivı́duos testados e da própria avaliação em si. Muitos exames realizados
em larga escala baseiam-se em medidas com essa natureza.
1.1.2 Avaliação em Larga Escala
Nas últimas décadas, a preocupação com a qualidade do processo educacional nos con-
textos escolar e universitário tem crescido e, como parte desse processo, destaca-se a avaliação
dos estudantes.
Desde 1964, foi despertada a necessidade de monitoramento da educação no que se re-

fere às questões estatı́sticas. Era necessário localizar e monitorar a quantidade de alunos dentro
e fora da escola. Em 1994, iniciou-se no Brasil o desenvolvimento de um sistema de avaliação
em larga escala, para a configuração de indicadores e resultados do processo educacional: o
SAEB, Sistema Nacional de Avaliação da Educação Básica e a Prova Brasil. Em 2005 foi criado
o Índice de Desenvolvimento da Educação Básica (IDEB) com o propósito de tornar possı́vel o
monitoramento de escolas com alunos de baixo desempenho. O cálculo desse ı́ndice se dá por
meio da combinação das notas padronizadas da Prova Brasil (indicador de proficiência) e da
21
taxa média de aprovação dos alunos (indicador de fluxo escolar). O resultado do IDEB é utili-
zado como critério para que as escolas sejam consideradas prioritárias para receber assistência
técnica e financeira por meio do Plano de Desenvolvimento da Escola (PDE).
Segundo Becker (2012), muitos governos passaram a se preocupar em coletar e divulgar

estatı́sticas que retratassem o funcionamento do sistema educacional como um todo, mas não
realizavam uma avaliação do produto final da educação, isto é, do que havia sido realmente
aprendido pelos alunos. A avaliação em larga escala é uma realidade em diversos paı́ses, mas
ainda precisa ser aprimorada para que se obtenham resultados mais efetivos. O diagnóstico por
si só não é suficiente para mudar uma determinada situação. Embora o Brasil tenha avançado
muito na coleta de dados e nos sistemas de avaliação ainda, é preciso construir mecanismos
para que os resultados sejam utilizados pelos próprios alunos, gestores e professores de modo a
melhorar a qualidade do ensino oferecido. A despeito de seus problemas, a avaliação em larga
escala faz uso de uma metodologia capaz de acessar as competências e habilidades do aluno
indo além da simples aferição de conteúdos especı́ficos. Nesse sentido, ela contém elementos
que podem ser usados na perspectiva de uma avaliação formativa.
Com o apoio computacional, tornam-se mais factı́veis as avaliações, acompanhamento

e orientação contı́nuos das participações dos alunos em atividades de aprendizagem propostas
ao longo de um curso, tais como o desenvolvimento de projetos individuais ou em grupo e
testes online. Além de permitir a continuidade do processo, o apoio computacional facilita a
individualização das avaliações.
Chinen et al. (2006) salientam que
o mapeamento do nı́vel de conhecimentos de um estudante ou de um grupo de

estudantes é uma tarefa praticamente impossı́vel para os professores. As me-
didas de conhecimento predominantes no sistema educacional se baseiam em
médias e conseguem apenas destacar aqueles estudantes que estão bem acima
ou bem abaixo da média. [. . .] No entanto, como as medidas de conhecimento
obtidas com as avaliações se baseiam em médias que envolvem vários con-
ceitos, torna-se praticamente impossı́vel identificar quais as reais lacunas que
impedem a aprendizagem. Torna-se necessário o uso de ferramentas que pos-
sam fornecer informações mais detalhadas sobre o nı́vel de conhecimentos do
estudante.
Vários estudos têm indicado os efeitos positivos de avaliação formativa. Entre eles,
citamos as pesquisas de Raabe (2005) e Pimentel e Omar (2006) que utilizam recursos com-
putacionais na tomada de decisões sobre a mediação e regulação da aprendizagem, e propõem
processos de avaliação formativa assistidos por computador. Propomos o desenvolvimento de
uma ferramenta que ofereça suporte a avaliação formativa, fornecendo informações (feedback)
para os alunos e fornecendo aos professores a oportunidade de rever a sua ação pedagógica e
também permita que o estudante seja o monitor do progresso da sua aprendizagem, seu desem-
penho, bem como suas dificuldades e lacunas na sua aprendizagem, tão individualizadas. Para
Al-A’Ali (2007), a questão não é se a avaliação deve ou não incorporar o uso da tecnologia, mas
22
sim fazê-lo de forma responsável, de forma a preservar a validade, utilidade e credibilidade dos
resultados.
Como relacionar o desempenho do aluno com a sua habilidade em determinado conteúdo?

A Teoria de resposta ao item (TRI) indica uma possibilidade.
1.2 Teoria da Resposta ao Item (TRI)
Na Teoria Clássica das Medidas (TCM), os resultados obtidos nas provas são expressos
apenas por seus escores brutos ou padronizados. Uma das principais caracterı́sticas dessa teoria
é a dependência de seus resultados em relação ao conjunto de itens (questões) que compõem
o instrumento de medida. Isto faz com que as análises e interpretações estejam sempre asso-
ciadas à prova como um todo, o que inviabiliza a comparação entre indivı́duos que não foram
submetidos às mesmas provas.
Segundo Thurstone (apud PASQUALI; PRIMI, 2003):
Um instrumento de medida, na sua função de medir, não pode ser seriamente

afetado pelo objeto de medida. Na extensão em que sua função de medir for
assim afetada, a validade do instrumento é prejudicada ou limitada. Se um
metro mede diferentemente pelo fato de estar medindo um tapete, uma pintura
ou um pedaço de papel, então nesta mesma extensão a confiança neste metro
como instrumento de medida é prejudicada. Dentro dos limites de objetos
para os quais o instrumento de medida foi produzido, sua função deve ser
independente da medida do objeto.
Pasquali e Primi (2003) afirmam que a Teoria da Resposta ao Item (TRI), também co-
nhecida como teoria do traço latente, admite a existência de uma relação entre o desempenho
do sujeito numa tarefa (item de um teste) e um conjunto de fatores ou variáveis hipotéticas
(os traços latentes). Ela considera que o desempenho é dependente do traço latente e por isso
pode ser considerado como uma função dele. Isto é, o comportamento observado = função
(traço latente). Como em um processo de “inversão” dessa relação funcional, o traço latente
é, então, inferido a partir da observação de variáveis secundárias, as observáveis, que estejam
relacionadas a ele. Essas relações são fundamentadas por modelos probabilı́sticos e estatı́sticos.
O termo teoria do traço latente se refere a uma famı́lia de modelos matemáticos

que relaciona variáveis observáveis (itens de um teste, por exemplo) e traços
hipotéticos não observáveis ou aptidões, estes responsáveis pelo aparecimento
das variáveis observáveis ou, melhor, das respostas ou comportamentos emiti-
dos pelo sujeito que são as variáveis observáveis. Assim, temos um estı́mulo
(item) que é apresentado ao sujeito e este responde a ele. A resposta que o
sujeito dá ao item depende do nı́vel que o sujeito possui no traço latente ou ap-
tidão. Desta forma, o traço latente é a causa e a resposta do sujeito é o efeito.
Agora, para se poder estimar, a partir da resposta dada pelo sujeito, o seu nı́vel
no traço latente, é preciso que se hipotetizem relações entre as respostas obser-
vadas do sujeito e o seu nı́vel neste mesmo traço latente. (PASQUALI; PRIMI,
2003, p. 102)
Estabelecido o modelo matemático que expressa essas relações, as caracterı́sticas das va-
riáveis observadas (como os itens de um teste) tornam-se parâmetros do modelo e ele pode ser,
23
então, utilizado para se estimar o nı́vel do traço latente ou a aptidão do sujeito. Analogamente,
se o nı́vel do traço latente de uma população é conhecido, é possı́vel estimar as caracterı́sticas
dos itens respondidos por essa população (PASQUALI; PRIMI, 2003). A multiplicidade de pos-
sibilidades de se expressar matematicamente a relação entre as variáveis observadas e variáveis
hipotéticas (traços latentes) se traduz em uma infinidade de possı́veis modelos para a TRI. Na
TRI, a relação entre o traço latente e as caracterı́sticas do item é dada pela chamada de Curva
Caracterı́stica do Item (CCI, ver Figura ??) e ela expressa a probabilidade de um indivı́duo
com habilidade θ responder corretamente ao item. Consequentemente, ela deve ser uma função
monótona crescente da habilidade θ. Traduzindo, assim, a percepção intuitiva de que quanto
maior a habilidade do aluno maior a sua chance de responder corretamente ao item. Cada item
tem sua própria CCI.
Figura 1 – Curva Caracterı́stica do Item

Fonte: Pasquali e Primi (2003)
A configuração em “S” do gráfico da CCI capta o comportamento de um item “ideal”:

um item que tivesse uma “discriminação perfeita”. Isto é, atingido um certo nı́vel de habilidade,
a probabilidade P (θ) de acerto é igual a um e, antes desse nı́vel, a probabilidade P (θ) de acerto
é nula. Nesse caso, a CCI do item seria da forma apresentada na figura abaixo.
24
Figura 2 – Curva Caracterı́stica de um Item com “discriminação perfeita”

Fonte: Pasquali e Primi (2003)
Note ainda que a configuração em “S” do gráfico da CCI na Figura ?? é definida pelos
parâmetros do item. Identificamos na CCI um “divisor de águas” para o valor da habilidade θ
no qual a probabilidade de acerto do item é exatamente igual a 1/2.
Os chamados modelos logı́sticos de CCI são comumente utilizados na literatura. Eles

diferem pela quantidade de parâmetros associadas a cada item. Nesse trabalho, utilizaremos
um deles: o modelo logı́stico de três parâmetros. Para cada item, considera-se: seu nı́vel de
dificuldade, sua capacidade de discriminação e a chance de acerto casual.
1.2.1 Modelo Logı́stico de Três Parâmetros (ML3P)
Já destacamos que, na TRI, o que diferencia os modelos é a expressão matemática ado-
tada para a relação (admitida existente) entre o nı́vel de habilidade (traço latente) do respon-
dente e certas caracterı́sticas do item que será respondido. No caso do modelo logı́stico de três
parâmetros (ML3P), conforme apresentado por Andrade, Tavares e Valle (2000), a probabili-
dade de acerto do item por um indivı́duo com habilidade θ é dada por
P (U = 1∣θ) = c + (1 − c)
1
1 + e−Da(θ−b)
, (1.1)
onde
● U é uma variável aleatória dicotômica que assume os valores 0 ou 1 indicando que o item foi
incorreta ou corretamente respondido respectivamente.
● θ representa a habilidade (traço latente) do indivı́duo.
● P (U = 1∣θ) é a probabilidade de um indivı́duo com habilidade θ responder corretamente ao
item.
● b é o parâmetro de dificuldade do item.
● a é o parâmetro de discriminação do item, com valor proporcional à inclinação da CCI no
ponto θ = b.
25
● c é o parâmetro do item que representa a probabilidade de indivı́duos com baixa habilidade

responderem corretamente ao item (muitas vezes referido como a probabilidade de acerto
casual).
● D é um fator de escala, constante e igual a 1. Utiliza-se o valor 1,7 quando se deseja que a
função logı́stica forneça resultados semelhantes ao da função ogiva normal.
Figura 3 – Curva Caracterı́stica do Item

Fonte: Andrade, Tavares e Valle (2000)
O parâmetro de dificuldade b é medido na mesma unidade da habilidade e o parâmetro c não

depende da escala, pois trata-se de uma probabilidade (de acerto ao acaso). Nesse caso, assume
sempre valores entre 0 e 1. O valor de c corresponde a uma assı́ntota horizontal quando θ
tende a −∞. Ele representa o valor limite da probabilidade de indivı́duos com baixa habilidade
responderem corretamente ao item. Observe que a CCI admite um ponto de inflexão quando
θ = b. Além disso, a probabilidade de acerto nesse caso é de ci2+1 . Este é exatamente o ponto
médio entre ci e 1. Note que quanto maior o valor de b, mais difı́cil é o item, e vice-versa.
O parâmetro a, por sua vez, está associado à capacidade de discriminação do item e é
proporcional à derivada da tangente da curva em seu ponto de inflexão. Andrade, Tavares &
Valle observam que
baixos valores de a indicam que o item tem pouco poder de discriminação

(alunos com habilidades bastante diferentes têm aproximadamente a mesma
probabilidade de responder corretamente ao item) e valores muito altos in-
dicam itens com curvas caracterı́sticas muito “ı́ngremes”, que discriminam os
alunos basicamente em dois grupos: os que possuem habilidades abaixo do va-
lor do parâmetro b e os que possuem habilidades acima do valor do parâmetro
b. (ANDRADE; TAVARES; VALLE, 2000, p. 11)
Note que quanto maior o valor de a, mais a CCI do item se aproxima da CCI de um item com
“discriminação perfeita” (ver Figura ??)
26
1.2.2 Calibração dos Parâmetros
Andrade, Tavares e Valle (2000) destacam que
um ponto crı́tico na TRI é a estimação dos parâmetros envolvidos nos modelos,

em particular quando necessita-se estimar tanto os parâmetros dos itens quanto
as habilidades. A probabilidade de uma resposta correta a um determinado
item depende somente da habilidade do indivı́duo e dos parâmetros que carac-
terizam o item. Mas, em geral, ambos são desconhecidos. Apenas as respostas
dos indivı́duos aos itens do teste são conhecidas. (ANDRADE; TAVARES; VALLE,
2000, p. 4)
Hambleton, Swaminathan e Rogers (1991) apresentam a calibração dos parâmetros do item

como etapa fundamental na aplicação da TRI. Indicam também a necessidade de se dispor
de bons métodos de estimação dos parâmetros a fim de viabilizar o sucesso da aplicação da
TRI.
Note que, nos modelos da TRI, a probabilidade de um indivı́duo responder corretamente

a um item depende tanto de sua habilidade quanto dos parâmetros do item. Tanto a habilidade
quanto os parâmetros são desconhecidos. Os únicos dados disponı́veis são as respostas dadas
por cada examinando, a cada item. No caso do ML3P, com esses dados, queremos determinar
o θj de cada um dos respondentes e os parâmetros ai , bi e ci de cada item presente na avaliação.
(HAMBLETON; SWAMINATHAN; ROGERS, 1991, p. 32)
Em geral, o Método da Máxima Verossimilhança (MMV) é usado para calibração dos

parâmetros. Essencialmente, ele consiste em se determinar quais valores para os parâmetros
ai , bi e ci e para θj que “melhor” se ajustam aos valores das respostas dadas. De acordo com
Andrade, Tavares e Valle (2000), os estimadores de Máxima Verossimilhança se mostram efi-
cientes em cenários em que tanto o número de itens quanto a quantidade de respondentes são
altos. Isso resulta em uma das dificuldades impostas para o uso da TRI em contexto de pequena
escala.
1.2.2.1 Método da Máxima Verossimilhança-MMV
Há duas importantes hipóteses subjacentes à TRI:
1. as respostas oriundas de indivı́duos diferentes são independentes,

2. os itens são respondidos de forma independente por cada indivı́duo (independência local),
fixada sua habilidade.
Vamos admitir, inicialmente, que temos um conjunto de I itens que foram respondidos
por n ı́ndivı́duos com habilidades θj conhecidas. Seja Uij uma variável aleatória dicotômica,
que assume o valor 1, quando o indivı́duo j responde corretamente ao item i, ou 0, quando o
indivı́duo j responde incorretamente ao item i que, no caso de ML3P, tem parâmetros ai , bi e ci .
Vamos denotar por P (U1j , U2j , . . . , UIj ∣θj , a1 , b1 , c1 , . . . , aI , bI , cI ) a probabilidade conjunta (ou
condicional) de ocorrência do padrão de respostas Uj = (U1j , U2j , . . . , UIj ) para um indivı́duo
27
de habilidade θj aos I itens. A hipótese de independência local das respostas de um indivı́duo

de habilidade θj a diferentes itens permite escrevermos a probabilidade conjunta na forma de
um produto
P (Uj ∣θj , a1 , b1 , c1 , . . . , aI , bI , cI ) = ΠIi=1 P (Uij ∣θj , ai , bi , ci )
como Uij ∈ {0, 1}, temos
= ΠIi=1 P (Uij ∣θj , ai , bi , ci )Uij (1 − P (Uij ∣θj , ai , bi , ci )1−Uij

= ΠIi=1 P (Uij ∣θj , ai , bi , ci )Uij Q(Uij ∣θj , ai , bi , ci )1−Uij .
Quando, ao invés de um padrão aleatório de respostas (U1j , U2j , . . . , UIj ), temos um padrão de
respostas observado, isto é Uij = uij (conhecido), já não é mais adequada uma interpretação
probabilı́stica. Nesse caso, a expressão para a probabilidade conjunta passa a ser chamada de
função de verossimilhança e será denotada por Lj (u1j , u2j , . . . , uIj ∣θj , a1 , b1 , c1 , . . . , aI , bI , cI )
(HAMBLETON; SWAMINATHAN; ROGERS, 1991, p. 34). Para cada padrão observado
(u1j , u2j , . . . , uIj ) de respostas, a função de verossimilhança depende da habilidade θj e dos
parâmetros ai , bi , ci dos I itens e é dada por
Lj (u1j , u2j , . . . , uIj ∣θj , a1 , b1 , c1 , . . . , aI , bI , cI ) = ΠIi=1 P (Uij = uij ∣θj , ai , bi , ci ).
Andrade, Tavares e Valle (2000, p. 31), como uij ∈ {0, 1}, temos
P (Uij = uij ∣θj , ai , bi , ci ) = P (Uij = 1∣θj , ai , bi , ci )uij P (Uij = 0∣θj , ai , bi , ci )1−uij = Pjiij Qji
u 1−uij
em que Pji = P (Uij = 1∣θj , ai , bi , ci ) é a probabilidade de um indivı́duo com habilidade θj

responder corretamente ao item de parâmetros ai , bi e ci e Qji = 1 − Pji . Consequentemente,
Lj (u1j , u2j , . . . , uIj ∣θj , a1 , b1 , c1 , . . . , aI , bI , cI ) = ΠIi=1 Pjiij Qji

u 1−uij
. (1.2)
Momentaneamente, vamos assumir que os parâmetros ai , bi , ci dos I itens são conhecidos.

Isto é, Lj depende apenas de θj . Ao variarmos θj , os valores assumidos pela função de
verossimilhança nos dão ideia da plausibilidade de um indivı́duo de habilidade θj apresentar o
padrão de respostas (u1j , u2j , . . . , uIj ). Nesse sentido, se pudermos determinar o valor de θj que
maximiza Lj estaremos encontrando uma estimativa para a habilidade θj que se mostra mais
verossı́mil para um indivı́duo que tenha fornecido um padrão de respostas (u1j , u2j , . . . , uIj )
aos I itens de parâmetros conhecidos ai , bi , ci , i = 1, . . . , I.
Analogamente, usando agora a hipótese de independência das respostas oriundas de di-

ferentes respondentes, a função de verossimilhança relativa aos padrões de respostas
uj = (u1j , u2j , . . . , uIj ) de n indivı́duos aos I itens é dada por
L(u1 , u2 , . . . , un ∣θj , a1 , b1 , c1 , . . . , aI , bI , cI ) = Πnj=1Lj (u1j , u2j , . . . , uIj ∣θj , a1 , b1 , c1 , . . . , aI , bI , cI )

= Πnj=1ΠIi=1 Pjiij Qji
u 1−uij
.
28
Um dos critérios adotados na TRI para definir os parâmetros de cada item é o de maxi-
mizar a verossimilhança. Isto é o de escolher valores para os parâmetros dos itens que tornem o
retrato oferecido pelas repostas desses n indivı́duos de habilidades conhecidas o mais provável.
(Observe que quanto maior o número de respondentes, mais “despersonalizados” se tornam os
parâmetros determinados.) Podemos também, estimar as habilidades quando os parâmetros dos
itens são conhecidos. Analogamente, pode-se admitir que tenhamos um conjunto de I itens com
parâmetros conhecidos que foram respondidos por n ı́ndivı́duos com habilidades θj desconhe-
cidas. Esse conjunto de informações fornece um retrato do comportamento de cada indivı́duo
quando confrontado com cada um dos I itens. Analogamente, um dos critérios adotados na
TRI para definir a habilidade de cada indivı́duo é o de maximizar a verossimilhança. Isto é, o
de escolher valores para as habilidades de cada indivı́duo que tornem o retrato oferecido pe-
las repostas desses n indivı́duos aos I itens calibrados o mais provável. A combinação desses
dois processos – através de um processo iterativo, por exemplo – permite a calibração tanto dos
parâmetros como das habilidades. Nesse caso, conforme destaca Ferreira (2009), “a estimação
feita através do método da máxima verossimilhança conjunta envolve um número muito grande
de parâmetros a serem estimados simultaneamente e, consequentemente, grandes problemas
computacionais”. Ferreira (2009) também aponta a complexidade computacional envolvida
nos procedimentos de calibração e o tardio desenvolvimento de procedimenos de estimação
dos parâmetros como a razões de a TRI passar a ser amplamente utilizada somente no anos 80
(ainda que já tivesse marcos teóricos bem estabelecidos já desde os anos 50.)
1.2.3 Invariância das Estimativas
Segundo Costa (2009), Birnbaum (1968) foi quem primeiro provou que as estimativas
de habilidade dos respondentes obtidas em uma avaliação feita através da TRI não dependem
do conjuntos de itens que a compõem. Ou seja, em avaliações feitas através da TRI, os resul-
tados não dependem do instrumento de medida. Ele também demonstrou que os parâmetros
caracterı́sticos de um item podem ser estimados a partir do conhecimento das habilidades dos
respondentes.
À primeira vista, deparamo-nos com um cı́rculo vicioso no que diz respeito à deter-
minação dos parâmetros dos itens e das habilidades dos respondentes. Mais ainda, estamos
diante do fato surpreendente de que, apesar de tanto os parâmetros dos itens serem usados para
inferir as habilidades e o conhecimento destas, por sua vez, ser usado para a calibração dos
parâmetros, a ferramenta de avaliação subsidiada pela TRI resulta ser independente tanto do
grupo de respondentes como dos itens que compõem os testes.
Essa surpreendente qualidade da TRI é conhecida como invariância dos parâmetros dos
itens e da habilidade. De acordo com Hambleton, Swaminathan e Rogers (1991), esta é uma
das mais marcantes diferenças entre a TRI e a TCM. Os autores ilustram a invariância das es-
timativas dos parâmetros dos itens na Figura ?? que mostra a obtenção da mesma CCI de um
29
item a partir das respostas de dois grupos de respondentes com diferentes distribuições de habi-
lidades (Curvas 1 e 2). Eles também afirmam que a propriedade de invariância dos parâmetros
dos itens e da habilidade resulta da incorporação de informações relativas às habilidades dos
respondentes no processo de estimação dos parâmetros dos itens.
Figura 4 – Invariância da Curva Caracterı́stica de um Item

Fonte:Hambleton, Swaminathan e Rogers (1991)
A habilidade e os parâmetros dos itens são estimados a partir das respostas de um grupo
de indivı́duos submetidos a esses itens, mas uma vez estabelecida a escala de medida da habi-
lidade, os valores dos parâmetros dos itens não mudam, isto é, seus valores são invariantes a
diferentes grupos de respondentes, desde que os indivı́duos destes grupos tenham suas habili-
dades medidas na mesma escala.
No próximo capı́tulo retomaremos e apronfudaremos o mecanismo de estimação da ha-

bilidade e dos parâmetros dos itens através da TRI usando o MMV.
1.3 Testes Adaptativos Informatizados
Shute e Towle (2003, p. 105) afirmam que há muito se sabe que as diferenças individuais
afetam a aprendizagem. Além disso, eles acreditam que o desenvolvimento tecnológico chegou
a um ponto em que temos a oportunidade de capitalizar esses efeitos em benefı́cio dos alunos.
No âmbito da pesquisa em Informática aplicada à Educação, tão importante quanto

o aperfeiçoamento e a personalização do ensino, adaptado às condições de aprendizagem do
aluno, é a qualidade e personalização da avaliação. Nas últimas décadas, a presença crescente
do uso do computador e suas tecnologias associadas promoveram uma importante mudança no
foco, nas estratégias e nos objetivos no campo da avaliação educacional. Dentre as mudanças,
a forma de avaliar utilizando testes adaptativos informatizados tem crescido, como mostram
pesquisas como as de Costa(2009) e Ferreira(2009).
Um teste adaptativo informatizado é um teste em que os itens são apresentados e res-

30
pondidos com o uso de um computador. A ideia subjacente a um teste adaptativo informatizado

(TAI) é oferecer a cada aluno um conjunto de questões adequado ao seu nı́vel de habilidade.
Para este fim, as questões são dinamicamente selecionadas para cada aluno, levando em conta o
seu desempenho individual durante o teste. Geralmente, o item inicial é uma pergunta aleatória
de dificuldade média. Se for respondida corretamente, a estimativa da capacidade do aluno
aumenta. Uma vez que a estimativa de habilidade aumentou, presume-se que ele também será
capaz de responder a uma pergunta mais difı́cil. Assim, segue-se uma questão mais desafiadora
apropriada para esta nova estimativa mais elevada. Por outro lado, se a resposta fornecida está
incorreta, a estimativa da sua capacidade é reduzida e uma pergunta mais fácil que é adequada
para esta nova estimativa mais baixa é apresentada em seguida (Lilley et al; 2004).
Lilley, Barker e Britton (2004) observam que
um dos princı́pios dos TAI é que a administração de perguntas fáceis para um

aluno de habilidade alta não é eficiente, na medida em que uma resposta correta
fornece informações de baixo valor sobre a sua habilidade. Da mesma forma,
uma resposta incorreta de um aluno menos proficiente a uma pergunta difı́cil
acrescenta pouca informação sobre a habilidade deste indivı́duo em relação ao
assunto que está sendo testado. Ao selecionar e propor perguntas que corres-
pondem ao nı́vel de habilidade estimado do aluno, questões que proporcionam
pouca informação podem ser evitadas. Ao fazer isso, o tamanho do teste pode
ser reduzido em até 50% sem perda de validade e confiabilidade do teste.
Lilley (2007) afirma que as primeiras experiências na construção de testes adaptativos

foram desenvolvidas por Binet e Simon (1905). Eles construı́ram diferentes testes de inte-
ligência de acordo com a idade ou nı́vel de educação dos estudantes. Atualmente, existem
versões adaptáveis de testes convencionais, por exemplo, o Test of English as a Foreign Lan-
guage (TOEFL), Graduate Management Admissions Test (GMAT) ou Graduate Record Exam
(GRE), vários testes de habilidades intelectuais e vários testes desenvolvidos nos Estados Uni-
dos e na Europa para avaliar os conhecimentos e habilidades em contextos de seleção do pes-
soal.
Em princı́pio, um teste computadorizado tem vantagens de grande valor quando com-

parados a testes tradicionais. Segundo Olea e Hontangas (apud OLEA; PONSODA, 2002), ele
permite obter informações que podem ser úteis na análise dos resultados da avaliação (por
exemplo, tempos de resposta aos itens), obter um retorno rápido de dados, minimizando er-
ros de correção, fornecer feedback aos alunos imediatamente, avaliar nı́veis de habilidades ou
outras competências que exigem a apresentação das informações de forma dinâmica, dentre
outras.
Um teste adaptativo informatizado tem, ainda, vantagens adicionais:
1. Melhora da segurança do teste, já que a maioria dos itens apresentado aos alunos são
diferentes. Isso não significa que os TAIs resolvem totalmente o problema da “cola”,
mas o problema é menor do que nos testes convencionais com papel e lápis. Há, ainda,
31
a possibilidade de criptografar os dados, de forma que somente o administrador de teste

tenha a chave para decodificar as informações do banco.
2. Redução do tempo na aplicação do teste, uma vez que conseguem com um número de
itens em menor quantidade que o necessário em testes convencionais. Para a escola, a
redução do tempo se associa a diminuição do custo da evolução no processo de avaliação.
Para os alunos, significa conhecer suas pontuações, com informações relacionadas a seu
nı́vel de habilidade, em uma única sessão de avaliação.
3. Boa precisão das estimativas. Com o mesmo número de itens de um teste convencional,
um TAI realiza estimativas mais precisas. Se o banco de questões tem um tamanho sufi-
ciente de itens com alto poder de discriminação para diferentes nı́veis de habilidade, um
TAI pode ser extremamente eficaz para medir nı́veis extremos de habilidade, algo difı́cil
de alcançar na aplicação de testes convencionais, informatizados ou não. Costa (2009)
complementa essa vantagem, justificando que cada item apresentado a um aluno é ade-
quado à sua habilidade, sendo possı́vel, então, a redução do número de itens e um maior
nı́vel de precisão. Essa redução só é possı́vel graças à informação sobre as estimativas de
habilidade em cada item administrado.
Uma das estratégias para desenvolvimento de testes em papel é apresen-
tar uma maior proporção de itens de dificuldade mediana e poucos itens
de alta e baixa dificuldade. Esse procedimento torna o teste mais ade-
quado para avaliar indivı́duos de habilidade média do que indivı́duos si-
tuados nos extremos da distribuição de habilidade, que possuirão menor
precisão de suas estimativas. Em contraste, testes adaptativos ajustam
adequadamente o nı́vel de dificuldade das questões aos examinandos,
sem prejudicar a acurácia das estimativas.(COSTA, 2009, p. 3)
4. Maior flexibilidade para realizar testes. Ao contrário de testes tradicionais, um TAI não
requer que todos os alunos façam a avaliação ao mesmo tempo (COSTA, 2009).
Para permitir um processo de aprendizagem personalizado, deve-se atender às necessi-

dades e interesses individuais. Além disso, é necessário garantir que cada aluno realize ple-
namente seu potencial. Eles apontam a capacidade individual e outras caracterı́sticas ou pre-
ferências como o ponto de partida no processo usual. Eles também enfatizam o papel de teorias
como a TRI para o desenvolvimento de uma aprendizagem personalizada.
Apesar de ser uma tecnologia vastamente implementada no exterior, o TAI ainda se

encontra em fase embrionária no Brasil. Pode-se destacar as dissertações de Oliveira (2002)
e Gonçalves (2004) do Instituto de Ciências Matemáticas e de Computação, ICMC/USP. Elas
discutem e analisam o desenvolvimento de sistemas para implementação de TAI e, em ambas,
salientou-se a grande dificuldade inerente à teoria estatı́stica nessa área.
Certamente, os testes adaptativos não representam a “pedra filosofal” do sistema de

avaliação de testes psicométricos (OLEA; PONSODA, 2002). Há ainda a necessidade de uma
reflexão sobre a sua utilização.
Há cinco ingredientes básicos para a construção de um TAI (OLEA; PONSODA, 2002):
a) um banco de itens; b) os critérios de seleção dos itens; c) um método estatı́stico para estimar
os nı́veis de habilidade; d) a escala subjacente que permitirá a interpretação dos resultados, e
32
e) critérios de parada (um procedimento para estabelecer o término do teste). Eles permitem,
por exemplo, definir como serão feitas as estimativas da habilidade do respondente, como novos
itens serão selecionados levando-se em conta essas estimativas e qual o critério de término do
teste.
Apresentaremos agora alguns aspectos dos ingredientes acima listados, restringindo

nossa atenção a TAI que se apóiam na TRI.
1.3.1 TAI baseados na Teoria da Resposta ao Item
A ideia original dos TAIs baseados na TRI é de Lord (1970), e foi desenvolvida na
década de 80 e apresentada em uma Convenção da Universidade de Minnesota. No entanto,
quando consideramos as origens dos TAI, temos que mencionar o trabalho de Lord e Novick
(1968), fundamentalmente os capı́tulos ligados a Birnbaum (1968), que estabeleceu as bases da
TRI e os fundamentos estatı́sticos para realizar estimações precisas dos nı́veis de habilidades de
amostras muito numerosas e heterogêneas de candidatos.
De maneira geral, um teste adaptativo contempla a seguinte estrutura: um item é ad-

ministrado e respondido. Com base nesta resposta, o algoritmo adaptativo irá (re)estimar a
proficiência do examinando. Após o cálculo dessa estimativa, um novo item será selecionado.
A incorporação da Teoria de Resposta ao Item à testagem adaptativa tornou possı́vel estimar as
proficiências dos candidados com base na resposta a um único item ou a uma série de itens.
1.3.1.1 Banco de Itens
Costa (2009) afirma que um TAI exige que o banco de itens seja composto por itens
com boas caracterı́sticas pedagógicas e psicométricas. Para a avaliação psicométrica dos itens,
encontra-se forte apoio estatı́stico na TRI, que fornece uma análise quantitativa das carac-
terı́sticas de determinado item, tais como dificuldade e discriminação. Quando combinada com
a TRI, a seleção de itens é projetada para permitir que o teste se ajuste aos nı́veis de habilidade
dos alunos. Assim, cada estudante que participa da avaliação pode ter um teste diferente, de-
pendendo de sua competência. Normalmente, quando se usa TRI, o item selecionado é aquele
que fornece mais informação, dada a capacidade do indivı́duo.
Para desfrutar das vantagens oferecidas pela TRI, o conjunto de itens, a partir do qual
os itens do teste são selecionados, deve conter itens de alta qualidade para diferentes nı́veis
de proficiência. Este recurso é muito diferente dos testes convencionais, que são constituı́dos
por itens que melhor discriminam sujeitos com habilidade média. Além de conter um amplo
espectro de itens de alta qualidade, o conjunto de itens TAI deve atender aos pressupostos
psicométricos subjacentes ao modelo e às exigências do processo de calibração e do método de
seleção. Assim, o esforço para preparar os itens em um TAI é maior do que para gerar um bom
teste convencional (FLAUGHER, 1990).
33
Para a elaboração dos itens para um TAI, como o que se pretende é medir o desempenho
máximo (por exemplo: a habilidade ou nı́vel de conhecimento), o mais usual é a utilização de
questões de múltipla escolha. Estudos são feitos para verificar qual o número ideal de opções
que se deve ter de boas respostas. Olea e Ponsoda (2002) concluem que os indicadores psi-
cométricos clássicos e os derivados da TRI são mantidos em nı́veis aceitáveis quando são cria-
das três boas opções de resposta.
Para preservar a suposição de independência local, deve-se ter especialmente cuidado

na formulação de itens, para que um item não forneça pistas para responder corretamente a
outro item. Quando vários itens têm fortes relações entre si, devem ser estabelecidas certas
restrições no algoritmo de seleção para garantir que não sejam simultaneamente apresentados
(OLEA; PONSODA, 2002).
Costa (2009) acrescenta, ainda, que os bancos de itens devem ser continuadamente atu-
alizados para garantir segurança dos testes. Itens que não atendem mais às especificações e
objetivos da avaliação devem ser retirados do banco.
1.3.1.2 Critérios de seleção dos itens
Durante as décadas de 70 e 80, foram propostos diferentes procedimentos ou estratégias

adaptáveis a seleção de itens, alguns dos quais são concebidos para a apresentação dos itens em
um formato de papel e lápis, dado que naqueles anos os computadores dificilmente poderiam
realizar cálculos matemáticos exigidos pelo TRI com suficiente rapidez.
Birnbaum (apud SAMEJIMA, 1973, p. 226) definiu diversas funções de informação que
cumprem um importante papel na determinação da precisão da estimativa da habilidade θ. Ao
discutir a informação, ele toma o item como a menor unidade de análise, nesse caso, ele define
a função de informação do item (também chamda de Informação de Fisher) I(θ) da seguinte
maneira:
[ ∂P (U∂θ=1∣θ) ]
2
I(θ) = onde Q(U = 1∣θ) = 1 − P (U = 1∣θ)

P (U = 1∣θ)Q(U = 1∣θ)
,
Costa (2009) afirma que
A Informação de Fisher1 é o valor médio da curvatura da Verossimilhança.

Quanto maior esta curvatura, maior será a informação sumarizada na função
de Verossimilhança e, consequentemente, maior o valor de I(θ).
Na TRI, a Informação de Fisher permite analisar quanto um item contém de
informação para a medida de habilidade e pode ser calculada para cada item
individualmente a partir dos seus parâmetros.
1
A Informação de Fisher em sua forma mais geral é definida como o valor esperado do quadrado da derivada
parcial da função de log-verossimilhança ln L(u∣θ):
2
I(θ) = E (( ln L(u∣θ)) ∣ θ) = E (− 2 ln L(u∣θ)∣ θ)
∂ ∂2
∂θ ∂θ
34
Um princı́pio de seleção bastante natural e razoável é a escolha de itens com nı́vel de di-
ficuldade próximo da estimativa de habilidade do respondente. Para Lord (apud BICKEL et al.,
2001), um aluno é avaliado de modo mais preciso e eficiente se ele não encontrar nem muita
dificuldade nem muita facilidade ao resolver as questões ofertadas a ele. No modelo logı́stico de
dois parâmetros (que corresponde a considerar c = 0 em (1.1)),maior precisão e eficiência são
alcançados quando se oferta ao aluno com habilidade estimada θ um item em que o parâmetro
de dificuldade b é igual a θ. Isto porque quando fixamos a habilidade θ e o parâmetro a, a
função de informação assume seu máximo quando b = θ. Isto é, o critério de seleção a escolha
no banco de itens, de um item que maximiza a função de informação é permeado pelo princı́pio
proposto por Lord.
Para o Modelo Logı́stico de três Parâmetros (ML3P), usando (1.1), a função de informação
do item é dada por:
1 − P (U = 1∣θ) P (U = 1∣θ) − c
2
I(θ) = D a [ ][ ] .
P (U = 1∣θ) 1−c
2 2
(1.3)
Sob a TRI, maximizar a Informação de Fisher significa intuitivamente selecionar um item de di-
ficuldade que corresponda exatamente ao nı́vel de proficiência do examinando. Além do mais,
itens com maior discriminação, ou equivalentemente, alto valor do parâmetro a, serão, prefe-
rencialmente, selecionados pelo algoritmo (ANDRADE; TAVARES; VALLE, 2000; COSTA,
2009). No entanto, uma análise mais cuidadosa do caso do ML3P nos mostra que nem sempre2
a função de informação assume seu máximo quando o nı́vel de dificuldade b do item coincide
com a habilidade θ.
Em uma avaliação, é interessante haver um controle sobre os assuntos que são tratados
no teste aplicado bem como da distribuição e proporção das questões referentes a eles. Esse as-
pecto é chamado de balanceamento de conteúdo. Atender ao balanceamento de conteúdo pode
conflitar com o critério de seleção do item de máxima informação. (EGGEN; STRAETMANS,
2000; HUANG, 1996a)
1.3.1.3 Estimativas da habilidade
Vimos anteriomente que a hipótese de independência local (os itens são respondidos de
forma independente por cada indivı́duo) faz com que a função de verossimilhança relativa ao
padrão de respostas uij de j-ésimo respondente aos I itens seja dada por
L(uj ∣θj , a1 , b1 , c1 , . . . , aI , bI , cI ) = ΠIi=1 Pjiij Qji = ΠIi=1 Pjiij Qji

u 1−uij u 1−uij
,
em que Pji = P (Uij = 1∣θj , ai , bi , ci ) é a probabilidade de um indivı́duo com habilidade θj

responder corretamente ao item de parâmetros ai , bi e ci e Qji = 1 − Pji .
Consideraremos o banco de itens calibrados. Isto é, os valores dos parâmetros ai , bi e

ci são conhecidos. Como o logaritmo é uma função crescente, deteminar o valor de θj que
2
Para mais detalhes, ver o Apêndice B
35
maximiza a função de verossimilhança L(θj ) é equivalente a maximizar o logaritmo de L(θj ):
ln L(θj ) = ∑ (uij ln Pji + (1 − uij ) ln Qji ) .

I
i=1
Chamamos de estimador de máxima verossimilhança (EMV) ao valor de θj que maximiza a

verossimilhança. Consequentemente, ele deve ser um ponto crı́tico de ln L(θj ). Isto é, deve ser
solução da equação:
ln L(θj ) = 0.
d
(1.4)
dθj
Desenvolvendo a expressão acima3 , deduzimos que θj deve ser tal que:
D ∑ ai (1 − ci )(uij − Pji )Wji = 0,

I
(1.5)
i=1
em que
Pji∗ Q∗ji
Wji =
Pji Qji
e
Pji∗ = (1 + e−Dai (θj −bi ) )−1 e Q∗ji = 1 − Pji∗ .
Portanto, a determinação de θj envolve a resolução da equação não linear (1.5). Métodos itera-
tivos como o método de Newton-Raphson são implementados ou incorporados ao TAI a fim de
se obter a estimativa para θj .
Erro-Padrão
Segundo Baker (2001), o comportamento da função de informação de um item revela

sua capacidade em medir a habilidade θ. Valores de habilidade mais próximos do valor de θ em
que a função de informação admite seu máximo, são medidos com maior precisão pelo item4 .
Essa caracterı́stica se revela na relação entre a quantidade de informação do item e o erro padrão
de estimativa. Temos (BAKER, 2001, p. 119)
SE(θ) = √
1
.
I(θ)
Como o erro-padrão depende de θ, a amplitude do intervalo de confiança para a estimativa da

habilidade θ também dependerá de seu valor. Por outro lado, a expressão do erro-padrão nos
mostra que a escolha do item que maximiza a função para um nı́vel de habilidade θ diminui o
erro padrão, aumentando a precisão da estimativa.
3
Para mais detalhes, consultem Andrade, Tavares e Valle (2000), Seção 3.3.
4
Essa caracterı́stica justifica o uso do critério de seleção que escolhe o item de máxima informação para a
habilidade θ vigente.
36
1.3.1.4 Critério de parada do teste
Em um teste adaptativo informatizado, é usual que o critério de término do teste dependa

dos objetivos do teste.
Quando um TAI é usado para classificação, é interessante estabelecer um nı́vel de pre-

cisão fixo, isto é “um nı́vel pré-determinado do erro-padrão é fixado [...] que resultará em um
conjunto de medidas ‘equiprecisas’, em que todos os examinandos terão escores com equiva-
lentes precisões.” (COSTA, 2009, p. 70). Tal critério pressupõe que o banco de itens dispõe
de itens de qualidade e em quantidade suficientes para que ele seja atendido para o conjunto de
examinandos que se deseja testar. Além disso, a quantidade de itens respondida por cada um
deles é variável. O teste é finalizado quando o nı́vel do erro-padrão da medida for satisfeito.
Em geral, um critério de precisão é também associado a um número máximo de questões

ofertadas no teste. Esse controle do número máximo de questões se apóia na expectativa de que
o caráter adaptativo do TAI permita que a habilidade seja estimada com a precisão desejada sem
que seja necessário a resolução de muitas questões. Na prática, estudos (EGGEN; STRAETMANS,
2000) mostram que, para que o TAI seja preferı́vel ao teste usual com lápis e papel, o número
de itens não deve superar 25. Além disso, esses estudos também comprovam que com esse total
de itens já se alcança uma boa estimativa para a habilidade.
1.4 Aspectos Metodológicos
Pelas diversas questões suscitadas pela Ferramenta DIA e por sua dimensão, fez-se ne-
cessária a realização de alguns recortes para melhor delimitação e investigação do objeto dessa
pesquisa. A análise inicial da ferramenta e de testes adaptativos informatizados baseados na
TRI mostrou que a possibilidade de fornecer um “diagnóstico” dependia de um diálogo de qua-
lidade entre a escala e o banco de itens utilizado. Decidiu-se por investigar a eficácia do diálogo
entre a escala e o banco de itens para a produção de um “diagnóstico”. Nesse sentido, ela tem
um caráter exploratório pois seu objetivo é a caracterização inicial de um problema. Ela tem
como objetivo “proporcionar maior familiaridade com o problema, com vistas a torná-lo mais
explı́cito ou a construir hipóteses” (GERHARDT; SILVEIRA, 2009, p. 35).
Para viabilizar essa investigação, cumprimos as seguinte etapas:
1. Desenvolver uma escala

2. Criar um banco de itens
3. Propor e implementar um algoritmo de um TAI para fornecer um “diagnóstico”
4. Realizar experimentos com o programa implementado
A etapa de desenvolvimento da escala envolveu os PCN (BRASIL, 1998), as matrizes de

referência do SAEB (BRASIL, 2005), a reinterpretação de descritores da matriz de referência
e a criação de novos objetivos e está descrita na Subseção 2.1.2 do Capı́tulo 2. A criação do
37
banco de itens exigiu o entrelaçamento dos objetivos propostos e a geração das questões e está
descrita na Subseção 2.1.3 e na Seção 2.2 do Capı́tulo 2. O algoritmo está descrito na Seção 2.3
e sua implementação na Seção 3.3. A proposição do algoritmo foi um dos pontos de encontro
nesse trabalho das duas vertentes presentes nos referenciais teóricos: o aspecto didático e o
computacional. Os experimentos foram realizados através de simulações de respondentes bem
como de suas respostas às questões propostas pelo algoritmo. Eles serão descritos em detalhe
no Capı́tulo 3.
38
2 FERRAMENTA DIA
A experiência de trabalhar com alunos em dificuldade com a aprendizagem da Ma-

temática revela que não são poucos (nem fáceis) os caminhos que existem para a recuperação
dessa dificuldade.
Muitas são as iniciativas que tentam contribuir com o ensino e a aprendizagem da Ma-
temática. Destacamos dentre elas a coleção de livros didáticos (ABREU; SIANI; COUTO,
2008), para o ensino fundamental II (6 o ano ao 9 o ano). Ela foi elaborada com o propósito
maior de estimular o aluno a refletir e fazer descobertas, utilizando para isso questões que ins-
tigam o debate, desenvolvem o espı́rito critico e favorecem a organização das relações lógicas
do pensamento matemático.
Para o desenvolvimento dessa coleção, foi criada uma lista de objetivos que descrevem
de forma especifica e detalhada, os conteúdos a serem tratados no decorrer de todo o ensino
fundamental. Para organizar todos os conteúdos dos quatro anos do ensino fundamental de
que trata a coleção, os autores optaram por uma estrutura em forma de capı́tulos e, em cada
tema discutido no interior desses capı́tulos, foram pensados quais os objetivos subjacentes a
eles seriam necessários serem desenvolvidos para a construção do tema a ser tratado. O termo
objetivo diz respeito a um fim que se quer atingir. Logo, cada objetivo procura descrever ou
destacar uma ação que se deseja alcançar. O trabalho com objetivos no sentido do mapeamento
do conteúdo facilitou bastante o desenvolvimento completo da coleção. Para ilustrar esse pro-
cesso, destacamos alguns dos objetivos que foram utilizados no desenvolvimento do conceito
semelhança.
● Reconhecer quando duas figuras são semelhantes;

● Identificar os ângulos correspondentes e os lados homólogos em dois polı́gonos semelhantes;
● Determinar a razão de semelhança entre dois polı́gonos;
● Aplicar o teorema fundamental de semelhança na resolução de situações problema;
● Saber que a razão entre linhas homólogas quaisquer de triângulos é igual à razão de semelhança
desses triângulos.
Ao descrever os diferentes objetivos que um conceito envolve, os autores buscaram di-

versificar e enriquecer o assunto a ser tratado. Uma outra motivação para o uso dos objetivos
está ligada à avaliação. Os professores que utilizavam a coleção, recebiam uma lista dos ob-
jetivos com sugestões de seu uso como indicadores do desempenho dos alunos e sinalizadores
das dificuldades encontradas na resolução de atividades propostas nos livros. A definição de
objetivos proporciona uma orientação: ao professor no estabelecimento de estratégias e ações
que ajudam aos alunos a atingirem esses objetivos; ao aluno, oferecendo a oportunidade de
identificar, através do erro, uma distração ou um objetivo ainda não alcançado.
No estudo das diferentes formas de minimizar as dificuldades que os alunos encontram

39
na construção do conhecimento matemático, a observação do erro cometido por eles e seu

uso como fonte de informação na tentativa de um diagnóstico dessas dificuldades apresenta-se
como uma alternativa. De onde vem o erro: Distração? Lacuna de conceitos não estruturados?
Incompreensão do enunciado?
De acordo com Miranda e Silva (2011)
Em toda a literatura disponı́vel sobre erros na atualidade, vemos a indissocia-

bilidade entre a concepção do erro e da avaliação, ficando evidente que, se o
caráter da avaliação é classificatório, o erro será considerado de forma nega-
tiva, tendo apenas o aspecto quantitativo na tomada de decisão em relação à
promoção escolar. Se o aspecto mais importante da avaliação for a formação
cognitiva do aluno, sua independência intelectual que implica em efetiva apren-
dizagem, a existência do erro em si faz com que o professor se questione sobre
suas causas e contribui para que os alunos também façam esse exercı́cio de
questionamento.
O erro não é necessariamente fruto da falta de conhecimento. Ele poderia ser o resul-
tado de um conhecimento anterior que produziu resultados positivos, mas que resiste diante
de fatos mais gerais e complexos. Portanto, não se trata sempre de erros de origem desconhe-
cida. Relacionar o erro a objetivos especı́ficos de um conteúdo a ser tratado é uma forma de
identificá-lo. Através da identificação dos objetivos provenientes desses erros espera-se que o
aluno possa mais facilmente saná-los ou, ao menos, que proporcione um reconhecimento de
sua dificuldade, que é uma habilidade de grande importância para o desenvolvimento da sua
aprendizagem.
Ao longo de sua experiência profissional, a autora deste trabalho desenvolveu um proce-

dimento de “diagnóstico” individual realizado com alguns de seus alunos. Para “diagnosticar”
as dificuldades apresentadas, inicialmente, ela pergunta ao aluno se ele identifica os conteúdos
em que tem dificuldade. Em caso positivo, pergunta se saberia justificá-la, se identifica onde
ocorreu o erro. Na maior parte das vezes, não sabem localizar. Ela inicia com algumas questões
simples procurando identificar as lacunas que possam provocar seus erros. Caso ele não saiba
dizer quais conteúdos geram seus erros ou em quais ele tem maior dificuldade, ela recorre, inici-
almente, a observação dos erros cometidos em avaliações feitas por ele. A partir da identificação
dos erros cometidos nas avaliações, dá-se inı́cio a um trabalho na tentativa de buscar por ob-
jetivos que refinem o conteúdo e apontem o motivo do erro. Esse processo serviu de base
para a construção da escala de objetivos. Para ilustrá-lo, uma forma bastante simplificada dele
será agora descrita. A partir do conteúdo que o aluno quer estudar (está com dificuldade) são
selecionadas em torno de 5 questões. Sua resolução é observada.
Considere o exemplo de um item:
UFMG – 2008 O octógono regular de vértices ABCDEFGH, cujos lados medem 1 dm cada
um, está inscrito no quadrado de vértices PQRS, conforme mostrado nesta figura. Então,
é correto afirmar que a área do quadrado PQRS é:
40
Figura 5 – Octógono inscrito em quadrado
Os objetivos relacionados a ele estão destacados abaixo.
O181 Descrever por meio de uma expressão algébrica a área de uma figura geométrica
O212 Reconhecer o teorema de Pitágoras e utilizá-lo na resolução de problemas
O171 Aplicar os casos de produto notável
O193 Efetuar operações com radicais
Os possı́veis erros cometidos na resolução desse item podem ter sido gerados pela falta
de atenção ou pela incompreensão de um desses objetivos relacionados. Nesse último caso, é
selecionado um novo item, associado somente aos objetivos envolvidos nos erros cometidos a
fim de que se tenha um refinamento do diagnóstico.
Vamos imaginar que no item exemplificado acima o aluno tenha cometido um erro ao
efetuar operações com radicais (O193). Novos itens especificamente envolvendo operações
com radicais são selecionados para verificar se esse foi o motivo da resposta incorreta.
Esse caminho é repetidamente percorrido, novos itens são selecionados e, ao final de

um tempo de aula, o aluno toma conhecimento dos objetivos que devem ser trabalhados com
mais atenção. Recebe indicações de maior dedicação aos objetivos em que ele apresentou uma
incompreensão ou lacuna na formação do conceito e é orientado a dar importância aos seus
erros pois eles sinalizam e indicam alguma distração ou uma lacuna de conteúdo nos objetivos
relacionados às questões.
O estudo do erro é uma temática já antiga de pesquisa e, ao mesmo tempo, recente.
Segundo de Torre (2000) o estudo do erro proporciona uma excelente estratégia para atender
à diversidade profunda dos processos de aprendizado e, com isso, melhorar a qualidade do
ensino. Pinto (2000) ainda acrescenta que “os erros são bons indicadores de lacunas e falhas
sistemáticas, e por essa razão, devem proporcionar uma ‘regulação’ competente”.
41
A longa experiência da autora na aplicação desse procedimento de “diagnóstico” e re-

sultados satisfatórios com ele obtidos, suscitou nela o interesse em pesquisar como traduzir
esse procedimento para um computador. Em um atendimento individual, os questionamentos
podem ser respondidos mais facilmente, mas, seria possı́vel ir além? Como permitir que o aluno
pudesse se auto diagnosticar? A ferramenta DIA, então, foi a forma encontrada.
Para criar uma ferramenta que pudesse fornecer esse diagnóstico fez-se necessário criar
uma escala com objetivos que mapeassem cada conteúdo a ser pesquisado.
2.1 Construção da Escala
Tanto na pesquisa elaborada por Costa (2009), como no Projeto GERES

(OLIVEIRA; FRANCO; SOARES, 2007) a construção da escala foi diferente da proposta que,
agora, apresentamos para a ferramenta DIA. Costa constrói uma escala “com a finalidade de se
buscar uma interpretação qualitativa dos valores das proficiências obtidas em testes de inglês”.O
Projeto GERES trata de um estudo longitudinal de painel, durante os anos 2005 a 2008, no qual
a mesma amostra de escolas e de alunos foi observada ao longo desses quatro anos. A técnica
empregada na dissertação de Costa foi a “Ancoragem”. É definida por “nı́veis-âncora”, que por
sua vez são caracterizados por “itens-âncora”. Ela afirma que: “na prática, existe uma grande
dificuldade de se encontrar itens que obedeçam a todas as caracterı́sticas de um ‘item-âncora’
”.
O Projeto Geres (OLIVEIRA; FRANCO; SOARES, 2007) descreve os dois procedi-

mentos básicos que são utilizados em programas de avaliação educacional em larga escala
no Brasil, para a construção de uma escala de proficiência: identificação de itens-âncora, e
interpretação pedagógica desses itens. São citados no Projeto algumas limitações desse proce-
dimento, que são superadas construindo as escalas a partir de informações fornecidas por cada
item. É feita uma análise detalhada das habilidades desenvolvidas pelos alunos e são considera-
das três fases: introdução, processamento e consolidação da habilidade. Essas fases tornam-se
pontos na curva caracterı́stica do item, criando três regiões na escala de proficiência.
Tanto em Costa como no Geres, a escala é construı́da a partir de um banco de itens

previamente conhecido. No caso da ferramenta DIA, como a intenção é a de fornecer um
diagnóstico, houve a necessidade de se conceber e construir uma escala que fosse independente
de um banco de itens particular e permitisse a avaliação de todo o conteúdo que se pretende
analisar. A escala tem a finalidade de descrever todos os objetivos associados a cada conteúdo
para permitir o refinamento da análise, necessário ao diagnóstico. Precisamos, então, construir
uma escala de objetivos que associe as competências e habilidades do aluno, descrevendo os
conteúdo na forma de ações a serem atingidas.
Uma outra diferença está na intenção de sua utilização. Não queremos comparar de-
sempenho dos alunos, nem localizá-lo dentro de uma região de habilidade. Temos a intenção de
descrever as ações necessárias para a execução de uma atividade ou situação-problema para que,
42
com isso, possamos fornecer uma informação das lacunas e dificuldades encontradas quando
da resolução de cada item avaliado. Dessa forma, a função de nossa escala é a de mapear
os conteúdos testados relacionando-os a objetivos especı́ficos que possam fornecer esse di-
agnóstico.
2.1.1 A importância dos objetivos
Acreditamos que, para consolidar uma habilidade em determinado conteúdo, devemos

utilizar objetivos bem definidos a eles associados. A definição clara e estruturada de objetivos,
considerando a aquisição de conhecimento, fornece uma direção no processo de ensino para a
escolha adequada de estratégias, métodos, instrumentos de avaliação e, consequentemente, para
uma aprendizagem efetiva e duradoura.
Ferraz e Belhot (2010) destacam duas vantagens do trabalho com objetivos:
● como base para o desenvolvimento de instrumentos de avaliação e utilização de estratégias diferenci-

adas para facilitar, avaliar e estimular o desempenho dos alunos em diferentes nı́veis de aquisição de
conhecimento; e
● para estimular os educadores a auxiliarem seus discentes, de forma estruturada e consciente, a adquirirem
competências especı́ficas a partir da percepção da necessidade de dominar habilidades mais simples
(fatos) para, posteriormente, dominar as mais complexas (conceitos).
Além disso, acreditamos que o uso de objetivos definidos oferece um bom apoio ao
esforço de compatibilizar testes de avaliação com conteúdos de ensino.
2.1.2 A Escala
Para a construção da escala de objetivos para a simulação da ferramenta DIA, ini-

cialmente foi feita uma pesquisa utilizando documentos como: Normas para o Currı́culo e
Avaliação em Matemática Escolar, do National Council of Teachers of Mathematics (NCTM)
criado em 1989 e os Parâmetros Curriculares Nacionais, no caso o PCN de Matemática. O pri-
meiro não pretendia ser um currı́culo nacional, mas, sim, fornecer recomendações e uma visão
da importância dos conceitos matemáticos para a formação de um cidadão, sob o ponto de vista
do ensino. Nesse sentido, o Conselho Internacional de Professores de Matemática (NCSM,
1990) especifica que se deve considerar a capacidade do aluno para:
● planejar ações e projetar soluções para problemas que exigem iniciativa e criatividade;
● compreender e transmitir ideias matemáticas, por escrito ou oralmente;
● usar o raciocı́nio matemático para a compreensão do mundo que o cerca;
● aplicar matemática nas situações do dia-a-dia;
● avaliar se resultados obtidos na solução de problemas são ou não razoáveis;
● efetuar cálculos “de cabeça”, estimativas ou cálculos aproximados;
● aplicar as técnicas básicas das operações aritméticas;
● utilizar os conceitos fundamentais de medidas em situações concretas;
43
● empregar o pensamento algébrico, incluindo o uso de gráficos e tabelas;

● reconhecer propriedades de figuras geométricas, relacionando-as com objetos do uso comum;
● usar a noção de probabilidade, para fazer previsões de eventos ou acontecimentos.
Espera-se que, dessa forma, o ensino da Matemática conduza ao reconhecimento de

que a aprendizagem não é uma questão de acumulação, mas, principalmente, de construção de
conhecimentos.
No decorrer de nossas pesquisas, deparamo-nos com os Programas de Avaliação Edu-

cacional em Larga Escala no Brasil, cujo objetivo é realizar um diagnóstico do sistema educa-
cional brasileiro e de alguns fatores que possam interferir no desempenho do aluno, fornecendo
um indicativo sobre a qualidade do ensino que é ofertado. O Instituto Nacional de Estudos
e Pesquisas Educacionais (INEP) considerou necessário o desenvolvimento de um referencial
que pudesse dar coesão e suporte para o desenvolvimento de um processo avaliativo. Foi rea-
lizada, então, a primeira Matriz Curricular de Referência para dar ao público um apoio para o
desencadeamento de provas de avaliação com abrangência nacional.
O primeiro Sistema de Avaliação Educacional (SAEB) aconteceu em 1999 com a partici-

pação de uma amostra de escolas públicas da rede urbana. Desde 1995, adotou-se uma nova me-
todologia de construção do teste e análise de resultados, a Teoria de Resposta ao Item, abrindo
a possibilidade de comparabilidade entre os resultados das avaliações ao longo do tempo. Em
2005, o SAEB foi reestruturado pela Portaria Ministerial n o 931, de 21 de março de 2005,
passando a ser composto por duas avaliações: Avaliação Nacional da Educação Básica (Aneb)
e Avaliação Nacional do Rendimento Escolar (Anresc), conhecida como Prova Brasil. Os re-
sultados da avaliação são apresentados em uma escala de desempenho capaz de descrever, em
cada nı́vel, as competências e habilidades que os alunos são capazes de demonstrar.
A escala do SAEB é única para cada disciplina. Elas são divididas em intervalos para
descrever e comparar a performace dos alunos nas disciplinas avaliadas. Para que as habilidades
e competências dos alunos fossem avaliadas dentro da escala, foram estruturadas matrizes com
descritores especı́ficos. O descritor é uma associação entre conteúdos curriculares e operações
mentais desenvolvidos pelo aluno, a partir dos quais os itens de prova são elaborados (BRASIL,
2005). As respostas dadas pelos alunos a esses itens possibilitam a descrição do nı́vel de desem-
penho por eles atingido. A partir daı́, é dado conhecer o desempenho dos sistemas de ensino.
Essas matrizes foram estruturadas em quatro temas:
Tema I. Espaço e Forma;
Tema II. Grandezas e Medidas;
Tema III. Números e Operações/Álgebra e Funções;
Tema IV. Tratamento da Informação.

44
Essas Matrizes de Referência do Sistema Nacional de Avaliação são resultado do estudo dos
Parâmetros Curriculares, Diretrizes Curriculares e livros didáticos e da reflexão realizada por
professores, pesquisadores e especialistas que buscam um consenso a respeito das habilidades
consideradas essenciais em cada etapa do ensino escolar.
Recortamos da Matriz de Refêrencia, as competências (M4 e M5) e habilidades (H16 a

H25), descritas a seguir, que utilizamos para o desenvolvimento dos objetivos usados no ensaio.
M4 Utilizar o conhecimento geométrico para realizar a leitura e

a representação da realidade, e agir sobre ela.
H16 Identificar e interpretar fenômenos de qualquer natureza ex-

pressos em linguagem geométrica.
H17 Construir e identificar conceitos geométricos no contexto da
atividade cotidiana.
H18 Interpretar informações e aplicar estratégias geométricas na
solução de problemas do cotidiano.
H19 Utilizar conceitos geométricos na seleção de argumentos
propostos como solução de problemas do cotidiano.
H20 Recorrer a conceitos geométricos para avaliar propostas de
intervenção sobre problemas do cotidiano.
Quadro 1 – Espaço e Forma

45
M5 Construir e ampliar noções de grandezas e medidas para a

compreensão da realidade e a solução de problemas do co-
tidiano.
H21 Identificar e interpretar registros, utilizando a notação con-

vencional de medidas.
H22 Estabelecer relações adequadas entre os diversos sistemas
de medida e a representação de fenômenos naturais e do
cotidiano.
H23 Selecionar, compatibilizar e operar informações métricas de
diferentes sistemas ou unidades de medida na resolução de
problemas do cotidiano.
H24 Selecionar e relacionar informações referentes a estimativas
ou outras formas de mensuração de fenômenos de natureza
qualquer, com a construção de argumentação que possibili-
tem sua compreensão.
H25 Reconhecer propostas adequadas de ação sobre a realidade,
utilizando medidas e estimativas.
Quadro 2 – Grandezas e Medidas
De posse de todo esse material de pesquisa, iniciamos a construção da nossa escala de

objetivos que serviu para a simulação da ferramenta DIA.
Selecionamos, na área de Geometria e dentro dos temas: Espaço e Forma e Grandezas

e Medidas, os descritores, listados a seguir, retirados da Matriz de Referência:
46
D3 Identificar propriedades de triângulos pela comparação de medidas de

lados e ângulos.
D4 Identificar relação entre quadriláteros, por meio de suas propriedades.
D5 Reconhecer a conservação ou modificação de medidas dos lados, do
perı́metro, da área em ampliação e/ou redução de figuras poligonais
usando malhas quadriculadas.
D6 Reconhecer ângulos como mudança de direção ou giros, identificando
ângulos retos e não retos.
D7 Reconhecer que as imagens de uma figura construı́da por uma
transformação homotética são semelhantes, identificando propriedades
e/ou medidas que se modificam ou não se alteram.
D8 Resolver problema utilizando a propriedade dos polı́gonos (soma de
seus ângulos internos, número de diagonais, cálculo da medida de cada
ângulo interno nos polı́gonos regulares).
D10 Utilizar relações métricas do triângulo retângulo para resolver proble-
mas significativos.
Quadro 3 – Descritores do Tema I. Espaço e Forma
D12 Resolver problema envolvendo o cálculo de perı́metro de figuras planas.

D13 Resolver problema envolvendo o cálculo de área de figuras planas.
D14 Resolver problema envolvendo noções de volume.
Quadro 4 – Descritores do Tema II. Grandezas e Medidas
Sendo nosso grande objetivo a informação mais refinada das dificuldades encontradas
na resolução dos itens no momento da sua execução, decidimos considerar, também, alguns
descritores relacionados ao tema III: Números e Operações.
Entendemos que, para identificar as dificuldades pontuais (mais especı́ficas) encontradas

na resolução dos itens que avaliam essas habilidades, era necessário a criação de objetivos
que apontassem essas dificuldades e erros. Vale ressaltar que utilizamos alguns descritores do
SAEB, transformando-os em objetivos mas optamos por criar outros objetivos com o intuito
de especificar e descrever de forma mais detalhada as ações inerentes aos conteúdos. Nesse
sentido, nossa escala está estruturada em quatro camadas: Temas, Competências, Habilidades
e Objetivos. Para facilitar a visualização da estrutura da escala de objetivos criada, vamos
apresentá-la através de uma tabela. As colunas do quadro 1 estão descritas abaixo:
47
D18 Efetuar cálculos com números inteiros envolvendo as operações.

D25 Efetuar cálculos que envolvam operações com números racionais.
D27 Efetuar cálculos simples com valores aproximados de radicais.
D30 Calcular o valor numérico de uma expressão algébrica.
D35 Identificar a relação entre as representações algébrica e geométrica de
um sistema de equações de primeiro grau.
D31 Resolver problema que envolva equação de segundo grau.
Quadro 5 – Descritores do tema III: Números e Operações.
primeira coluna: o número dado ao objetivo

segunda coluna: o conteúdo a que se refere o objetivo
terceira coluna: ano em que o objetivo se inicia
quarta coluna: descrição do objetivo
Tabela 1 – Descrição dos objetivos (continuação)

Objetivo Conteúdo Ano Descrição
O100 UnidadedeMedida 6 Desenvolver o conceito de medir, desenvolvendo sua capacidade de es-
timar resultados
O101 UnidadedeMedidacomprimento 6 Desenvolver o conceito de medida de comprimento relacionando com
unidades padronizadas
O103 UnidadedeMedidaarea 6 Desenvolver o conceito de medida de superfı́cie, relacionando com uni-
dades padronizadas
O105 UnidadedeMedidavolume 6 Desenvolver o conceito de volume, relacionando com unidades padro-
nizadas
O106 Formas Geométricas 6 Reconhecer formas geométricas
O107 Formas Geométricas 6 Classificar os sólidos geométricos
O108 Formas Geométricas 6 Reconhecer diferentes polı́gonos e suas caracterizaç ões
O109 Formas Geométricas 6 Reconhecer e nomear os poliedros
O110 Formas Geométricas 6 Identificar as dimensões dos poliedros
O111 Formas Geométricas 6 Compor / Decompor poliedro (planificação)
O112 Formas Geométricas 6 Construir as cevianas (altura, mediana e bissetriz) de um triângulo
O113 UnidadedeMedidacomprimento 6 Identificar a medida do comprimento de um contorno de uma figura
como sendo o seu perimetro
O114 UnidadedeMedidacomprimento 6 Estabelecer a unidade padrão para medir comprimento, com os seus
múltiplos e submúltiplos
O127 UnidadedeMedidacomprimento 6 Resolver uma situação problema que envolva o conceito de perı́metro
O129 UnidadedeMedidaarea 6 Calcular área por meio da composição e decomposição de figuras
O130 UnidadedeMedidaarea 6 Calcular áreas de figuras desenhadas em malhas quadriculadas
O131 UnidadedeMedidaarea 6 Estabelecer a unidade padrão para medir área, com os seus múltiplos e
submúltiplos
O132 Cevianas 6 Identificar as alturas e a base correspondente de um triângulo
O136 Cevianas 6 Reconhecer que a altura do triângulo é uma ceviana perpendicular à
base correspondente do triângulo
O137 UnidadedeMedidaarea 6 Calcular a área de um triângulo
O138 UnidadedeMedidaarea 6 Calcular a área de um quadrado
48

O139 UnidadedeMedidaarea 6 Calcular a área de um retângulo
O142 UnidadedeMedidaarea 6 Resolver uma situação problema que envolva o conceito de área
O161 UnidadedeMedidavolume 6 Calcular o volume através da contagem de blocos
O162 UnidadedeMedidavolume 6 Calcular o volume de diferentes sólidos por meio de comparação com
outros
O164 UnidadedeMedidavolume 6 Resolver problema que envolva o volume de paralelepı́pedos (cubos)
O166 UnidadedeMedidavolume 6 Estabelecer a unidade padrão para medir volumes, com os seus
múltiplos e submúltiplos
O167 UnidadedeMedidavolume 6 Relacionar as unidades de volume(cúbicas) às de capacidade (litro)
O207 UnidadedeMedida 6 Identificar a medida de um objeto por meio de régua, expressando-a em
sua forma decimal
O192 Números e Operações 6 Efetuar operações com potências
O216 Números e Operações 6 Operar com números decimais
O217 Números e Operações 6 Operar com números fracionários
O204 UnidadedeMedidacomprimento 6 Fazer transformação de unidades de medida de comprimento
O205 UnidadedeMedidaarea 6 Fazer transformação de unidades de medida de área
O206 UnidadedeMedidavolume 6 Fazer transformação de unidades de medida de volume
O143 UnidadedeMedidacomprimento 7 Resolver problemas de perı́metro de polı́gonos utilizando equações po-
linômiais do 1 o grau
O144 UnidadedeMedidaarea 7 Resolver problemas de área de polı́gonos que utilizam em equações po-
linômiais do 1 o grau
O175 Proporcionalidade 7 Identificar proporção como a igualdade entre duas razões
O176 Proporcionalidade 7 Aplicar a propriedade fundamental das proporções
O177 Proporcionalidade 7 Resolver problemas aplicando todas as propriedades das proporções
O178 Proporcionalidade 7 Reconhecer quando dois conjuntos de números são diretamente ou in-
versamente proporcionais
O180 Proporcionalidade 7 Reconhecer quando duas grandezas variáveis dependentes são direta-
mente ou inversamente proporcionais
O182 Proporcionalidade 7 Aplicar a regra de três simples/composta
O185 Números e Operações 7 Operar com números racionais
O173 Equação 7 Escrever a equação correspondente ao enunciado de um problema
O174 Equação 7 Resolver e dar o conjunto-verdade de equações, observando restrições
O187 Equação 7 Resolver equações polinomiais do 1 o grau
o
O188 Equação 7 Resolver equações polinomiais do 1 grau com duas variáveis (sis-
tema)
O213 Equações 7 Resolver equações polinomiais utilizando o conceito de equações equi-
valentes
O135 Cevianas 8 Reconhecer os pontos de encontro das cevianas (baricentro, incentro e
ortocentro) de um triângulo)
O146 UnidadedeMedidaarea 8 Calcular a área de um paralelogramo
O147 UnidadedeMedidaarea 8 Calcular a área de um losango
O148 UnidadedeMedidaarea 8 Calcular a área de um trapézio
O165 UnidadedeMedidavolume 8 Descrever por meio de uma expressão algébrica o volume de uma figura
geométrica
O168 Cálculo algébrico 8 Empregar o valor numérico real em uma expressão algébrica
O170 Cálculo algébrico 8 Operar com polinômio
O171 Cálculo algébrico 8 Aplicar os casos de produtos notáveis
O172 Cálculo algébrico 8 Aplicar os casos de fatoração
49
Tabela 1 – Descrição dos objetivos (conclusão)

O181 Cálculo algébrico 8 Descrever por meio de uma expressão algébrica a área de uma figura
geométrica
O189 Triângulo 8 Determinar os pontos notáveis de um triângulo:baricentro, ortocentro,
incentro
O214 Cálculo algébrico 8 Compreender e interpretar geometricamente os casos de produto
notável e fatoração
O140 UnidadedeMedidaarea 8 Identificar figuras equivalentes
O145 Formas Geométricas 8 Reconhecer as diagonais de um losango
O215 Formas Geométricas 8 Aplicar as propriedades dos quadriláteros na resolução de problemas
O116 UnidadedeMedidacomprimento 8 Descrever por meio de uma expressão algébrica o comprimento
(perı́metro) de uma figura geométrica
O117 UnidadedeMedidacomprimento 9 Calcular medidas de segmentos através da semelhança entre figuras
O118 UnidadedeMedidacomprimento 9 Calcular o perı́metro de polı́gonos regulares utilizando razões trigo-
nométricas
O119 Semelhança 9 Reconhecer quando duas figuras são semelhantes
O120 Semelhança 9 Determinar a razão de semelhança entre dois polı́gonos
O121 UnidadedeMedidacomprimento 9 Reconhecer que a razão entre os perı́metros de dois polı́gonos seme-
lhantes é igual à razão de semelhança
O122 UnidadedeMedidaarea 9 Reconhecer que a razão entre as áreas de dois polı́gonos semelhantes é
igual ao quadrado da razão de semelhança
O123 UnidadedeMedidavolume 9 Reconhecer que a razão entre os volumes de dois sólidos semelhantes é
igual ao cubo da razão de semelhança
O124 UnidadedeMedidaarea 9 Resolver problemas de áreas com figuras equivalentes
O125 UnidadedeMedidacomprimento 9 Calcular o comprimento de uma circunferência
O126 UnidadedeMedidacomprimento 9 Calcular o comprimento de um arco de circunferência
O150 UnidadedeMedidaarea 9 Calcular a área de um triângulo dados a medida dos seus lados (fórmula
de Herão)
O151 UnidadedeMedidaarea 9 Calcular a área de um triângulo dados as medidas de seus lados e do
raio da circunferência inscrita ou circunscrita ao triângulo
O152 UnidadedeMedidaarea 9 Calcular a área de um triângulo dados as medidas de dois lados e o
ângulo por eles formado
O154 UnidadedeMedidaarea 9 Calcular a área do cı́rculo e suas partes
O156 Polı́gonos Regulares 9 Reconhecer poligonos regulares como sendo aqueles que têm lados e
ângulos congruentes
O157 UnidadedeMedidaarea 9 Calcular área de um polı́gono regular
O158 Polı́gonos Regulares 9 Reconhecer polı́gonos inscritos ou circunscritos na circunferência
o
O159 UnidadedeMedidaarea 9 Calcular área utilizando a resolução de equações do 2 grau
O163 UnidadedeMedidavolume 9 Calcular o volume de sólidos através de semelhança
O193 Números e Operações 9 Efetuar operações com radicais; (raiz quadrada; raiz cúbica)
O194 Equação 9 Resolver equações polinomiais do 2 o grau
o
O195 Equação 9 Resolver equações polinomiais do 2 grau com duas incógnitas (sis-
tema)
O208 Triângulo 9 Aplicar as relações métricas do triângulo retângulo na resolução de
exercı́cios
O209 Poligono regular 9 Resolver em situações problema relações métricas nos polı́gonos regu-
lares inscritos
O210 Razões trigonometrias 9 Aplicar as razões trigonométricas na resolução de problemas
O211 Poligono regular 9 Calcular o apótema de um poligono regular
50
Dentro dos temas escolhidos (Espaço e Forma; Grandezas e Medidas) e com foco nas
competências e habilidades anteriormente citadas, escolhemos o conteúdo a ser tratado: Uni-
dade de medida (perı́metro, área e volume) que foi destacado em cores na tabela. Criamos
alguns objetivos, com a finalidade de associar esses conteúdos aos cálculos mentais desenvol-
vidas pelo aluno. A partir dos objetivos criados, sentimos a necessidade de outros objetivos que
se referem a conhecimentos prévios desses ou a conteúdos que aparecem relacionados a eles
em diferentes situações. Como esses últimos objetivos criados não são os principais escolhidos
para o ensaio, aparecem sem destaque (sem cor) na tabela.
Ressaltamos que não há uma hierarquia solidificada entre os conceitos, nem tampouco
entre os objetivos. E, também, que não esgotamos os objetivos na criação dessa escala. Con-
cordamos com Machado (1993) quando afirma que “um significado nunca está definitivamente
construı́do. O feixe de relações que o constitui transforma-se continuamente, incorporando
novas relações ou depurando-se outras, que se tornam menos expressivas.”
2.1.3 O entrelaçamento dos objetivos
A construção da escala de objetivos tem seu importante papel na possibilidade de a ferra-

menta DIA existir. Deve-se a eles a captação dos erros, apontando as dificuldades e deficiências
encontradas. No momento em que chegamos ao refinamento mı́nimo na escala (estabelecemos
o 6 o ano como mı́nimo), conseguimos construir um mapeamento do assunto testado. Como
não dispúnhamos de um Banco de Itens “real”, era preciso saber: quais combinações de objeti-
vos podem gerar questões e permitir que os eventuais erros cometidos na resolução das mesmas
sejam apontados? Foi necessário criar conexões, entrelaçando-os de forma a criar questões
possı́veis de refletir itens “reais” e, assim, permitir a geração do banco de itens.
No momento da construção da escala, ao conceber e definir os diferentes objetivos re-

lacionados aos conceitos escolhidos (perı́metro, área e volume), procuramos não nos restringir
a situações em que um conhecimento de um determinado conteúdo favorece o conhecimento
de outro, ou de que o conhecimento de um não é possı́vel sem o conhecimento de outro. Pro-
curávamos naquele momento definir elementos que tanto permitissem o refinamento da análise
quanto se constituı́ssem em elementos necessários e inerentes ao desenvolvimento de habilida-
des na perspectiva dos conteúdos associados ao tema tratado.
Já no momento da construção do Banco de Itens, retornamos aos objetivos (agora já
integrados na estrutura da escala) para pensar em possı́veis conexões e entrelaçamentos que
pudessem gerar itens. Revisitamos os diferentes objetivos relacionados aos conceitos escolhidos
(perı́metro, área e volume) e observamos algumas questões que utilizam diferentes objetivos
durante a sua resolução. Por exemplo, entrelaçamos os objetivos: calcular o volume de um
sólido através de semelhança (O163) ao objetivo: reconhecer que a razão de semelhança entre
os volumes de dois sólidos semelhantes é igual ao cubo da razão de semelhança (O123).
Duarte (PsiEsc4.pdf) afirma que o estabelecimento dessas relações de dependência entre

51
objetivos de aprendizagem num determinado domı́nio de conhecimento permitem estruturar o

processo de avaliação e sequenciar os processos de ensino e de aprendizagem. Afirma ainda que
esse recurso está presente no desenvolvimento de várias propostas formativas personalizadas
em sistemas de aprendizagem com suporte tecnológico. Elas fazem referência explı́cita às
competências e aptidões subjacentes ao tema tratado, integrando os objetivos de aprendizagem
e tendo como foco a avaliação do conhecimento.
Essas conexões não foram encerradas. Há sempre uma possibilidade de se criarem novos
entrelaçamentos e novos objetivos. Desta forma, reiteramos não haver uma hierarquia solidifi-
cada entre os conceitos nem tampouco entre os objetivos.
2.2 Banco de Itens
Com o objetivo de fornecer um diagnóstico de informação das dificuldades encontradas

pelo aluno no conteúdo testado, dentro da sua proficiência, utilizamos a TRI. Para isso, preci-
samos de um banco de itens possı́vel que dialogue com a escala para permitir e viabilizar esse
diagnóstico.
Não foi utilizado nenhum banco de itens previamente construı́do para a construção da
escala. Os itens do banco foram criados através da combinação de cada objetivo do nono ano
com o entrelaçamento criado a partir deles. Na tabela abaixo, listamos os objetivos de nono ano
(segunda coluna) e seus objetivos associados (quarta coluna). Ao se ter a geração de itens em
mente, um novo aspecto surgiu: há objetivos que não geram isoladamente um item. Na terceira
coluna, o número zero indica que o objetivo pode gerar uma questão com um único objetivo e
o 1 indica que o objetivo não gera questão em que ele é o único objetivo a ela associado. (A
primeira coluna numera a linha da tabela para facilitar referências futuras)
Tabela 2 – O entrelaçamento dos objetivos (continuação)
Objetivo Objetivos entrelaçados

1 117 1 176
2 118 1 116, 210, 156
3 119 0 –
4 120 0 119
5 121 1 176, 116, 119, 120
6 122 1 176, 119, 120
7 123 1 176, 119, 120
8 124 0 140
9 125 0 –
52
10 126 0 125
11 142 1 211, 156, 157
12 150 1 113, 193
13 151 0 –
14 152 0 –
15 154 0 125
16 156 0 –
17 157 1 113, 211, 156
18 158 0 –
19 159 1 187, 173, 174, 168, 170, 194
20 163 1 122
21 164 1 193, 194
22 193 0 192
23 194 0 192, 185, 165, 171, 187, 213
24 195 0 192, 194, 193
25 208 0 176, 119
26 209 0 211
27 210 0 119
28 211 0 210
29 212 0 116, 208
30 218 1 157, 210
Foram respeitados os critérios: gerar questões com no máximo 5 objetivos e a possibi-

lidade ou não de o objetivo gerar questões com um único objetivo. Para gerar as questões do
banco, consideramos o objetivo O do nono ano e seus kO objetivos entrelaçados. Foram con-
sideradas todas as combinações k a k dos objetivos entrelaçados com k = 1, . . . , min{kO , 4}.
Cada uma dessas combinações associada ao objetivo O gerou uma1 questão. É importante
lembrar que os itens gerados com a combinação desses objetivos não devem ser considerado
artificias e não factı́veis. E, também, não esgotam as possı́veis relações entre os objetivos.
À medida em que se criam novos entrelaçamentos entre os objetivos, novos itens podem ser
formados ou, ainda, a introdução de novos itens no banco, através dos objetivos associados a
1
Na verdade, cada combinação gerou no banco 13 questões. Cada uma dessas 13 questões tem os mesmos
objetivos mas com parâmetro de dificuldade b ∈ {−3, −2.5, . . . , 2.5, 3}
53
cada um dos itens, pode agregar entrelaçamentos ainda não previstos na matriz apresentada na
Tabela 2.
Abaixo, apresentamos exemplos de itens gerados do entrelaçamento descrito na Ta-

bela 2. Na linha 2, o objetivo 118 aparece entrelaçado com os objetivos 116, 210 e 156. Além
disso, o número 1 na terceira coluna indica que o objetivo 118 não gera isoladamente uma
questão. Consequentemente, teremos um total de 7 questões que correspondem a soma das
combinações dos três objetivos que com ele se entrelaçam.
⎛3⎞ ⎛3⎞ ⎛3⎞

7 = 3+3+1 = ⎜ ⎟+⎜ ⎟+⎜ ⎟.
⎝1⎠ ⎝2⎠ ⎝3⎠
A composição dos itens gerados pode ser vista na tabela abaixo:
Tabela 3 – Questões geradas a partir do objetivo O118
No. da Questão Objetivos

2 118 116
3 118 210
4 118 156
5 118 116 210
6 118 116 156
7 118 210 156
8 118 116 210 156
O objetivo 120 (ver linha 4 da Tabela 2), por sua vez, pode gerar isoladamente uma
questão (conforme indicado pelo 0 na terceira coluna, linha 4 da Tabela 2) e tem apenas o
objetivo 119 a ele entrelaçado. Desse modo, foram gerados por ele dois itens cuja composição
pode ser vista na tabela abaixo:
Tabela 4 – Questões geradas a partir do objetivo O120

10 120
11 120 119
Na linha 19 da Tabela 2, o objetivo 159 está descrito como um objetivo que não gera
isoladamente uma questão e tem com ele entrelaçados seis objetivos: 187, 173, 174, 168, 170,
54
194. A partir das combinações entre eles um total de 56 itens serão gerados:
⎛6⎞ ⎛6⎞ ⎛6⎞ ⎛6⎞

56 = 6 + 15 + 20 + 15 = ⎜ ⎟ + ⎜ ⎟ + ⎜ ⎟ + ⎜ ⎟ .
⎝1⎠ ⎝2⎠ ⎝3⎠ ⎝4⎠
A composição dos itens gerados pode ser vista na tabela abaixo. Observe que o número máximo
fixado em 5 objetivos associados a cada item foi respeitado.
Tabela 5 – Questões geradas a partir do objetivo O159 (continuação)

69 159 187
70 159 173
71 159 174
72 159 168
73 159 170
74 159 194
75 159 187 173
76 159 187 174
77 159 187 168
78 159 187 170
79 159 187 194
80 159 173 174
81 159 173 168
82 159 173 170
83 159 173 194
84 159 174 168
85 159 174 170
86 159 174 194
87 159 168 170
88 159 168 194
89 159 170 194
90 159 187 173 174
91 159 187 173 168
92 159 187 173 170
55
Tabela 5 – Questões geradas a partir do objetivo O159 (continuação)
93 159 187 173 194

94 159 187 174 168
95 159 187 174 170
96 159 187 174 194
97 159 187 168 170
98 159 187 168 194
99 159 187 170 194
100 159 173 174 168
101 159 173 174 170
102 159 173 174 194
103 159 173 168 170
104 159 173 168 194
105 159 173 170 194
106 159 174 168 170
107 159 174 168 194
108 159 174 170 194
109 159 168 170 194
110 159 187 173 174 168
111 159 187 173 174 170
112 159 187 173 174 194
113 159 187 173 168 170
114 159 187 173 168 194
115 159 187 173 170 194
116 159 187 174 168 170
117 159 187 174 168 194
118 159 187 174 170 194
119 159 187 168 170 194
120 159 173 174 168 170
121 159 173 174 168 194
122 159 173 174 170 194
56
Tabela 5 – Questões geradas a partir do objetivo O159 (conclusão)
123 159 173 168 170 194

124 159 174 168 170 194
2.3 Algoritmo
O algoritmo proposto permite simularmos o processo de “diagnóstico” individual des-

crito no inı́cio desse capı́tulo (ver p. 38). Ele descreve os procedimentos de seleção das questões
e o mecanismo de refinamento que subsidiará o diagnóstico final.
Ele está estruturado em dois blocos. O primeiro deles é processado apenas na primeira
iteração e sua função é apresentar um conjunto inicial de questões e usar as respostas dadas pelo
aluno para fazer uma primeira estimativa da habilidade do aluno e, caso alguma questão tenha
sido respondida incorretamente, identificar se já há um conjunto de objetivos a ser analisado
para diagnóstico. O segundo bloco está subdividido em duas partes. Uma delas lida com
o conjunto de objetivos a ser analisado para diagnóstico e é acessada até que se alcance o
refinamento necessário para o diagnóstico. A outra é semelhante ao bloco inicial e só é acessada
quando da ocorrência de 100% de acerto nas questões apresentadas na iteração anterior. A cada
iteração, a estimativa de habilidade do aluno é recalculada em função das respostas dadas pelo
aluno nas questões a ele apresentadas.
Bloco 1 No inı́cio do algoritmo, um conjunto de questões é selecionado aleatoriamente no

banco de itens. Dentro do algoritmo, um valor para a habilidade inicial θ0 do aluno é
fixado. Considerando a habilidade θ0 e o vetor de respostas v0 gerado pelo aluno, uma
nova habilidade θ1 e o erro padrão associado a esta estimativa são calculados.
Bloco 2 Nas demais iterações, há novamente dois possı́veis blocos:
Houve erro Estamos na etapa k e o vetor resposta vk−1 da etapa k − 1 tem elementos
nulos. Isto é, houve itens respondidos incorretamente. Neste caso:
● são identificados os objetivos oi
(k−1)
presentes nas questões respondidas incorre-
tamente na etapa k − 1
● são selecionadas no banco de questões um novo conjunto de questões com parâmetro
de dificuldade bi mais próximo do valor do parâmetro de dificuldade que maxi-
miza a função de informação Fi para um indivı́duo com habilidade θk . A seleção é
feita em um subconjunto K do banco de itens. Todos os elementos de K são itens
(k−1)
cujos objetivos associados pertencem ao conjuntos dos objetivos oi presentes
nas questões respondidas incorretamente na etapa k − 1. A seleção é feita priori-
zando questões com maior número de objetivos e que não apresentem objetivos
comuns. Esgotadas as escolhas feitas com esses critérios e ainda não tendo sido
57
atingido o número máximo de itens a serem apresentados por iteração (parâmetro

que deve estar definido internamente no programa), novos itens são selecionados,
priorizando questões com maior número de objetivos associados, sendo permitido
que elas possuam objetivos em comum.
Considerando a habilidade θk e o vetor de respostas vk gerado pelo aluno, uma
nova habilidade θk+1 e o erro padrão associado a esta estimativa são calculados.
Diagnóstico Se no vetor resposta vk há questões de um objetivo ou dois objeti-
vos2 respondidas incorretamente, a ferramenta DIA diagnostica o objetivo gera-
dor como não tendo sido plenamente desenvolvido ou alcançado pelo aluno. Os
(k−1)
objetivos diagnosticados são excluı́dos do conjunto dos objetivos oi que estão
sendo testados.
Não houve erro Estamos na etapa k e o vetor resposta vk−1 da etapa k − 1 não tem ele-
mentos nulos. Isto é, não houve itens respondidos incorretamente. Neste caso:
● um conjunto de questões é selecionado aleatoriamente com no banco de itens com
parâmetros de dificuldade bi . Os parâmetros de dificuldade bi de cada um dos
itens selecionados são os mais próximos do valor do parâmetro de dificuldade
que maximiza a função de informação Fi para um indivı́duo com habilidade θk .
Eventualmente, na iteração k no bloco H OUVE E RRO, não é possı́vel esgotar todos os

objetivos entrelaçados às questões respondidas incorretamente na iteração k − 1. Nesse caso,
após a nova estimativa θk+1 e da possı́vel obtenção de diagnóstico para alguns objetivos testados,
o algoritmo força a volta para o bloco H OUVE E RRO na iteração k + 1.
2
No caso de questões com dois objetivos, consideramos apenas aquelas associadas a um objetivo gerador que
não gera isoladamente questões.
58
3 ENSAIO DA FERRAMENTA DIA
Em nosso ensaio, vamos simular o procedimento de diagnóstico de um protótipo da Fer-

ramenta DIA. Esse protótipo consiste em um TAI que será brevemente descrito. Descreveremos
também os elementos e procedimentos de simulação.
3.1 Protótipo da Ferramenta DIA
O protótipo da Ferramenta DIA é um TAI baseado na TRI. Seus principais componentes

são:
1. a escala
2. o banco de itens
3. o critério de seleção dos itens
4. o estimador do parâmetro de habilidade θ
5. o critério de parada
e serão descritos nas próximas seções.
3.1.1 A escala
Diferentemente da maioria dos TAI baseados na TRI, a escala subjacente ao TAI de-
senvolvida nesse trabalho tem o propósito de viabilizar o diagnóstico e não de classificar ou
determinar nı́veis de proficiência. A construção da escala de objetivos envolveu os PCN, as ma-
trizes de referência do SAEB, a reinterpretação de descritores da matriz de referência e a criação
de novos objetivos. Ela está estruturada em quatro camadas: Temas, Competências, Habilida-
des e Objetivos. A camada de objetivos é uma peça chave na determinação do diagnóstico e
será o elo de ligação e diálogo com o banco de itens.
3.1.2 Banco de Itens
Através do processo de geração descrito na Seção 2.2, foram construı́dos 212 itens a
partir dos objetivos de nono ano. Levando-se em conta o entrelaçamento dos objetivos (descrito
na Subseção 2.1.3), foram agregados 14 itens compostos por um (ou no máximo dois objetivos).
Esses itens foram gerados por objetivos do sexto ao oitavo ano que figuravam como objetivos
entrelaçados aos do nono ano e estão listados abaixo.
59
Tabela 6 – Objetivos do 6 o ao 8 o ano utilizados no entrelaçamento

213 116
214 140
215 165
216 168
217 170
218 171
219 187 170
220 213
221 173
222 174
223 176
224 185
225 113
226 192
Com esse processo foram gerados 226 itens. Para compor o banco, fixamos o valor do
parâmetro de discriminação a = 1, 2. Esse valor é o mesmo proposto por Huang (1996b) e
corresponde ao valor médio dos parâmetros de discriminação do banco de itens analisado por
Kingsbury e Weiss (1979). Supusemos que todos os itens são questões de múltipla escolha com
cinco alternativas. Por esse motivo, usamos a orientação de Huang (1996b) e admitimos que
a chance de acerto ao acaso é de uma em cinco e fixamos o valor do parâmetro de acerto ao
acaso em c = 0.2. Para atribuir valores aos parâmetros de dificuldade, fizemos uma hipótese
simplificadora de que todos os itens gerados ocorriam no banco uma vez com parâmetros de
dificuldade bi ∈ {−3, −2.5, . . . , 2.5, 3}. Isto é, cada um dos 226 itens gerados ocorre 13 vezes no
banco com dificuldades distintas. Desse modo, trabalhamos com um banco de itens já calibrado
contendo 2938 questões.
É importante observar que, apesar de termos fixados dois (a e c) dos três parâmetros dos
itens, nosso modelo ainda é o logı́stico de três parâmetros devido à presença do parâmetro de
acerto ao acaso c ∈ (0, 1).
60
3.1.3 O critério de seleção dos itens
O critério de seleção utilizado no TAI foi o de maximizar a função de informação

do item. A cada iteração, para o respondente com habilidade estimada θk , as questões fo-
ram selecionadas de modo que o parâmetro de dificuldade bi fosse o elemento do conjunto
{−3, −2.5, . . . , 2.5, 3} mais próximo do máximo da função de informação (1.3).
É importante notar que, quando o algoritmo processa o bloco H OUVE E RRO, o critério
de seleção é feito em um subconjunto K do banco de itens. Todos os elementos de K são itens
cujos objetivos associados pertencem ao conjunto dos objetivos presentes nas questões respon-
didas incorretamente na iteração k − 1. Nesse caso, há uma restrição do tipo balanceamento de
conteúdo.
3.1.4 O estimador do parâmetro de habilidade θ
O TAI foi implementado utilizando-se o software livre octave. A cada iteração do al-
gortitmo, a habilidade foi estimada pela maximização do logaritmo da função de verossimi-
lhança (1.2). A determinação da estimativa do parâmetro de habilidade θ é feita através da
determinação do ponto crı́tico do logaritmo da função de verossimilhança (1.4). Essa equação
não linear foi resolvida numericamente através do método de Newton-Raphson. É conve-
niente lembrar que nem sempre admite um máximo finito. Os casos mais conhecidos são
aqueles em que o respondente obtém um “escore perfeito” (responde correta ou incorreta-
mente a todas as questões). Nesse caso, o máximo do log da verossimilhança é θ = ±∞.
(HAMBLETON; SWAMINATHAN; ROGERS, 1991, p. 36) Para contornar o problema de con-
vergência nesses casos, utilizamos o artifı́cio proposto por Andrade, Tavares e Valle (2000): “os
alunos que erraram todos os itens ganham um meio certo no item mais fácil. Alunos que acer-
taram todos os itens, perdem um meio certo no item mais difı́cil.” Se ainda assim persistir a
divergência, a estimativa de habilidade é considerada igual a −3, se a divergência for para −∞ e
igual a 3, se a divergência for para +∞. Nesse caso, um marcador de divergência é acionado para
que possa ser acompanhado pelo avaliador. A implementação do método de Newton-Raphson
utilizada foi uma adaptação da rotina fnewton.m apresentada por Lindfield e Penny (2002) 1
3.1.5 O critério de parada
O objetivo de nosso TAI não é o de seleção, classificação ou estimativa do nı́vel de

proficiência. Além disso, não tı́nhamos previamente um critério de parada claramente associ-
ado à qualidade alcançada no diagnóstico. Por esse motivo, adotamos como critério de pa-
rada um número fixo de iterações. O valor estabelecido foi de 25 iterações. O estudo de
Eggen e Straetmans (2000) mostrou que com 20 ou mais itens o aumento da exatidão2 era muito
1
Disponı́vel em http://www.mathworks.com/matlabcentral/fileexchange/2305-numerical-methods-using-
matlab-2e/content/edition2/na funcs/fnewton.m (acessada em 01 de janeiro de 2012)
2
proximidade da estimativa com o valor verdadeiro ou aceito
61
pequeno, justificando, portanto, “a conclusão de que a exigência prática de um teste adaptativo

com no máximo 25 itens é realista” (EGGEN; STRAETMANS, 2000, p. 17).
Cabe ressaltar que, ainda que apliquemos mais do que 25 questões ao longo de nossas
25 iterações, mantivemos esse valor pois entendemos que a sugestão de 25 itens está atrelada a
realizar 25 novas estimativas para o parâmetro de habilidade θ. Em nosso caso, ainda que em
cada iteração o aluno possa responder a mais de uma questão, apenas um nova estimativa de θ
é calculada.
3.2 Experimentos
Os experimentos foram realizados através de simulações de respondentes bem como de

suas respostas às questões propostas pelo algoritmo. O estudo utilizou uma simulação com 23
alunos do 9 o ano cujas habilidades conhecidas θc estavam igualmente distribuı́das no intervalo
[−3, 3]. Admitimos que θc ∈ {−2.75, 2.5, . . . , 2.5, 2.75}. Com essa escolha, evitamos que todos
os respondentes tivessem habilidade coincidente com os valores dos parâmetros de dificuldade
dos itens do banco.
3.2.1 Simulação das Respostas
Para simular a resposta de um respondente de habilidade conhecida θc a um item de

parâmetros a, b e c, um número r, 0 < r < 1 foi gerado randomicamente. A probabilidade de o
aluno responder corretamente a esse item foi calculada através do ML3P (1.1)
(EGGEN; STRAETMANS, 2000, p. 14). Se essa probabilidade fosse maior ou igual a r,
admitia-se que o aluno respondera corretamente ao item. Caso contrário, a resposta dada era
considerada como incorreta. Por exemplo, se há uma probabilidade 0, 70 de resposta correta,
r = 0, 75 produziria uma resposta “incorreta”. As respostas são geradas à medida que cada item
é administrado ao examinando na simulação.
3.3 Algoritmo
O algoritmo proposto descreve os procedimentos de seleção das questões e o mecanismo

de refinamento que subsidiará o diagnóstico final.
Ele está estruturado em dois blocos. O primeiro deles é processado apenas na primeira
iteração e sua função é apresentar um conjunto inicial de 10 questões e usar as respostas dadas
pelo aluno para fazer uma primeira estimativa da habilidade do aluno e, caso alguma questão
tenha sido respondida incorretamente, identificar se já há um conjunto de objetivos a ser anali-
sado para diagnóstico. O segundo bloco está subdividido em duas partes. Uma delas lida com
o conjunto de objetivos a ser analisado para diagnóstico e é acessada até que se alcance o refi-
namento necessário para o diagnóstico. A outra, é semelhante ao bloco inicial e só é acessada
quando da ocorrência de 100% de acerto nas questões apresentadas na iteração anterior. A cada
iteração, a estimativa de habilidade do aluno é recalculada em função das respostas dadas pelo
62
aluno nas questões a ele apresentadas.
Através de um ensaio da ferramenta DIA, simulamos o diagnóstico de um aluno do nono

ano com habilidade conhecida θc . Sua resposta a um item i com parâmetro de dificuldade bi
apresentado a ele pelo algoritmo foi gerada da seguinte maneira:
● gera-se um número aleatório γi ∈ [0, 1]

● através do modelo logı́stico de três parâmetros, calcula-se a probabilidade de acerto Pi (θc )
do item i por um aluno com habilidade θc .
● se a probabilidade de acerto Pi (θc ) é maior ou igual a γi , considera-se que o aluno respondeu
corretamente ao item i. Caso contrário, considera-se que o aluno respondeu incorretamente
ao item i
Na perspectiva de selecionar itens que mais se ajustem à habilidade vigente θk do aluno

e de favorecer a redução do erro padrão da estimativa, o parâmetro de dificuldade bi dos itens
selecionados após a primeira iteração coincide com o bi ∈ {−3, −2.5, −2, . . . , 2, 2.5, 3} que ma-
ximiza a função de informação Fi para um indivı́duo com habilidade θk .
3.3.1 Algoritmo
1. No inı́cio do algoritmo, são selecionadas aleatoriamente dez questões com parâmetro de

dificuldade bi pertencentes ao intervalo [−1.5, 1.5]. Todas as questões são do nono ano. A
cada uma delas estão entrelaçados até cinco objetivos. Dentro do algoritmo, assumimos
que a habilidade inicial θ0 do aluno é igual a zero. As respostas às 10 questões são
simuladas como descrito no inı́cio da seção. Considerando a habilidade θ0 e o vetor de
respostas v0 gerado para o aluno, uma nova habilidade θ1 e o erro padrão entrelaçados a
esta estimativa são calculados.
2. Nas etapas k = 1, . . . , 25, há dois possı́veis blocos:
Houve erro Estamos na etapa k e o vetor resposta vk−1 da etapa k − 1 tem elementos
nulos. Isto é, houve itens respondidos incorretamente. Neste caso:
● são identificados os objetivos oi
(k−1)
presentes nas questões respondidas incorre-
tamente na etapa k − 1
● são selecionadas no banco de questões até 20 questões com parâmetro de difi-
culdade bi . Os itens selecionados não possuem objetivos entrelaçados que não
pertençam ao conjunto dos objetivos oi presentes nas questões respondidas in-
corretamente na etapa k − 1. As seleção é feita priorizando questões com maior
número de objetivos entrelaçados e a não interseção de seus objetivos. Esgo-
tadas as escolhas feitas com esses critérios e ainda não tendo sido atingido um
total de 20 itens, novos itens são selecionados priorizando questões com maior
número de objetivos entrelaçados sendo permitido que elas possuam objetivos
em comum. O parâmetro de dificuldade bi de cada um dos itens selecionados é
tal que bi ∈ {−3, −2.5, −2, . . . , 2, 2.5, 3} e bi que maximiza a função de informação
63
Fi para um indivı́duo com habilidade θk .

● As respostas às questões selecionadas são simuladas como descrito no inı́cio da
seção. Considerando a habilidade θk e o vetor de respostas vk gerado para o
aluno, uma nova habilidade θk+1 e o erro padrão associado a esta estimativa são
calculados.
Diagnóstico Se no vetor resposta vk há questões de um objetivo ou dois objeti-
vos3 respondidas incorretamente, a ferramenta DIA diagnostica o objetivo gera-
dor como não tendo sido plenamente desenvolvido ou alcançado pelo aluno. Os
(k−1)
objetivos diagnosticados são excluı́dos do conjunto de objetivos oi que estão
sendo testados.
Não houve erro Estamos na etapa k e o vetor resposta vk−1 da etapa k − 1 não tem ele-
mentos nulos. Isto é, não houve itens respondidos incorretamente. Neste caso:
● são selecionadas no banco de questões 10 questões com parâmetro de dificuldade
bi . O parâmetro de dificuldade bi de cada um dos itens selecionados é tal que
bi ∈ {−3, −2.5, −2, . . . , 2, 2.5, 3} e bi maximiza a função de informação Fi para
um indivı́duo com habilidade θk .
● As respostas às questões selecionadas são simuladas como descrito no inı́cio da
seção. Considerando a habilidade θk e o vetor de respostas vk gerado para o
aluno, uma nova habilidade θk+1 e o erro padrão associado a esta estimativa são
calculados.
Eventualmente, na iteração k no bloco H OUVE E RRO, não é possı́vel esgotar todos os

objetivos entrelaçados às questões respondidas incorretamente na iteração k − 1. Nesse caso,
após a nova estimativa θk+1 e da possı́vel obtenção de diagnóstico para alguns objetivos testados,
o algoritmo força a volta para o bloco H OUVE E RRO na iteração k + 1.
3
No caso de questões com dois objetivos, consideramos apenas aquelas associadas a um objetivo gerador que
não gera questões com um único objetivo.
64
4 ANÁLISE
Este capı́tulo trata da análise das simulações feitas no ensaio da ferramenta DIA. Foram
simulados os diagnósticos de 23 alunos do 9 o ano com habilidades igualmente distribuı́das
dentro do intervalo de −2, 75 a +2, 75. Com os dados de alunos gerados foi possı́vel observar
o bom comportamento do algoritmo e acompanhar a evolução do θ (habilidade) e se houve ou
não convergencia do método de Newton-Raphson. Na tabela abaixo, apresentamos todos os θ
estimados para cada um dos respondentes com θc conhecido. Indicamos também o erro-padrão
da estimativa e apresentamos o valor do controlador de convergência.
Tabela 7 – θ estimados dos 23 respondentes do ensaio da ferramenta DIA (continuação)
θ conhecido Iteração θ DIA Erro div

-2.750000 25 -2.857575 0.083636 0
-2.500000 25 -2.439424 0.084413 0
-2.250000 25 -2.29 0.078878 0
-2.000000 25 -1.958429 0.079719 0
-1.750000 25 -1.799391 0.074934 0
-1.500000 25 -1.562592 0.070644 0
-1.250000 25 -1.165647 0.073055 0
-1.000000 25 -0.996111 0.068490 0
-0.750000 25 -0.662145 0.079791 0
-0.500000 25 -0.437845 0.080592 0
-0.250000 25 -0.307217 0.073734 0
0.000000 25 -0.136529 0.086432 0
0.250000 25 0.164904 0.083481 0
0.500000 25 0.416976 0.080951 0
0.750000 25 0.856825 0.073115 0
1.000000 25 1.078768 0.071851 0
1.250000 25 1.357463 0.068070 0
1.500000 25 1.503235 0.090100 0
1.750000 25 1.886016 0.094844 0
2.000000 25 1.969950 0.079472 0
2.250000 25 2.239162 0.069641 0
65
Tabela 7 – θ estimados dos 23 respondentes do ensaio da ferramenta DIA (conclusão)
2.500000 25 2.477565 0.094668 0

2.750000 25 2.668205 0.074595 0
A confiança no funcionamento do algoritmo no que diz respeito à estimativa da habili-

dade permitiu que prosseguı́ssemos agora com uma análise mais qualitativa. Como o objetivo é
verificar o comportamento individual, selecionamos um aluno dentre os 23 testados. Escolhe-
mos a habilidade conhecida θc = −2, 25 para acompanhamento e diagnóstico.
4.1 Dados da Análise – θc = −2, 25
Passamos, agora, a descrever os dados utilizados na análise do aluno com habilidade

θc = −2, 25. Eles foram gerados nas 25 iterações previstas internamente no algoritmo. Em cada
uma dessas iterações, foram criados 2 grupos de informações: Respostas e Diagnósticos1.
4.1.1 Grupo das Respostas
A cada iteração k, no grupo das Respostas são listadas em uma matriz todas as questões
que foram testadas nessa iteração e os objetivos que as compõem. Além disso, indica-se na
primeira coluna se a questão foi respondida corretamente (1) ou não (0).
A seguir um exemplo da décima iteração onde o aluno de habilidade conhecida θc =

−2.25 teve sua habilidade estimada em θ5 = −2.29 e respondeu a 4 questões todas com parâmetro
de dificuldade (b) igual a −2, 5. Ele errou uma e acertou as demais.
Iteração 10, aluno com habilidade -2.29 estimada para habilidade conhecida -2.25
Tabela 8 – Exemplo grupo Respostas
Resposta n o questão b n o Objetivo

0 217 -2.50 170
1 216 -2.50 168
1 221 -2.50 173
1 222 -2.50 174
Nesse grupo são gerados também dois conjuntos. A partir da composição das questões
respondidas incorretamente, forma-se o conjunto dos objetivos respondidos incorretamente.
1
Ao final da pesquisa esse material completo pode ser consultado.
66
Analogamente, a partir da composição das questões respondidas corretamente, forma-se o con-

junto dos objetivos respondidos corretamente.
Tabela 9 – Objetivos respondidos incorretamente
170
Tabela 10 – Objetivos respondidos corretamente
168 173 174
4.1.2 Grupo dos Diagnósticos
Para permitir e acompanhar o processo de diagnóstico, a cada iteração k, foram gerados

também dois conjuntos de dados. Usamos a iteração k = 10 para ilustrar a apresentação do
diagnóstico:
1. Objetivos diagnosticados (respondido incorretamente a uma questão de apenas um obje-

tivo)
Na iteração 10 com habilidade -2.29 estimada para habilidade conhecida -2.25
com erro padrão 0.119481
Tabela 11 – Objetivo Diagnosticado
Questão Dificuldade Ano Objetivo Descrição do objetivo

217 -2.50 8 170 Operar com polinômio.
2. Objetivos testados na iteração k (são aqueles associados a questões respondidas cor-

retamente ou a questões respondidas incorretamente que ainda não puderam gerar di-
agnóstico. Eles são listados para permitir uma visão global da iteração.)
Na iteração 10 com habilidade -2.29 estimada para habilidade conhecida -2.25,
foram testados os objetivos
Tabela 12 – Objetivos Testados
Ano Objetivo Descrição do objetivo

8 168 Empregar o valor numérico real em uma expressão algébrica
7 173 Escrever a equação correspondente ao enunciado de um problema.
7 174 Resolver e dar o conjunto-verdade de equações, observando restrições.
67
Além disso, os objetivos que foram testados são sumarizados em uma tabela:
Tabela 13 – Objetivos testados e não diagnosticados
168 173 174
4.2 Diagnóstico DIA – θc = −2, 25
Os dados brutos do algoritmo se mostraram inadequados para produção do diagnóstico.

Apenas listar ao final de todo o processo os objetivos não alcançados do 6o. ao 9o. anos que
puderam ser diagnósticados como possı́veis lacunas não se mostrava útil para indicar nem ao
professor nem ao aluno o que fazer. Nesse momento, o entrelaçamento proposto inicialmente
apenas para geração do banco de itens ganhou outra dimensão. Ele se tornou um elemento
chave para ressignificar esta lista de dados brutos.
Passamos, agora, a descrever a simulação desse aluno com habilidade θc = −2, 25 e

pontuar com as observações decorrentes da análise de todo o processo.
A iteração 0 foi chamada de calibração. Foi utilizada para selecionar, através das questões
respondidas, quais objetivos seriam testados. Como a habilidade do aluno não é conhecida
estabelecemos no algoritmo habilidade inicial média (teta igual a zero) para habilidade conhe-
cida -2.25. São selecionadas aleatoriamente 10 questões, com nı́vel de habilidade no intervalo
[-1.5;+1.5]. Foram geradas as respostas conforme tabela a seguir:
Tabela 14 – Calibração
Resposta n o questão b Objetivos

0 202 -1.50 210 0 0 0 0
0 185 1.00 194 185 165 187 213
0 124 0.50 159 174 168 170 194
0 173 1.50 194 192 185 165 171
0 209 -1.00 212 116 208 0 0
0 131 0.00 194 0 0 0 0
0 126 0.00 164 193 0 0 0
0 139 0.00 194 192 165 0 0
1 94 -1.50 159 187 174 168 0
1 38 1.00 123 176 120 0 0
68
Objetivos respondidos incorretamente:
116 159 164 165 168 170 171 174 185 187 192 193 194 208 210 212 213
Objetivos respondidos corretamente:
120 123 159 168 174 176 187
Destacamos da iteração 0 acima os objetivos que foram respondidos incorretamente.

Descrevemos a seguir esses objetivos com o seu respectivo ano.
Ano Objetivo Descrição dos objetivos

9 120 Determinar a razão de semelhança entre dois polı́gonos.
9 123 Reconhecer que a razão entre os volumes de dois sólidos semelhantes é
igual ao cubo da razão de semelhança.
9 159 Calcular área utilizando a resolução de equações do 2o grau
9 164 Resolver problema que envolva o volume de paralelepı́pedos (cubos)
9 193 Efetuar operações com radicais; (raiz quadrada; raiz cúbica)
9 194 Resolver equações polinomiais do 2o grau
9 208 Aplicar as relações métricas do triângulo retângulo na resolução de
exercı́cios
9 210 Aplicar as razões trigonométricas na resolução de problemas
9 212 Reconhecer o Teorema de Pitágoras e utilizá-lo na resolução de proble-
mas
8 116 Descrever por meio de uma expressão algébrica o comprimento
8 165 Descrever por meio de uma expressão algébrica o volume de uma figura
geométrica
8 170 Operar com polinômio.
8 171 Aplicar os casos de produtos notáveis.
8 213 Resolver equações polinomiais utilizando o conceito de equações equi-
valentes.
7 176 Aplicar a propriedade fundamental das proporções.
69
7 185 Operar com números racionais

6 192 Efetuar operações com potências
Como há questões respondidas incorretamente, nas próximas iterações aparecem itens
com objetivo de refinar os objetivos respondidos incorretamente:
116 159 164 165 168 170 171 174 185 187 192 193 194 208 210 212 213
Esse processo se repetirá até que se alcance um refinamento suficiente para o diagnóstico
ou haja uma iteração com 100% de acerto.
Na iteração 1, a habilidade estimada foi calculada a partir das respostas dadas na iteração 0,
passando a -2.09 ( para habilidade conhecida -2.25). Foram gerados 20 novos itens. Como o al-
goritmo foi criado perseguindo os itens onde HOUVE ERRO, selecionamos apenas as questões
respondidas incorretamente com os respectivos objetivos.
Tabela 16 – Questões respondidas incorretamente

0 117 -2.00 159 187 174 168 194
0 119 -2.00 159 187 168 170 194
0 124 -2.00 159 174 168 170 194
0 176 -2.00 194 192 185 171 187
0 186 -2.00 194 185 171 187 213
Ano Objetivo
valentes.
70

Como todas as questões continham 4 objetivos associados, não foi possı́vel diagnosticá-
los.
Uma nova iteração é feita com itens formados por esses objetivos respondidos incorre-
tamente. São selecionadas até 20 questões, priorizando as questões que contêm o maior número
de objetivos entrelaçados.
Aproveitamos para observar, também, que nas primeiras iterações, a habilidade estimada
ainda não está confiável quando comparada com a habilidade conhecida -2.25.
Esse processo se repete até que apareça uma resposta incorreta em um item com um ou
dois objetivos. Nesse momento, é gerado um diagnóstico informando que o objetivo ainda não
foi plenamente desenvolvido ou alcançado pelo aluno.
A análise de cada iteração não se faz necessária para interpretar e acompanhar os obje-
tivos gerados a cada ocorrência de novas 10 questões, por isso optamos pela análise em etapas.
4.3 Etapas
A ocorrência de uma iteração com 10 novas questões (I10) selecionadas aleatoriamente

dentre todas as questões do banco (e não somente dentre aquelas compostas por objetivos asso-
ciados a questões previamente respondidas incorretamente), indica o inı́cio de um processo de
diagnóstico. Conforme descreve o algoritmo, a cada grupo de objetivos já testados (respondido
corretamente ou incorretamente em questões com mais de um (ou dois) objetivo(s)) ou diag-
nosticados (respondidos incorretamente em questões que permitem o diagnóstico) é gerado um
grupo de mais 10 questões com novos objetivos, até que o número de iterações (25) se complete.
Chamamos de etapa ao bloco de iterações que se inicia com o conjunto de novos objetivos para
serem testados ou diagnosticados.
Para analisar os dados gerados nas 25 iterações, essas etapas foram criadas (em função
da ocorrência de uma iteração I10) para uma melhor compreensão e acompanhamento do pro-
cesso. Para θc = −2, 25, as 25 iterações foram subdivididas em 6 etapas iniciadas por uma
iteração I10. Além disso, como estamos considerando alunos do 9 o ano, destacamos apenas
os objetivos referentes a esse ano para acompanhar o refinamento e diagnóstico final. Dessa
forma, nem todos os objetivos respondidos incorretamente em cada etapa serão listados.
71
Etapa 1
A iteração I10 da primeira etapa é a iteração k = 0. Essa etapa é composta de 7 iterações.

Nela, com habilidade 0.00 estimada para habilidade conhecida -2.25 dentre os 20 objetivos tes-
tados, os objetivos listados abaixo estavam associados a questões respondidas incorretamente:
116 159 164 165 168 170 171 174 185 187 192 193 194 208 210 212 213
Desses objetivos destacamos, na figura abaixo, apenas os do nono ano que nos dão uma
visão global das principais ocorrências dessa primeira etapa.
Figura 6 – Etapa 1
Todos os objetivos foram testados ou diagnosticados até a 7 a iteração. Destacamos em

amarelo em qual iteração o objetivo foi diagnosticado e, em verde, a iteração em que o item foi
respondido de forma correta com apenas um objetivo sendo testado.
Uma vez que a análise dos objetivos dessa primeira etapa foi completada, inicia-se o
que chamamos de 2 a etapa (8 a iteração até a 10 a iteração)
Etapa 2
Na iteração 8, a habilidade estimada -2.13 (calculada a partir das respostas dadas em

cada iteração), já se encontrava próxima a habilidade conhecida -2.25.Um novo grupo de 10
itens é gerado. Desses apenas 3 foram respondidos incorretamente.
Tabela 18 – Tabela de Respostas (continuação)

0 20 -2.50 121 116 120 0 0
0 109 -2.50 159 168 170 194 0
0 102 -2.50 159 173 174 194 0
72
Tabela 18 – Tabela de Respostas (conclusão)
1 37 -2.50 123 176 119 0 0

1 211 -2.50 218 210 0 0 0
1 169 -2.50 194 165 171 187 0
1 65 -2.50 157 113 156 0 0
1 5 -2.50 118 116 210 0 0
1 15 -2.50 121 120 0 0 0
1 171 -2.50 194 165 187 213 0
Dos itens respondidos incorretamente, listamos os objetivos:
116 120 121 159 168 170 173 174 194
Dentre eles destacamos apenas os objetivos do 9 o ano (O120, O121, O159 e O194) que
aparecem na Figura ??. A decisão de acompanhar apenas os objetivos do 9 o ano foi tomada por
serem esses os objetivos que inicialmente estamos pesquisando. Os objetivos dos outros anos
aparecem como recorrência deles. Lembramos que chamamos de refinamento essa “busca”
pelo(s)objetivo(s) ainda não alcalçado(s).
Determinar a razão de semelhança entre dois polı́gonos (O120) e reconhecer que a razão
de semelhança entre os perı́metros de dois polı́gonos semelhantesé igual à razão de semelhança
(O121) foram dois objetivos testados nessa etapa e respondidos de forma correta. O O194
(resolver uma equação do 2 o grau) não foi alcançado, sendo diagnosticado na 9 a iteração. É de
se esperar que o objetivo O159 (cálculo de área utilizando equação do 2 o grau) também tenha
sido diagnosticado.
73
Etapa 3
Recomeça um novo grupo de 10 itens, na 11 a iteração (a habilidade -2.28 estimada se

aproxima ainda mais da habilidade conhecida -2.25).
Das 10 questões respondidas, foram listados os objetivos das questões respondidas in-
corretamente:
119 120 122 165 192 194 195
Desses 7 objetivos, os 5 que se referem ao 9 o ano (O119, O120, O122, O194 e O195)
foram descritos a seguir:
Tabela 19 – Descrição dos objetivos
Ano Objetivo
9 119 Reconhecer quando duas figuras são semelhantes
9 120 Determinar a razão de semelhança entre dois polı́gonos.
9 122 Reconhecer que a razão entre as áreas de dois polı́gonos semelhantes é
igual ao quadrado da razão de semelhança.
9 195 Resolver equações polinomiais do 2o grau com duas incógnitas (sis-
tema)
Na 12 a iteração, apesar de o aluno ter respondido de forma correta a um item que

envolve a determinação da razão de semelhança entre dois polı́gonos (O120), nessa mesma
iteração, ele ainda não reconhece que a razão entre as áreas de dois polı́gonos semelhantes é
igual ao quadrado da razão de semelhança (O122), conforme pode ser visto na figura a seguir.
Observamos que o objetivo O194 apareceu em todas as etapas anteriores, mas, nessa
74
etapa, ele foi testado e não foi diagnosticado (foi respondido corretamente). A resolução de
equações polinomiais do 2 o grau (de que trata o O194) pode aparecer em diferentes contextos
e, por esse motivo, existe uma grande quantidade de objetivos entrelaçados a ele como pode ser
visto no grafo apresentado a seguir. Dessa forma, um número grande de combinações possı́veis
foi criado e deve ser testado, justificando o aparecimento desse objetivo em diferentes etapas.
Figura 9 – Objetivo 194
Etapa 4
Na iteração I10 da quarta etapa, a habilidade -2.23 estimada é praticamente a mesma da

habilidade conhecida -2.25. Dos 10 itens gerados com nı́vel de dificuldade adaptado a habili-
dade estimada, o número de respostas incorretas é pequeno. Dos 22 objetivos testados nas 10
questões, podemos observar que:
15 objetivos foram respondidos corretamente:
113 116 118 120 156 157 159 164 168 170 174 187 193 194 210
7 objetivos foram respondidos incorretamente:
121 123 171 176 185 192 194
E dos incorretos, apenas 3 objetivos (O121, O123 e O194) se referem ao nono ano.
75
Mais uma observação referente ao objetivo 194 pode ser feita, nessa etapa: ele apa-
rece listado nos objetivos respondidos corretamente e também nos objetivos respondidos de
forma incorreta. Isso mostra que um objetivo com um grande número de “entrelaçamento com
outros objetivos”retarda o diagnóstico pelo número de questões criadas com esses objetivos
entrelaçados.
Etapa 5
No inı́cio dessa etapa, a habilidade -2.28 estimada continua próxima da habilidade co-
nhecida -2.25. Enquanto o número de objetivos aumenta (24 objetivos testados nessa etapa),
o número de iterações é reduzido (iterações 19 a 21). A justificativa para o refinamento dos
objetivos ser alcançado mais rapidamente pode ser dada pelo nı́vel de dificuldade das questões
se encontrar cada vez mais adaptado à habilidade do aluno.
Objetivos respondidos incorretamente:
116 159 165 173 187 194 208 212
Objetivos respondidos corretamente:
116 118 119 120 123 124 140 159 173 174 185 187 194 210 211 213
76
O objetivo O159 que aparece nessa quinta etapa também tem um grande número de
objetivos entrelaçados, assim como no caso do O194, há um grande número de combinações
pelo entrelaçamento de seus objetivos.
Figura 12 – Objetivo 159
Como mostra a legenda, o objetivo O159 não gera itens apenas com esse objetivo. É razoável
encontrar os objetivos O194 (resolver equações polinomiais do 2 o grau) e O159 (Calcular área
utilizando a resolução de equações do 2 o grau) sendo testados em uma mesma iteração (como
aconteceu nessa 5 a etapa) por serem objetivos entrelaçados e bastante usados no desenvolvi-
mento dos grandes temas que foram selecionados para essa simulação: comprimento, área e
volume. Lembramos, também, que os testes foram simulados para alunos do 9 o ano.
77
Etapa 6
Nessa última etapa (iteração 22 a iteração 25), a habilidade -2.26 estimada, pratica-
mente, é a mesma da habilidade conhecida -2.25. São gerados os últimos 10 itens para pesquisa
e refinamento dos objetivos e, de acordo com o critério de parada do algoritmo o teste é finali-
zado.
Dos objetivos respondidos incorretamente nas 10 questões iniciais dessa etapa (I10)
119 171 185 194 209 211 213
podemos observar que os objetivos O171 (aplicar os casos de produto notável), O185
(operar com números racionais) e O213 (resolver equações polinomiais utilizando o conceito de
equações equivalentes) são objetivos que fazem parte do grafo do objetivo O194 (ver Figura ??)
e foram respondidos incorretamente.
Logo na primeira iteração dessa etapa, o objetivo O119 (reconhecer quando duas figuras
são semelhantes) já aparece diagnosticado, enquanto o O194 continua até a última iteração. É
razoável informar ao aluno que o objetivo O194 ainda não foi alcançado pela incompreensão
ou lacuna de um (ou mais) dos objetivos O171 (aplicar os casos de produtos notáveis), O185
(operar com números racionais) e O213 (resolver equações polinomiais utilizando o conceito
de equações equivalentes). Esses objetivos estão entrelaçados ao objetivo O194.
4.4 Diagnóstico
Organizamos em dois grafos o resultado da simulação. Em um deles, apresentamos to-

dos os objetivos testados. No outro, o resultado do diagnóstico. O grafo se mostrou bastante
útil para a apresentação dos objetivos qua ainda não foram alcançados pelo aluno. Procuramos
destacar, também, além dos objetivos do 9 o ano, os objetivos a eles relacionados, inclusive o
de anos anteriores que foram testados em decorrência do entrelaçamento deles. Comparando
todos os objetivos testados e todos os diagnosticados concluı́mos que o trabalho proposto aten-
78
deu às expectativas esperadas. A escala proposta e o entrelaçamento viabilizaram o diálogo

entre a escala e o banco de itens de modo a permitir a construção de um diagnóstico. Através
do diagnóstico, o aluno tem a possibilidade de observar quais os objetivos ainda não foram
alcançados, quer por lacunas identificadas de anos anteriores quer por incompreensão de con-
ceitos testados.
Foram criados dois esquemas: Conjunto de objetivos testados e Diagnóstico. Neles,na

cor laranja, aparecem os objetivos referentes ao 9 o ano. Na rosa, são objetivos do 8 o ano, na
cor verde, os objetivos de 7 o ano e na cor azul, os objetivos de 6 o ano.
Figura 14 – Conjunto de objetivos testados
E a seguir o diagnóstico final:

79
Figura 15 – Diagnóstico
Comparando os dois grafos podemos observar a quantidade de objetivos testados e di-

agnosticados durante as 25 iterações desse aluno com habilidade -2,25.
Tabela 20 – Tabela Comparativa

Foram diagnosticados os objetivos listados abaixo
Tabela 21 – Descrição dos objetivos(continuação)
Ano Objetivo
9 119 Reconhecer quando duas figuras são semelhantes
9 121 Reconhecer que a razão entre os perı́metros de dois polı́gonos seme-
lhantes é igual à razão de semelhança.
9 122 Reconhecer que a razão entre as áreas de dois polı́gonos semelhantes é
igual ao quadrado da razão de semelhança.
9 123 Reconhecer que a razão entre os volumes de dois sólidos semelhantes é
igual ao cubo da razão de semelhança.
9 164 Resolver problema que envolva o volume de paralelepı́pedos (cubos)
9 212 Reconhecer o Teorema de Pitágoras e utilizá-lo na resolução de proble-
mas
80
8 116 Descrever por meio de uma expressão algébrica o comprimento

8 165 Descrever por meio de uma expressão algébrica o volume de uma figura
geométrica
valentes.
Como poderia ser feita a interpretação do diagnóstico apresentado?
Dos objetivos apresentados, os O119, O122 , O123 devem ser (re)trabalhados para me-
lhor compreensão e esclarecimento do que trata o objetivo. O objetivo O164 é um objetivo que
aparece inicialmente no 6 o ano (ver Tabela ??), mas a resolução de problema que envolva o
volume de paralelepı́pedos é um conteúdo que continua sendo tratado e aprofundado em todos
os anos seguintes. Como ele foi diagnosticado quando relacionado ao objetivo O194 (resolver
equação polinomial do 2 o grau), a dificuldade provavelmente se encontra nesse objetivo ou
naqueles que estão entrelaçados a ele.
Os objetivos O194 e O159 percorreram praticamente todas as iterações por serem obje-
tivos com um número grande de objetivos entrelaçados. Com o refinamento proposto através
do algoritmo, conseguimos destacar os objetivos que, entrelaçados a eles, geram respostas in-
corretas, sinalizando, assim, as dificuldades encontradas quando da execução de atividades com
esses objetivos.
A importância do entrelaçamento no grafo apresentado foi grande. O diagnóstico deixa

de ser uma lista (que pode ser extensa) e ganha uma estrutura de dependência que, no mı́nimo,
dá um norte para começar a resolver as dificuldades apresentadas.
Lembramos que o entrelaçamento aqui formalmente proposto, no caso da ferramenta

DIA “real” emanará do próprio banco, desde que se associem a ele objetivos já pertencentes
ou adequadamente inseridos na escala de objetivos proposta na ferramenta. Isso dá um caráter
dinâmico tanto à escala como ao entrelaçamento proposto. Além disso, ele permite que o uso
da ferramenta a aproxime das conexões reais entre os objetivos quase como em um processo de
81
inteligência artificial.
82
5 CONSIDERAÇÕES FINAIS
As diferentes possibilidades de aprender, por diversos meios, indica que o processo de

ensino e de aprendizagem é complexo, mas deve ser facilitado com estratégias que permitam
ao aluno maior controle e reflexão sobre seu próprio processo de aprendizagem. Para proporci-
onar essa reflexão, o processo deve ser ajustado às necessidades e caracterı́sticas individuais do
aluno. Os testes adaptativos informatizados (TAI) têm se mostrado como ferramentas de grande
potencial nesse processo. O diagnóstico proposto no ensaio da ferramenta DIA conjugou a
análise dos erros com o TAI, mostrando um caminho na direção por soluções que minimizem
as dificuldades na aprendizagem da Matemática. Reconhecer uma dificuldade ou verificar que
ainda não compreendeu algo é uma habilidade de grande importância para o desenvolvimento
da aprendizagem. Reforçar as capacidades do aluno para refletir sobre seus erros, é um outro
aspecto igualmente importante.
Como a pesquisa apresentou dois aspectos teóricos, educacional e computacional, fa-

remos nossas considerações nessas duas direções que, apesar de distintas, se mostraram total-
mente entrelaçadas durante o processo.
No aspecto educacional, caminhamos na direção de uma avaliação formativa, utilizando

as respostas dos alunos adaptadas à sua competência e fornecendo um diagnóstico. Armstrong
(2004) afirma que “o uso do feedbaack formativo pelo aluno resulta na avaliação formativa e
aproxima o trabalho do ideal”. Nossa proposta no ensaio informa aos alunos os objetivos ainda
não alcançados durante o processo, mas não descreve explicitamente os caminhos de solução.
No aspecto computacional, para o desenvolvimento de um TAI, utilizando a TRI, com

o propósito de informação (ferramenta DIA), alguns componentes se mostraram essenciais: a
construção da escala com os objetivos, o entrelaçamento dos objetivos (para a construção do
banco de itens) e a implementação dos algoritmos (com os critérios de seleção e de parada do
teste determinados). Na construção da escala, envolvendo os PCN e as matrizes de referência,
fizemos um recorte nos conteúdos envolvendo os temas propostos (Espaço e Forma; Grande-
zas e Medidas). Esse recorte (unidade de medida: perı́metro, área e volume) possibilitou a
identificação das dificuldades em objetivos especı́ficos para o desenvolvimento e construção
dos conteúdos. Para o refinamento dos objetivos sentimos necessidade do entrelaçamento com
objetivos de anos anteriores. A partir de todos os objetivos criados, os itens do banco foram
construı́dos. Como esse banco foi criado por um entrelaçamento possı́vel de objetivos, consi-
deramos bastante realista a sua criação. No caso da ferramenta DIA, os objetivos serão interli-
gados naturalmente quando na introdução de uma questão ao banco. Em cada questão estarão
associados os objetivos necessários para o seu desenvolvimento.
O critério de seleção dos itens está associado aos objetivos respondidos incorretamente.
Nesse sentido, há um balanceamento dinâmico de conteúdo. Isto é, a cada iteração, as questões
83
não são selecionadas em todo o banco e, sim, apenas em um subconjunto dele associado aos
objetivos presentes nas questões respondidas incorretamente. O trabalho de Eggen e Straetmans
(2000) mostrou que 25 ajustes da habilidade garantem uma estimativa de qualidade para θ. Isso
dá confiabilidade ao diagnóstico efetuado. Nosso critério de parada foi realizar 25 iterações
para trabalharmos com uma boa estimativa do parâmetro de habilidade do aluno. Mas, como
no nosso caso cada iteração poderia ter até 20 questões, é interessante fazer um estudo futuro
das implicações com a redução do número de questões em cada iteração ou de uma redução no
número de iterações realizadas.
As etapas da simulação, apresentadas no capı́tulo de análise, foram delineadas para

acompanhar o refinamento dos objetivos respondidos incorretamente pelo aluno. As análises
feitas abriram espaço para outros futuros acompanhamentos possı́veis desse processo:
registro do tempo para o desenvolvimento das etapas com a calibração dos itens à medida
de seu uso (usando, por exemplo o CBAT proposto por Huang (1996b)), a seleção das
questões cada vez mais adaptadas à habilidade do aluno, podem proporcionar um refina-
mento mais rápido;
controle de exposição do objetivo: número de vezes que cada objetivo (correto e incorreto)
aparece sinalizando para o aluno os objetivos que requerem mais atenção e estudo;
acompanhamento do desempenho do aluno: possibilitando o conhecimento de sua trajetória;
acompanhamento do desempenho de uma turma: proporcionando ao professor um caminho

seguro para a realização de avaliações fidedignas ao que foi ensinado)
Um dos objetivos da ferramenta DIA é colocar os professores a par da importância de

se trabalhar com objetivos que descrevem os conteúdos a serem desenvolvidos e permitem um
feedback das avaliações da aprendizagem. O uso de uma ferramenta como o DIA representa
mais uma alternativa dentro do leque de instrumentos e técnicas disponı́veis ao professor para
o acompanhamento do aluno e avaliação de sua aprendizagem.
O ensaio da ferramenta DIA mostrou que a construção total e real de uma ferramenta
desse porte requer um custo alto. Mas a motivação continua e a utilização de um teste adaptativo
informatizado junto a TRI e com as caracterı́sticas descritas da ferramenta DIA é uma proposta
promissora ao procedimento utilizado pela autora no trabalho com alunos em dificuldades na
Matemática.
5.1 Trabalhos Futuros
Um aspecto importante do uso da TRI ainda não mencionado, diz respeito à verificação
da adequação do modelo escolhido. Hambleton, Swaminathan e Rogers (1991) destacam que
as vantagens da TRI só podem ser usufruı́das quando o ajuste entre o modelo adotado e os
84
dados de teste obtidos é satisfatório. Eles indicam alguns métodos de verificação1 da validade
das propriedade de invariância e de predição do modelo que pretendemos aplicar ao protótipo
desenvolvido nesse ensaio a fim de dar continuidade ao trabalho assegurados da consistência da
ferramenta ou eventualmente fazer ajustes que se mostrem necessários.
1
Para maiores detalhes, ver Capı́tulo 4, Hambleton, Swaminathan e Rogers (1991)
86
CERNY, R. Uma reflexão sobre a avaliação formativa na educação a distância. In: . [S.l.]:
Anped, 2001. (Anped: Associação Nacional de Pós-graduação e Pesquisa em Educação.
24a. Reunião Anual Caxambu).
CHINEN, A. et al. Netedu – um ambiente computacional para o mapeamento do conhecimento

do estudante. In: Memorias del XI Taller Internacional de Software Educativo. Santiago de
Chile: LOM Ediciones S.A., 2006.
COSTA, D. R. Métodos estatı́sticos em testes adaptativos informatizados. 107 f. Dissertação

(Mestrado em Estatı́stica) — Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2009.
EGGEN, T.; STRAETMANS, G. Computerized adaptive testing for classifying examinees into
three categories. Educational and Psychological Measurement, v. 60, n. 5, p. 713–734, 2000.
FERRAZ, A. P. d. C. M.; BELHOT, R. V. Taxonomia de Bloom: revisão teórica e apresentação

das adequações do instrumento para definição de objetivos instrucionais. Gestão & Produção,
scielo, v. 17, p. 421 – 431, 00 2010.
FERREIRA, F. F. G. Escala de Proficiência para o ENEM utilizando a Teoria da Resposta ao

item. 107 f. Dissertação (Mestrado em Matemática e Estatı́stica) — Universidade Federal do
Pará, Belém, 2009.
FLAUGHER, R. Item pool. In: . Hillsdale, New Jersey: Lawrence Erlbaum Associates,
1990. (Computerized Adaptive Testing: A Primer), p. 37–60.
FRISON, L. Auto-regulação da aprendizagem. Revista Eletrônica da Ulbra São Jerônimo –

Pedagogia, A.1. Ciência e conhecimento, v. 2, 2007.
GERHARDT, T.; SILVEIRA, D. Métodos de Pesquisa. [S.l.]: Plageder, 2009.
HADJI, C. Compreender que avaliar não é medir, mas confrontar um processo de negociação
(balanço dos saberes produzidos pela pesquisa). In: . Tradução de Patrı́cia C. Ramos.
Porto Alegre: Artes Médicas, 2001. (Avaliação desmistificada), p. 27–49.
HAMBLETON, R.; SWAMINATHAN, H.; ROGERS, H. Fundamentals of Item Response

Theory. 1. ed. Newbury Park, Calif: Sage Publications, 1991. (Measurement Methods for the
Social Sciences Series).
HUANG, S. On content-balanced adaptive testing. In: SÁNCHEZ, A. Dı́az de I.; CASTRO,

I. Fernández de (Ed.). Computer Aided Learning and Instruction in Science and Engineering.
[S.l.]: Springer Berlin / Heidelberg, 1996, (Lecture Notes in Computer Science, v. 1108). p.
60–68. 10.1007/BFb0022592.
HUANG, S. X. On content-balanced adaptive testing. In: Proceedings of the Third

International Conference on Computer Aided Learning and Instruction in Science and
Engineering. London, UK: Springer-Verlag, 1996. (CALISCE ’96), p. 60–68.
87
KINGSBURY, G.; WEISS, D. An Adaptive Testing Strategy for Mastery Decisions. [S.l.]:
Defense Technical Information Center, 1979.
LILLEY, M. The Development and Application of Computer-Adaptive Testing in a Higher

Education Environment. Tese (Doutorado) — School of Computer Science, University of
Hertfordshire, Hertfordshire, 2007.
LILLEY, M.; BARKER, T.; BRITTON, C. The development and evaluation of a software
prototype for computer-adaptive testing. Computers & Education, v. 43, n. 1–2, p. 109–123,
2004.
LINDFIELD, G.; PENNY, J. Numerical Methods: Using Matlab. [S.l.]: Elsevier Science &
Technology, 2002. (Academic Press).
LORD, F. Some test theory for tailored testing. In: . Computer-assisted instruction,
testing, and guidance. New York: Harper and Row, 1970. p. 139–183.
LORD, F.; NOVICK, M. Statistical theories of mental test scores. [S.l.]: Addison-Wesley Pub.
Co., 1968. (Addison-Wesley series in behavioral science).
MACHADO, N. Interdisciplinaridade e matemática. Pro-Posiçoes, v. 2, n. 1, 1993.
MENDES, O. Avaliação formativa no ensino superior. reflexões e alternativas possı́veis. In:

. Currı́culo e avaliação na educação superior. São Paulo: Junqueira & Marin, 2005. p.
175–197.
MIRANDA, W.; SILVA, F. H. A interrelação entre avaliação, obstáculo e erro. In: . Recife:
[s.n.], 2011. (XIII CIAEM-IACME).
MORAN, J. M.; MASETTO, M. Novas Tecnologias e Mediação Pedagógica. 13. ed.

Campinas, SP: Papirus, 2007. (Coleção Papirus Educação).
OLEA, J.; HONTANGAS, P. Tests informatizados de primera generación. In: .

Tests Informatizados: Fundamentos y Aplicaciones. Madrid: Pirámide, 1999. (Colección
Psicologı́a/Ediciones Pirámide Series), p. 111–125.
OLEA, J.; PONSODA, V. Test adaptativos informatizados. Preprint. 2002.
OLIVEIRA, L. Mesquita de; FRANCO, C.; SOARES, T. M. Projeto GERES/2005: Novos

indicadores para construção e interpretação da escala de proficiência. Revista Electrónica
Iberoamericana sobre Calidad, Eficacia y Cambio en Educación, v. 5, p. 153–182, 2007.
PACHECO, J. Avaliação da aprendizagem. In: . Porto: Porto Editora, 1998. (Conhecer,

aprender e avaliar), p. 111–132.
PASQUALI, L.; PRIMI, R. Fundamentos da teoria da resposta ao item: TRI. Avaliação

Psicológica, scielopepsic, v. 2, p. 99–110, 12 2003.
88
PERRENOUD, P. Construir as competências desde a escola. Tradução de Bruno Charles

Magne. Porto Alegre: Artmed Editora, 1999. (Biblioteca Artmed).
PIMENTEL, E.; OMAR, N. Métricas para o mapeamento do conhecimento do aprendiz em

ambientes computacionais de aprendizagem. In: . Brası́lia: [s.n.], 2006. (Anais do XVII
Simpósio Brasileiro de Informática na Educação), p. 247–256.
PINTO, N. O erro como estratégia didática: estudo do erro no ensino da matemática

elementar. [S.l.]: Papirus Editora, 2000. (Série Prática pedagógica).
RAABE, A. L. A. Uma proposta de arquitetura de Sistema Tutor Inteligente baseada na

Teoria das Experiências de Aprendizagem Mediadas. 152 p. Tese (Doutorado em Informática
na Educação) — Universidade Federal do Rio Grande do Sul, Porto Alegre, 2005.
RIBEIRO, C. Metacognição: um apoio ao processo de aprendizagem. Psicol. Reflex. Crit.,

Porto Alegre, v. 16, n. 1, 2003.
RIOS, M. A avaliação formativa como procedimento de qualificação docente. Revista

e-Curriculum, Pontifı́cia Universidade Católica de São Paulo, São Paulo, v. 1, n. 1, 2005.
SADLER, D. R. Formative assessment and the design of instructional systems. Instructional

science, Springer, v. 18, n. 2, p. 119–144, 1989.
SAMEJIMA, F. A comment on Birnbaum’s three-parameter logistic model in the

latent trait theory. Psychometrika, Springer New York, v. 38, n. 2, p. 221–233, 1973.
10.1007/BF02291115.
SCRIVEN, M. The methodology of evaluation. In: . Perspectives of Curriculum

Evaluation, AERA Monograph Series on Curriculum Evaluation. Chicago: Rand McNally,
1967. v. 1, p. 39–83.
SHUTE, V.; TOWLE, B. Adaptive e-learning. Educational Psychologist, Routledge, v. 38, p.

105 – 114, 2003.
TARAS, M. De volta ao básico: definições e processos de avaliação. Práxis Educativa, v. 5,

n. 2, p. 123–130, 2010.
TEIXEIRA, A. P. F. Estratégias de auto-regulação na aprendizagem em história: estudo no

2 o C.E.B. Dissertação (Mestrado no Ensino de História) — Universidade do Minho, Portugal,
2004.
THURSTONE, L. L. Attitudes can be measured. American Journal of Sociology, v. 33, p.

529–554, 1928.
TORRE, S. d. l. El error como estrategia didáctica. In: . Estrategias didácticas

innovadoras: Recursos para la formación y el cambio. Barcelona: Octaedro, 2000.
(Recursos/Octaedro Series).
89
VERGANI, F. M. Avaliação externa de rendimento escolar: um instrumento da gestão

pedagógica. 111 p. Dissertação (Mestrado) — Universidade de Caxias do Sul, 2010.
ZIMMERMAN, B. J. A Social Cognitive View of Self-Regulated Academic Learning. J. Educ.

Psychol., v. 81, p. 329–339, 1989.
90
APÊNDICE A – Objetivos
A.1 6o. ano
Objetivo
100 Desenvolver o conceito de medir, desenvolvendo sua capacidade de estimar resul-
tados
101 Desenvolver o conceito de medida de comprimento relacionando com unidades pa-
dronizadas
103 Desenvolver o conceito de medida de superfı́cie, relacionando com unidades padro-
nizadas.
105 Desenvolver o conceito de volume, relacionando com unidades padronizadas.
106 Reconhecer formas geométricas
107 Classificar os sólidos geométricos.
108 Reconhecer diferentes polı́gonos e suas caracterizações
109 Reconhecer e nomear os poliedros
110 Identificar as dimensões dos poliedros
111 Compor / Decompor poliedro (planificação)
112 Construir as cevianas (altura, mediana e bissetriz) de um triângulo
113 Identificar a medida do comprimento de um contorno de uma figura como sendo o
seu perı́metro.
114 Estabelecer a unidade padrão para medir comprimento, com os seus múltiplos e
submúltiplos.
127 Resolver uma situação problema que envolva o conceito de perı́metro
129 Calcular área por meio da composição e decomposição de figuras
130 Calcular áreas de figuras desenhadas em malhas quadriculadas
131 Estabelecer a unidade padrão para medir área, com os seus múltiplos e submúltiplos.
132 Identificar as alturas e a base correspondente de um triângulo
136 Reconhecer que a altura do triângulo é uma ceviana perpendicular à base corres-
pondente do triângulo
137 Calcular a área de um triângulo
138 Calcular a área de um quadrado
91
139 Calcular a área de um retângulo

142 Resolver uma situação problema que envolva o conceito de área
161 Calcular o volume através da contagem de blocos
162 Calcular o volume de diferentes sólidos por meio de comparação com outros
164 Resolver problema que envolva o volume de paralelepı́pedos (cubos)
166 Estabelecer a unidade padrão para medir volumes, com os seus múltiplos e
submúltiplos
167 Relacionar as unidades de volume (cúbicas) às de capacidade (litro)
207 Identificar a medida de um objeto por meio de régua, expressando-a em sua forma
decimal
192 Efetuar operações com potências
216 Operar com números decimais
217 Operar com números fracionários
204 Fazer transformação de unidades de medida de comprimento
205 Fazer transformação de unidades de medida de área
206 Fazer transformação de unidades de medida de volume
A.2 7o. ano
Objetivo
143 Resolver problemas de perı́metro de polı́gonos utilizando equações polinomiais do
1o grau
144 Resolver problemas de área de polı́gonos que utilizam em equações polinomiais do
1o grau
175 Identificar proporção como a igualdade entre duas razões.
176 Aplicar a propriedade fundamental das proporções.
177 Resolver problemas aplicando todas as propriedades das proporções.
178 Reconhecer quando dois conjuntos de números são diretamente ou inversamente
proporcionais.
180 Reconhecer quando duas grandezas variáveis dependentes são diretamente ou in-
versamente proporcionais.
92
182 Aplicar a regra de três simples/composta

185 Operar com números racionais
173 Escrever a equação correspondente ao enunciado de um problema.
174 Resolver e dar o conjunto-verdade de equações, observando restrições.
187 Resolver equações polinomiais do 1o grau
188 Resolver equações polinomiais do 1o grau com duas variáveis (sistema)
205 Fazer transformação de unidades de medida de área
206 Fazer transformação de unidades de medida de volume
213 Resolver equações polinomiais utilizando o conceito de equações equivalentes.
A.3 8o. ano
Objetivo
135 Reconhecer os pontos de encontro das cevianas (baricentro, incentro e ortocentro)
de um triângulo)
146 Calcular a área de um paralelogramo
147 Calcular a área de um losango
148 Calcular a área de um trapézio
165 Descrever por meio de uma expressão algébrica o volume de uma figura geométrica
168 Empregar o valor numérico real em uma expressão algébrica
170 Operar com polinômio.
171 Aplicar os casos de produtos notáveis.
172 Aplicar os casos de fatoração.
181 Descrever por meio de uma expressão algébrica a área de uma figura geométrica
188 Resolver equações polinomiais do 1o grau com duas variáveis (sistema)
189 Determinar os pontos notáveis de um triângulo: baricentro, ortocentro, incentro
213 Resolver equações polinomiais utilizando o conceito de equações equivalentes.
214 Compreender e interpretar geometricamente os casos de produto notável e fatoração
93
140 Identificar figuras equivalentes

145 Reconhecer as diagonais de um losango
215 Aplicar as propriedades dos quadriláteros na resolução de problemas
116 Descrever por meio de uma expressão algébrica o comprimento (perı́metro) de uma
figura geométrica
A.4 9o. ano
Objetivo
117 Calcular medidas de segmentos através da semelhança entre figuras
118 Calcular o perı́metro de polı́gonos regulares utilizando razões trigonométricas
119 Reconhecer quando duas figuras são semelhantes
120 Determinar a razão de semelhança entre dois polı́gonos
121 Reconhecer que a razão entre os perı́metros de dois polı́gonos semelhantes é igual
à razão de semelhança
122 Reconhecer que a razão entre as áreas de dois polı́gonos semelhantes é igual ao
quadrado da razão de semelhança
123 Reconhecer que a razão entre os volumes de dois sólidos semelhantes é igual ao
cubo da razão de semelhança
124 Resolver problemas de áreas com figuras equivalentes
125 Calcular o comprimento de uma circunferência
126 Calcular o comprimento de um arco de circunferência
150 Calcular a área de um triângulo dadas as medidas dos seus lados (fórmula de Herão)
151 Calcular a área de um triângulo dadas as medidas de seus lados e do raio da circun-
ferência inscrita ou circunscrita ao triângulo
152 Calcular a área de um triângulo dadas as medidas de dois lados e o ângulo por eles
formado
154 Calcular a área do cı́rculo e suas partes
156 Reconhecer polı́gonos regulares como sendo aqueles que têm lados e ângulos con-
gruentes
157 Calcular a área de um polı́gono regular
158 Reconhecer polı́gonos inscritos ou circunscritos na circunferência
159 Calcular área utilizando a resolução de equações do 2o grau.
94
163 Calcular o volume de sólidos através de semelhança

193 Efetuar operações com radicais; (raiz quadrada; raiz cúbica)
195 Resolver equações polinomiais do 2o grau com duas incógnitas (sistema)
208 Aplicar as relações métricas do triângulo retângulo na resolução de exercı́cios
209 Resolver em situações problema relações métricas nos polı́gonos regulares inscritos
210 Aplicar as razões trigonométricas na resolução de problemas
211 Calcular o apótema de um polı́gono regular
212 Reconhecer o Teorema de Pitágoras e utilizá-lo na resolução de problemas
218 Calcular a área de polı́gonos regulares utilizando razões trigonométricas
95
APÊNDICE B – O ML3P e o Critério da Máxima Informação
Vamos discutir aqui a afirmação de que, para uma habilidade θ fixada, quanto mais
próximo o parâmetro de dificuldade b está de θ maior é a informação do item associado a ele.
Vamos considerar o modelo logı́stico adotado no ensaio. Para todos os itens, foram considera-
dos c = 0.2 e a = 1.7. Cabe ressaltar que, mesmo com esses valores fixados, o modelo em estudo
pertence à famı́lia dos ML3P (e não é um modelo de apenas um parâmetro) pois o parâmetro
de acerto ao acaso c é não nulo.
Como para todos os itens, os parâmetros de discriminação e acerto ao acaso são os

mesmos, eles serão denotados por a e c (sem o ı́ndice i), respectivamente. No caso do modelo
logı́stico de três parâmetros (ML3P), vimos que a probabilidade de acerto do item por um
indivı́duo com habilidade θ é dada por
Pi (U = 1∣θ) = c + (1 − c)
1
1 + e−Da(θ−bi )
, (B.1)
em que
●U é uma variável aleatória dicotômica que assume os valores 0 ou 1 indicando que o item foi
incorreta ou corretamente respondido respectivamente.
●θ representa a habilidade.
●Pi (U = 1∣θ) é a probabilidade de um indivı́duo com habilidade θ responder corretamente ao
item i.
●bi é o parâmetro de dificuldade do item i.
●a é o parâmetro de discriminação do item i.
●c é o parâmetro de acerto casual do item i.
●D é um fator de escala.
Vamos detalhar a dedução da função de informação do item i. Temos
[ ∂Pi (U ]
2
=1∣θ)
Ii (θ; a, bi , c) = onde Qi (U = 1∣θ) = 1 − Pi (U = 1∣θ).

∂θ
Pi (U = 1∣θ)Qi (U = 1∣θ)
,
Observe que
∂Pi (U = 1∣θ) DaQi (U = 1∣θ)

= (1 − c) =
Dae−Da(θ−bi )
(1 + e ) 1 + e−Da(θ−bi )
−Da(θ−b ) 2
.
∂θ i
96
Logo
Q2i (U = 1∣θ)
Ii (θ; a, bi , c) = D 2 a2
Pi (U = 1∣θ)Qi (U = 1∣θ)(1 + e−Da(θ−bi ) )2
1 − Pi (U = 1∣θ) Pi (U = 1∣θ) − c
2
=D a [ ][ ]
P (U = 1∣θ) 1−c
2 2
Qi (U = 1∣θ) Pi (U = 1∣θ) − c
2
= D 2 a2 [ ] .
Pi (U = 1∣θ) 1−c
Note que
1 ∂Ii (θ; a, bi , c) ∂Pi (U = 1∣θ) Pi (U = 1∣θ) + Qi (U = 1∣θ) Pi (U = 1∣θ) − c

2
=− [ ]
2
D a2 ∂bi ∂bi Pi2(U = 1∣θ) 1−c
2 ∂Pi (U = 1∣θ) Qi (U = 1∣θ) Pi (U = 1∣θ) − c
+ [ ]
1−c ∂bi Pi (U = 1∣θ) 1−c
∂Pi (U = 1∣θ) Pi (U = 1∣θ) − c Pi (U = 1∣θ) − c
= [ ] (2Qi (U = 1∣θ) − )
1
(1 − c)2 ∂bi Pi (U = 1∣θ) Pi (U = 1∣θ)
∂Pi (U = 1∣θ) Pi (U = 1∣θ) − c −2Pi2 (U = 1∣θ) + Pi (U = 1∣θ) + c
= [ ]( ).
1
(1 − c)2 ∂bi Pi (U = 1∣θ) Pi (U = 1∣θ)
Temos também
∂Pi (U = 1∣θ)
= −(1 − c)
Dae−Da(θ−bi )
(1 + e−Da(θ−bi ) )2
.
∂bi
∂Ii (θ;a,bi ,c)
Na expressão de ∂bi acima, vemos que apenas a parcela
−2Pi2 (U = 1∣θ) + Pi (U = 1∣θ) + c.
pode apresentar variação de sinal conforme bi varia.
Como Pi (U = 1∣θ) ∈ (c, 1) e a parábola n(p) = −2p2 + p + c é positiva para p ∈ (0, pc ) e

negativa para p ∈ (pc , 1) onde √
1 + 1 + 8c
pc = .
4
Observe que
√ √
1 + 1 + 8c c + 9c
pc = > = c.
4 4
É fácil ver que existe um único bc ∈ (−∞, ∞) tal que a probabilidade de acerto Pic (U = 1∣θ) de
um item com parâmetros a, bc , D e c por um indivı́duo de habilidade θ é dada por
Pic (U = 1∣θ) = pc .
Como ∂Pi (U =1∣θ)

∂bi < 0 para todo bi ∈ R,
●enquanto bi varia de −∞ a bc , Pi (U = 1∣θ) decresce de 1 a pc ;

●enquanto bi varia de bc a +∞, Pi (U = 1∣θ) decresce de pc a c.
Consequentemente,
97
●enquanto bi varia de −∞ a bc , −2Pi2 (U = 1∣θ) + Pi (U = 1∣θ) + c é negativo;

●enquanto bi varia de bc a +∞, −2Pi2 (U = 1∣θ) + Pi (U = 1∣θ) + c é positivo.
Portanto, a função de informação Ii (θ; a, bi , c) assume seu máximo quando bi = bc . Além disso,
Pic (U = 1∣θ) = pc . Vimos na apresentação do ML3P que, quando a habilidade θ é igual ao
parâmetro de dificuldade bi do item, a probabilidade de acerto desse item por um indivı́duo de
habilidade θ é igual a
c+1
.
2
Como para c ∈ (0, 1), temos 4c(c − 1) < 0, segue que
(2c + 1)2 = 4c2 + 4c + 1 < 8c + 1

√
2c + 1 < 1 + 8c
√
c + 1 1 + 1 + 8c
< .
2 4
Isto é, c+1
2 < pc para c ∈ (0, 1). Além disso, podemos concluir que bc < θ. Ou seja, nesse caso, o
item que maximiza a informação tem parâmetro de dificuldade menor do que θ. Vamos ilustrar
graficamente o resultado apresentado acima. Consideraremos os parâmetros usados em nosso
experimento a = 1, 2, c = 0, 2 e θ = −2, 25.
0.25
0.2
0.15
0.1
0.05
0
−8 −6 −4 −2 0 2 4
Figura 16 – Gráfico da Função de Informação com os parâmetros θ, a e c fixados

98
0.9
0.8
0.7 √
1+ 1+8c
pc = 4
0.6 c+1
2
0.5
0.4
0.3
0.2
−8 −6 −4 −2 0 2 4
bi = −2, 25 = θ
bc = −2, 4726
Figura 17 – Gráfico do ML3P com os parâmetros θ, a e c fixados

Ensaio Da Ferramenta DIA Diagnóstico e Informação Do Aluno

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Ensaio Da Ferramenta DIA Diagnóstico e Informação Do Aluno

Enviado por

Direitos autorais:

Formatos disponíveis

Universidade do Estado do Rio de Janeiro

Centro de Tecnologia e Ciências

Renata Cardoso Pires de Abreu

Ensaio da Ferramenta DIA – Diagnóstico e Informação do aluno.

Ensaio da Ferramenta DIA – Diagnóstico e Informação do aluno.

Dissertação apresentada, como

Orientadora: Profª. Dra. Patrícia Nunes da Silva

Coorientador: Prof. Dr. Carlos Frederico F. B. Vasconcellos

A162 Abreu, Renata Cardoso Pires de.

1. Matemática - Estudo e ensino. 2. Avaliação educacional -

Ensaio da Ferramenta DIA – Diagnóstico e Informação do aluno.

Dissertação apresentada, como requisito

Aprovada em 6 de agosto de 2012

Prof. Dr. Gerson Pastre de Oliveira

Por isso, agradeço:

aos professores do mestrado, por me mostrarem tantos conhecimentos novos,

ao Prof.Gerson e a Profª Chang, também membros da banca, pela participação e comentários

À todos vocês meu muito obrigado.

Apresentamos os resultados de nossa pesquisa para concepção, execuçãoo e avaliação

Palavras-chave: Avaliação. Teste Adaptativo Informatizado (TAI). Teoria da Resposta ao

Keywords: Evaluation. Computerized Adaptive Testing (CAT). Item Response Theory

Figura 1 – Curva Característica do Item................................................................... 23

Figura 2 – Curva Característica de um Item com “discriminação perfeita”............. 24

Figura 3 – Curva Característica do Item................................................................... 25

Figura 4 – Invariância da Curva Característica de um Item .................................... 29

Figura 5 – Octógono inscrito em quadrado ............................................................. 40

Figura 6 – Etapa 1 .................................................................................................... 71

Figura 7 – Etapa 2 .................................................................................................... 72

Figura 8 – Etapa 3 .................................................................................................... 73

Figura 9 – Objetivo 194............................................................................................ 74

Figura 10 – Etapa 4 .................................................................................................... 75

Figura 11 – Etapa 5 .................................................................................................... 76

Figura 12 – Objetivo 159............................................................................................ 76

Figura 13 – Etapa 6 .................................................................................................... 77

Figura 14 – Conjunto de objetivos testados ............................................................... 78

Figura 16 – Gráfico da Função de Informação com os parâmetros ,a e c fixados . 97

Figura 17 – Gráfico do ML3P com os parâmetros ,a e c fixados............................ 98

Tabela 1 – Descrição dos Objetivos................................................................................ 47

Tabela 2 – O entrelaçamento dos objetivos..................................................................... 51

Tabela 3 – Questões geradas a partir do objetivo O118 ................................................. 53

Tabela 4 – Questões geradas a partir do objetivo O120 .................................................. 53

Tabela 5 – Questões geradas a partir do objetivo O159 .................................................. 54

Tabela 6 – Objetivos do 6º ao 8º ano utilizados no entrelaçamento................................. 59

Tabela 7 – estimados dos 23 respondentes do ensaio da ferramenta DIA..................... 64

Tabela 8 – Exemplo grupo Respostas............................................................................... 65

Tabela 9 – Objetivos respondidos incorretamente .......................................................... 66

Tabela 10 – Objetivos respondidos corretamente ............................................................. 66

Tabela 11 – Objetivos Diagnosticados .............................................................................. 66

Tabela 12 – Objetivos Testados ......................................................................................... 66

Tabela 13 – Objetivos testados e não diagnosticados ........................................................ 67

Tabela 14 – Calibração ...................................................................................................... 67

Tabela 15 – Descrição dos objetivos ................................................................................. 68

Tabela 16 – Questões respondidas incorretamente ............................................................ 69

Tabela 17 – Descriçao dos objetivos.................................................................................. 69

Tabela 18 – Tabela de Respostas ....................................................................................... 71

Tabela 19 – Descriçao dos objetivos.................................................................................. 73

Tabela 20 – Tabela Comparativa ....................................................................................... 79

Tabela 21 – Descriçao dos objetivos.................................................................................. 79

Quadro 1 – Espaço e Forma 44

Quadro 2 – Grandezas e Medidas 45

Quadro 3 – Descritores do Tema I. Espaço e Forma 46

Quadro 4 – Descritores do Tema II. Grandezas e Medidas 46