Escolar Documentos
Profissional Documentos
Cultura Documentos
Rio de Janeiro
2021
C828p Côrtes, Letícia Maria de Souza.
Parâmetros comportamentais de itens de língua
portuguesa da Secretaria Municipal de Educação do
Rio de Janeiro: um estudo avaliativo / Letícia Maria de
Souza Côrtes. - 2021.
76 f.; 30 cm.
CDD 469.07
Assinatura Data
Dedico esse trabalho a dois grandes
amores: André Luiz (in memorian) e Saulo
José. Por meio deles, entendi que “o correr
da vida embrulha tudo. A vida é assim:
esquenta e esfria, aperta e daí afrouxa,
sossega e depois desinquieta. O que ela
quer da gente é coragem [...]”
(Guimarães Rosa)
AGRADECIMENTOS
À Professora Doutora Ligia Gomes Elliot, todo meu respeito, carinho e admiração,
pela exigência na construção desse estudo.
Aos Professores Doutores Glauco Aguiar e Maria Cristina Rigoni Costa pela
participação na banca examinadora e pelas valiosas contribuições ao estudo.
Ao Professor Doutor Ovidio Orlando Filho, pela singularidade com que constrói
processos de aprendizagem sobre avaliação de políticas públicas na vida dos seus
alunos.
À Professora Doutora Tássia Cruz por possibilitar a imersão na avaliação, vista sob a
ótica do Mindset de professores.
Aos amigos Ana Cristina da Silva, Saulo Albuquerque, Viviane Lucas, Leila Martins,
Ana Paula Pinto, que torcem por mim incondicionalmente (mesmo quando brigamos).
A minha terapeuta Louise Bonitez, por não permitir que eu desacreditasse de mim
mesma, apesar de todas as dificuldades.
Aos amigos do trabalho, Selma Kronemberg, Natalino Pontual, Antonio Junior, André
Filipe de Almeida, Bernardo Andretti pela generosidade em cederem seus
conhecimentos à construção desse estudo.
A Deus, por estar viva, num contexto tão peculiar e adverso provocado pela pandemia
de COVID-19.
RESUMO
The purpose of the present study was to evaluate statistical parameters regarding the
behavior of the Portuguese Language items from the Item Bank of the Municipal
Education Secretariat of Rio de Janeiro applied to 9th grade students. It was taken into
consideration that, based on the measurement of more reliable information on the
development of competences and skills of students, it is possible to contribute to the
improvement of technical aspects in the development of cognitive tests. The study
verified through the Classical Test Theory parameters such as percentage of
correctness of the item, percentage of students who chose each alternative of each
item, discrimination index, biserial correlation coefficient and biserial correlation
coefficient per alternative. The Item Response Theory focused on the following indexes
- discrimination, difficulty, and inferior asymptote (random error). The study adopted
the results obtained in the pre-testing of the items and it relied on the processing of
consolidated data through free technology statistical software R. The study sample had
selected 38 items, distributed by 19 Portuguese Language descriptors of the Basic
Education Assessment System – 9th grade. From the results obtained by the pre-
testing, it was found that 71% of the sample items had a median level of difficulty and
47,3% of the items were considered as of advanced proficiency. It was clear that there
was a need for better equalization of the proportions of the categories of the items,
both in terms of difficulty and levels of proficiency.
Keywords: Items. Classical Test Theory. Item Response Theory. Difficulty.
Proficiency. Assessment.
LISTA DE ILUSTRAÇÕES
gestão na educação. Isto significa afirmar que, em um curto prazo de tempo, seria
possível minimizar os gastos financeiros com avaliações externas – aplicadas em
anos distintos das avaliações externas nacionais e com vistas a mensurar o
desenvolvimento das habilidades e competências dos alunos, além de, em médio
prazo, consolidar a cultura da avaliação nesta rede de ensino, fortalecendo todos os
envolvidos no processo.
Foi, “com vistas ao aprofundamento e ampliação das reformas pela cessão” de
política de desenvolvimento, que o Rio de Janeiro firmou com o BIRD, em 2014, “um
acordo de empréstimo para a execução” do projeto de promoção da excelência na
gestão pública do município. O acordo denominado Technical Assistance Loan
(Empréstimo de Assistência Técnica) resultou no projeto intitulado Rio de Excelência,
que no âmbito da SME-RJ viabilizou recursos financeiros para melhorias na prestação
de serviços públicos em educação, principalmente no que diz respeito à avaliação e
ao monitoramento da qualidade da educação (BANCO INTERNACIONAL PARA
RECONSTRUÇÃO E DESENVOLVIMENTO, 2016).
Em aderência a este projeto de assistência técnica, a contratação de um Banco
de Itens para a SME-RJ teve como objetivo geral “Aprimorar os aspectos técnicos dos
instrumentos de avaliação e a formação técnico-especializada da Equipe de Avaliação
do Desempenho Escolar, das Coordenadorias Regionais (CRE) e dos professores
regentes” (RIO DE JANEIRO, 2016).
A proposta de contratação prevê ainda como objetivos específicos:
melhoria das características técnicas dos resultados das Provas Bimestrais. O projeto
tinha em seu escopo que a aquisição de um sistema desta natureza poderia contribuir
para obtenção do máximo de qualidade nas estimativas dos itens (padrões de
dificuldade, confiabilidade, medidas de competências), além de sofisticar os relatórios
técnico-pedagógicos e aproximar a tecnologia da avaliação em larga escala ao
cotidiano do contexto escolar da SME-RJ.
A expectativa para a exequibilidade do projeto é que, a partir da implementação
de um Banco de Itens, o processo de acompanhamento do desenvolvimento do
desempenho dos alunos disponha de fineza de detalhes. Confiabilidade e validade
dos dados, por meio de parâmetros estatísticos são fatores que impulsionam
tecnicamente a administração de informações em níveis pedagógicos e gerenciais.
De igual forma, os resultados permitirão também colaborar efetivamente com o
detalhamento de intervenções pedagógicas para (re)alinhamento no processo ensino-
aprendizagem, sempre que se fizer necessário.
McIntire e Miller (2000) destacaram ainda que este conceito é sinalizado por
três relevantes características:
A intitulada Teoria Clássica dos Testes, também conhecida por TCT, considera
o teste como unidade de análise. Nesta teoria procura-se verificar o comportamento
de cada item no conjunto de itens utilizados em cada teste. Considerar-se-á a resposta
de todos os alunos que responderam ao instrumento avaliativo. Segundo Klein (2013,
p. 3), trata-se de “um modelo para a habilidade (escore verdadeiro), no qual o erro não
depende da habilidade do aluno. A habilidade [...] é estimada pelo número de acertos”
no teste.
Ainda segundo o autor, ao considerar 𝑇 como escore verdadeiro, 𝐸 como erro
do escore, e 𝑥 como resultado observado, pode-se depreender que o escore
verdadeiro e o escore observado no teste do indivíduo (𝑥) é resultante da soma do
escore verdadeiro (𝑇) com o erro do escore (𝐸), logo, 𝑥 = 𝑇 + 𝐸.
Assim, o escore verdadeiro 𝑇 é o escore observado no teste.
Lord e Novick (1968, apud KLEIN, 2013, p. 83), referências no estudo da TCT,
salientaram cinco importantes pressupostos desta teoria, a saber:
Vale ressaltar, que mesmo com tais limitações, as análises pressupostas pela
TCT são valiosos subsídios para parâmetros estatísticos como dificuldade e
confiabilidade dos itens. Além disso, a TCT será um importante instrumento para
atribuição de notas bimestrais aos alunos, a partir de seus escores.
Na qual,
𝑥𝑖𝑗 é a resposta do item (=1, se correta; e =0, se errada);
Ɵ é a proficiência do aluno;
𝑎 é o parâmetro de inclinação do item, também chamado de parâmetro de
discriminação do item (𝑎 > 0);
𝑏 é o parâmetro de dificuldade (ou de posição) do item e 𝑐 é o parâmetro da
assíntota inferior do item que reflete as chances de um estudante de proficiência muito
baixa selecionar a opção de resposta correta; isto é, acerto ao acaso (0 < 𝑐 <1).
O modelo da logística de três parâmetros considera nos itens de múltipla
escolha as diferentes discriminações dos itens refletidas no parâmetro “a” e a
probabilidade de acerto a um item por um aluno com baixa habilidade ou proficiência
pela escolha de uma alternativa qualquer, refletida no parâmetro “c”.
As experiências internacionais, como do National Assessment of Educational
Progress - NAEP (Avaliação Nacional do Progresso Educacional), dos Estados Unidos
e avaliações nacionais, como o Sistema Avaliação da Educação Básica (SAEB),
evidenciam a grande diferença de discriminação que pode existir entre os itens e as
diferentes probabilidades de acerto dos itens por alunos com baixa habilidade. Esta
probabilidade de acerto será alta se a alternativa correta atrair os alunos e será baixa,
se uma ou mais alternativas erradas atraírem os alunos.
Associada a outros procedimentos estatísticos, a TRI permite posicionar todos
os alunos em uma escala comum de proficiência, ainda que nem todos tenham
respondido aos mesmos itens. Isto permite fazer comparações e acompanhar a
evolução do sistema educacional, tanto entre escolas, turmas e anos escolares, como
ao longo do tempo.
Uma etapa importante desta teoria é chamada de calibração dos itens. Esta
etapa consiste basicamente na estimativa dos três parâmetros (a, b e c). Calibrar um
item de teste significa identificar seus parâmetros. Segundo Klein (2013, p. 7), “os
parâmetros dos itens obtidos de grupos diferentes de alunos testados são invariantes.”
O autor ainda acrescenta que esta característica é fundamental para a construção de
banco de itens, pois como “a estimação dos parâmetros dos itens deve estar na
37
mesma escala”, outros itens podem ser inseridos na mesma escala, a posteriori. Para
tal, são necessários planejamento e novas testagens. A estimação dos parâmetros
dos itens é realizada pelo método da maximização de uma função de verossimilhança
(KLEIN, 2013).
A Figura 1 apresenta uma análise de item realizada pela TRI. Ele foi elucidado
no Relatório Técnico e Metodológico do Plano Amostral da Pré-testagem da empresa
ELBI (2018b) para a SME-RJ, com vistas à exemplificação psicométrica da teoria.
3 METODOLOGIA
3.1 A ABORDAGEM
3.2 O INSTRUMENTO
Como recorte da população escolhida para este estudo, optou-se por avaliar os
resultados dos itens validados para alunos do 9º ano do Ensino Fundamental.
Importante é notar que o universo amostral escolhido pela empresa ELBI para a
realização da pré-testagem dos itens que compõem o Banco de Itens da SME-RJ fora
constituído por alunos oriundos da Secretaria Estadual da Paraíba. O pré-teste
ocorreu entre os dias 8 e 16 de maio de 2018, nas cidades de João Pessoa e Campina
Grande.
De acordo com orientação da empresa consultora, cabe ressaltar que, como a
pré-testagem ocorreu no primeiro semestre do ano de 2018, cada instrumento de
44
avaliação foi aplicado ao ano escolar subsequente em relação ao ano que o item foi
elaborado. Segundo as considerações da empresa consultora, “este procedimento
visou assegurar que todos os estudantes respondentes estivessem plenamente
formados e aptos a responder o conjunto de itens aplicados” (ELBI, 2018b, p. 14).
Desta forma, os itens referentes ao 9º ano do Ensino Fundamental foram aplicados
em alunos do primeiro ano do Ensino Médio.
Sobre a participação no pré-teste, pode-se afirmar que dos 8.907 respondentes
previstos para o primeiro ano do Ensino Médio, participaram da aplicação 4.840
respondentes. O número de participantes corresponde a pouco mais de 50% do que
era esperado.
(Conclusão)
Cód. Cód.
Descritores SAEB Descritores SME Dimensão
SAEB SME
Inferir uma
D4 informação implícita P28 Inferir informação implícita. Enciclopédica
em um texto.
Identificar o tema de
D6 P10 Identificar o tema de um texto. Textual
um texto.
Distinguir um fato da
D14 opinião relativa a P26 Distinguir fato de opinião Enciclopédica
esse fato.
Fonte: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO
TEIXEIRA (2020).
Quadro 6 - Cotejo de descritores referentes ao Tópico III – Relação entre textos da matriz
SAEB de Língua Portuguesa
Cód. Cód.
Descritores SAEB Descritores SME Dimensão
SAEB SME
Reconhecer diferentes Reconhecer diferentes
formas de tratar uma formas de tratar uma
informação na comparação informação na comparação
de textos que tratam do de textos que tratam do
D20 P12 Textual
mesmo tema, em função mesmo assunto, em função
das condições em que ele das condições em que ele
foi produzido e daquelas foi produzido e daquelas
em que será recebido. em que será recebido.
Reconhecer posições Reconhecer posições
distintas entre duas ou distintas entre duas ou
D21 mais opiniões relativas ao P14 mais opiniões relativas ao Textual
mesmo fato ou ao mesmo mesmo fato ou ao mesmo
tema tema.
Fonte: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO
TEIXEIRA (2020).
48
(Conclusão)
Cód. Cód.
Descritores SAEB Descritores SME Dimensão
SAEB SME
Reconhecer o efeito de
Reconhecer o efeito de
sentido decorrente da
sentido decorrente do uso
D18 escolha de uma P58 Sistêmica
de uma determinada palavra
determinada palavra ou
ou expressão.
expressão
Reconhecer o efeito de Reconhecer o efeito de
sentido decorrente da sentido decorrente da
D19 exploração de recursos P57 exploração de recursos Sistêmica
ortográficos e/ou ortográficos e/ou
morfossintáticos morfossintáticos
Fonte: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO
TEIXEIRA (2020).
Após o cotejo dos descritores dos itens do 9º ano, descritores propostos para
a matriz SME-RJ correspondentes aos contidos na matriz SAEB de Língua
Portuguesa, dos 559 itens dispostos no banco com tal correspondência, 468 foram
aprovados. Segundo os relatórios da empresa consultora (ELBI, 2018b), os motivos
para não aprovação ou não convergência dos itens foram: valor negativo para
alternativa correta no coeficiente bisserial por alternativa; discriminação baixa no
parâmetro c da TRI, isto é, assíntota inferior maior a 0,35.
Embora o relatório entregue a SME-RJ saliente que as informações intrínsecas
aos itens convergentes sejam facilmente identificáveis por meio de entrega de
produtos em três modalidades – banco de itens online, relatório Ficha do Item e
planilha de micro dados (ELBI, 2018a), as informações complementares sobre cada
um dos itens, considerando TCT e TRI, precisam ser cotejadas para que se possa ter
uma visão mais ampla sobre os parâmetros obtidos pelos itens.
50
4 RESULTADOS
(Conclusão)
Descritores Banco de Quantidade de
Descritores SAEB
Itens -SME -RJ Itens
D7 P15 34
D8 P16 20
D9 P06 00
D10 P13 04
D11 P52 22
D15 P50 20
D18 P58 18
D19 P57 8
D13 P49 2
Total 468
Fonte: RIO DE JANEIRO (2018b).
Tabela 5 - Distribuição dos itens do 9º ano, por nível da escala SAEB de desempenho em
Leitura e índices de dificuldade e de discriminação
Nº dos itens
Nº dos itens fáceis Nº dos itens médios Total
difíceis
Nível
Discr Discr Discr Discr Discr Discr
Baixa Boa Baixa Boa Baixa Boa
225 -
250 1, 6, 11, 14,24 5
275 9, 30 7,15, 19, 25, 36 7
300 4, 12, 22, 28, 32, 34 6
325 5, 13, 17, 27 4
10,16, 21, 23, 26,
350 8 8
33, 38
375 3, 20 4 31,35 37 6
425 29 18 2
- - - - - - - 38
Fonte: A autora (2019).
da alternativa A é provável para até 31% dos estudantes com maior escore de acertos
no teste e para a alternativa D é de 22%.
solução daqueles que não a têm. No item 3, por exemplo, é possível verificar o ponto
em que o item passa a ter probabilidade de acerto superior a 60% entre os
respondentes identificados em dois desvios padrão acima da média.
assume nos itens valores que variam entre 0, 20 e 0,18. Tomando-se por base o
desenho da linha modelo, observa-se que o item 22 apresenta 20% de probabilidade
de acerto e o item 23 apresenta 18% de probabilidade de acerto.
No item 31, por exemplo, é possível verificar o ponto em que o item passa a ter
probabilidade de acerto superior a 60% entre os respondentes identificados em dois
desvios padrão acima da média.
No item 35, por exemplo, é possível verificar o ponto em que o item passa a ter
probabilidade de acerto superior a 60% entre os respondentes identificados em quase
três desvios padrão acima da média.
4.7 RECOMENDAÇÕES
Com base nos resultados obtidos pelo presente estudo e considerando que o
Banco de Itens é um recurso capaz de prover a elaboração de inúmeros instrumentos
de avaliação sobre a aprendizagem dos alunos e para tal é necessário dispor de itens
com diferentes níveis de dificuldade, recomenda-se que:
haja maior equalização das proporções das categorias dos itens tanto
quanto à dificuldade, como os níveis de proficiência;
a régua dos descritores não seja tão extensa. Torna-se de suma importância
que os parâmetros de avaliação nacional como SAEB guiem a construção de matrizes
de referência do Banco de Itens da SME-RJ;
haja nova pré-testagem dos itens da SME-RJ, para retroalimentação do
Banco de Itens, de forma que seja exequível a elaboração de provas calibradas por
itens com diferentes níveis de dificuldade e proficiência, com vistas a uma radiografia
mais aprimorada das maiores dificuldades e potencialidades dos alunos;
as alternativas dos cartões-respostas dos testes correspondam ao número
de alternativas contidas dos itens. Os cartões-respostas dos alunos que participaram
do pré-teste apresentavam cinco opções de respostas (A, B, C D e E), ao passo que
as provas dispunham de quatro alternativas (A, B, C e D). Embora as marcações nas
opções letra E tenham atingido um universo de até 1% para cada item, é fundamental
evitar vieses de respostas dos alunos. Dispor de itens em que os distratores indiquem
etapas do processo de aprendizagem dos alunos é de suma importância para a coleta
de dados sobre o desenvolvimento de uma determinada habilidade.
74
REFERÊNCIAS
GIL, Antônio Carlos. Métodos e técnicas de pesquisa social. 6. ed. São Paulo: Atlas,
2008. Disponível:
https://biblioteca.isced.ac.mz/bitstream/123456789/707/1/M%C3%A9todos%20de%2
0Pesquisa%20Social.pdf. Acesso em: Acesso em: 21 set. 2020.
LORD, Frederick M.; NOVICK, Melvin Robert. Statical theories of mental test score.
Reading, MA: Addison Wesley, 1968.