Escolar Documentos
Profissional Documentos
Cultura Documentos
45411
Preencha a ficha de cadastro no final deste livro
e receba gratuitamente informações
sobre os lançamentos e as promoções da Elsevier.
U
ma equipe conduzida por Vincent Greaney
(consultor do Grupo de Educação da Rede de
Desenvolvimento Humano do Banco Mun-
dial) e Thomas Kellaghan (Centro de Pesquisas Educacionais, St. Patrick’s
College, Dublin) preparou a série da qual este é o Volume 2. Também con-
tribuíram para a série: Sylvia Acana (Uganda National Examinations Board),
Prue Anderson (Australian Council for Educational Research), Fernando
Cartwright (Canadian Council on Learning), Jean Dumais (Statistics Can-
ada), Chris Freeman (Australian Council for Educational Research), Hew
Gough (Statistics Canada), Sara Howie (University of Pretoria), George
Morgan (Australian Council for Educational Research), T. Scott Murray
(UNESCO Institute e Statistics) e Gerry Shiel (Educational Research Cen-
tre, St. Patrick’s College, Dublin). O trabalho foi realizado sob a direção
geral de Ruth Kagia, diretora do Setor de Educação do Banco Mundial, e
Robin Horn, gerente do Setor de Educação. Robert Prouty iniciou e super-
visionou o projeto até agosto de 2007. Marguerite Clarke supervisionou as
últimas etapas, até a revisão e a publicação.
Somos gratos às contribuições do painel de revisão: Al Beaton (Bos-
ton College), Irwin Kirsch (Educational Testing Service) e Benoit Millot
(Banco Mundial). Comentários adicionais muito úteis foram feitos por
Helen Abadzi, Regina Bendokat, Marguerite Clarke, Robin Horn, Eliza-
beth King, Maureen Lewis, Harry Patrinos, Carlos Rojas, Jee-Peng Tan,
Eduardo Velez e Raisa Venalainen.
Recebemos valiosos subsídios e apoio de Carly Cheevers, David Har-
ding, Aidan Mulkeen, Aleksandra Sawicka, Thi Tran, Hilary Walshe e
Hans Wagemaker.
Desejamos agradecer às seguintes instituições a permissão de repro-
duzir seu material no texto: Australian Council for Educational Research
(Conselho Australiano de Pesquisas Educacionais), Educational Resear-
ch Centre, Dublin (Centro de Pesquisas Educacionais, Dublin); Inter-
national Association for the Evaluation of Educational Achievement
(Associação Internacional para Avaliação do Aproveitamento Escolar);
Massachusetts Department of Education (Departamento de Educação
de Massachusetts); National Center for Education Statistics of the U.S.
Department of Education (Centro Nacional de Estatísticas de Educação
do Departamento de Educação, EUA), Organisation for Economic Co-
operation and Development (Organização para a Cooperação e o De-
senvolvimento Econômico, OCDE) e Papua New Guinea Department
of Education (Departamento de Educação de Papua Nova Guiné).
A diagramação, a edição e a produção dos livros foram coordenados
por Mary Fisk e Paola Scalabrin, do Escritório de Publicações do Banco
Mundial.
O Irish Educational Trust Fund; o Bank Netherlands Partnership Pro-
gram; o Educational Research Center, Dublin, e o Australian Council
for Educational Research deram generoso apoio à preparação e publica-
ção desta série.
A tradução desta série para o português só foi possível com o genero-
so apoio da Russia Education Aid for Development Trust Fund.
PREFÁCIO
A
qualidade de qualquer exercício de avaliação
escolar depende da qualidade dos instrumen-
tos utilizados. De fato, se esses instrumentos
estiverem mal concebidos, a avaliação pode ser uma perda de tempo e di-
nheiro. Este livro descreve como desenvolver instrumentos tecnicamente
robustos para uma avaliação nacional do aproveitamento escolar, com foco
especial na realização dessa tarefa em países em desenvolvimento. O Volu-
me 1 descreve os principais objetivos e características de avaliações nacionais
e se destina principalmente a formuladores de políticas e responsáveis por
decisões na área da educação. O segundo livro e a maior parte dos seguintes
fornecem, passo a passo, os detalhes sobre desenho, implementação, análise
e apresentação das constatações de uma avaliação nacional e se destinam
principalmente às equipes de avaliação nacional.
Desenvolvimento de testes e questionários para avaliação do desempenho
educacional aborda a elaboração de dois tipos de instrumentos de coleta
de dados: testes de aproveitamento dos alunos e questionários sobre fa-
tores socioeconômicos e contextuais. A Parte I cobre o desenvolvimento
de um marco de referência da avaliação, a construção de uma tabela de
especificações para o teste, a elaboração de itens, a realização do pré-
teste (ou teste piloto) e a formatação do teste final. A Parte II delineia as
etapas e atividades observadas na construção de questionários sobre fa-
tores socioeconômicos e contextuais. Os questionários serão usados para
obter informações sobre alunos, professores, diretores ou pais relativas
a variáveis que poderiam ajudar a explicar as diferenças no desempenho
dos alunos no teste de aproveitamento. A Parte III descreve como criar
um manual para aplicação do teste, de forma a garantir que todos os
alunos façam o teste em condições padronizadas.
O Volume 3 enfoca questões práticas que devem ser levadas em conta
na implementação de um programa de avaliação nacional em larga escala,
incluindo logística, amostragem e limpeza e gerenciamento de dados. O
Volume 4 trata de como gerar dados sobre itens e sobre pontuações de tes-
tes e como estabelecer relação entre as pontuações do teste e outros fatores
educacionais. Finalmente, o Volume 5 aborda como redigir relatórios com
base nas constatações da avaliação nacional e como usar os resultados para
aprimorar a qualidade do processo decisório das políticas educacionais.
À medida que os leitores avançarem na leitura deste volume, deve fi-
car evidente que o desenvolvimento de instrumentos de avaliação é um
exercício complexo, que demanda muito tempo e requer conhecimentos,
habilidades e recursos consideráveis. Ao lado disso, a experiência tem de-
monstrado que os benefícios resultantes de instrumentos bem concebidos
podem ser substanciais em termos da qualidade da informação fornecida
sobre os níveis de aproveitamento dos alunos e sobre os fatores escolares e
não escolares que poderiam contribuir para elevar aqueles níveis de apro-
veitamento. Instrumentos de boa qualidade podem fazer com que as cons-
tatações sejam vistas como mais confiáveis pelos formuladores de políticas e
por outros interessados. Também podem aumentar a probabilidade de que
os formuladores de políticas usem os resultados de uma avaliação nacional
para desenvolver planos e programas sólidos destinados a aprimorar a quali-
dade do ensino. Se os resultados dos testes e questionários alcançarem esses
resultados, estarão mais que justificados o tempo e o esforço envolvidos em
seu desenvolvimento.
Marguerite Clarke
Especialista Sênior em Educação
Banco Mundial
OS AUTORES E
ORGANIZADORES
AUTORES
1 INTRODUÇÃO 3
3 ELABORAÇÃO DE ITENS 29
Grau de dificuldade do item 31
Tendenciosidade do item 33
Material de estímulo 33
Formato do item 36
Itens de prática 48
Diagramação e elaboração dos itens 49
A equipe de elaboração de itens 55
Painéis de itens 59
Outros revisores 62
Rastreamento de itens 63
4 PRÉ-TESTE DE ITENS 67
Desenho do formulário do pré-teste 70
Impressão e revisão do pré-teste 75
Realização do pré-teste 78
Pontuação do pré-teste 79
Confiabilidade 84
APÊNDICES
A GLOSSÁRIO 161
ÍNDICE 177
QUADROS
FIGURAS
TABELAS
I A CONSTRUÇÃO
DE TESTES DE
APROVEITAMENTO
CAPÍTULO
1 INTRODUÇÃO
U
ma avaliação nacional envolve muitas ativi-
dades, desde o momento em que se decide
realizá-la até o momento em que alguém
começa a ler um relatório com as constatações. Cada livro desta série
de cinco volumes descreve algumas das atividades envolvidas numa ava-
liação nacional, com ênfase especial na realização dessa avaliação em
países em desenvolvimento. Provavelmente, parte da tecnologia neces-
sária para realizar uma avaliação nacional satisfatória em países que ca-
recem de forte tradição em pesquisas educacionais empíricas não estará
disponível localmente. Portanto, esta série buscou explicar em detalhes
as atividades de uma avaliação e, onde se mostrar relevante, ajudar os
leitores (que, presumimos, serão os responsáveis por pelo menos alguns
dos aspectos de uma avaliação) a compreender por que é necessário de-
senvolver essas atividades.
O Ministério da Educação ou a comissão de coordenação nacional
(CCN) nomeada por ele terão, usualmente, a responsabilidade geral
de orientar e apoiar uma avaliação nacional. Sob a supervisão do mi-
nistério ou da CCN, a maior parte do trabalho será realizada por um
órgão de implementação que, por sua vez, supervisionará o trabalho
do gerente de desenvolvimento de teste, dos especialistas em cada dis-
4 | SÉRIE P ESQ UISAS DO BANC O M U NDI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
FIGURA 1.1
Ministério da Educação/
Comissão de Coordenação
Nacional
Órgão implementador/
Líder da equipe
Desenvolvimento
Análise Logística
do teste/Gerente
Especialistas
nas disciplinas Amostragem Administração
Análise de currículo, Entrada e limpeza do pré-teste
desenvolvimento do marco de dados Contato com as escolas
de referência, elaboração de Análise estatística Impressão
itens, pré-teste, seleção de
itens finais, interpretação
de resultados
Pré-teste do teste e de
itens do questionário
Seleção de itens finais
Interpretação de resultados
Elaboração de relatório
1. O Ministério da Educação 2. O Ministério da Educação 3. O órgão implementador, 4. Os especialistas nas 5. O gerente de desenvolvi-
ou a CCN indica o órgão ou a CCN e outros o líder da equipe, o gerente disciplinas analisam o mento de teste treina os
implementador. O líder da concordam com o marco de desenvolvimento de currículo e esclarecem elaboradores de itens.
equipe e o órgão imple- de referência (inclusive a teste e os especialistas os objetivos.
mentador elaboram a respeito dos temas e da nas disciplinas elaboram a
versão preliminar do marco população-alvo a ser versão preliminar da tabela
de referência da avaliação testada). de especificações dos
nacional. testes e questionários.
10. O líder da equipe e o 9. O gerente de desenvolvi- 8. O órgão implementador 7. O órgão implementador 6. O gerente de desenvolvi-
gerente de desenvolvi- mento de teste supervi- realiza o pré-teste. organiza painel de mento de teste e o líder
mento de teste super- siona a revisão de itens e revisão. da equipe supervisionam
visionam a elaboração questões e realiza pré- a versão preliminar dos
preliminar da versão final -testes adicionais, se itens, das questões e do
dos itens, questionários e necessário. manual de aplicação.
do manual de aplicação.
11. O órgão implementador 12. O órgão implementador 13. O órgão implementador 14. O órgão implementador 15. O órgão implementador
organiza painel de seleciona a amostra providencia a impressão treina aplicadores de supervisiona a aplicação
revisão. de escolas. de testes, questionários teste e questionário, da avaliação nacional.
e manuais. usando o manual.
20. O Ministério da Educação 19. O Ministério da 18. O órgão implementador 17. O órgão implementador 16. O órgão implementador
e outros utilizam os Educação ou a CCN elabora versões prelimi- analisa os dados. supervisiona a pontuação
resultados. publica os relatórios. nares de relatórios e os dos testes, gravando
submete ao Ministério da todos os resultados e
Educação ou à CCN e fazendo a limpeza dos
outros para revisão. dados.
Fonte: Autores.
TABELA 1.1
Etapas da Avaliação Nacional para Desenvolvimento de Teste e Elaboração de Questionário
2 DESENVOLVIMENTO
DE UM MARCO DE
REFERÊNCIA DA
AVALIAÇÃO
P
ara que se possa determinar os conteúdos de
uma avaliação, é fundamental dispor de um
marco de referência que forneça um quadro
geral ou plano para orientar o desenvolvimento de testes de avaliação,
questionários e procedimentos (Linn e Dunbar, 1992; Mullis et al.,
2006). Tal marco de referência ajuda a fornecer uma boa compreensão
do conceito que está sendo avaliado (por exemplo, aproveitamento em
leitura ou matemática) e dos vários processos associados ao conceito.
Deve incluir uma definição do que está sendo avaliado, identificar as
características das tarefas realizadas durante o desenvolvimento do teste
e fornecer uma base para a interpretação dos resultados (Kirsch, 2001;
Messick, 1987). Um marco de referência pode ajudar a explicar o ob-
jetivo de uma avaliação. Pode facilitar discussões e o processo decisório
entre os interessados nas questões educacionais, esclarecendo conceitos-
-chave antes que se dê início à avaliação. O marco de referência também
pode identificar variáveis-chave que tenham a probabilidade de estar
associadas aos resultados (a pontuação) do teste, e pode ajudar a garantir
que essas variáveis sejam incluídas no projeto da avaliação nacional.
Inicialmente, a comissão de coordenação deve concordar quanto à
definição do que deve ser medido. Em muitas situações, o documento
10 | SÉRIE P ESQ UISAS DO BANC O M U N DI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
QU A D R O 2 . 1
QU A D R O 2 . 2
Comportamentos intelectuais
Computação Conceitos Solução de problemas
Habili-
dade de Habili- Habili- Habili-
Conheci- Compreen- Compreen- Compreen- traduzir dade de Habili- dade de dade de
mento Habili- são de são de são de elementos ler e dade de analisar resolver
de dade para conceitos princípios estrutura de um interpretar resolver e fazer problemas
termos realizar matemá- matemá- matemá- formulário gráficos e problemas compa- não
Áreas de e fatos operações ticos ticos tica para outro diagramas de rotina rações rotineiros Total
conteúdo (A1) (A2) Total (B1) (B2) (B3) (B4) (B5) Total (C1) (C2) (C3) Total geral
1. Números 1 25 26 1 4 7 2 4 18 14 2 2 18 62
inteiros
2. Frações 4 4 4 1 2 7 5 5 16
3. Decimais 8 8 5 1 6 5 19
4. Medida 2 2 3 2 5 3 3 10
5. Geometria 0 2 2 4 0 4
6. Mapas e 0 0 4 4 4
gráficos
Total geral 3 37 40 7 7 14 5 7 40 27 6 2 35 115
TABELA 2.2
Tabela de Especificações de Matemática do TIMMS, 3a e 4a Séries
(Na média, a probabilidade deve ser de 50%, pois isso ajudará a maxi-
mizar a variação das pontuações nos testes dos alunos.) A outra terça
parte do teste deve estar uniformemente dividida entre itens que mais
de 70% dos alunos que fazem o teste tenham a probabilidade de respon-
der corretamente e itens que menos de 30% tenham a probabilidade de
responder corretamente. Embora a sensibilidade ao aproveitamento dos
alunos refletida nesses números seja importante, não deve levar à exclu-
são de áreas importantes do currículo simplesmente porque os alunos
se saem muito mal ou muito bem nelas. A adequação de itens deve ser
estabelecida no programa de pré-teste, em que os itens são aplicados a
alunos com características similares às encontradas na população-alvo da
avaliação nacional.
TABELA 2.3
Tabela de Especificações do Conteúdo de Matemática em Papua Nova Guiné
VALIDADE
IDIOMA DO TESTE
FORMATO DO ITEM
yMúltipla escolha
yResposta fechada
yResposta curta aberta
yRedação ou resposta dissertativa
QU A D R O 2 . 3
2. Uma caixa de suco de laranja custa R$3,35. Um pão de forma custa R$2,75.
Qual dos valores a seguir é o menor de que você precisa para comprar o
suco de laranja e o pão?
QU A D R O 2 . 4
2.000 + + 30 + 9 = 2.739
Que número deve ser colocado onde está o para que a sentença seja verdadeira?
Resposta: _________________
QU A D R O 2 . 5
QU A D R O 2 . 6
A imagem do estímulo mostrada no exemplo foi usada em Papua Nova Guiné a fim
de avaliar as habilidades linguísticas dos alunos para elaborar uma história narrativa.
O aplicador do teste disse aos alunos que poderiam usar as ideias contidas na figura
ou elaborar suas próprias ideias para uma história sobre caçada.
TABELA 2.5
Formato de Itens do Teste de Matemática de Papua Nova Guiné
que, a essa altura, a maior parte dos alunos deve conseguir ler; ou pode-
ria justificar um teste durante a 8a série para avaliar o aproveitamento do
aprendizado dos alunos nesse importante ponto do sistema educacional.
O documento do marco de referência também poderia especificar sub-
populações de alunos que poderiam ser excluídos da amostra nacional,
como alunos com necessidades educacionais especiais ou alunos de es-
colas pequenas em áreas muito remotas.
APRESENTAÇÃO DE RESULTADOS
CONTEXTOS
NOTAS
1. Após o terceiro estudo, esta série de estudos passou a se chamar Tendências Interna-
cionais no Estudo de Matemática e Ciências, e a sigla TIMSS foi mantida.
2. Note-se que, em alguns países, existe uma resistência à ideia de se coletarem dados
sobre as características socioeconômicas.
CAPÍTULO
3 ELABORAÇÃO DE ITENS
E
ste capítulo descreve as características de bons
itens num teste, as diretrizes para a elaboração
de itens, a estruturação e organização de itens
que comporão um teste, e a pontuação de itens.1 Também descreve os
papéis do pessoal envolvido no desenvolvimento do teste – a equipe de
elaboração de itens e outros revisores –, que trabalha sob a orientação do
gerente de desenvolvimento de teste.
Deve-se ter em mente que a qualidade de um teste depende, em
grande medida, de quão claramente atenda a seu objetivo e da exatidão
com que os itens correspondam a uma tabela de especificações bem
concebida. Os itens de boa qualidade são claros, relevantes para o currí-
culo e focalizam um aspecto claramente definido do aprendizado. Eles
apresentam tarefas atraentes, genuínas, e não distinguem entre alunos de
diferentes contextos idiomáticos e culturais.
Um bom item tem as seguintes características:
yÉ justo.
yO estímulo gira em torno de questões centrais, e não de detalhes
periféricos ou triviais.
yDeixa claro para os alunos o que se pede deles.
yTem sentido intrínseco e não depende da compreensão de algo que
constituía a base de um item anterior.
ySe for um item sobre vocabulário, é direcionado para o significado da
palavra no contexto do texto, e não para um conhecimento geral.
yDe preferência, é expresso em termos positivos, pois formas negati-
vas tendem a causar confusão.
TENDENCIOSIDADE DO ITEM
MATERIAL DE ESTÍMULO
QU A D R O 3 . 1
80 cm
QU A D R O 3 . 2
160 Mario
altura (cm)
120
Lita
80
40
0
2 4 6 8 10
idade (anos)
36 | SÉRIE P ESQ UISAS DO BANC O M U N DI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
FORMATO DO ITEM
QU A D R O 3 . 3
Tânia tem três flores. Ganha mais duas flores do seu pai. comando
Quantas flores Tânia tem ao todo?
A 2
B 3 distratores
C 4
QU A D R O 3 . 4
QU A D R O 3 . 5
QU A D R O 3 . 6
Reduzindo a Leitura
Por quanto tempo Joel ficará na casa de seu avô?
Não assim Mas assim
Carlos foi para Carlos e sua família foram para
A o rio com sua família. A rio.
B a praia com sua família. B praia.
C o campo com sua família. C campo.
D as montanhas com sua família. D montanhas.
QU A D R O 3 . 7
QU A D R O 3 . 8
QU A D R O 3 . 9
uma ou duas palavras ou uma linha num diagrama são suficientes para
a resposta. Itens de resposta fechada em geral têm um número muito
limitado de respostas corretas.
Itens abertos devem se referir a habilidades significativas em áreas-
-chave do currículo, de modo a justificar o tempo de teste que os alunos
gastarão para respondê-los. Os alunos também devem ter a possibilidade
de dar breves respostas corretas a itens abertos. A maior parte do tempo
que os alunos gastam com um item deve ser devotada a encontrar uma
solução, e não a registrar suas respostas.
Num item de resposta curta, é importante considerar qual poderia
ser uma resposta incorreta. Se todas as respostas coerentes imagináveis
têm a probabilidade de ser corretas, talvez o item pouco contribua para
a avaliação de uma habilidade específica. O item deve ser construído de
forma a garantir que existam respostas incorretas plausíveis.
Certifique-se de que itens de resposta curta têm mais de duas respos-
tas possíveis. Itens para os quais existam apenas duas possíveis opções,
como “fechado” ou “aberto”, dão aos alunos uma chance de 50% de
adivinhar a resposta correta. Tal item poderia ser ampliado pedindo-se
aos alunos que deem razões para suas respostas. O item poderia, então,
ser pontuado em função da seleção correta de “aberto” ou “fechado” e
também da explicação. Alunos que selecionassem a opção correta, mas
não dessem uma explicação, receberiam a pontuação zero.
Os itens não devem dar ajuda excessiva ao leitor para que compre-
enda o significado do estímulo. Por exemplo, um item não deve resu-
mir as ideias-chave num parágrafo do estímulo ou deixar explícita uma
inferência no estímulo. É preferível citar algo do estímulo a resumir ou
interpretar o significado.
Um risco que se corre com os itens abertos é que os alunos podem
respondê-los superficialmente. A resposta “porque é importante”, por
exemplo, poderia ser tecnicamente correta em várias questões, mas seria
uma resposta fraca. Às vezes, uma resposta potencialmente superficial
pode ser incluída na questão para eliminá-la da gama de possíveis res-
postas corretas. Por exemplo, um item pode ser fraseado assim: “Por que
o acidente de Renata é importante nesta história?” Os alunos não podem
responder simplesmente “porque o acidente é importante”. Quando se
DESENVOLVIMENTO DE TESTES E QUESTIONÁRIOS PARA AVALIAÇÃO DO APROVEITAMENTO ESCOLAR | 43
QUADRO 3.10
____________________________________________________________________________
____________________________________________________________________________
3 pontos: descreve um quadrado de 20cm e uma caixa com dimensões de 110cm por
60cm por 20cm; também explica que esse tamanho de caixa tem a maior capaci-
dade
2 pontos: descreve um quadrado de 20cm a ser cortado em todos os cantos, mas não
dá qualquer explicação
9: em branco
44 | SÉRIE P ESQ UISAS DO BANC O M U N DI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
QU A D R O 3 . 1 1
QUADRO 3.12
Guia de pontuação:
3 pontos: desenha um quadrado com 4 lados de 10cm de comprimento e 4 ângulos
retos
2 pontos: desenha um retângulo com 2 lados de 10cm comprimento e 4 ângulos
retos
1 ponto: desenha uma forma de 4 lados com 2 lados de 10cm de comprimento, mas
sem ângulos retos
0 ponto: desenha qualquer outra forma
9: em branco
yOs alunos recebem uma pontuação mais alta para uma compreensão
mais sofisticada; por exemplo, a pontuação 2 num teste de leitura
poderia refletir a compreensão da ironia em determinada passagem,
enquanto a pontuação 1 é atribuída para a leitura literal do texto.
yUma pontuação 2 pode incluir a identificação tanto da causa quanto
da consequência, enquanto uma pontuação 1 requer a identificação
correta de apenas uma dessas.
yEm matemática, uma pontuação 3 é dada para a solução correta de
um problema e a explicação adequada do método, a pontuação 2
é atribuída para a solução correta sem uma explicação, enquanto a
pontuação 1 é dada para a descrição de um método adequado com
cálculos incorretos.
QU A D R O 3 . 1 3
João diz que Miguel agora tem uma chance de 160% de derrubar uma manga.
Explique.
____________________________________________________________________________
____________________________________________________________________________
Guia de pontuação:
9: em branco
QUADRO 3.14
Miguel está em sua fazenda tentando acertar algumas mangas com a atiradeira.
Quando a árvore tem 50 mangas, ele tem 20% de chance de acertar. Sua chance
de acertar uma manga duplica quando o número de mangas duplica. Estime a
chance de Miguel acertar uma manga numa árvore com 200 mangas.
________________________________________________________________________
Guia de pontuação:
0 ponto: qualquer outra resposta, inclusive simplesmente “80”, sem “%” ou “por
cento”
9: em branco
yOs itens devem ser independentes uns dos outros. Os alunos não
devem ter de responder a um item corretamente para responder a
outros itens corretamente.
48 | SÉRIE P ESQ UISAS DO BANC O M U N DI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
yOs itens não devem se superpor. Cada item deve avaliar um aspecto
claramente diferente do estímulo.
yOs itens devem avaliar uma gama de habilidades. Por exemplo, os
itens não devem avaliar repetidamente a recuperação de uma infor-
mação diretamente explicitada ou a ideia central de cada parágrafo
do estímulo.
yOs itens numa unidade devem cobrir uma gama de níveis de dificul-
dade, começando, em geral, com um item fácil.
yA informação dada no comando ou nas opções de múltipla escolha de
um item não deve ajudar o aluno a responder a outro item.
yOs itens devem avaliar aspectos significativos (e evitar aspectos tri-
viais) do estímulo.
yOs itens devem estar na mesma página que a unidade ou na página ao
lado (no caso de um estímulo longo).
Unidades com oito ou mais itens associados tendem a ter alguns itens
duplicados, superpostos ou triviais. Alguns itens podem ser eliminados
durante o painel de itens. Alternativamente, a equipe de desenvolvi-
mento de teste poderia desenvolver dois formulários para o pré-teste
usando a metade dos itens em um formulário e os demais no segundo.
A seção de linguagem encontrada em http://go.worldbank.org/
M2O1YDQO90 contém muitos exemplos de unidades seguidas de um
conjunto de questões. (Veja, por exemplo, os itens que se seguem a “Le-
bre Anuncia o Terremoto”, em Itens da Amostra de Leitura Internacional
para a 4a série do PIRLS de 2001 ou “O Acordo de Petra”, em Questões
da Amostra de “Lendo a Austrália”, Ano 3.)
ITENS DE PRÁTICA
Os itens de prática são essenciais para garantir que os alunos não sejam pe-
nalizados pela falta de familiaridade com o formato de itens ou com a for-
ma como devem apresentar suas respostas às questões do teste. Em geral,
o aplicador do teste repassa os itens de prática com os alunos, de acordo
com instruções muito específicas contidas no manual de aplicação.
DESENVOLVIMENTO DE TESTES E QUESTIONÁRIOS PARA AVALIAÇÃO DO APROVEITAMENTO ESCOLAR | 49
2 + 2 = __________
Diretrizes Básicas
QU A D R O 3 . 1 5
Parte A
Parte B
Parte C
Parte D
A Parte A
B Parte B
C Parte C
D Parte D
QU A D R O 3 . 1 6
C
A
D
E
QUADRO 3.17
Em que dia e em que momento a temperatura mostrada na tabela era a mesma que
a mostrada no termômetro?
40°
35°
TEMPERATURA 30°
6h 9h 12h 15h 18h 25°
20°
Segunda-feira 15° 17° 24° 21° 16° 15°
10°
Terça-feira 20° 16° 15° 10° 9°
5°
Quarta-feira 8° 14° 16° 19° 15°
Quinta-feira 8° 11° 19° 26° 20°
Termômetro
A. Segunda-feira, 12h
B. Terça-feira, 6h
C. Quarta-feira, 15h
D. Quinta-feira, 15h
QUADRO 3.18
Oceano
Ártico
ÁSIA
AMÉRICA EUROPE
DO NORTE
Oceano
Atlântico
ÁFRICA
Oceano
Oceano Pacífico
Pacífico
Equador
AMÉRICA
DO SUL Oceano
Índico
AUSTRÁLIA
Oceano
Antártico
QUADRO 3.19
A figura anterior mostra uma caixa contendo um material que poderia ser
um sólido, um líquido ou um gás. O material, então, é posto numa caixa
quatro vezes maior.
QU A D R O 3 . 2 0
<insira meia linha > (instrução para publicação em itálico e entre parênteses)
(tabela com 3 colunas e 2 linhas: títulos das colunas, Times New Roman 12 em negrito;
corpo da tabela, Times New Roman 12 sem negrito)
Esse guia mostra que os elaboradores de itens têm de dar à sua uni-
dade um título usando Arial 16 em negrito com maiúsculas. O restante
do texto do item é em Times New Roman. A maior parte é em tipo 12.
DESENVOLVIMENTO DE TESTES E QUESTIONÁRIOS PARA AVALIAÇÃO DO APROVEITAMENTO ESCOLAR | 59
PAINÉIS DE ITENS
yEncurtando-o.
yAcrescentando mais informação.
yMudando expressões ou o fraseado.
yAcrescentando um diagrama ou imagem.
yDando a ele um novo formato de item.
OUTROS REVISORES
RASTREAMENTO DE ITENS
NOTAS
1. Para informação adicional sobre a construção de itens de teste, ver Chatterji (2003),
Haladyna (1999), Kubiszyn e Borich (2000) e Linn e Miller (2004).
2. A Avaliação Nacional do Progresso Educacional dos Estados Unidos inclui um com-
ponente de escrita (Conselho Diretor da Avaliação Nacional, s.d.).
CAPÍTULO
4 PRÉ-TESTE
DE ITENS
A
construção de testes para uma avaliação na-
cional usa, na maior parte dos casos, a tec-
nologia que tem sido desenvolvida para o
desenho de testes destinados a avaliar e divulgar o aproveitamento de
alunos individuais. Como esses testes são usados para discriminar entre
desempenhos de alunos, todos os alunos farão basicamente o mesmo tes-
te. O objetivo de uma avaliação nacional é bastante diferente: não se tra-
ta de discriminar entre alunos, mas de descrever à medida que os alunos
num sistema educacional como um todo (ou em partes dele claramente
definidas) adquiriram os conhecimentos e habilidades prescritos em um
currículo. Para fazer isso, o teste deve fornece uma cobertura adequada
do currículo, o que pode requerer que se trabalhe com uma amostra do
conteúdo do currículo muito maior que a usada em testes destinados a
avaliar alunos individualmente. A necessidade de uma ampla cobertura
do currículo é reforçada quando uma avaliação busca identificar áreas de
currículo em que os alunos apresentam pontos fortes e pontos fracos.
Para lidar com essas questões, muitas avaliações nacionais e interna-
cionais usam um número muito maior de itens que o utilizado em um
teste concebido para avaliar alunos individualmente. No entanto, para
evitar pôr um peso muito grande sobre os alunos individualmente, cada
68 | SÉRIE P ESQ UISAS DO BANC O M U N DI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
A análise dos dados do pré-teste fornece a base para a seleção dos itens
que entrarão no teste final. Muitas avaliações nacionais preparam dife-
rentes formulários de cadernos de prova associados a cada série. Essa
DESENVOLVIMENTO DE TESTES E QUESTIONÁRIOS PARA AVALIAÇÃO DO APROVEITAMENTO ESCOLAR | 71
FIGURA 4.1
FIGURA 4.2
4 a 5 itens
3ª série 3ª série 3ª série
comuns a
Formulário A Formulário B Formulário C
3A e 3B
8 a 10 itens 8 a 10 itens 8 a 10 itens
comuns a comuns a comuns a
3A e 5A 3B e 5B 3C e 5C
4a5
itens
5ª série 5ª série 5ª série
comuns
Formulário A Formulário B Formulário C
a 5B
e 5C
8 a 10 itens 8 a 10 itens 8 a 10 itens
comuns a comuns a comuns a
5A e 7A 5B e 7B 5C e 7C
4 a 5 itens
7ª série 7ª série 7ª série
comuns a
Formulário A Formulário B Formulário C
7A e 7B
8 a 10 itens 8 a 10 itens 8 a 10 itens
comuns a comuns a comuns a
7A e 10A 7B e 10B 7C e 10C
4a5
itens
10ª Série 10ª série 10ª série
comuns
Formulário A Formulário B Formulário C
a 10B
e 10C
TABELA 4.1
Itens de Ligação em Duas Unidades de Leitura
TABELA 4.2
Parte de uma Planilha para Rastrear Itens em Diferentes Formulários
“Cachorros” R070101 1 1 4 4
“Cachorros” R070102 3 3 5 5
“Cachorros” R070103 2
“Cachorros” R070104 2
“Elisa” R070201 1
“Elisa” R070202 2 1
“Elisa” R070203 3 2
“Elisa” R070204 3
“Bang” R070301 4 6
“Bang” R070302 5 7
Fonte: Criação dos autores.
REALIZAÇÃO DO PRÉ-TESTE
Os alunos não devem ter qualquer dúvida sobre como apresentar suas
respostas a cada item ou questão do pré-teste ou do teste final. Os tes-
tes são projetados para testar o conhecimento de uma importante área
do currículo – não as habilidades dos alunos de adivinhar como devem
apresentar suas respostas. Os alunos devem receber oportunidades ade-
quadas durante o pré-teste, tanto no começo do pré-teste quanto no
início das seções dentro do pré-teste, para que façam os itens de prática.
É particularmente importante dar um número adequado de itens de prá-
tica (por exemplo, 3 ou 4) aos alunos de sistemas educacionais nos quais
não exista uma tradição de testes do tipo múltipla escolha.
O número de itens nos formulários de pré-teste pode ser igual ao
dos formulários finais ou ligeiramente menor. É importante que todos
os alunos tentem responder a todos os itens do pré-teste. Se o pré-teste
for muito longo, ou se contiver muitos itens difíceis na parte final, então
poucos itens do final do teste serão respondidos.
Comece cada formulário com alguns itens fáceis, para que os alunos
mais fracos sintam-se encorajados a tentar fazer todo o teste. Em geral,
é desejável distribuir a dificuldade dos itens subsequentes de tal modo
que os alunos persistam, em vez de abandonarem todo o teste quando
se defrontarem com uma série de itens difíceis. Tente fazer com que a
dificuldade geral de cada formulário do pré-teste seja basicamente igual.
Evite que qualquer um dos formulários esteja cheio de itens difíceis,
porque os alunos podem desistir. Se isso acontecer, os itens na parte
final do formulário não terão dados suficientes para que se possa fazer
uma boa análise do pré-teste.
O pré-teste oferece a oportunidade de se experimentar versões alter-
nativas de itens em diferentes formulários. Por exemplo, um item pode
DESENVOLVIMENTO DE TESTES E QUESTIONÁRIOS PARA AVALIAÇÃO DO APROVEITAMENTO ESCOLAR | 79
QU A D R O 4 . 1
OU
13 + 17 + 8 = _______
PONTUAÇÃO DO PRÉ-TESTE
ySe 15% ou mais dos alunos não tiverem tentado responder a vários
itens no final de um teste, o pré-teste pode ter sido muito longo.
Considere fazer o teste final mais fácil, mais curto ou ambos.
ySe 15% ou mais dos alunos não tiverem tentado responder a um item
que não está no final do teste, pode haver algo errado na forma como
o item foi apresentado ou ele pode ser muito difícil. Os alunos po-
dem ter ignorado o item, não souberam como registrar sua resposta
ou não compreenderam o fraseado. Considere rever e fazer o pré-
-teste de um novo item.
ySe certo grupo na população (por exemplo, 15% ou mais de meninas)
não tiver tentado responder a um item que foi respondido pela maior
parte dos alunos, o item pode ser tendencioso. Considere não incluí-
-lo no teste final.
ySe 15% ou mais dos alunos consistentemente não tentaram responder
a itens num formato específico (por exemplo, itens abertos), esses
alunos podem não ter compreendido como registrar suas respostas
ou podem ter precisado de mais itens de prática para aprender a res-
ponder a esse tipo de item. Considere acrescentar itens de prática
adicionais ou faça uma amostra de itens desse formato e teste-os no-
vamente.
QU A D R O 4 . 2
Almir Barros 2 3 2 1
Opções escolhidas por cada
Míriam Campos 4 3 2 4 aluno para cada item
Alberto Duarte 2 3 1 4
Fonte: Autores.
CONFIABILIDADE
5 SELEÇÃO DE
ITENS DO TESTE
A
seleção de itens do pré-teste para o teste
final (coberta, em mais detalhes, no Vo-
lume 4) depende, em primeiro lugar, e
principalmente, do marco de referência, especialmente da tabela
de especificações. Em segundo lugar, das propriedades de mensu-
ração dos itens.
Tipicamente, os seguintes critérios de seleção são adotados para cada
item:1
TABELA 5.1
Exemplo de Resultado da Análise de um Item de Múltipla Escolha
Critério Opção
A (0) B (0) C (0) D (1)
Contagem 90 14 21 254
Percentual 23,7 3,7 5,5 67,0
Ponto bisserial −0,26 −0,21 −0,16 0,39
Habilidade média −0,02 −0,48 −0,14 0,54
Fonte: Criação dos autores.
TABELA 5.2
Exemplo de Resultado da Análise de um Item Aberto de Crédito Parcial
Índice de
Categoria de resposta dos alunos discriminação = 0,47
Critério 0 (0) 1 (1) 2 (2) 9 (0)
Contagem 1.466 425 268 809
Percentual 49,4 14,3 9,0 27,3
Ponto bisserial 0,09 0,11 0,45 −0,48
Habilidade média −1,66 0,53 0,90 −1,90
Fonte: Criação dos autores.
NOTA
1. Os exemplos usados neste capítulo baseiam-se em análises de itens que usam a abor-
dagem da teoria clássica dos testes. O Volume 4 contém essa abordagem de forma
mais detalhada. Também apresenta outro método de análise de itens, a teoria de
resposta ao item, que usa uma abordagem estatística diferente e uma terminologia
um pouco diferente.
CAPÍTULO
6 PRODUÇÃO
DO TESTE FINAL
yNome da escola
yNome completo do aluno
yGênero do aluno
yIdade ou data de nascimento do aluno
ySérie ou classe do aluno
yIdioma do aluno [primeiro idioma e o falado em casa].
QU A D R O 6 . 1
Escola _____________________________________________________________________
Estado _____________________________________________________________________
Série _______________________________________________________________________
Primeiro nome ______________________________________________________________
Sobrenome _________________________________________________________________
Sou um menino. Sou uma menina.
Idade: anos e meses
O idioma que uso com mais frequência em casa é o português. Sim Não
IMPRESSÃO E REVISÃO
7 PONTUAÇÃO MANUAL
DOS ITENS DO TESTE
A
equipe da avaliação nacional deve se certi-
ficar de que os avaliadores que vão fazer a
pontuação manual dos formulários finais do
teste estejam bem treinados. A essa altura, os guias de pontuação já
terão sido revisados durante o pré-teste e deverão estar na forma quase
final. Antes de começar a pontuação manual final, os elaboradores de
itens poderiam selecionar uma pequena amostra de formulários finais
completados, conferir a clareza e eficiência dos guias de pontuação e,
possivelmente, fazer pequenas revisões.
É preciso planejar com bastante antecedência o estabelecimento de
um centro de classificação para a pontuação manual e definir processos
eficazes de pontuação. A equipe da avaliação nacional deve ter respon-
dido às seguintes questões antes de dar início à pontuação manual:
yO treinador pede aos avaliadores que respondam a cada item pontua-
do manualmente no teste. Esse processo familiariza os avaliadores
com o item e garante que o leram e entenderam adequadamente.
yO treinador dá a cada avaliador 4 ou 5 cadernos de prova respondidos
por alunos. O treinador discute o primeiro item e o guia de pontua-
ção e, então, os avaliadores pontuam esse item em seus cadernos de
prova. O treinador encoraja o grupo a discutir quaisquer discrepân-
cias ou dúvidas sobre como pontuar uma resposta. Os avaliadores
são encorajados a partilhar respostas que possam ser diferentes dos
exemplos no guia de pontuação. Depois que o primeiro item tiver
sido adequadamente discutido, o treinador passa para o item seguinte
e para as orientações para pontuá-lo. Em geral, esse método de trei-
namento requer várias horas.
yOs avaliadores têm uma segunda sessão de treinamento na qual tra-
balham em pares. Pontuam alguns testes individualmente e, então,
conferem o trabalho uns dos outros e discutem os itens sobre os quais
tiveram julgamentos diferentes. Se não puderem chegar a um acordo,
devem consultar o treinador. Depois de encerradas as sessões de trei-
namento, o avaliador líder assume a responsabilidade pelo gerencia-
DESENVOLVIMENTO DE TESTES E QUESTIONÁRIOS PARA AVALIAÇÃO DO APROVEITAMENTO ESCOLAR | 105
três horas pela manhã, com um breve intervalo, e uma sessão de três
horas à tarde, com um breve intervalo. As pessoas que trabalham mais
lentamente podem necessitar de uma meia hora extra para completar o
número esperado de testes por dia. Deve-se exigir dos avaliadores que
completem uma folha de presença diária.
PA R T E
II CONSTRUÇÃO DE
QUESTIONÁRIOS
CAPÍTULO
8 DESENHO DE
QUESTIONÁRIOS
U
m questionário é um conjunto de itens de-
senhados para obter informações sobre uma
pessoa. O tipo de informação pode variar
amplamente e incluir dados sobre características pessoais; qualificações
e práticas de trabalho; condições de trabalho e recursos; ou fatores so-
cioeconômicos e contextuais de uma pessoa, bem como suas atitudes,
crenças ou opiniões a respeito de certas questões.
Uma avaliação nacional busca obter uma estimativa confiável do apro-
veitamento dos alunos (medido num teste especialmente concebido para
isso) e informações (obtidas com um questionário) sobre variáveis-chave
associadas a diferenças no aproveitamento. Os testes coletam informação
sobre o desempenho dos alunos, e os questionários – quando usados junto
com os testes – coletam dados sobre variáveis que poderiam estar associa-
das a diferenças nos níveis de desempenho dos alunos ou ajudar a explicá-
-las. Por exemplo, os dados do questionário podem sugerir que escolas
que não têm bibliotecas estão associadas ao baixo desempenho dos alunos
ou que escolas em que os professores participam regularmente de progra-
mas de desenvolvimento profissional estão associadas ao alto desempenho
dos alunos. Esses dados sugerem formas úteis de redirecionar os recursos
educacionais para aprimorar o aprendizado dos alunos.
110 | SÉRIE P ESQ UISAS DO BANC O M U NDI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
CONTEÚDO DO QUESTIONÁRIO
yGênero, idade e idioma (em geral, esses dados são coletados na pági-
na de rosto do caderno de prova).
yAntecedentes educacionais, como anos de escolaridade e períodos
fora da escola.
yOportunidades de frequentar uma escola.
yExpectativas de sucesso e atitudes pessoais ou familiares sobre os va-
lores da escola.
yPercepções sobre o ambiente da sala de aula, como sentimento de
segurança, camaradagem de outros alunos ou apoio dos professores.
114 | SÉRIE P ESQ UISAS DO BANC O M U NDI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
yGênero e idade.
yPrimeiro idioma.
yCondições de ensino, como tamanho da classe, acesso a recursos,
percentual de alunos que têm livros didáticos, acesso a professores
substitutos em casos de doença e assistência para lidar com alunos
desafiadores.
yExperiência educacional, qualificações como professor e número de
anos nesta escola.
DESENVOLVIMENTO DE TESTES E QUESTIONÁRIOS PARA AVALIAÇÃO DO APROVEITAMENTO ESCOLAR | 115
yGênero e idade.
yExperiência educacional e gerencial, e qualificações.
yAmbiente da escola, como qualidade dos prédios e instalações, bem
como disponibilidade de recursos.
yRegistros da escola, como flutuações no número de alunos, taxa de
absenteísmo de alunos ou professores, e frequência com que os alu-
nos mudam de escola.
yCompromisso profissional com a liderança da escola, como interes-
se pelo desenvolvimento profissional e acesso a ele, e interesse pela
educação.
yEstilo de liderança e uso do tempo.
ySatisfação com as condições de trabalho, como carreira, remunera-
ção, e nível e frequência de supervisão.
yRelacionamento com a comunidade escolar, como interações com os
pais e participação em eventos da comunidade local.
116 | SÉRIE P ESQ UISAS DO BANC O M U NDI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
ITENS DO QUESTIONÁRIO
QU A D R O 8 . 1
Parte II
Atitudes com Crenças sobre a vida em Percepções da
relação à escola Papua Nova Guiné comunidade local
Crenças sobre Atitudes com relação à Nível de cooperação
aproveitamento pessoal, educação: ensino no percebido na comuni-
duração pretendida da idioma local, educação dade local: apoio à esco-
escolarização e planos compulsória, papel da la, envolvimento local em
pessoais para o futuro escola, educação de meni- eventos da comunidade
nas e papéis das mulheres e partilha de recursos
Percepções de ajuda Atitudes com relação à Atitude percebida da
recebida de professores, comunidade: intenção comunidade local com
camaradagem dos alunos, pessoal de permanecer relação a meninas e
intimidação e disposição na comunidade local ou mulheres
para fazer amizade com razões para sair
pessoas de fora da
comunidade
Parte III
Crenças sobre a vida Percepções da
Valores em Papua Nova Guiné comunidade local
Valores sobre resolução de Atitudes com relação a Nível percebido de
conflitos conflitos e solução de emprego construtivo na
disputas comunidade local e uso
de meios pacíficos para
resolver problemas
Valores sobre hábitos de Atitudes com relação a Percepções de
higiene pessoal álcool e drogas problemas causados
pelo uso de drogas e
álcool na comunidade
local
Fonte: Papua Nova Guiné, Departamento de Educação 2004.
118 | SÉRIE P ESQ UISAS DO BANC O M U NDI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
TABELA 8.2
Funções da Leitura num Estudo Internacional: Pesos Usados para Criar Duas Novas
Variáveis , “Leitura com um Objetivo Utilitário” e “Leitura por Prazer”
Pesos
Item (abreviado) Objetivo utilitário Prazer
Ajuda-me na escola. 0,75
Ajuda-me a passar nas provas. 0,74
Ajuda-me com temas futuros na escola. 0,73
Ajuda-me a trabalhar melhor. 0,65
Posso passar para a faculdade. 0,65
Ajuda-me a conseguir um bom emprego. 0,63
Meus pais acham que é importante. 0,58
É prazeroso. 0,76
É empolgante. 0,72
É interessante. 0,71
É como entrar em outro mundo. 0,68
É bom pensar sobre coisas que leio. 0,54
É divertido pensar que sou um personagem 0,53
numa história.
É bom ficar sozinho. 0,53
Ajuda-me a relaxar. 0,50
Fonte: Dados extraídos de Greaney e Neuman, 1990 (Tabela 8, registros inferiores a 0,20 foram ex-
cluídos).
DESENVOLVIMENTO DE TESTES E QUESTIONÁRIOS PARA AVALIAÇÃO DO APROVEITAMENTO ESCOLAR | 119
FORMATO DO ITEM
IDIOMA DO QUESTIONÁRIO
RESPONDENTES
APLICAÇÃO DO QUESTIONÁRIO
9 ELABORAÇÃO DE ITENS
DE QUESTIONÁRIOS
A
partir da forma como um item é construído,
deve estar claro qual é a informação reque-
rida. Além disso, os respondentes devem ser
capazes de fornecer essa informação. Assim, não se pediria a alunos das
primeiras séries para lembrar quantos dias faltaram às aulas durante o
ano escolar, porque provavelmente não seriam capazes de dar uma res-
posta confiável. Na melhor das hipóteses, poderiam se lembrar de quan-
tos dias faltaram na semana anterior.
O fraseado dos itens deve ser o mais simples e claro possível. O vo-
cabulário deve ser familiar, e as sentenças devem ser curtas e diretas. A
menos que seja aplicado oralmente, todos os respondentes devem ser
capazes de ler o questionário. Também é importante que todos inter-
pretem os itens do questionário do mesmo modo. Caso contrário, será
difícil interpretar os resultados de maneira significativa.
A primeira parte do item de um questionário pode ser uma questão,
uma sentença incompleta ou uma afirmação que os respondentes devem
avaliar.
Os respondentes devem ser abordados num estilo consistente. Uma
das duas formas pode ser usada:
126 | SÉRIE P ESQ UISAS DO BANC O M U NDI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
QUESTÕES
AFIRMAÇÕES
Itens que começam com uma afirmação em geral requerem que os res-
pondentes façam algum tipo de avaliação da afirmação, como “concordo
fortemente”, “concordo”, “discordo” ou “discordo fortemente”.
DESENVOLVIMENTO DE TESTES E QUESTIONÁRIOS PARA AVALIAÇÃO DO APROVEITAMENTO ESCOLAR | 127
CATEGORIAS DE RESPOSTAS
ySim, não
yConcordo fortemente, concordo, discordo, discordo fortemente
yQuase todos os dias, uma ou duas vezes por semana, uma ou duas
vezes por mês, nunca ou quase nunca
yDe jeito nenhum, um pouco, bastante, muito
yNão tem importância, um pouco importante, muito importante.
DIAGRAMAÇÃO DO QUESTIONÁRIO
QU A D R O 9 . 1
Quanto tempo você leva para chegar à escola na maior parte dos dias?
Fonte: Autores.
DESENVOLVIMENTO DE TESTES E QUESTIONÁRIOS PARA AVALIAÇÃO DO APROVEITAMENTO ESCOLAR | 131
QU A D R O 9 . 2
Com que frequência as seguintes pessoas de sua família o ajudam em seu dever de casa?
Fonte: Autores.
10 CODIFICAÇÃO DAS
RESPOSTAS DOS
QUESTIONÁRIOS
A
ntes de dar entrada no computador, as cate-
gorias de respostas têm de ser codificadas. A
codificação pode ser alfabética ou numérica.
Os códigos alfabéticos em geral requerem que os respondentes façam
um círculo em torno de uma letra para dar sua resposta. Esse método
pode não ser adequado para alunos mais jovens. Marcar uma caixa ou
sombrear círculos pode ser uma tarefa mais fácil para pessoas com habi-
lidades de letramento limitadas. Se os itens usarem esse tipo de diagra-
mação, deverão ser codificados numericamente.
Se for usada a codificação numérica, a primeira categoria de respos-
ta recebe, em geral, o código 1, a segunda recebe o código 2, e assim
por diante. A entrada de dados é mais eficiente se os códigos estiverem
impressos no questionário. Pode-se usar uma fonte pequena em escala
cinza, conforme se vê no Quadro 10.1. No exemplo, as categorias de
resposta estão numeradas sob as caixas: andando é a categoria 1, trans-
porte público é a categoria 2, e assim por diante. O aluno marca a caixa
que se aplica ao seu caso. A pessoa que faz a entrada de dados dá entrada
no número da caixa que o aluno selecionou.
Se os respondentes tiverem a oportunidade de selecionar mais de uma
categoria de resposta para um item, cada categoria deve ser tratada como
134 | SÉRIE P ESQ UISAS DO BANC O M U NDI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
QUADRO 10.1
QUADRO 10.2
Fonte: Autores.
11 CORRESPONDÊNCIA
ENTRE QUESTIONÁRIOS
E DADOS DO TESTE
A
correspondência entre os dados do ques-
tionário e os do teste será orientada pelas
necessidades da análise e da apresentação
dos resultados. Todas as correspondências devem ser estabelecidas cla-
ramente e sem ambiguidades antes da coleta de dados. Poderá ser difícil
ou impossível corrigir qualquer erro de correspondência descoberto de-
pois que os dados tiverem sido coletados. Esses erros podem fazer com
que se tenha de abandonar algumas das análises planejadas.
III DESENHO DE UM
MANUAL PARA
APLICAÇÃO DO TESTE
CAPÍTULO
12 O MANUAL DO
APLICADOR DE TESTE
CONTEÚDO DO MANUAL
serão usados.
yQuais os testes aplicados, quais os alunos testados e quando são tes-
tados?
c Quais testes estão sendo aplicados na escola.
lápis e borrachas.
yComo a sala deve ser preparada para o teste?
c Instalações físicas que a escola precisa fornecer, como carteiras e
cadeiras.
c Os recursos que poderiam ajudar os alunos devem ser retirados da
do teste.
yComo os materiais do teste devem ser guardados?
c Procedimentos para garantir a segurança dos materiais antes, du-
USO DO MANUAL
CARACTERÍSTICAS DE UM MANUAL
QU A D R O 1 2 . 1
Por favor, leia este Manual de Aplicação antes que seus alunos façam o teste.
y O teste está dividido em quatro sessões. Os alunos devem fazer duas ses-
sões por dia.
y Não deixe que os alunos façam todo o teste de uma única vez.
Regras de Aplicação
y Os alunos NÃO devem levar os cadernos de prova para fora da sala ou traba-
lhar neles depois que o professor tiver saído.
y Os alunos devem usar lápis com borrachas na ponta, fornecidos pela escola.
y Os alunos não devem usar nenhum material da sala de aula, como livros de
exercícios, dicionários ou calculadoras, enquanto fazem o teste.
y Os alunos não devem receber ajuda para responder às questões. Por exem-
plo, se um aluno não compreender o que deve ser feito, explique de novo
as questões de prática e diga para que faça o melhor possível, mas não dê
qualquer ajuda adicional.
Segurança do Teste
QUADRO 12.2
Materiais do Teste
Seu Inspetor Escolar lhe dirá quais turmas em sua escola devem participar deste teste.
y um questionário para cada professor participante com questões sobre seu his-
tórico
Se estiver faltando algum material, ou se esses não forem suficientes, por favor,
contate seu Inspetor Escolar
QUESTÕES DE PRÁTICA
O manual deve estar preparado para ser testado durante o pré-teste dos
itens do teste. O pré-teste do manual revelará quaisquer equívocos ou
ambiguidades que requeiram esclarecimento ou refinamento na versão
final. Como as condições do pré-teste ou teste-piloto devem ser tão se-
melhantes quanto possível às do teste final, o manual deve estar o mais
próximo possível da forma final quando se fizer o teste dos itens.
QU A D R O 1 2 . 3
DIGA
Vamos trabalhar um pouco com matemática hoje, para que vocês descubram
todas as coisas diferentes que podem fazer em matemática. Em primeiro lu-
gar, faremos algumas questões de prática, para que vocês saibam como fazer
e como mostrar suas respostas.
DIGA
Espere até que todos os alunos tenham terminado e, então, verifique suas res-
postas.
DIGA
Espere até que todos os alunos tenham corrigido seus trabalhos, se necessário.
REVISÃO
13 O APLICADOR
DO TESTE
OBSERVAÇÃO DE INSTRUÇÕES
GARANTIA DA QUALIDADE
QUADRO 13.1
Nome Data
Tarefa Referência Tempo Completado
1. Complete o formulário Alocação do Formulário 10min
Caderno de Prova do Aluno (ACPA) ACPA
inserindo o número do teste em ordem
consecutiva e colocando os nomes dos
alunos em ordem alfabética.
2. Aplique o questionário do professor. Formulário do 15min
questionário
do professor
3. Complete o formulário de comentários. Formulário de 10min
comentários do
professor
4. Distribua o teste a cada aluno e Formulário 10min
marque ausente naqueles que não ACPA
compareceram.
5. Leia a introdução das Diretrizes. Diretrizes para 5min
o Aplicador,
p. 7
6. Peça aos alunos para fornecer os dados Diretrizes para 5min
relativos ao aluno na folha de rosto do o Aplicador,
teste. p. 9
7. Verifique se todos os alunos 10min
completaram os detalhes sobre os
alunos na folha de rosto.
8. Siga as instruções para a Sessão 1. Diretrizes para 60min
o Aplicador,
pp. 11-13
9. Nos intervalos, peça aos alunos que 15min
saiam da sala em fila e deixem seus
testes sobre as carteiras.
10. Siga as instruções para a Sessão 2. Diretrizes para 60min
o Aplicador,
pp. 15-17
158 | SÉRIE P ESQ UISAS DO BANC O M U NDI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
Nome Data
Tarefa Referência Tempo Completado
11. Nos intervalos, peça aos alunos que 15min
saiam da sala em fila e deixem seus
testes sobre as carteiras.
12. Siga as instruções para a Sessão 3. Diretrizes para 70min
o Aplicador,
pp. 19-21
13. Recolha todos os cadernos de prova e Formulário 10min
confira seu retorno usando o formulário ACPA
ACPA.
14. Conte todos os testes e certifique-se de Formulário 5min
que todos foram devolvidos. ACPA
15. Dispense a turma. 2min
14 INFORMANDO AS
ESCOLAS SOBRE A
AVALIAÇÃO NACIONAL
O
s alunos precisam ser motivados para ten-
tar fazer o melhor possível numa avaliação
nacional. Em geral, é mais fácil motivar os
alunos quando os professores explicam a eles o objetivo do teste e se
certificam de que compreenderam que o resultado final será usado para
ajudar a aprimorar a qualidade da educação, e não para julgar os alunos
ou as escolas.
Todos os alunos precisam se sentir encorajados a participar, espe-
cialmente aqueles com menos habilidades. A decisão sobre o melhor
momento para informar aos alunos as datas do teste dependerá das cir-
cunstâncias da escola. Se os alunos se sentirem ameaçados por um teste
e ficarem longe da escola, então é preferível não dizer a eles a data exata
da aplicação do teste. Se os alunos estiverem animados com a possibi-
lidade de fazer um teste e se sentirem mais confortáveis para vir para a
escola, então é preferível dizer a eles a data exata.
O órgão implementador deve certificar-se de que as escolas estejam
informadas sobre o objetivo do teste com bastante antecedência. A in-
formação pode ser dada por meio de seminários, cartas ou contatos te-
lefônicos. É aconselhável ser honesto e claro sobre quais dados estão
sendo coletados, como serão apresentados e usados e quais informações
160 | SÉRIE P ESQ UISAS DO BANC O M U NDI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
A GLOSSÁRIO
item de crédito parcial: Item que tem duas ou mais categorias de respos-
tas corretas; em geral, essas categorias são hierárquicas para os itens do
formulário final do teste, mas podem não ser para itens do pré-teste ou
itens de teste.
itens abertos de resposta curta: Itens que requerem que um aluno gere
uma resposta curta, tal como uma ou duas sentenças, ou faça diversas
modificações numa tabela, num gráfico ou diagrama.
itens de resposta fechada: Itens que requerem que os alunos produzam uma
resposta curta com um conjunto pequeno e finito de respostas corretas.
164 | SÉRIE P ESQ UISAS DO BANC O M U NDI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
painel de itens: Pequeno grupo de três a seis pessoas que fazem a revisão
crítica e refinam todos os aspectos dos itens para garantir que sejam de
alta qualidade.
respostas em branco: Itens aos quais o aluno não fez qualquer tentativa
de responder.
B LEITURA ADICIONAL
Allen, N. L., J. R. Donoghue e T. L. Schoeps. 2001. The NAEP 1998 Technical Re-
port. Washington, DC: National Center for Education Statistics.
Baker, F. 2001. The Basics of Item Response Theory. College Park, MD: ERIC Clear-
inghouse on Assessment and Evaluation, University of Maryland.
Beaton, A. E. e E. G. Johnson. 1989. “Overview of the Scaling Methodology used in
the National Assessment.” Journal of Educational Measurement 29: 163–75.
Bloom, B. S., M. D. Engelhart, E. J. Furst, W. H. Hill e D. R. Krathwohl. 1956.
Taxonomy of Educational Objectives: Handbook 1 – Cognitive Domain. Londres:
Longmans, Green.
Campbell, J. R., D. L. Kelly, I. V. S. Mullis, M. O. Martin e M. Sainsbury. 2001.
Framework and Specifications for PIRLS Assessment 2001. Chestnut Hill, MA:
International Study Center, Boston College.
Chatterji, M. 2003. Designing and Using Tools for Educational Assessment. Boston:
Allyn and Bacon.
Centro de Pesquisas Educacionais. 1978. Drumcondra Attainment Tests, Manual,
Level II, Form A. Dublin: Educational Research Centre.
Conselho Australiano de Pesquisas Educacionais. S.d. Literacy and Numeracy Na-
tional Assessment (LANNA), Sample Questions, Numeracy Year 5. http://www.
acer.edu.au/documents/LANNA_Y5NumeracyQuestions.pdf.
Conselho Diretor da Avaliação Nacional. S.d. Writing Framework and Specifications
for the 1998 National Assessment of Educational Progress. Washington, DC: U.S.
Department of Education.
168 | SÉRIE P ESQ UISAS DO BANC O M U NDI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
ed. Chestnut Hill, MA: TIMSS and PIRLS International Study Center, Boston
College.
Mullis, I. V. S., M. O. Martin, E. J. Gonzalez e S. J. Chrostowski. 2004. TIMSS
2003 International Mathematics Report: Findings from IEA’s Trends in Interna-
tional Mathematics and Science Study at the Fourth and Eighth Grades. Chestnut
Hill, MA: TIMSS and PIRLS International Study Center, Boston College.
Mullis, I. V. S., M. O. Martin, E. J. Gonzalez, K. D. Gregory, R. A. Garden, K.
M. O’Connor, S. J. Chrostowski e T. A. Smith. 2000. TIMSS 1999 Interna-
tional Mathematics Report. Findings from IEA’s Repeat of the Third International
Mathematics and Science Study at the Eighth Grade. Chestnut Hill, Mass.: The
International Study Center, Boston College. Timssandpirls. bc.edu/timss1999i/
pdf/T99i_Math_2.pdf.
Nova Zelândia, Ministério da Educação. 2002. English in the New Zealand Curricu-
lum. Wellington: Learning Media for the New Zealand Ministry of Education.
Nitko, A. J. 2004. Educational Assessment of Students. 4a ed. Upper Saddle River,
NJ: Pearson, Merrill, Prentice Hall.
Papua Nova Guiné, Departamento de Educação 2003. Cultural Mathematics El-
ementary Syllabus. Port Moresby: Papua New Guinea Department of Educa-
tion.
———. 2004. National Curriculum Standards Monitoring Test. Port Moresby: Papua
New Guinea Department of Education.
PISA (Programa Internacional de Avaliação de Alunos). 2004. Learning for Tomor-
row’s World: First Results from PISA 200. Paris: OCDE.
APÊNDICE
C EXEMPLOS DE ITENS
DE TESTE E DE
QUESTIONÁRIO E
MANUAIS DE APLICAÇÃO
E
m http://go.worldbank.org/M2O1YDQO90,
você encontra exemplos de itens de teste de
aproveitamento, guias de pontuação, itens
de questionário e manuais que têm sido usados em vários contextos, in-
clusive em avaliações nacionais e internacionais. A Figura C.1 mostra o
diagrama do material encontrado. A maior parte dos itens, questionários
e manuais está disponível para o público e pode ser acessada. Somos
muito gratos pelo apoio das editoras e organizações (listadas no final
deste Apêndice) que deram permissão para que seus materiais originais
fossem reproduzidos.
Os exemplos podem dar às equipes de avaliação nacional ideias sobre
tipos e formatos de itens, guias de pontuação, cobertura do conteúdo
curricular, diagramação de testes e questionários e tipo de informação
contida nos manuais de aplicação de testes. As equipes podem usar essas
informações como subsídios para desenhar os próprios instrumentos de
teste, guias de pontuação e manuais. Ao selecionar ou adaptar materiais,
as equipes de avaliação nacional devem ter em mente os currículos na-
cionais e a adequação do vocabulário e dos formatos de teste.
172 | SÉRIE P ESQ UISAS DO BANC O M U NDI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL
FIGURA C.1
Exemplos
Itens do teste e
Questionários Manuais
guias de pontuação
Pais
Nota: Clique no arquivo “Fontes” para acessar a fonte de itens, questões ou manuais individuais
liberados, bem como ver uma lista de endereços na internet (onde disponível), por meio dos quais as
informações liberadas foram obtidas.
QUESTIONÁRIOS
MANUAIS
AGRADECIMENTOS
dificuldade de itens, 15, 31-32, 90, 95 equipe para elaboração de itens, 55-59,
diretores 58q, 91
avaliação nacional, informar sobre, escala cinza
159-160 definição de, 163
manual dos aplicadores para os, opções de pontuação em, 76
145-146 para títulos de itens, 50, 64, 74, 96
disponibilidade de itens de teste na respostas a questionário e, 133, 134q
internet, 30 escaneamento, uso de, 22
distratores em itens de múltipla especialistas nas disciplinas, 4f, 5f, 6t,
escolha, 37, 39-41, 163 12
doença de aluno durante teste, 155 Estudo Internacional sobre o Progresso
elaboração de itens do Letramento em Leitura (PIRLS),
amostras de itens de alta qualidade, 20, 27, 30, 41, 48
30 etapas do desenvolvimento do teste e
características de bons itens, 29-30 desenho do questionário, 6-7t
dificuldades de itens, 15, 31-32, 95 exigências estatísticas do teste final, 93
elaboradores, qualidades e extensão dos cadernos de prova, 96-98
treinamento de, 55-59 fatores da escola, 28
equipe de elaboração de itens, fatores familiares, 28
55-59, 58q, 91 Filipinas, 156, 157-158q
equipe para, 55-59, 58q, 91 fluxograma de atividades da avaliação
formato de itens, 18–25, 36-49 nacional, 4, 5f
grupos de referência e, 62 folha de entrada de dados, 81-82,
itens de prática, 48-49 81q
material de estímulo, 33-36, 35q, folha de estilo de itens, 58q
54q, 75, 95, 164 folha de estilo para elaboradores de
modelos de itens de alta qualidade, itens, 58-59
30 folha de respostas, 96, 163
painéis de itens, 5f, 49, 59-62, formato de itens
82-83, 165 pré-testes, 78, 79q
para questionários, 112t, 125-132 questionários, 119-120
rastreamento de itens, 63-65 testes, 18-25, 30, 36-49
revisores, outros, 62 Veja também elaboração de itens;
tarefas, 6t, 7t itens de resposta fechada; itens de
tendenciosidade do item, 33 redação ou resposta dissertativa;
tópicos, 29-65 itens de múltipla escolha; itens
Veja também diagramação e desenho abertos; itens de resposta curta
de itens formato. Veja formato de itens
elaboradores de itens do teste, formuladores de políticas
qualidades e treinamento de, 55-59, definição de, 163
58q, 82-83 desenvolvimento do marco de
encarregado de turma, 115, 138, referência da avaliação e, 10, 14,
145-146 15, 27-28
180 | SÉRIE P ESQ UISAS DO BANC O M U NDI AL SOB R E AVAL I AÇ ÕE S DE DE SE M PE NH O E DU C AC I ONAL