Escolar Documentos
Profissional Documentos
Cultura Documentos
ANÁLISES ESTATÍSTICAS
TRI
CME – COO
C COORDENAÇÃO
Ç O DE MEDIDASS EDUCACIONAIS
UC C O S
CAEd/UFJF (32)4009‐2071
Wellington@caed.ufjf.br
Fundamentos da TRI
• O que são itens?
– São os elementos que compõem os testes ou
questionários
ti á i
• O que é proficiência?
– É a medida que representa um determinado traço
latente (aptidão)
• Teoria da Resposta
p ao Item ((TRI))
– Grupo de modelos matemáticos e estatísticos que
descrevem a associação entre a aptidão de um indivíduo
e a probabilidade de uma resposta a um item
PRINCIPAIS PRODUTOS DA TRI
‐ Interpretação pedagógica da escala
‐ Comparabilidade de resultados:
• I ‐ AVALIAÇÃO
à EM LARGA ESCALA
• Item 2
Você consegue subir ou descer dois degraus de cada
vez em uma escada?
• Item 3
Para conversar com as pessoas,
pessoas você precisa olhar para
baixo?
R
Respostas
t dod Questionário
Q ti á i
32%
14,6%
9,8%
15
1,5 1,6
16 1,7
17 18
1,8 19
1,9
9 4 16 17 15 7 20 18 11 14 5 13 6 3 2 19 8
12 10 1
INTERPRETAÇÃO
Ç DA ESCALA
II – TEORIA DA RESPOSTA AO ITEM ‐ TRI
• HISTÓRICO TRI
• FUNDAMENTOS – TRI
• MEDIDAS E ESCALAS
Avaliações
ç em larga
g escala com a TRI
• Análise segundo a TRI – Lord (1952)
– Probabilidade de acerto ao item em função
ç da
habilidade
– Posicionamento dos itens em função da dificuldade
na mesma escala da proficiência
• Década de 1970
– Desenvolvimento de testes adaptativos
• Década de 1980
– Desenvolvimento de softwares específicos para TRI
• Década de 1990
– Desenvolvimento
D l i d testes informatizados
de i f i d (CBT’s)
(CBT’ )
e testes adaptativos informatizados (CAT’s)
Características das avaliações em larga escala no Brasil
• Até 1993: TCT
• A partir de 1995: TRI
• INEP SAEB
1° Momento
2° Momento
3° Momento
BIB ‐ SAEB ATÉ 2005
BLOCOS BLOCOS
CADERNO CADERNO
POS1 POS2 POS3 POS1 POS2 POS3
1 1 2 5 14 1 3 8
2 2 3 6 15 2 4 9
3 3 4 7 16 3 5 10
4 4 5 8 17 4 6 11
5 5 6 9 18 5 7 12
6 6 7 10 19 6 8 13
7 7 8 11 20 7 9 1
8 8 9 12 21 8 10 2
9 9 10 13 22 9 11 3
10 10 11 1 23 10 12 4
11 11 12 2 24 11 13 5
12 12 13 3 25 12 1 6
13 13 1 4 26 13 2 7
BIB
‐ A PARTIR DE 2005
FUNDAMENTOS DA TRI
MÉTODOS DE LINKAGENS
MÉTODOS DE ESTIMAÇÃO
LINEARES
PARÂMETROS DE ITENS
MODELO LOGÍSTICO REGRESSÃO LINEAR
MML MÉDIA/SIGMA
1LP
1LP MMAP MÉDIA/MÉDIA
2LP
2LP CURVA CARACTERÍSTICA
3LP
3LP SCORES
ML NÃO LINEARES
MAP
EAP CALIBRAÇÃO SIMULTÂNEA
Ç DE PARÂMETROS ‐ FPIP
PRÉ‐FIXAÇÃO
Dicotômico 2 PL
3 PL
UIRT
Dicotômico
MIRT
Politômico
MODELOS MATEMÁTICOS
MODELOS MATEMÁTICOS DA TRI
• Relação
R l ã entre a probabilidade
b bilid d d
de acerto ao iitem e a
habilidade do respondente
Relação não‐linear
não linear
Relação não‐linear
1
P( Xi 1 / , bi, aii, cii) cii (1 cii)
1 e aiD( bi )
MODELOS DA TRI
MODELOS DA TRI – 3PL
ITEM PARÂMETROS
A B C
1 0,010 250 0,30
bilidade de Accerto
1
Probab
0,5
0,3
250
Proficiência
MODELOS DA TRI – 3PL
ITEM PARÂMETROS
A B C
1 0,010 250 0,30
bilidade de Accerto
1
Probab
0,65
0,5
0,3
250
Proficiência
MODELOS DA TRI – 3PL
ITEM PARÂMETROS
A B C
1 0,010 250 0,30
bilidade de Accerto
1
Probab
0,65
0,5
0,3
250
Proficiência
MODELOS DA TRI – 3PL
ITEM PARÂMETROS
A B C
1 0,010 250 0,30
bilidade de Accerto
1
Probab
0,65
0,5
0,3
250
Proficiência
MODELOS DA TRI – 3PL
ITEM PARÂMETROS
A B C
1 0,010 250 0,30
bilidade de Accerto
1 2 0 020 250
0,020 0 30
0,30
2
1
Probab
0,65
0,5
0,3
250
Proficiência
MODELOS DA TRI – 3PL
ITEM PARÂMETROS
A B C
1 0,010 250 0,30
bilidade de Accerto
1 2 0 020 250
0,020 0 30
0,30
3 0,020 350 0,30
2
1
Probab
0,65
0,5
3
0,3
250 350
Proficiência
MODELOS DA TRI – 3PL
ITEM PARÂMETROS
A B C
1 0,010 250 0,30
bilidade de Accerto
1 2 0 020 250
0,020 0 30
0,30
3 0,020 350 0,30
2 4 0,020 350 0,20
1
Probab
0,65
0,5
3
0,3 4
250 350
Proficiência
EXEMPLOS DE ITENS – discriminação boa
EXEMPLOS DE ITENS – discriminação ruim
LINKAGEM
• Avaliações do SAEB
• Testes com conteúdos diferentes
• Testes com descritores diferentes
• Populações não equivalentes
Designs ou Delineamentos para coleta de dados
Forma X Forma Y
Itens Itens
comunsc comunsc
omum omum
Grupo 1 Grupo 2
LINKAGEM
• Processo para colocar diferentes testes em uma mesma
escala (equalização vertical)
DESIGN TESTE SAEPE 2008 LÍNGUA PORTUGUESA
4ª SÉRIE EF
8ª SÉRIE EF
3º ANO EM
ML NÃO LINEARES
MAP
EAP CALIBRAÇÃO SIMULTÂNEA
PRÉ‐FIXAÇÃO DE PARÂMETROS ‐ FPIP
TTestes U
Unidimensionais
idi i i compostos por iitens
dicotômicos
MEDIDAS E ESCALAS
• A ESCALA SAEB
• CONTRUÇÃO
Ç DE TESTES
COMO MEDIR A HABILIDADE DOS ALUNOS
• Matriz de referência
• Design
D i d do tteste
t
ESCALAS DE PROFICIÊNCIA
Curva normal
ESCALA SAEB
9° ano EF
9
250
ESCALA SAEB
5° ano EF
5 3° ano EM
3
250 270
ESCALA SAEB
5° ano EF
5 9° ano EF
9 3° ano EMF
3
ESCALA SAEB
ESCALA
CONTRUÇÃO DE TESTES
‐ Comparabilidade de resultados:
Participação
Medidas de Desempenho
Proficiência Média
Percentual de alunos por Padrões de Desempenho
Desvio Padrão
Interpretação de medidas de desempenho educacional
III – INDICADORES DE DESEMPENHO
• Sé i histórica
Série hi tó i SAEB – Rede
R d pública
úbli LÍNGUA PORTUGUESA
310.0
290.0
270.0
250.0 5ºEF
230.0 9ºEF
210 0
210.0 3ºEM
3 EM
190.0
170.0
150.0
1995 1997 1999 2001 2003 2005 2007 2009
Série histórica SAEB – Rede pública MATEMÁTICA
290
270
250
5ºEF
230
9ºEF
210
3ºEM
190
170
150
1995 1997 1999 2001 2003 2005 2007 2009
IDEB
FForma gerall do
d Id
Ideb:
b IDEB = N . P
• N = média da proficiência em Língua Portuguesa e
Matemática padronizada para um indicador entre
Matemática,
0 e 10, no exame realizado ao final da etapa de ensino
• P = indicador de rendimento baseado na taxa de
aprovação da etapa de ensino
Evolução
ç do Ideb ‐ Brasil
• Rede Pública – Anos Iniciais Ens. Fundamental
Evolução do Ideb ‐ Brasil
• Rede Pública – Anos Finais Ens. Fundamental
Evolução
ç do Ideb ‐ Brasil
• Rede Pública – Ensino Médio
Evolução
ç do Ideb ‐ Estados
• Rede Pública – Anos Iniciais Ens. Fundamental