Escolar Documentos
Profissional Documentos
Cultura Documentos
wainer@ic.unicamp.br
Sumrio
Problema alvo
Redes Bayesianas
Reduo de cardinalidade
Redes Bayesianas com estrutura local
Resultados experimentais
Redes Bayesianas
CPT para o n D
D1
... DI ...
DN
A1, B1
C
...
AJ, BK
...
AN , BN
NUM jki +
NUM jk + M
NCM
Pais
URF
Erro
NCM
Pr-processamento
Na reduo de cardinalidade de um atributo, X, gerase um novo atributo, Z, tal que |Z| < |X| que passa a
substituir X na formulao do problema
Um atributo, Y, serve como referncia
Inicialmente Z = X
Os dois valores de Z cuja aglomerao leva a menor
perda na informao mtua entre Z e Y so
aglomerados
O processo para quando um limite na perda de
informao mtua ou no nmero de valores de Z
atingido
Considera apenas um atributo de cada vez
Receita Federal, Unicamp
Substituio de CPTs:
Estruturas locais aglomerativas
NUM jri +
NUM jr + M
Tabelas Default
rvores de deciso
Grafos de deciso
Resultados experimentais
Recall
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
TAN CPT
DG BSM CBM
AIBN TAN
HC DT MDL
PRIOR
10
Selection rate
20
30
40
60
80
Resultados
RM
RM
20
EQM
ECM
R:1/4
R:1/2
1%
2%
5%
10%
20%
DG BSM CBJ
66.3
37.2
11.7
7.2
3.0
25.0
16.8
22.5
31.9
39.5
46.6
DG BSM CB
66.3
36.3
11.6
6.7
4.0
25.0
16.1
19.8
29.8
36.9
46.4
AIBN
81.0
44.2
12.0
5.1
4.0
12.0
11.7
17.3
31.4
45.6
64.4
TAN CPT
81.7
45.8
12.6
6.9
4.0
11.0
10.2
17.8
31.4
47.5
66.8
DG BSM C
69.7
31.7
10.9
4.6
6.0
24.0
8.1
11.5
23.6
32.0
46.1
DT MDL
62.0
21.4
10.9
4.5
13.0
34.0
6.6
8.8
14.1
21.2
34.6
DF MDL
64.4
20.2
10.9
4.6
13.0
34.0
3.6
6.1
10.8
20.3
34.6
DG BSM CJ
68.3
22.0
10.9
4.6
13.0
28.0
3.4
6.1
11.9
21.5
39.0
HC CPT
55.7
11.1
10.9
4.7
22.0
44.0
0.3
1.2
4.1
10.3
22.5
Prior
50.0
10.2
10.9
4.7
26.0
51.0
0.8
1.7
4.2
10.2
20.3
Anlise do resultados
Concluso