Escolar Documentos
Profissional Documentos
Cultura Documentos
FSS
A relevância de um atributo é dependente do
Alguns indutores geralmente conceito a ser aprendido e do indutor a ser
degradam seu desempenho utilizado
quando são fornecidos muitos Vários indutores assumem que os atributos
atributos irrelevantes para o originais que descrevem os exemplos são
conceito a ser aprendido relevantes o suficiente para aprender a tarefa em
questão
Feature Subset Selection
(FSS) é o processo de Entretanto, alguns atributos podem não ser
diretamente relevantes e outros até irrelevantes
selecionar um subconjunto de
atributos para posterior Um atributo é irrelevante se existe uma hipótese
completa e consistente que não usa aquele
utilização pelo indutor atributo
José Augusto Baranauskas augusto@ffclrp.usp.br
Departamento de Física e Matemática – FFCLRP-USP http://dfm.ffclrp.usp.br/~augusto
2
3 4
5 6
1
Ponto de Partida Organização da Busca
Quando a busca tem seu estado A cada ponto na busca, modificações locais no conjunto de atributos são
inicial mais à esquerda, o conjunto consideradas; uma dessas é selecionada e uma nova iteração é realizada
vazio de atributos, representado Claramente, uma busca exaustiva em todo o espaço de estados é
pelos quatro círculos em brancos, impraticável, já que para um número m de atributos existem 2^m possíveis
esse sentido da busca é conhecido estados
forward Uma abordagem mais prática é a utilização de um método greedy para a
Já a situação que inicia com o travessia do espaço de busca: em cada ponto da busca, consideram-se
subconjunto contendo todos os alterações locais sobre o conjunto corrente de atributos, seleciona-se um
atributos e sucessivamente novo atributo e realiza-se uma nova iteração
removendo-os, é denominada de Por exemplo, hill-climbing, considera tanto a adição quanto a remoção de
eliminação (ou sentido da busca) atributos em cada ponto de decisão, permitindo ainda que a recuperação de
backward uma decisão anterior possa ser realizada
Também podem ser empregadas Dentre essas opções, pode-se considerar todos os estados gerados e
variações de ambas abordagens, selecionar o melhor, ou simplesmente escolher o primeiro estado que
selecionando-se um estado inicial melhora a precisão sobre o conjunto corrente
em algum ponto do espaço de
busca e movendo-se a partir desse Pode-se, também, substituir o método greedy por métodos mais sofisticados,
ponto − busca outward como, por exemplo, o método best-first, o qual, embora sendo mais custoso,
é ainda computacionalmente viável para alguns domínios
forward backward
7 8
9 10
2
FSS: Embutida FSS: Filtro
Essa abordagem de seleção de atributos introduz um
processo separado, o qual ocorre antes da aplicação do
Conjunto de Treinamento algoritmo de indução propriamente dito
(m atributos)
Indutor A idéia é filtrar atributos irrelevantes, segundo algum
critério, antes de iniciar a indução
Estimativa de Esse passo de pré-processamento considera
Desempenho
características gerais do conjunto de exemplos para
Classificador selecionar alguns atributos e excluir outros
Conjunto de Teste
Classificador Sendo assim, métodos de filtros são independentes do
(< m atributos)
algoritmo de indução que, simplesmente, receberá como
entrada o conjunto de exemplos contendo apenas os
atributos selecionados pelo filtro
13 14
15 16
3
FSS: Wrapper FSS: Wrapper
Em geral, a busca é conduzida no espaço do subconjunto
de atributos, com os operadores adicionar ou remover,
Conjunto de
utilizando como busca o método hill-climbing ou best-first Treinamento
Busca por Atributos
diferente
Por outro lado, essa abordagem pode ser Indutor Conjunto de
Teste Reduzido Estimativa de
computacionalmente dispendiosa, uma vez que o indutor Desempenho
deve ser executado para cada subconjunto de atributos
considerado Conjunto de Teste
Classificador
19 20
21 22
20 80
15
62,68 Wrapper
60
10
80%
40
Selected Features
5
1,03 1,15
0,05 0,16
20 13,30 60% anneal
2,21 3,06
0
C4.5 CN2 IB NB TM
0 dna
C4.5 CN2 IB NB TM 40%
genetics
genetics
sonar
14 2,0 20% sonar
Running time (hours)
Running time (hours)
11,80
12 1,59
10,14
10 1,5
8
0%
1,0
6
4 2,37
0,60 C4.5 CN2 IB NB TM
0,5
2 0,63
0,16
0,45 0,04 0,02
0 0,0
C4.5 CN2 IB NB TM C4.5 CN2 IB NB TM
23 24
4
Wrapper versus Filter
Error Comparison
Execution Time
dna 180-(0c,180d)
dna
30
all
anneal 38-(6c,32d)
50
all
25
24,34
anneal
ID3=0,001 96,98 ID3=0,009
wrapper wrapper 100
Error %
Error %
15 60
15
20 10
10 40
10 5 13,30
5 1,03 1,15 20
0,05 0,16 3,06
2,21
0
0
0 0
C4.5 CN2 IB NB TM C4.5 CN2 IB NB TM C4.5 CN2 IB NB TM
C4.5 CN2 IB NB TM
genetics 60-(0c,60d) sonar 60-(60c,0d)
40
all
50
all
genetics ID3=0,003 sonar ID3=0,001
14 2,0
8
20 1,0
20 6 0,60
4 2,37 0,5
10
10 2 0,63
0,16
0,45 0,04 0,02
0 0,0
0 0 C4.5 CN2 IB NB TM C4.5 CN2 IB NB TM
C4.5 CN2 IB NB TM C4.5 CN2 IB NB TM 25 26
Error %
Error %
80% 15 20
10
Selected Features
10
60% anneal 5
0
0
dna C4.5 CN2 IB NB TM C4.5 CN2 IB NB TM
40% 40
genetics 60-(0c,60d)
55
sonar 60-(60c,0d)
genetics all
wrapper
all
wrapper
ID3 45 ID3
20% sonar 30
35
Error %
Error %
20
0% 25
10
C4.5 CN2 IB NB TM ID3 15
0 5
27 C4.5 CN2 IB NB TM C4.5 CN2 IB NB TM 28