Escolar Documentos
Profissional Documentos
Cultura Documentos
Extração de Regras de Redes Neurais Via Algoritmos Genéticos PDF
Extração de Regras de Redes Neurais Via Algoritmos Genéticos PDF
pp. 158-163, July 20-22, 1999 - ITA, So Jos dos Campos - SP - Brazil
158
classificao; caso contrrio tem-se um neurnio para de treinamento, para evitar um overfitting das regras
cada classe existente. aos dados de treinamento.
O conhecimento do sistema tem sua representao
distribuda entre os pesos das conexes, mas esta
representao no pode fornecer uma explicao
compreensvel sobre a razo pela qual uma classe foi Seleo
escolhida. Consequentemente, no contexto de data
mining geralmente desejvel converter esta
representao em regras do tipo IF-THEN que possam Crossover
ser compreensveis para o usurio [4],[2].
159
dados de teste, que so independentes dos dados de onde, R o nmero de regras, C o nmero de
treinamento e validao. condies, Max_R o maior nmero de regras
extradas at o momento e Max_C o maior nmero de
3.1 Extrao de regras condies extradas at o momento.
Como o software ENZO considera o melhor
Utilizou-se para extrao das regras uma adaptao indivduo o que possui o menor fitness, a seguinte
do algoritmo RX apresentado em [2]. Em particular, o funo de fitness foi definida,
mtodo proposto avalia a qualidade das regras
extradas com relao preciso preditiva e Fitness = 1 (pta * TC + pc * CP ) (5)
compreensibilidade, enquanto o algoritmo RX avalia as
regras apenas com relao preciso preditiva. onde pta e pc so pesos definidos pelo usurio.
Aps a obteno de um conjunto de regras faz-se
necessrio o clculo do fator de confiana de cada uma
3.3 Mtodo de seleo e operadores
das regras devido ao fato de que mais de uma regra
pode ser aplicvel a um mesmo exemplo. Neste caso o
O mtodo de seleo utilizado gera um nmero
fator de confiana indica qual regra a mais confivel,
aleatrio que freqentemente selecionar o primeiro
e portanto deve ser escolhida. O fator de confiana
quarto da populao para gerar os filhos. Isto permite
dado pela equao (1).
manter uma maior diversidade gentica. Os operadores
utilizados so crossover que insere uma conexo que
A encontrada em apenas um dos pais, mutao de links,
FC = (1)
ETC mutao de unidades ocultas e mutao de unidades de
entrada. Para maiores detalhes sobre as operaes de
onde, FC o fator de confiana da regra, A o nmero seleo, crossover e mutao consulte [5].
de acertos e ETC o nmero de exemplos cobertos
pela regra. 3.4 Bases de dados utilizadas
Por exemplo, se a parte IF da regra cobre 10
exemplos de treinamento e 8 destes exemplos so Neste trabalho foram utilizadas duas bases de dados
corretamente classificados pela parte THEN da regra, disponveis publicamente no repositrio Machine
ento o fator de confiana de 80%. Learning (http://www.ics.uci.edu/AI/Machine-
Learning.html).
3.2 Clculo do fitness A primeira base utilizada foi Hayes-Roth [7]. Esta
base possui 4 atributos previsores e um atributo meta
O clculo do fitness do conjunto de regras extradas como apresentado a seguir:
da rede neural composto da taxa de acerto do
conjunto de regras e da compreensibilidade deste A - hobby: Valores nominais no intervalo de 1 a 3.
mesmo conjunto de regras. A taxa de acerto obtida B - Idade: Valores nominais no intervalo de 1 a 4.
utilizando-se a equao (2), lembrando-se que quando C - Nvel Educacional: Valores no intervalo de 1 a
mais de uma regra aplicvel a um dado exemplo, 4.
utiliza-se a regra com maior fator de confiana para D - Estado Civil: Valores no intervalo de 1 a 4.
classificar aquele exemplo. E - Atributo meta: Valores no intervalo de 1 a 3.
160
0.6
Criou-se para esta base uma rede neural Melhor
feedforward totalmente conectada, com 15 neurnios pior
Medio
0.5
na camada de entrada, 5 neurnios na camada oculta e
3 neurnios na camada de sada. Para a evoluo com o 0.4
algoritmo gentico foram efetuadas 50 geraes, com
populao de 30 indivduos e 10% de mutao.
fitness
0.3
apresentado a seguir:
0.1
A - Pelo: 0 ou 1.
0
B - Penas: 0 ou 1. 0 5 10 15 20 25 30 35 40 45 50 55
Gerao
C - Ovos: 0 ou 1
D - Leite: 0 ou 1
Figura 3 Evoluo do fitness da base Hayes-Roth.
E - Voador: 0 ou 1.
F - Aqutico: 0 ou 1. 1
G - Predador: 0 ou 1. 0.98
Taxa de Acerto
H - Dentado: 0 ou 1. 0.96
I - coluna vertebral: 0 ou 1. 0.94
J - Respira: 0 ou 1.
Ta 0.92
K - Venenoso: 0 ou 1 xa
de 0.9
L - Barbatana: 0 ou 1. ac
ert 0.88
M - Pernas: Valores possveis [0,2,4,5,6,8]. o
N - Rabo: 0 ou 1. 0.86
O - Domstico: 0 ou 1. 0.84
P - Catsize: 0 ou 1. 0.82
4. Resultados 0.85
161
Regra 4: Se (B 1) E (B 4) E (C = 1) E (D 2) E 0.84 Taxa de Acerto
Regra 5: Se (B 4) E (C 1) E (C 4) E (D = 2) 0.8
ento Classe 2 0.78
Regra 6: Se (B 1) E (B 4) E (C 1) E (C 4) E
Taxa de acerto
0.76
(D 2) E (D 4) ento Classe 2 0.74
Default Classe 3. 0.72
0.7
Tabela 1 Hayes-Roth: Taxa de acerto das regras
0.68
obtidas.
0.66
6 8 75% 0.9
Compreensibilidade 0.88
A figura 6 apresenta a evoluo do melhor fitness,
do pior fitness e a mdia dos fitness, para o a base zoo. 0.86
0.35
Figura 6 Evoluo do fitness base zoo. Tabela 2 Zoo database: Taxa de acerto das regras
obtidas.
162
anterior, a saber 89,28%, com o percentual de
ocorrncia da classe default (classe da maioria) no
conjunto de testes, que de 50%, observa-se boa
preciso do conjuntos de regras. Resultado semelhante
tambm foi obtido para a base zoo. Apesar da preciso
obtida ser um pouco menor, a saber 78,94%, este valor
ainda maior que o percentual de ocorrncia da classe
default no conjunto de teste, cujo percentual de
42,1%.
Pode-se observar nas tabelas 1 e 2 os percentuais de
acerto individual de cada uma das regras obtidas, sendo
bastante satisfatrio com exceo da regra 2 na tabela
2. Deve-se observar que estes percentuais foram
calculados sobre dados de teste no vistos durante o
processo de evoluo.
As regras descobertas tambm so compreensveis,
consistindo de um pequeno nmero de condies,
conforme foi visto anteriormente.
Referncias Bibliogrficas
163