16 PDF

Revista del Instituto Chileno de Investigacin Operativa 2(2012) 30-35
30
ALGORITMO GENTICO POR CADEIA DE MARKOV HOMOGNEA

VERSUS NO-HOMOGNEA: UM ESTUDO COMPARATIVO
V.S.M. Campos1, A.G.C. Pereira2 , L.A.Carlos3 e I. A. S. de Assis4
1
Universidade Federal do Rio Grande do Norte, Departamento de Matemtica, viviane@ccet.ufrn.br

Universidade Federal do Rio Grande do Norte, Departamento de Matemtica, andre@ccet.ufrn.br
3
Universidade Federal do Rio Grande do Norte, Departamento de Informtica e Matemtica Aplicada,
amorim@dimap.ufrn.br
4
Universidade Federal do Rio Grande do Norte, italo@italoaugusto.com
2
RESUMO
O Algoritmo gentico padro, aqui denominado por AGH, usa na sua dinmica parmetros com valores
constantes, ao longo de sua evoluo, enquanto que o algoritmo gentico, aqui denominado por AGNH,
permite que esses valores variem. As denominaes de algoritmo gentico padro AGH e algoritmo
gentico no-homogneo AGNH devem-se por permitirem ser modelados respectivamente por cadeias
de Markov homognea e no-homognea. A convergncia do AGH analisada em Rudolph (1994) e a do
AGNH, em Pereira (2011) e Rojas Cruz (2011). com a mudana nos valores dos parmetros do AGH,
resultando no AGNH, que se busca um melhor desempenho. Por isso, os testes comparativos realizados
entre o AGH e o AGNH, onde a probabilidade de mutao, neste ltimo, reduzida, com o aumento das
iteraes, buscando, com isso, um bom equilbrio entre diversificao de intensificao. Os resultados
desses testes confirmam a boa escolha do critrio de ajuste usado. A escolha dos problemas testes leva em
conta caractersticas a desafiar no apenas a capacidade dos algoritmos de acharem o timo global,
quando este for nico, mas tambm de se livrar de timos locais, quando existirem muitos.
INTRODUO
Um algoritmo gentico tal como descrito em Holland (1975), aqui chamado apenas de AGH, destinase resoluo de problemas que podem ser modelados por:
min f(x) | x = (x 1 ,... x n ) R n , l i x i u i , i = 1,... , n >

Para realizar a tarefa a que se destina ser estabelecida uma malha,
(1)
M , de pontos
X i x = (x 1 ,...x n ) R , l i x i u i , i = 1,..., n , com a preciso desejada, o que transforma o

n
problema contnuo, (1), no problema discreto (2), seguinte
min{ f(X i ) | X i M } > 0
(2)
Na mudana de (1) para (2) foi usada uma constante de translao nos valores de f a fim de torn-los
positivos.
O AGH uma metfora para o princpio evolucionrio de C. Darwin, em que a seleo natural fator
preponderante, e as leis de G. Mendel, de transferncia de fatores hereditrios aos descendentes, como na
descrio seguinte.
O AGH parte de uma amostra de pontos X = [X 1 ,..., X t ], X i M , de tamanho t , chamada
populao, escolhidos aleatoriamente, e faz uso de um processo no determinstico para gerar, a partir
desta, uma nova amostra, acreditando que nesta nova amostra h uma maior chance da presena do ponto
timo. Este processo estocstico evolui ao longo do tempo atravs do uso repetido dos operadores de
seleo, cruzamento e mutao, representados respectivamente por S, C e M , com o objetivo de dotar o
algoritmo da capacidade de no apenas identificar um timo local, mas procurar fugir deste quando no
for global. Esta capacidade dada pelo equilbrio entre intensificao, pela procura do timo local, e
diversificao, para fugir dele.
Na forma estruturada, o AG tem a seguinte descrio:
31
Escolhe-se aleatoriamente uma populao inicial, X = [X 10 ,..., X t0 ] ;

Repita
Seleo;
Cruzamento;
Mutao;
At que (condio de parada)
A representao binria
Aqui a malha M
{x = (x ,...x
1
estabelecida,
com
preciso
desejada,
sobre
domnio
) R , li xi ui , i = 1,..., n , onde cada elemento ser representado por um arranjo binrio

n
b , de tamanho nm o que faz sua cardinalidade ser |M | = 2 nm . Este arranjo b obtido pela
concatenao de arranjos binrios bi de tamanhos m , sendo m escolhido a fim de satisfazer s precises
u li
desejadas para a malha. Com isto, cada componente xi , do ponto X i , dada por xi = li + Bi i
,
2m 1
onde Bi a representao decimal do binrio bi . Alm disso, para uma populao X T = [X 1T ,..., X tT ] ,
de tamanho t , o arranjo binrio de tamanho nmt .
Os operadores S,C, M
Uma grandeza que tem sido usada na definio do mecanismo de seleo, S , dada por
pi =
f(X i )
t
, i = 1,...,t
f(X i )
i =1
onde t o tamanho da populao, e com esta define-se, em vista da minimizao, 1 pi , a chamada

adequabilidade do ponto X i . Com esta adequabilidade, um mecanismo padro de seleo tem sido usado
1 pi
, que deve ser rodada t > 1 vezes,
t 1
selecionando, em cada rodada, um elemento para a nova populao. Esta seleo pode levar a uma
convergncia prematura para um timo local ainda distante do timo global, quando a adequabilidade de
um dos representantes, na populao, for comparativamente grande, o que determina o predomnio, pela
forte presso seletiva desse elemento.
O controle da presso seletiva atravs de mecanismos tais como: classificao de solues atravs de
pesos, escalamento nos valores da funo, uso do simulated annealing, cujos detalhes podem ser vistos
em Michalewicz (1992), podem ser usados na tentativa de estabelecer um bom equilbrio entre
diversificao e intensificao.
onde se define uma roleta, com setores de tamanhos
O cruzamento
No cruzamento usa-se pc para determinar a quantidade de elementos sujeitos a cruzamento, podendo
os pares e o ponto de corte serem gerados aleatoriamente.
A mutao
Este operador o principal na diversificao da populao no qual se usa pm para determinar a
quantidade de elementos sujeitos mutao, sendo que esta quantidade pode variar, no caso do AGNH.
Cadeia de Markov
Definio 1: Um processo estocstico {Xn}n1 uma seqncia de variveis aleatrias definidas sobre
um mesmo espao de probabilidade ( , F, P) . O conjunto onde estas variveis aleatrias tomam valores
chamado de espao de estados do processo, que no nosso caso discreto e ser denotado por E .
Definio 2: Um processo estocstico {X n }n1 um processo de Markov se satisfaz a propriedade
de Markov, a saber: Para todo n N e todos i1 ,...,in+1 E
32
P(X n+1 = i n+1 | X n = i n , X n 1 = i n 1 ,..., X 1 = i1 ) = P(X n+1 = i n+1 | X n = i n ).

Em outras palavras, a informao do futuro (X n+1 = i n+1 ) s depende do passado mais prximo
(X n = i n ) . Quando o espao de estados discreto, o processo de Markov chamado de cadeia de
Markov.
(n,n + 1)
Denota-se por P(X n+1 = in+1 | X n = in ) = Pi i
a probabilidade de transio do passo n para o
n n+1
passo n + 1 . Quando a transio no depende de n a cadeia de Markov dita homognea, e nohomognea caso haja dependncia. Assim quando a cadeia homognea Pi(n,jn+1 ) = Pi j , n e uma
matriz P descrever a probabilidade de transio de um passo da cadeia e esta matriz ser chamada
matriz de transio da cadeia. Portanto com uma distribuio inicial possvel a completa descrio do
processo.
Quando a cadeia no homognea precisamos de todas as matrizes
{P
(n,n+1 )
n1
e de uma
distribuio inicial para a completa descrio do processo.

As ferramentas utilizadas na abordagem de cadeias homogneas so bem diferentes das utilizadas no caso
no-homogneo. O estudo da convergncia de cadeias homogneas e no-homogneas pode ser vista em
Isaacson (1976), Cruz (1998) e Pereira (2001).
A cadeia homognea versus no-homognea
A composio do algoritmo, atravs da definio de cada uma de seus operadores, S,C, M possibilita
a obteno da correspondente matriz de transio. Quando a cadeia homognea esta matriz
P = SCM , como pode ser visto em Neto (2010). Ainda para a verso AGH, em Rudolph (1994), outra
disposio utilizada para a matriz de transio, a saber: P = CSM . Quando a cadeia no-homognea,
devido variao na probabilidade de mutao, a matriz de transio P (n,n+1 ) = SCM n , pois, agora, a
transio correspondente ao operador de mutao dependente do passo, como proposto em Pereira,
(2011) e Rojas Cruz (2011).
MATERIAL E MTODOS
As variantes do AG
Muitos trabalhos tm sido desenvolvidos sobre algoritmos genticos, onde se prope vrios tipos
diferentes de operadores de seleo, cruzamento e mutao como em Cerf (1998) e Cruz (1998) em que
no usa as probabilidades de cruzamento e mutao e ainda o chamando de algoritmo gentico. Em outros
trabalhos, os autores consideram que o cruzamento e mutao produzem o mesmo efeito e eliminam uma
delas fazendo o estudo da convergncia deste novo tipo de algoritmo gentico, como em Dorea (2010).
Em Pereira (2011) e em Rojas Cruz (2011) o algoritmo gentico tal como definido em Holland (1975),
apenas dando liberdade aos parmetros probabilidade de cruzamento e de mutao.
Como se sabe, alm da forma de representao em binrio ou em ponto-flutuante, o AGH muda no
s com a definio de cada uma de suas etapas, mas pela forma de atribuio de valores aos parmetros
t , tamanho da populao, pc , probabilidade de cruzamento, e pm , probabilidade de mutao.
Em Pereira (2011) e em Rojas Cruz (2011) mostrou-se que, sob adequadas condies, quando se
permite tanto a variao de pc quanto a variao de pm , o AGNH continua convergente. Desta forma
temos agora infinitas variantes possveis para as regras de variao dos parmetros pc e pm .
Nos algoritmos testes, como proposto em Rudolph (1994), criada uma varivel extra, no vetor de
representao da populao, de modo a guardar a melhor soluo encontrada, at a presente iterao. Este
representante extra no influencia na dinmica do algoritmo.
O controle de diversificao escolhido
A escolha da representao binria traz vantagens na definio dos operadores, alm de dotar a
mutao de uma grande potencialidade na diversificao. Neste trabalho a mutao, por seu papel
diversificador, ser controlada atravs de valores decrescentes para pm , sendo maior nos primeiros
passos, a fim de possibilitar que o algoritmo possa chegar a regies promissoras, e, em oposio, deve ser
reduzido em passos posteriores, para aumentar a chance dessas regies promissoras no virem a ser
descartadas. assim, neste trabalho, que se deseja encontrar um bom equilbrio entre diversificao e
intensificao.
33
Os algoritmos testados
Na ausncia de outro critrio, o valor para a probabilidade de mutao, no AGH, ser o sugerido em
Michalewicz (1992). Para a verso no-homognea, o AGNH, a probabilidade de mutao ser dado por
uma regra, aqui definida, para este fim. Nos algoritmos comparados, as regras de controles da mutao
so as seguintes:
1.
Com probabilidade de mutao fixa, p m = 0,01 ;
2.
Com probabilidade de mutao varivel, sendo a mesma, na iterao k , definida por
p m (k) = 0,05 0,000049k
Alm disso, com o fim de observar tambm o comportamento das regras frente aos outros parmetros
foram feitos testes, para o tamanho da populao, nos valores de t = 5,10 , 15 e 20 e, para a
probabilidade de cruzamento, com elementos e ponto de quebra escolhidos aleatoriamente, sendo que o
primeiro escolhido cruza com o segundo, o terceiro com o quarto e assim sucessivamente enquanto
houver pares a ser cruzados, foram testados os valores p c = 0,5 e 0,6 , como em Michalewicz (1992).
Para a seleo o mtodo usado foi o da roleta. Cada algoritmo foi executado 100 vezes e em cada
execuo foram feitas 1000 iteraes.
Os testes realizados
Os testes so realizados com as seguintes funes:
1.
f : [ 4,2 ] [ 4,2 ] R definida por f(x, y) =
2.
f : [ 0,4 ] [ 0,4 ] R definida por f(x, y) = 6 + x 2 3cos( 2 x) + y 2 3cos( 2 y) .
0.3 + x 2 + y 2
A primeira funo tem apenas um timo enquanto a segunda possui vrios timos locais.
RESULTADOS
Nas figuras 1 4, apresentam-se a taxa de sucesso de cada algoritmo, isto , quantas das 100
execues o algoritmo encontra o ponto timo, ou seja, dado o ponto (70, 80), por exemplo, significa que
nas 100 repeties, em 80 delas o timo foi encontrado em 70 iteraes. Vrios outros testes foram feitos,
tanto com a variao do tamanho da populao quanto variando o tamanho da probabilidade de
cruzamento, nos quais fica confirmada a robustez das comparaes realizadas.
Figura 1. Funo1 com t =20 e pc =0,4.
34

DISCUSSO
Como se observa nos grficos acima, a estratgia usada, no controle do parmetro, pm , na qual o
parmetro reduzido ao longo da execuo do algoritmo, indica ser exitosa, pois d ao algoritmo um
melhor equilbrio entre diversificao e intensificao ou confirma a afirmao inicial de que nas
primeiras iteraes o algoritmo deve procurar regies promissoras enquanto que nas ltimas iteraes,
tendo estas regies sido visitadas, deve aprofundar a busca nas mesmas, a fim de obter o melhor timo
local.
CONCLUSES
Em relao aos problemas acima apresentados, a estratgia, de controle do parmetro de mutao, no
AGH, que redunda no designado AGNH tem levado este ltimo a um melhor desempenho, como se
constata nos resultados obtidos onde o timo global encontrado, em 1000 iteraes, com taxa de sucesso
de 100%, a menos em 2 testes com taxa de sucesso de 80%. Por isso, embora seja demasiado forte fazer
afirmaes conclusivas frente a tantas outras formas possveis de controle de parmetros para o algoritmo
gentico padro, os resultados obtidos permitem afirmar que, quando se usa controle, aqui definido, de
reduo do parmetro de mutao, leva o algoritmo a apresentar melhorias, o que nos motiva a acreditar
ser promissora a tese apresentada neste trabalho.
REFERNCIAS
Cerf, R. (1996). A new Genetic Algorithm, The Annals of Applied Probability, vol. 6, No. 3, 778-817.
Cerf, R. (1998). Asymptotic Convergence of Genetic Algorithms, Adv. Appl. Prob., 30,521-550.
Cruz, J.R. (1998). Convergncia de Cadeias de Markov No-Homogneas: Ergodididade Fraca e
Forte, Tese de Doutorado, Departamento de Matemtica, Universidade de Braslia, Brasil.
Dorea, C. C. Yu, Guerra Junior, J. A., Morgado, R., & Pereira, A. G. C. (2010). Multistage Markov
Chain Modeling of the Genetic Algorithm and Convergence Results. Numerical Functional Analysis and
Optimization, v. 31, p. 164-171.
Holland, J.H. (1975). Adaptation in natural and artificial systems, Ann Arbor: The University of
Michigan Press.
Isaacson, D.L. & Madsen,R.W. (1976). Markov Chains Theory and Applications, John Wiley and
Sons.
Michalewicz, Z. (1992). Genetic algorithms + data structures = evolution programs, New York:
Springer-Verlag.
Neto, J.C.R. (2010). Modelagem dos Algoritmos Gentico Simples e Simulated Annealing por
Cadeias de Markov, Dissertao de Mestrado, Natal: Universidade do Rio Grande do Norte.
Pereira, A.G.C. (2001). Anlise de Ergodicidade das Cadeias de Markov No-Homogneas Via
Condies do Tipo Doeblin, Tese de Doutorado, Departamento de Matemtica, Universidade de Braslia,
Brasil.
35
Pereira, A.G.C., Campos, V.S.M. & Rojas Cruz, J.A., (2011). Modeling the Genetic Algorithm by a
Non-Homogeneous Markov Chain: Weak and Strong Ergodicity. Com aceite para publicao em Theory
of probability and its applications.
Rojas Cruz, J.A. & Pereira, A.G.C. (2011). The Elitist Non-homogeneous Genetic Algorithm: Almost
sure convergence, submetido revista Computational Statistics & Data Analysis.
Rudolph, G. (1994). Convergence Analysis of Canonical Genetic Algorithms, IEEE Transactions on
Neural Networks, 5, pp. 96-101.

16 PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

16 PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Revista del Instituto Chileno de Investigacin Operativa 2(2012) 30-35

ALGORITMO GENTICO POR CADEIA DE MARKOV HOMOGNEA

Universidade Federal do Rio Grande do Norte, Departamento de Matemtica, viviane@ccet.ufrn.br

min f(x) | x = (x 1 ,... x n ) R n , l i x i u i , i = 1,... , n >

X i x = (x 1 ,...x n ) R , l i x i u i , i = 1,..., n , com a preciso desejada, o que transforma o

problema contnuo, (1), no problema discreto (2), seguinte

min{ f(X i ) | X i M } > 0

Revista del Instituto Chileno de Investigacin Operativa 2(2012) 30-35

Escolhe-se aleatoriamente uma populao inicial, X = [X 10 ,..., X t0 ] ;

) R , li xi ui , i = 1,..., n , onde cada elemento ser representado por um arranjo binrio

onde t o tamanho da populao, e com esta define-se, em vista da minimizao, 1 pi , a chamada

Revista del Instituto Chileno de Investigacin Operativa 2(2012) 30-35

P(X n+1 = i n+1 | X n = i n , X n 1 = i n 1 ,..., X 1 = i1 ) = P(X n+1 = i n+1 | X n = i n ).

distribuio inicial para a completa descrio do processo.

Revista del Instituto Chileno de Investigacin Operativa 2(2012) 30-35

f : [ 4,2 ] [ 4,2 ] R definida por f(x, y) =

f : [ 0,4 ] [ 0,4 ] R definida por f(x, y) = 6 + x 2 3cos( 2 x) + y 2 3cos( 2 y) .

Figura 1. Funo1 com t =20 e pc =0,4.

Figura 2. Funo1 com t =20 e pc =0,5.

Revista del Instituto Chileno de Investigacin Operativa 2(2012) 30-35

Figura 3. Funo2 com t =20 e pc =0,4.

Figura 4. Funo2 com t =20 e pc =0,5.

Revista del Instituto Chileno de Investigacin Operativa 2(2012) 30-35

Você também pode gostar