Roberto Tavares

R O B E R T O F E R N A N D E S TAVA R E S N E T O
PLANEJAMENTO DE VISTORIAS USANDO ROBS MVEIS AUTNOMOS E OTIMIZAO PELO ALGORITMO DE COLNIA DE FORMIGAS
Dissertao apresentada ao Programa de PsGraduao em Engenharia de Produo e Sistemas da Pontifcia Universidade Catlica do Paran como requisito parcial para obteno do ttulo de Mestre em Engenharia de Produo e Sistemas.
CURITIBA 2005
ii
R O B E R T O F E R N A N D E S TAVA R E S N E T O
PLANEJAMENTO DE VISTORIAS USANDO ROBS MVEIS AUTNOMOS E OTIMIZAO PELO ALGORITMO DE COLNIA DE FORMIGAS
Dissertao apresentada ao Programa de PsGraduao em Engenharia de Produo e Sistemas da Pontifcia Universidade Catlica do Paran como requisito parcial para obteno do ttulo de Mestre em Engenharia de Produo e Sistemas. rea de Concentrao: Automao e Controle Orientador: Prof. Dr. Leandro dos Santos Coelho
CURITIBA 2005
iii
Tavares Neto, Roberto Fernandes Planejamento de Vistorias Usando Robs Mveis Autnomos e Otimizao pelo Algoritmo de Colnia de Formigas. Curitiba, 2005. 99p
Dissertao Pontifcia Universidade Catlica do Paran. Programa de PsGraduao em Engenharia de Produo e Sistemas.
1. Inspeo 2. Manuteno Preventiva 3. Colnia de Formigas 4. Otimizao. I.Pontifcia Universidade catlica do Paran. Centro de Cincias Exatas e de Tecnologia. Programa de Ps-Graduao em Engenharia de Produo e Sistemas.
iv
Agradecimentos
Ao professor Leandro dos Santos Coelho pela inspirao, orientao, competncia e pacincia durante todo o desenvolvimento desta dissertao. PUCPR pelo incentivo pesquisa no perodo em que fui bolsista de mestrado, e a todos os envolvidos nos projetos em que tive o prazer de trabalhar, pela f em minha capacidade. minha irm Ana Flvia, pelo carinho e apoio nas horas ruins e pelos momentos compartilhados nas horas boas. Ao meu irmo Tiago, pela ajuda no decorrer da dissertao. E, em especial, minha me, que me surpreende a cada dia com seu complexo conhecimento da humanidade, ao meu pai, por ter me mostrado as potencialidades da engenharia, e a ambos, por compartilhar uma compreenso do mundo que me permite hoje fazer o bem. A todos que, direta ou indiretamente, colaboraram para a realizao deste trabalho.
Sumrio
Pg. Agradecimentos .....................................................................................................................iv Sumrio................................................................................................................................... v Lista de figuras ......................................................................................................................vi Lista de Tabelas ....................................................................................................................vii Lista de siglas ......................................................................................................................viii Resumo ..................................................................................................................................ix Abstract................................................................................................................................... x Captulo 1. Introduo ............................................................................................................ 1 Captulo 2. Descrio do problema ........................................................................................ 8 2.1. Limitaes fsicas do meio .......................................................................................... 8 2.2. Limitaes fsicas do ROV.......................................................................................... 9 2.3. Anlise de arquiteturas para autonomia de robs...................................................... 12 2.4. Premissas do problema encontradas at agora .......................................................... 16 Captulo 3. Uma introduo robtica mvel...................................................................... 17 3.1. Sensores de uso comum na robtica mvel............................................................... 26 3.1.1. Sensores de proximidade .................................................................................... 26 3.1.2. Sensores de deslocamento .................................................................................. 28 3.1.3. Cmeras .............................................................................................................. 29 3.1.4. Outros sensores e a ambiguidade sensorial ........................................................ 30 3.2. Morfologias de robs disponveis comercialmente ................................................... 31 3.2.1. Robs mveis com rodas.................................................................................... 31 3.2.2. Esteiras ............................................................................................................... 32 3.2.3. Pernas ................................................................................................................. 33 Captulo 4. Metodologia ....................................................................................................... 35 4.1. O problema do caixeiro viajante................................................................................ 35 4.2. Algoritmos para o problema do caixeiro viajante ..................................................... 38 4.2.1. GRASP (Greedy Randomized Adaptive Search Procedure).............................. 41 4.2.2. Simulated annealing ........................................................................................... 41 4.2.3. Algoritmo de Lin-Kernighan .............................................................................. 42 3.2.4. Algoritmos genticos.......................................................................................... 44 4.2.5. Programao evolutiva ....................................................................................... 47 4.3.6. Otimizao por colnia de formigas e outros modelos baseados em inteligncia coletiva ......................................................................................................................... 47 Captulo 5. A escolha do mtodo ......................................................................................... 54 5.1. Algoritmo ACS original ............................................................................................ 54 5.2. Primeira anlise do algoritmo da colnia de formigas aplicado ao problema de planejamento de rotas de ROVs com cordo umbilical ................................................... 57 5.3. Adaptao do ACS visando melhorar a convergncia .............................................. 62 5.4. Alterao do critrio de parada para reforo do caminho timo encontrado......... 67 5.5. Limitao do espao de busca atravs de algoritmo cultural .................................... 68 6. Concluses e trabalhos futuros ......................................................................................... 82 Referncias bibliogrficas .................................................................................................... 84
vi
Lista de figuras
Pg. 1.1. Exemplo de tubulao em uso, em pobre estado de conservao................................ 1 1.2. Exemplo de ROVs....................................................................................................... 2 2.1. Problemas esperados durante uma inspeo de instalaes......................................... 9 2.2. Exemplo de ROV ligado base de operaes atravs de um cabo umbilical............. 11 2.3. Arquitetura de sistemas robticos adaptativos porposta por Alami et al. (1998)........ 14 3.1. Sensor de proximidade utilizando um conjunto emissor/detector de infravermelho... 27 3.2. O rob Nomad 200...................................................................................................... 27 3.3. Um exemplo de sensor de toque.................................................................................. 28 3.4. Exemplos de encapsulamentos de acelermetros disponveis no mercado................. 29 3.5. Rob com duas rodas de acionamento independente.................................................. 31 3.6. O rob Soujourner da NASA...................................................................................... 31 3.7. Conjunto de esteiras prontas para serem usadas em um rob de inspeo................. 32 3.8. O rob co AIBO da SONY........................................................................................ 33 3.9. Um dos robs bpedes apresentados em eventos da FIRA.......................................... 33 4.1. Exemplo de aplicao do algoritmo 2-opt................................................................... 41 4.2. Exemplo de aplicao do algoritmo 3-opt................................................................... 42 4.3. Aplicao do operador de mutao (Morawek, 2003)................................................ 45 4.4. Aplicao do operador de crossover (Morawek, 2003).............................................. 45 4.5. A descoberta do menor caminho atravs do feromnio.............................................. 51 5.1. O algoritmo da colnia de formigas sugerido por Dorigo et al. (1996)...................... 56 5.2. Exemplo de operao de uma pilha FILO................................................................... 57 5.3. Grafo de ensaio com 11 ns......................................................................................... 59 5.4. Resultados obtidos....................................................................................................... 60 5.5. Heurstica do reconhecimento do feromnio............................................................... 62 5.6. Primeiro mapa analisado aps adicionar-se o reforo negativo................................... 63 5.7. Mapa n 2 analisado com o algoritmo do item 5.3...................................................... 65 5.8. Configurao de um sistema evolutivo com algorimo cultural................................... 68 5.9. Exemplo da alterao de um espao de busca por um algoritmo cultural................... 69 5.10. Pseudo-cdigo de um algoritmo cultural................................................................... 69 5.11. Pseudo-cdigo do algoritmo cultural aplicado colnia de formigas....................... 71 5.12. Heursticas do item 3.3.4 e do reforo negativo (item 3.3.3) em comparao ao algoritmo mostrado no item 3.3.2(a). em (b), tem-se destacado apenas as heursticas dos itens 3.3.3 e 3.3.4................................................................................................................ 73 5.13. Resultados obtidos com simulao atravs da incluso das heursticas do algortmo cultural mostradas no item 5.5........................................................................... 75 5.14. Uma nova anlise obtida com simulao atravs da incluso das heursticas do algortmo cultural................................................................................................................ 75 5.15. Segundo campo de testes analisado atravs do algoritmo cultural............................ 77 5.16. Resultados da aplicao de heursticas de algoritmo cultural no mapa 3 atravs da incluso das heursticas do algoritmo cultural utilizando o campo de teste mostrando na figura 3.28 e c_min=f_min=5.............................................................................................. 78 5.17. Resultado da aplicao das heursticas com parmetros modificados de algoritmo cultural no mapa 3 com c_min=f_min=3............................................................................ 79
vii
Lista de Tabelas
4.1 Resultados da aplicao de vrios algoritmos distintos para problemas do TSP ........ 5.1 Anlise do Movimento dos agentes com a alterao do parmetro BadFeromBias..... 5.2 Anlise do Movimento dos agentes com a alterao do parmetro QBad................... 5.3 Anlise do movimento dos agentes com a alterao do parmetro BadFeromBias..... 5.4 Anlise do movimento dos agentes com a alterao do parmetro Qbad.................... 5.5 Sries de dados referentes figura 5.12...................................................................... 5.6 Sries de dados referentes figura 5.12....................................................................... 5.7 Sries de dados referentes figura 5.13....................................................................... 5.8 Sries de dados referentes figura 3.28....................................................................... 5.9 Sries de dados referentes figura 3.28 e c_min=f_min=3.......................................... 52 64 64 65 65 74 76 77 78 79
viii
Lista de siglas
ACS Ant Colony System Sistema de Colnia de Formigas AGVs Automated Guied Vehicles Veculos Guiados Automaticamente ROV Remoted Operated Vehicle Veculo Operado Remotamente FIRA - Federation of International Robot-soccer Association Associao Internacional de Futebol de Robs GA Genetic Algorithm Algortimo Gentico AG Algoritmo Gentico SA Simulated Annealing PE Programao Evolutiva UAV - Unmanned Aerial Vehicles Veculos areos no tripulados BEES Bioinspired Engineering of Exploration Systems Sistemas de explorao inspirados biologicamente TSP Travelling Salesman Problem Problema do caixeiro viajante DA Deterministic Annealing RNA Redes neurais artificiais QAP Quadratic Assighment Problem Problema da designao quadrtica JSP Job-shop Scheduling Problem Problema da escalonamento de turnos FILO First in, Last Out Primeiro a entrar, ltimo a sair.
ix
Resumo
A inspeo robotizada em locais de difcil acesso um problema cada dia mais presente no cotidiano. Na busca de solues a este desafio, observa-se o surgimento de iniciativas, seja de forma orientada como nas competies robticas a exemplo do Robocup Rescue, seja em aplicaes prticas em que companhias oferecem veculos de operao remota para inspeo de tubulaes, galerias e demais estruturas subterrneas. A seqncia natural da evoluo destes servios, conforme j notado por diversos pesquisadores, a automao destas tarefas. Com esta automao, os robs podem realizar, automaticamente, vistorias em locais de difcil acesso ou que oferecem riscos integridade humana, de forma contnua, sem exigir a presena constante do ser humano no controle e avaliao da situao. Este trabalho apresenta um conjunto de heursticas de um sistema multi-agente baseadas em reforos positivos gerados atravs de comunicao sinergtica. Os negativos so baseados na memria dos agentes e modificaes no espao de busca atravs de algoritmos culturais para a automao do planejamento de inspees. Atravs de modificaes realizadas no algoritmo de inteligncia coletiva, baseado no comportamento de colnia de formigas, mostra-se a viabilidade dos servios a serem executados de forma autnoma, mesmo em situaes difceis, tais como aquelas em que os robs necessitam de cordes umbilicais para envio de dados e alimentao dos motores eltricos. Buscando o aperfeioamento das heursticas apresentadas, detectadas atravs do aumento da rapidez da convergncia do algoritmo, esta dissertao se utiliza do paradigma denominando Algoritmo Cultural. Atravs da adaptao de heursticas com esta inspirao, possvel colnia a reduo do espao de busca, permitindo que o esforo de otimizao seja convergido para solues de um mnimo local do problema, convergncia no encontrada no algoritmo original. Palavras-chave: Inspeo, Manuteno Preventiva, Colnia de Formigas, Otimizao.
Abstract
Robot-based inspection on sites with difficult access is a problem that becomes more common nowadays. Searching for solutions to this challenge, its observed new initiatives, either in orientated form in robot competitions like Robocup Rescue, or practical applications in companies that offer remoted operated vehicles to inspect pipes, galleries and further underground facilities. The natural evolution sequence for those services, as mentioned by several researches, is the automation of those tasks. With this automation, robots can accomplish, in an independent form, inspections of hard-access or dangerous places continually, without requiring the constant operation by a human being. This dissertation presents a set of heuristics of a multi-agent system based on positive reinforcements generated by a synergetic communication and negative reinforcements based on individual agent memory and modifications at the searching area using cultural algorithms to the automation of inspections. Beyond modifications on the collective intelligence, based on ant colonies behavior, its presented in this document the viability of the automation of this services, even on hard situations such as robots that require umbilical cables for data communication and power supply. Looking for improvement to the presented heuristics, detected by the of the algorithm convergence, this dissertation uses the Cultural Algorithms paradigm. Beyond adaptations of heuristics with this inspiration, the colony could reduce the searching space, allowing the optimization effort to be converted to the solution of a reduced part of the problem, this convergence could not be observed on the original algorithm.
Keywords: Inspection, Preventive Maintanence, Ant Colony, Optimization.
Captulo 1. Introduo
Vrios setores de prestao de servios na rea de construo, como aqueles relacionados com a manuteno preventiva e corretiva, j definiram como necessria a inspeo de locais de difcil acesso pelo ser humano. Lockheed (1997) afirma que existe uma necessidade no Departamento de Energia [dos Estados Unidos] em inspecionar as condies internas de tubulaes e outros ambientes inacessveis, perigosos ou restritos durante a descontaminao e decomissionamento (desativao) de instalaes sem uso. Em seu relato tcnico de abril de 2001, a New York Gas Group afirma que durante a dcada passada, a inspeo robtica tem encontrado um aumento de uso em instalaes de gs (New York Gas Group, 2001). A Paul Hayward Associates (2003) afirma que grande parte do sistema de esgoto do Reino Unido e de outros pases industrializados se encontram em precrio estado de conservao. como pode ser visto na Fig. 1.1.
Figura 1.1 Exemplo de tubulao em uso, em pobre estado de conservao (fonte: Paul Hayward Associates).
Com o objetivo de evitar os prejuzos devido ao efeito do envelhecimento de encanamentos, organizaes como o Departamento de Energia Americano tm criado programas de pesquisa visando garantir a segurana e a eficincia operacional de seus servios (Panetta et al., 2001). Venugopal (2001) enumera uma gama de testes no destrutveis empregados pela indstria e tendncias atuais de pesquisa na rea de inspeo de tubulaes. Estas so: deteco de falhas: as causas das falhas de um sistema de tubulao so vrias, tais como a corroso e dano por aes de equipamentos de obras; testes no destrutivos baseados no vazamento de fluxo magntico; testes no destrutivos baseados no mtodo ultrasnico.
De acordo com Panetta et al. (2001), os testes mais usados para a deteco de falhas mecnicas so os que se utilizam de ferramentas de inspeo in-line. Como inspeo inline, entende-se sistemas de instrumentao que se movem de um ponto a outro no interior de uma tubulao. A inspeo atravs de veculos controlados remotamente (remote controlled vehicles ROVs) j uma realidade. Vrias empresas, como a Roboprobe e a SRI International, oferecem ao mercado diversos sistemas teleoperados para inspeo. Alguns exemplos so mostrados na Figura 1.2.
(i)
(ii)
(iii)
Figura 1.2 Exemplo de ROVs. (i) um ROV para desarmamento de bombas; (ii) e (iii), ROVs para inspeo de tubulaes (fontes: RoboProbe Technologies Inc., 2003; SRI International, 2003). Tais tarefas de inspeo requerem, atualmente, um controlador de superfcie para monitorar e operar o ROV. Tais tarefas costumam ser repetitivas, pois a topologia da construo a ser monitorada no tende a mudar constantemente. O estudo da automatizao destes sistemas de forma que a ao humana seja mnima uma realidade (Byrne et al., 2002; Jianxu et al., 2000). Whittaker et al. (2000) mostra resultados na automao de montagens, inspees e manuteno de estruturas em aplicaes espaciais. Estudos neste contexto, que permitem aos robs realizarem tarefas em ambientes complexos e dinmicos, so desafios importantes no estudo da robtica (Kita et al., 1999). Supondo que esta tecnologia a inspeo robotizada seguir o rumo de vrias outras, possvel supor que logo esta automao estar presente no dia-a-dia, como mais uma forma de prestao de servio. Como toda prestao de servio de manuteno, existem variveis cuja alterao afetam o custo do servio:
4 o tempo de durao da inspeo, que gera custos tanto relacionados alocao da equipe que acompanha a inspeo quanto de possveis paradas do sistema a ser verificado (no caso, por exemplo, de paradas em usinas hidroeltricas); o desgaste de equipamento durante o uso, presente em qualquer sistema mecnico. Para a minimizao de ambas as variveis, um dos fatores a ser perseguido a otimizao do caminho a ser percorrido pela inspeo. Este problema tambm estar presente em verses autnomas destes sistemas de inspeo, que quando automatizados, ganham maior importncia. Citando Nehmzow (2001): aplicaes industriais de robs mveis tem ganho importncia continuamente, em particular sob consideraes de confiabilidade (operao ininterrupta de tarefas montonas como vigilncia), acessibilidade (inspeo de locais que so inacessveis por humanos, tais como espaos estreitos, ambientes hostis ou remotos) e custo (sistemas autnomos de transporte podem ser mais baratos que formas tradicionais de transporte). Kita et al. (1999) mostra a aplicao de um sistema composto de dois robs autnomos atuando em conjunto para a inspeo em usinas nucleares. Nehmzow (2001) indica a importncia de um controle adaptativo em um rob mvel, evitando o que o autor chamou de hard-wired (inflexvel), sendo este indicado como sendo a forma preferida de implementao para ambientes dinmicos. Com o controle adaptativo, ou seja, com a habilidade do rob mvel de aprender, mudanas na sua percepo de mundo podem ser toleradas, levando o sistema de controle a se adequar mudana do mundo, da tarefa, ou de sua prpria morfologia. Alami et al. (2002) notam tambm a necessidade de uma autonomia avanada para sistemas embarcados em tempo real, como robs, satlites e aeronaves no tripuladas (UAV Unmanned Aerial Vehicles). Koening (1999) mostra alguns algoritmos de planejamento atravs de sistemas centrados em agentes simples ou sistemas multi-agentes. Thakoor et al. (2002) descrevem algumas sadas encontradas por insetos para executar tarefas que, embora simples para humanos, ainda tm sido alvo de pesquisas no desenvolvimento de vrios robs. Tendo como foco o vo, o reconhecimento de obstculos ou o pouso de insetos como abelhas e liblulas, os autores mostram como sistemas de
5 explorao inspirados na biologia (BEES Bioinspired Engineering of Exploration Systems) podem ser utilizados na automao de robs da NASA. A idia de planejamento de tarefas atravs de algoritmos inspirados em BEES, tambm explorada por Bonabeau e Theuralaz (1998). Neste artigo, os sistemas inspirados em comportamentos de enxames de insetos so utilizados para se obter solues de problemas de caixeiro viajante, roteamento de veculos, transporte cooperativo e agendamento de tarefas. Uma caracterstica presente em grande parte destes algoritmos a possibilidade de ser executado utilizando-se de processamento paralelo, normalmente de complexidade e custo computacional menor que o algoritmo como um todo. Esta caracteristica foi utilizada por Schoonderwoerd et al. (1996), que apresenta um modelo de rede populado por formigas artificiais para o roteamento de chamadas de uma rede de comunicao heterognia e dinmica. Neste caso, as formigas depositam feromnios artificiais (usados como um reforo positivo de parmetros de um algoritmo pseudo-aleatrio) de acordo com o congestionamento do n e o comprimento do caminho da formiga. Sim e Sun (2003) analisam o uso de algoritmos de otimizao por colnia de formigas (ACS Ant Colony System) e comparam seu uso com mtodos tradicionais de roteamento de chamadas. So destacados trs aspectos: Para algoritmos tradicionais, necessrio o conhecimento de toda a rede para a construo da tabela de roteamento (com informaes sobre topologia da rede e respectivo trfego nos roteadores). No caso do ACS, cada formiga apenas se utiliza da informao dos ns adjacentes. Com isso, cada transmisso de pacotes de um elemento roteador da rede para outro uma instncia independente, sendo suas propriedades (quantidade de feromnio) atualizadas em funo da chegada ou no de formigas no roteador. Ao contrrio da abordagem tradicional, um roteador de uma rede que se utilize de um algoritmo como o ACS apenas necessita conhecer as relaes com os roteadores adjacentes, e sua operao consiste apenas em atualizar feromnios e redirecionar pacotes segundo uma funo pseudo-aleatria simples. Ainda em algoritmos tradicionais, o roteamento de chamadas requer a transmisso de tabelas de roteamento para todos os ns da rede. O tamanho desta tabela proporcional ao tamanho da rede. O uso de algoritmos baseados
6 em ACS requerem apenas que um pequeno cdigo (a formiga) seja enviada pela rede. De acordo com Sim e Sun (2003), este pedao de cdigo tem um tamanho na ordem de 6 bytes. O trfego resultante deste pequeno cdigo em muito superado quando confronta-se o tamanho de transmisses de dados realizados diariamente, como acesso sites WEB populares como o Google (11.776 bytes) (Google, 2004), e portais que possuem grande volume de acessos dirios, como o Universo Online (114.176 bytes) (UOL, 2004) e o Terra (70.144 bytes) (Terra, 2004). Para evitar a sobrecarga da rede ao retransmitir de forma excessiva a tabela de roteamento em algoritmos tradicionais, pode-se escolher aumentar o intervalo de transmisso da mesma. Porm, esta estratgia falha ao aumentar o tempo pelo qual os padres de roteamento se mantero, aumentando o tempo de resposta mudanas da topologia da rede. Com o uso de ACS, o pequeno trecho referente formiga no causa transtornos significativos rede, sendo que seu intervalo de transmisso pode ser reduzido, tornando este algoritmo sensvel mudanas na rede, sejam elas de topologia (roteador desligado) ou de trfego (canais de transmisso sobrecarregados). Existem algumas caractersticas interessantes na aplicao de sistemas inspirados em formigas para o roteamento de redes. Inicialmente, pode-se caracterizar esta aplicao como um sistema multi-agente (Franklin e Graesser, 1996), aonde no h interao direta entre os integrantes do sistema: em vez disso, a comunicao se d atravs do meio, pelo depsito e percepo de feromnios (comunicao indireta). A complexidade deste sistema, se d no pela ao de um nico elemento, mas sim desta interao, que proporciona ao conjunto de agentes resolver problemas cuja soluo no seria alcanvel por um nico elemento (Zhong e Evans, 2002). Este conecito utilizado na robtica por vrias pesquisas. Dorigo et al. (2004), mostra um estudo de caso na formao de comportamentos complexos como a movimentao coordenada e agregao de agentes. Atravs do conceito de enxames de robs (swarm robots) introduzido pelos pesquisadores, conseguiu-se alguns resultados promissores. Nos experimentos apresentados por Dorigo et al. (2004), um conjunto de sbots robs autnomos relativamente simples de reduzido poder computacional, de ao e
7 sensoriamento limitado foram capazes de formar um enxame de robs (swarm-bot). Estes experimentos demonstraram que a evoluo do swarm-bot foi capaz de produzir um sistema auto-organizvel baseado em regras gerais e simples, resultando em um sistema robusto e escalvel (Dorigo et al., 2004). Percebendo o potencial de heursticas inspiradas em enxames e colnias, esta dissertao visa o estudo, a caracterizao e a implementao de um sistema bio-inspirado, adaptando heursticas j estabelecidas na literatura ao problema de planejamento de rotas de ROVs, e aumentando seu desempenho atravs da combinao de algoritmos culturais (Reynolds e Chung, 1997; Iacoban et al., 2003; Coello e Becerra, 2003) com ACS. A dissertao est organizada da seguinte forma. Aps a introduo, no captulo 2, o problema descrito com detalhes e so apontadas as limitaes fsicas previstas. No captulo 3 apresentada uma introduo robtica mvel. No captulo 4 so apresentados mtodos de resoluo do problema, enfatizando o mtodo de ACS. No captulo seguinte, so apresentados e discutidos os estudos de casos realizados. Por fim, no captulo 6 so mencionadas as concluses e perspectivas de futura pesquisa.
Captulo 2. Descrio do problema

Conforme mencionado no captulo anterior, o foco desta dissertao o planejamento de uma rota de inspeo para um rob disponvel no mercado para trabalhar em dutos de mdio calibre (maiores de 150 mm). Para isso, inicia-se definindo o problema de planejamento de caminhos para a robtica autnoma. Thomaz et al. (1999) formularam o problema de planejamento de caminho de um rob autnomo como sendo dado um rob e o ambiente no qual ele est inserido, planejar um caminho entre dois locais especficos que seja livre de colises e satisfaa alguns critrios de otimizao especificados. Para abordar este problema, utilizado o conceito de sistema auto-organizvel definido por nsal (1993). De acordo com nsal (1993), um sistema auto-organizvel um sistema com trs caractersticas principais:
affect, ou seja, consegue analisar o meio no qual o rob est inserido. Esta caracterstica trata das limitaes que o meio impe ao rob mvel, assim como as conseqncias que tais limitaes trazem no projeto do mesmo; telos (do grego, aqui entendido como sendo avaliao) que representa a capacidade de planejamento de uma ao; efeito que simboliza as aes tomadas pelo sistema, entre as quais acionamento de motores, ajuste de foco de cmeras, controle de luminosidade de lmpadas e outros atuadores do rob mvel.
2.1. Limitaes fsicas do meio

A princpio, supe-se que existe o conhecimento da planta dos caminhos a serem inspecionados. O tempo esperado para a inspeo de cada trecho deve ser um parmetro conhecido a priori. No entanto, razovel supor que tais variveis mudem ao longo da inspeo. So esperados, em quaisquer inspees deste tipo, que se encontrem quebras na tubulao (Figura 2.1(a)), infiltraes (Figura 2.1(b)) e at mesmo corpos estranhos, como as razes de plantas (Figura 2.1(c)).
(i) (ii) (iii) Figura 2.1 Problemas encontrados durante uma inspeo de instalaes. Da esquerda para a direita: (i) quebra nas tubulaes; (ii) infiltraes; (iii) razes dentro da tubulao (fonte: Metropolitan Sewer District, 2003). No contexto desta pesquisa, supe-se que os efeitos do meio possveis so apenas no que tangem ao impedimento do movimento do ROV. Outros estudos como efeito de fluxo de gua no ROV, e outras possveis interferncias do meio sobre sua operao, como por exemplo, a reteno da estrutura mecnica, so tpicos de estudos posteriores.
2.2. Limitaes fsicas do ROV

Grande parte dos ROVs disponveis comercialmente pesquisados (Universidade de Oldenburg (2003), RoboProbe (2003), SRI International (2003)) possuem uma boa manobrabilidade. Normalmente, robs de tubulaes so compostos por duas esteiras que permitem a realizao de movimentos em curvas. Existem outras morfologias possveis de robs para esta finalidade, como robs peristlticos (Jianxu et al., 2000). Tais robs, ainda em fase de pesquisa e portanto no esto disponveis comercialmente, no so alvos desta pesquisa. Porm, no foram encontrados indcios que impeam a extenso dos resultados aqui obtidos para novas morfologias com suas devidas condies de contorno impostas por diferentes configuraes mecnicas. Sendo assim, a mobilidade do rob, ou mais especificamente a impossibilidade de que este realize curvas ou seja impedido de se movimentar no so fatores considerados obstculos resoluo do problema apresentado. Porm, tambm lhes compartilhado uma limitao: o cabo umbilical, mostrado na Figura 2.2 (Watanasin et al., 2001). Este cabo,
10 necessrio para a transmisso de sinais de controle e alimentao, assim como para a recepo dos dados dos sensores do ROV, possui um comprimento finito que limita o planejamento das aes do mesmo. Assim, o problema de planejar a inspeo toma um novo contorno, ao ser verificado que este cabo se move apenas com o auxlio do ROV, sendo para o ROV um limitante da distncia percorrida. O cabo umbilical dificilmente ser removido dos ROVs nos prximos anos. Existem vrios motivos para isso: primeiro, os ROVs normalmente se utilizam de motores eltricos, que requerem uma quantidade considervel de armazenadores eltricos (baterias), com consequente aumento do peso do ROV (Watanasin et al., 2001). Segundo, o armazenamento de imagens das inspees no realizado no ROV por questes de espao fsico, peso e segurana dos dados. Este envio de informaes deve ser feito atravs de cabos pois, muitas vezes, o meio interfere nas comunicaes de rdio. Por fim, interessante a disponibilidade de alguma forma de recuperar o ROV no caso do sistema ficar sem reao em algum ponto (imobilidade devido a obstculos no ambiente, problemas mecnicos etc).
11
Umbilical Transponder Sonda
Figura 2.2 Exemplo de ROV ligado base de operaes atravs de um cabo umbilical (Fonte: Universidade de Oldenburg, 2003).
12
2.3. Anlise de arquiteturas para autonomia de robs

Alami et al. (1998) enumeram seis propriedades requeridas por uma estrutura de controle de robs: 1. Programabilidade um rob no deve ser concebido apenas para uma tarefa ou ambiente descrito em detalhes, mas suas funes devem ser facilmente combinadas visando tarefa a ser executada. 2. Autonomia e adaptabilidade o rob deve executar suas aes e refinar (ou modificar) a tarefa e seu prprio comportamento de acordo com suas aes e o contexto percebido. 3. Reatividade o rob deve considerar eventos com limites de tempo compatveis com formas corretas e eficientes de se atingir suas metas (incluindo sua operao). 4. Comportamento consistente as reaes dos robs na ocorrncia de eventos devem ser guiadas pelos objetivos de sua tarefa. 5. Robustez a arquitetura de controle deve ser capaz de explorar a redundncia das funes de processamento. 6. Extensvel integrar novas funes e definies de novas tarefas deve ser uma tarefa fcil. A capacidade de aprendizado um fator importante a ser considerado. De acordo com os autores, a arquitetura deve aprender sempre que possvel.
Ao analisar estas caractersticas na tica dos sistemas auto-organizveis (nsal, 1993), nota-se que parte dos desafios propostos por Alami et al. (1998) enfocam a capacidade de entender o meio (Affect) e planejar suas aes sobre este (Telos). Ambos os autores notam que a atuao em ambientes no-ideais de sistemas inteligentes robticos ou no dependem no s da programao inicial do sistema, mas tambm de sua adaptabilidade ao contexto aonde o rob est inserido. Os pesquisadores vm buscando arquiteturas de sistemas que permitam esta adaptabilidade. Na Figura 2.3, a arquitetura proposta por Alami et al. (1998) apresentada. Esta arquitetura possui cinco nveis:
13
Nvel fsico: onde realizada a converso entre os sinais digitais e analgicos atravs de sensores e atuadores;
Nvel lgico: realiza o interfaceamento entre o nvel fsico e o nvel funcional; Nvel funcional: encapsula uma gama de aes elementares do rob, tais como localizao, controle do movimento, de garras/braos mecnicos, mecanismos de movimentao de cmera, etc;
Nvel de controle: controla e coordena a execuo de funes distribuindo-as de acordo com os requisitos da tarefa;
Nvel de deciso: engloba a capacidade de planejamento de tarefas e supervisionamento de suas execues. reativo a eventos do nvel anterior. Este nvel pode ser decomposto no sistema de planejamento da misso e no sistema supervisrio da execuo da mesma.
No caso do rob mvel aqui proposto, tem-se os nveis fsico e lgico como sendo os projetos mecnico e de interface do ROV. Esta interface permite ao nvel funcional, por exemplo, manter a estabilidade de robs submarinos ou ajustar a intensidade de uma lmpada para a obteno de uma melhor imagem de um problema em um duto por um rob de inspeo de tubulaes. O nvel de controle executa os comandos do supervisor de tarefas, enquanto este executa as tarefas planejadas pelo supervisor de planejamento. Outro conceito proposto na literatura o de arquitetura de robs reativos, definido por Ranganatha e Koeing (2003) como sendo uma arquitetura cujo objetivo a concepo de um sistema rpido baseado apenas nas leituras dos sensores, no possuindo um planejamento a longo prazo. Para o trabalho com robs de inspeo, um planejamento a longo prazo se faz necessrio, pois atravs deste planejamento que se busca uma reduo de tempo na execuo do servio. Tal esforo de controle particionado por Sandi et al. (1998) em dois subproblemas principais. Primeiro, o problema de navegao que designa a determinao de posio e orientao do veculo em um dado instante de tempo e, segundo, a guiagem, referente ao controle da trajetria do sistema mvel. Na arquitetura proposta por Alami et al. (1998),
14
Figura 2.3 Arquitetura de sistemas robticos adaptativos proposta por Alami et al. (1998). quanto maior o nvel hierrquico, maior a preocupao com a navegabilidade do rob. Quanto menor o nvel hierrquico, maior a preocupao com a guiagem. Sandi et al. (1998) citam como mtodo clssico de navegao o dead-reckoning, mtodo que, segundo os autores, no imune ao acumulamento de erros no posicionamento do sistema devido s limitaes do sensor. Esta tcnica, segundo os autores, requer o uso em conjunto de vrios outros sensores de forma que se obtenham medidas redundantes da
15 mesma grandeza e, assim, consiga-se compensar este erro. Sandi et al. (1998) citam vrios experimentos no qual encoders (codificadores digitais de posio) so utilizados junto a acelermetros e giroscpios para a obteno da posio, e outros onde informaes dos encoders so contrabalanadas por um sistema de processamento de imagem. Segundo Sandi et al. (1998), tanto a navegao quanto a guiagem necessitam de uma referncia em comum: pontos com posio e orientao desejadas para o veculo (waypoints). A obteno destes pontos alvo de vrios trabalhos. Dixon et al. (2002) utilizam uma anlise estatstica para determinar os objetivos a serem atingidos por um brao robtico, mostrando que esta necessidade no est presente apenas em robs mveis. A dificuldade de um projeto sensvel realidade de onde o rob opera foi notada por Hagras et al. (2001): Outro grande desafio na robtica autnoma a incerteza que caracteriza o ambiente do mundo real. Isso explica porque difcil, ou realmente impossvel, produzir simulaes de robs de operao em meios externos que sejam suficientemente condizentes com a real dinmica para o projeto e otimizao de controladores bons o suficiente. Esta incerteza maior de acordo com o grau de aproximao do mundo real. Referenciando-se estrutura da Figura 2.3, nota-se que o tempo de resposta do sistema deve ser menor quanto mais baixo for o nvel abordado. As incertezas mencionadas por Hagras et al. (2001) so fundamentadas no nvel fsico, sendo que cada nvel superior, ao abstrair os dados, possuem tambm a tarefa de filtrar informaes, s passando os dados pertinentes ao nvel superior. Assim, o nvel de controle no recebe as variaes tnues das leituras dos sensores, assim como o sistema de planejamento da misso no recebe o estado das tarefas, pois uma tarefa do sistema supervisor de tarefas. interessante notar que a simulao da operao do rob em um meio dinmico como no caso dos ambientes encontrados em inspees de tubos complexa. Existem foras referentes a dinmicas de fluidos ( raro encontrar tubulaes sem carga), a diferenas na resposta dinmica do sistema (devido, por exemplo a trechos escorregadios do percurso formados por acmulo de limo etc) e a outros problemas. Uma abstrao semelhante se faz necessria em outras arquiteturas de controle com planejamento de robs como a definida por Low et al. (2002). Todas as anlises mostradas at o momento, sejam abordagens prticas ou tericas de automao, mostram um ponto comum: em algum momento se faz necessrio o
16 planejamento de elementos referenciados como waypoints (Sandi et al., 1998; Dixon et al., 2002) ou plano de misso (Alami et al., 1998). Esta dissertao enfoca obteno automtica deste planejamento. As preliminares topologia do meio e lista de pontos por onde o rob deve passar para realizar a inspeo devem ser determinadas a priori. Cientes de que este meio pode mudar devido a passagens interrompidas, nosso sistema deve ser capaz de, com alteraes mnimas, recalcular estes waypoints no momento em que perceber quaisquer variaes.
2.4. Premissas do problema encontradas at agora

As premissas do problema a serem consideradas so as seguintes: Premissa 1: Deseja-se planejar a rota a ser usada em uma inspeo de um ROV, minimizando o caminho necessrio para passar por um conjunto de locaes determinadas. Para tal planejamento, pode-se considerar que se possui o mapeamento do local a ser inspecionado. Premissa 2: Este mapeamento pode ser alterado no decorrer da inspeo (caminhos podem estar obstrudos). Assim, se faz necessrio realizar um replanejamento com baixo custo computacional. Premissa 3: levada em conta a limitao do cabo umbilical. Assim, mais uma premissa a ser considerada que existe uma limitao de distncia entre o ROV e a base. No captulo 3, uma analogia deste problema com o problema do caixeiro-viajante, e uma forma de resoluo deste discutida.
17
Captulo 3. Introduo robtica mvel
Jones et al. (1998), caracterizam um rob como sendo a conexo inteligente entre percepo e ao. Visando a implementao desta conexo, Pfeifer e Scheier (1994) citam a metfora do processamento de informaes, tambm denominada de metfora do computador, como algo que obtm uma entrada, realiza um processamento e uma sada obtida. Quando esta metfora aplicada na rea de agentes inteligentes, tem-se o ciclo sentir-e-atuar. Utilizando esta abordagem, as arquiteturas de agentes inteligentes so subdivididos em vrios subsistemas: perceptual, de processamento central, motor e variaes. Porm, de acordo com Pfeifer e Scheider (1994), estas classificaes possuem uma premissa em comum: a hiptese de que eles podem ser divididos e estudados em subsistemas. Os autores exemplificam esta hiptese da seguinte forma: Primeiro, o sistema de percepo acionado, por exemplo, um copo de cerveja reconhecido. Depois disso, um sistema de controle central toma o lugar do sistema de percepo, atuando por exemplo como um sistema de tomada de deciso (se o agente est com sede, ele ou ela pode planejar a atividade de beber). E finalmente, o plano transferido para uma sequncia de aes motoras (levantando o copo, inclinando-o, etc). Em outras palavras existe uma cadeia de eventos ligando a percepo ao (Pfeifer e Scheider, 1994). Os autores criticam esta abordagem, defendendo que a sensao no pode ser processada de uma forma to analtica quanto conclui o senso comum. A conexo inteligente entra a percepo e a ao se d no atravs da anlise da percepo, mas sim da
18 busca de uma percepo para que se consiga uma ao determinada. Citando Pfeifer e Scheider (1994): O organismo est sempre envolvido em uma determinada ao ou atividade e esta determina o tipo de sensoriamento a ser realizado. Mais que isso, determina a interpretao deste estmulo. Esta interpretao ser muito diferente quando se olha para uma bebida ou quando se escreve um artigo cientfico. Assim, talvez ir da percepo ao no seja a direo correta, sendo prefervel, ao invs disso, que se inicie pela ao. Marchi (2001) cita trs categorias principais aonde os robs atuais podem ser enquadrados: robs industriais, de servio e de campo. Marchi (2001) define robs industriais como em geral, plataformas mveis utilizadas para tarefas pesadas como o transporte de materiais e produtos finais em sistemas de manufatura. Ainda de acordo com a autora, estes robs so denominados AGVs Automated Guied Vehicles e so concebidos para atuar em ambientes altamente estruturados seguindo marcaes no piso. Como robs de servio, so classificados aqueles utilizados para limpeza em geral (de pisos, dutos de ar etc), vigilncia e no transporte de materiais leves. O ambiente neste caso estruturado, e o rob possui um conhecimento prvio do mesmo (Marchi, 2001). Os robs de campo, trabalham em ambientes no estruturados, pouco conhecidos e geralmente perigosos (Marchi, 2001). So utilizados para a explorao (espacial, espeleolgica, etc), minerao, limpeza de acidentes nucleares, navegao em estradas e em tarefas agrcolas. Fuller (1999), citam alguns destes robs: O espao sideral um meio hostil para os seres humanos, ento robs so usados para muita da explorao espacial. Viking 2 pousou em Marte, a Voyager investigou Saturno e hoje deixou nosso sistema solar e se encontra em um local desconhecido; Galileo
19 voou por Jpiter e o Mars Rover explorou Marte. Ao contrrio sonda Viking, o Mars Rover realizou grande parte de suas prprias decises, em vez de depender de comandos humanos provenientes da Terra. A explorao de grandes profundidades ocenicas perigosa para seres humanos. Pessoas j vem usando manipuladores controlados remotamente para auxiliar esta explorao. Como o uso de manipuladores controlados remotamente possui um valor limitado neste meio, os pesquisadores tentam desenvolver robs autnomos para o uso explorao de ambientes ocenicos. No presente momento, companhias que mantm tubulaes se utilizam de robs para realizar a inspeo por dentro dos tubos. Uma verso modificada deste rob pode ser usada para inspecionar dutos externamente quando estes forem submersos. Costa (1998), sintetiza duas formas de descrio de um sistema robtico autnomo: uma primeira, trata dos diferentes mdulos do sistema enquanto outra trata da criao de solues baseadas em comportamento. Quando se trata o sistema por mdulos, o resultado um conjunto de mdulos funcionais interdependentes distribudos entre camadas de sensores e atuadores. Neste caso, a definio de aes a serem realizadas ficam em geral sob controle de um mdulo de planejamento. (Costa, 1998). As solues baseadas em comportamentos so baseados na construo de um sistema robtico composto de mdulos independentes, definidos por Costa (1998) como subsistemas capazes de operar sozinhos e realizar tarefas especficas. Tais sistemas, que executam as tarefas atravs de recursos limitados de informao e atuao, so mais fceis de implementar e possuem um custo computacional menor (Costa, 1998). A interligao
20 dos subsistemas realizada de forma hierrquica, dividindo os mdulos por nveis de comportamento. Como comportamento, Costa (1998) define como uma ao motora objetiva ligada a um processo especfico de percepo. Se aprofundando mais, o autor ainda diz que um comportamento definido como um sistema que resolve um problema especfico, gerindo a informao proveniente de alguns sensores e controlando alguns atuadores, utilizando para isso recursos computacionais limitados, interagindo, normalmente, de uma forma reativa com o meio ambiente. Marchi (2001) define a construo de sistemas robticos como uma tarefa multidisciplinar, envolvendo elementos das engenharias eltrica, mecnica e de cincia da computao. Ao se analisar trabalhos como o de Zimmer (1995), notamos que, dependendo da abordagem utilizada no desenvolvimento do sistema autnomo, outras reas podem ser includas, como psiclogos, fisiologistas, neuro-cientistas, entre outros. Zimmer (1995) analisa trs tarefas importantes que o rob autnomo deve ser capaz de realizar: obter sua localizao, mesmo estando em um ambiente desconhecido e no
estruturado; realizar navegao, englobando duas tarefas, a de navegao global, que se
refere ao planejamento de trajetrias e a navegao local, que cuida da realizao de manobras para o cumprimento da trajetria; determinar um alvo, quando se requer do rob aes que vo alm da
navegao pura e simples (como por exemplo transporte de cargas, vigilncia etc).
21 Marchi (2001) sintetiza que a principal dificuldade em se construir um sistema de navegao (local) de um rob mvel autnomo permitir ao rob trafegar entre dois pontos sem que haja coliso com obstculos. As principais dificuldades encontradas nesta tarefa, ainda segundo a autora, so aquelas relacionadas ao mundo real, que possui caractersticas que no podem ser desprezadas no projeto de um sistema autnomo: o mundo real no totalmente acessvel, pois os sensores oferecem medies
imprecisas e algumas mudanas do meio so percebidas apenas quando o rob est fisicamente prximo a elas; indeterminado, pois sempre rodas podem escorregar, baterias podem falhar,
sendo assim impossvel assegurar que uma determinada ao seja executada sem falhas; no totalmente previsvel, pois suas aes futuras e efeitos no podem ser pr-
determinados com exatido; dinmico, sendo necessrio o rob autnomo entender quando melhor esperar
e quando melhor agir imediatamente; contnuo, sendo que as aes e estados ocorrem de acordo com as mudanas no
prprio meio. Como existem infinitas combinaes, impossvel enumerar o conjunto de aes.
Tais caractersticas, podem tambm ser um problema para o sistema de navegao global (ou planejamento de caminhos), pois podem causar passagens interrompidas, dificultar trecho e facilitar outros, fornecendo assim novas caractersticas ao meio previamente conhecido.
22 Assim, para que um rob mvel possa atuar no mundo real, ele deve ser capaz de se adaptar s suas mudanas. Conforme define Marchi (2001), a estrutura do sistema autnomo deve ser hbrida, consistindo de duas partes principais: Uma primeira, que trata o ambiente como um problema esttico, e realiza o
planejamento de rotas a partir deste conhecimento. Esta abordagem, aonde temos um modelo de ambiente fornecido a priori, chamada de Abordagem Planejada ou Deliberativa. Uma segunda, que garante robustez e adaptabilidade ao rob, aonde o mesmo
assume comportamentos (como desviar de obstculos, seguir paredes, caminhas em uma direo, etc) e toma suas decizes baseando-se na leitura de seus sensores. Com isso, consegue-se navegar por ambientes dinmicos e no estruturados.
Na abordagem hbrida, o rob conhece o ambiente, planeja a trajetria e age reativamente diante de situaes imprevistas (Marchi, 2001). Ou seja, existe um plano inicial de trajeto, e um sistema de navegao pronto para responder s respostas inesperadas do meio. Tal habilidade citada por Nehmzow (2001), que afirma que antes que se tente fazer um rob mvel desempenhar uma tarefa complexa, essencial que o rob opere de maneira segura, realizando comportamentos simples como evitando obstculos e pessoas. O problema de planejamento de caminhos pode ser definido como uma variao do planejamento de aes de um outro sistema robtico: robs manipuladores. Siegwart e Nourbakhsh (2004, pp.259), afirmam que o problema de planejamento de trajetrias para um rob manipulador com, por exemplo, seis graus de liberdade, mais complexo que um rob mvel de trao diferencial operando em um ambiente bidimensional. Assim, embora possamos obter inspirao de tcnicas inventadas visando robs manipuladores, algoritmos de planejamento de trajetrias usados por robs mveis tendem a possuir simplificaes
23 graas ao nmero reduzido de graus de liberdade do sistema. Mais ainda, os robs manipuladores industriais normalmente buscam operar na maior velocidade possvel, levando em conta o impacto econmico envolvido. Assim, deve-se levar em conta a dinmica, no apenas a cinemtica de seus movimentos. Em contraste, o nmero de robs mveis que operam em baixas velocidades grande, o que faz estas consideraes serem raramente consideradas durante o planejamento de trajetrias, simplificando ainda mais a instanciao do problema. Este planejamento de tarefas complexas, segundo Choset et al. (1996), pode ser feito de duas formas distintas: Atravs do mtodo denominado pelo autor de planejamento clssico
(classical planning), que requer um conhecimento antecipado e total do contexto aonde o rob est inserido Ou atravs do mtodo de planejamento baseado em sensores (sensor based
planning), que, em contraste ao planejamento clssico, integra os sistemas de sensoriamento do rob com o processo de planejamento. Choset et al. (1996) e Choset e Nagatami (2001), adicionam o conceito de roadmap na aplicao deste mtodo de planejamento, visando possibilitar ao sistema de planejamento trs caractersticas: acessibilidade (achando um caminho livre pelo roadmap), conectividade (permitindo ao rob se mover em direo vizinhana do objetivo) e ainda partio do planejamento (construindo um caminho livre de colises entre os vrios pontos que ligam o local de incio do movimento at o objetivo).
Todas as abordagens, porm, levam em conta uma variedade limitada de elementos sensores. McKerrow (1991), define os usos principais dos sensores em robs autnomos:
24 medir os parmetros do prprio rob para laos de controle (por exemplo, um
encoder pode fornecer a posio angular de uma roda, permitindo assim aumentar ou diminuir o torque do motor correspondente); determinar a localizao de objetos (por exemplo, um alvo a ser seguido); correo de erros no modelo matemtico do rob ou do mundo (por exemplo:
erro de sensores, mudana no contexto do rob, etc); detectar e evitar situaes de falha (como por exemplo evitar um buraco no
solo); detectar e evitar colises (seja contra objetos estticos ou mesmo objetos
mveis); monitorar interaes com o meio (por exemplo, a passagem por uma mancha de
leo); monitorar mudanas no meio que possam vir a atrapalhar a tarefa (mudanas de
temperatura, por exemplo); inspecionar os resultados dos processos (para garantir que uma tarefa foi
realmente realizada).
Para tal, os elementos sensores devem ser capazes de transformar uma grandeza fsica em uma percepo vlida para o rob. McKerrow (1991) define o processo de sensoriamento de um rob da seguinte forma: uma grandeza fsica transformada em um sinal eltrico por um transdutor; este sinal eltrico condicionado por uma eletrnica de condicionamento, se
tornando um sinal condicionado, normalmente aps etapas de linearizao e amplificao;
25 o sinal condicionado passa por uma interface computacional, que o transforma
em um sinal digital; este sinal digital processado, gerando um modelo geomtrico da grandeza
que se deseja perceber, sendo que este pode conter informaes de diversos sensores (como uma matriz de contato, ou at mesmo um sinal multiplexado no tempo como o caso de um sinal de vdeo); por fim, esse modelo geomtrico analisado com o intuito de se conseguir
determinar o estado atual do mundo e se inferir o resultado de possveis aes do sistema robtico. O resultado desta anlise denominado por McKerrow (1991) como sendo a percepo.
Gaspar et al. (2004) analisa que a forma de percepo do mundo por robs como uma ao cujo resultado depende do contexto aonde o sistema autnomo est inserido. O autor exemplifica, dizendo que quando andamos em uma avenida, suficiente que se conhea a posio atual com preciso de uma quadra. Porm, quando se deseja entrar passar por uma porta, a preciso requerida muito maior. Este raciocnio fundamentado quando observa-se que, na natureza, muitos animais se utilizam de navegao baseada em pontos especficos do terreno (landmarks) e mtodos de integrao de rotas. Tambm defendendo que a percepo no pode ser tratada de forma separada ao, Wasson et al. (1999) afirma que a percepo precisa conhecer a ao e a ao precisa conhecer a percepo. Ou seja, um sistema que perceba o mundo deve poder ser direcionado e controlado de acordo com a tarefa atual do agente. A ao, por sua vez, precisa de conhecer a natureza da informao disponibilizada pelo sistema de percepo.
26 Esta conexo, notada claramente em arquiteturas robticas reativas, pode ser combinada com elementos de processamento que geram padres comportamentais esperados que dificilmente seriam gerados de forma puramente reativa. Estas arquiteturas hbridas, combinam formas diferentes de mecanismos de planejamento com nveis mais baixos de controles baseados em comportamento. As arquiteturas hbridas consistem hoje no maior foco no desenvolvimento de agentes autnomos e semi-autnomos operando em tempo real e ambientes reais (Datteri et al., 2003). Tanto em arquiteturas hbridas quanto em arquiteturas reativas, temos um conjunto limitado de grandezas que o rob pode medir. A seguir, mostrado um conjunto de sensores e atuadores encontrados comercialmente com frequncia.
3.1. Sensores de uso comum na robtica mvel
3.1.1. Sensores de proximidade

Para evitar colises, so encontrados no mercado mdulos detectores de obtculos baseados em infravermelho (Figura 3.1). Tais mdulos, possuem um emissor de luz infravermelha e um receptor, e se baseia na premissa de que possvel detectar um obstculo quando este estiver prximo do rob o bastante para que o feixe de infravermelho seja detectado pelo receptor.
27
Figura 3.1 Sensor de proximidade utilizando um conjunto emissor/detector de infravermelho (fonte: LYNXMOTION, 2005).
Para detectar a proximidade de obstculos, tambm se utilizado sensores de ultrassom, como os existentes no rob Nomad 200 (Queiroz et al., 1996). Estes sensores, permitem que o sistema mvel obtenha a distncia entre o rob e o objeto em que o sensor est focalizado. O rob Nomad 200 mostrado na Figura 3.2.
Figura 3.2 O rob Nomad 200 (fonte: Queroz et al., 1996).
28 Outro tipo de sensor comum o sensor de toque mecnico (Figura 3.3). Este sensor popular principalmente pela sua simplicidade no tratamento do sinal (pois consiste apenas de um interruptor que chaveia entre dois nveis lgicos).
Figura 3.3 Um exemplo e sensor de toque (fonte: Instituto para a Robtica Prtica, 2005).
3.1.2. Sensores de deslocamento

Utilizados para inferir a posio atual dos robs, os encoders so um tipo de sensor de deslocamento muito encontrado no mercado. Sua importncia tamanha que empresas fornecedoras de motores de preciso j incluem encoders acoplados aos seus motores. Os encoders consistem basicamente de um disco com aberturas (janelas) estrategicamente localizadas acoplado um sensor tico transmissivo. Desta forma, contando o nmero de vezes o sensor chaveado, consegue-se saber o nmero de janelas passaram, e, desta forma, consegue-se saber quanto um determinado eixo girou. interessante notar que os encoders esto sujeitos ao deslizamento das rodas. Desta forma, embora sejam uma boa fonte de estimativa de deslocamento, o ajuste fino da posio do rob deve ser realizada atravs de outro estmulo.
29 De interpretao um pouco mais complexa, os acelermetros tambm podem ser usados para a determinao do deslocamento, assim com a velocidade instantnea do rob. Na Figura 3.4 tem-se exemplos de acelermetros disponveis no mercado. Porm, devido a alguns fatores, tais como custo (muito maior que o encoder) e custo computacional envolvido para sua anlise (pois a determinao do espao percorrido a integral no ponto da acelerao), estes sensores no so explorados em vrios robs comerciais, como o Nomad 200 e o Kephera.
Figura 3.4 Exemplos de encapsulamentos de acelermetros disponveis no mercado (fonte: P.A.R.T.S., 2005).
3.1.3. Cmeras
Hoje, nota-se em diversos robs de laboratrio o uso de cmeras. Estes sensores, embora venham com a dificuldade do tratamento de vdeo em tempo real, permitem a extrao de informaes importantes do meio, por exemplo, a localizao de obstculos, localizao de objetivos etc.
30
3.1.4. Outros sensores e a ambiguidade sensorial

Comercialmente e em desenvolvimento, encontra-se no mercado uma vasta gama de sensores que tambm podem ser utilizados na robtica mvel. Entre eles, temos bssulas eletrnicas (Zagros Robotics, 2005) entre outros. A lista mostrada at agora no tem o intuito de esgotar as possibilidades de grandezas e formas de medio que possam ser percebidas por um sistema robtico mvel. Muito antes pelo contrrio, o nmero de universidades e empresas que pesquisam novas formas de sensoriamento vasto, como por exemplo a empresa Sensor Research (Sensor Research 2005). O que foi apresentado representa apenas os sensores mais comuns. O projetista de sistemas robticos tambm no pode ignorar a convenincia do uso combinado de vrios tipos de sensores que objetivem a medida de uma mesma grandeza. Segundo Monteiro e Ribeiro (2004), a ambiguidade sensorial se torna mais interessante principalmente quando se percebe que nenhum sensor d uma informao completa do meio. Segundo os autores, frequentemente, o estado no totalmente observvel, ou seja, no sempre conhecido qual o estado atual em que o sistema est. Nas situaes prticas, os sensores do agente fornecem apenas informaes parciais (e com freqncia ruidosas), que no conseguem perceber o estado real do ambiente. Neste caso, Monteiro e Ribeiro (2004) se utilizaram de uma arquitetura baseada em redes neurais para realizar a integrao das leituras de sensores como sonar, laser e infravermelho. So observados outras arquiteturas que possibilitam a integrao entre sensores, como o trabalho de Sandi et al. (1998), que integra odmetros e bssula digital. Neste trabalho, os autores escolheram uma abordagem baseada em filtros de Kalman para a obteno da posio do rob mvel. Dando continuidade esta introduo robtica mvel, ser apresentada a seguir as morfologias mais comuns de robs mveis encontrados comercialmente.
31
3.2. Morfologias de robs disponveis comercialmente

3.2.1. Robs mveis com rodas
Uma arquitetura comum quando tratamos do robs mveis, a arquitetura de robs dotados de rodas (figura 3.5). Existem vriaes desta arquitetura, sendo a mais divulgada ao pblico a arquitetura de seis rodas com amortecedores independentes, existente no rob Sojourner enviada pela NASA ao planeta Marte (figura 3.6).
Figura 3.5 Rob com duas rodas de acionamento independente (fonte: Robot Books, 2005).
32
Figura 3.6 O rob Soujourner da NASA (fonte: NASA, 2005).
Outras arquiteturas, como a mostrada por Choi e Ryew (2002), se utilizam de sistemas de rodas articuladas que, juntamente com um corpo segmentado, permitem uma grande manobrabilidade dentro de tubos de gs.
3.2.2. Esteiras
Utilizadas quando se busca um atrito maior do solo, esteiras como as mostradas na Figura 3.7.
Figura 3.7 Conjunto de esteiras prontas para serem usadas em um rob de inspeo (fonte: Inuktum, 2005).
33
3.2.3. Pernas
O simples ato de andar traz tona uma srie de problemas, a maioria relacionados manuteno do equilbrio. Apenas resolver este problema mecatrnico um dos campos de destaque da pesquisa em robtica atual. Robs com quatro pernas j so realidade no mercado, como o co-rob Aibo da Sony (Figura 3.8). Porm, o desafio de se criar um rob bpede maior. Este desafio, vm sido colocado comunidade cientfica, como em competies como as promovidas pela FIRA (Figura 3.9).
Figura 3.8 O rob co AIBO da Sony (fonte: Sony, 2005).
34
Figura 3.9 Um dos robs bpedes apresentados em eventos da FIRA (fonte: FIRA, 2005).
35
Captulo 4. Metodologia
4.1. Problema do caixeiro viajante
As origens do problema do caixeiro viajante (TSP Travelling Salesman Problem) so obscuras, de acordo com Applegate et al. (1998). Os autores enumeram trabalhos relevantes no estudo do algoritmo: a primeira referncia citada pelo autor uma publicao do matemtico e economista Karl Menger na dcada de 20. Na dcada de 30, o problema reapareceu em grupos de estudo da Universidade de Princeton. Na dcada de 40, foi estudado por estatsticos que ligaram este problema com aplicaes na agricultura, e o matemtico Merril Flood popularizou o problema entre seus colegas da corporao RAND na Califrnia. Ravikumar et al. (1998) define o problema do TSP como: O problema do caixeiro viajante um problema bem conhecido de otimizao NPdifcil. Pode ser definido da seguinte forma. Seja G = (V, E) um grafo, onde V = (v1...vn) representa o conjunto de vrtices e E = ((vi, vj): vi, vj V) represente o conjunto de arestas. A cada aresta (vi, vj), (i j), associado um custo no negativo cij . O TSP consiste em encontrar uma rota fechada de custo mnimo passando por todos os vrtices apenas uma vez. Helsgaun (1998) classifica o problema do TSP em trs categorias, a partir da anlise da matriz de custos que possui todos os elementos cij: se cij = cji, o problema dito simtrico. Caso contrrio, dito assimtrico; se a inequao cik cij + c jk se mantm para todo i, j, k, o problema dito mtrico; se cij so as distncias euclidianas entre pontos no plano, o problema dito Euclidiano. Um problema Euclidiano , tambm, simtrico e mtrico. Cunha et al. (2002), assim como Ravikumar et al. (1998) e Helsgaun (1998), citam o trabalho de outros pesquisadores, demonstrando a vasta gama de aplicaes em engenharia, cincia e bioinformtica da resoluo deste problema. Entre eles, so citados o
36 uso deste para a soldagem de placas de circuito impresso em fbricas automatizadas, cristalografia de raio-x e controle de robs. Existem outras heursticas, como o planejamento de rotas de veculos de entrega, o problema de atribuio quadrtica, entre outros discutidos na literatura (Boctor et al., 2003). Para todas as aplicaes mencionadas, nota-se a necessidade de heursticas de baixo custo computacional e rpida convergncia, conforme mencionado por Ravikumar et al. (1998). O conceito de problema de otimizao combinatria, definido por Blum (2003). Segundo o autor, P=(S,f) um problema de otimizao combinatrio quando possui:
Um conjunto X de variveis, tal que X = {x1,...xn} Domnios D1,...Dn das variveis x1,...,xn Condies de contorno para cada varivel Uma funo objetivo f a ser minimizada onde f:D1x...xDnR+.
O TSP considerado um problema de otimizao combinatria no determinstico e de complexidade polinomial categorizado como NP-difcil (do ingls NP-Hard,
Nondeterministic-Polynomial-Hard, no determinstico-polinomial-difcil), indicando sua

complexidade exponencial. Assim como o caixeiro viajante, outros problemas combinatrios so categorizados como NP-difcil. Entre eles, tem-se (Silver 2002):
O problema de atribuio quadrtica (quadratic assignment problem), definido como: dado um conjunto de n depsitos, o volume de material que pode ser movido por unidade de tempo entre dois depsitos conhecido a priori. O objetivo posicionar os armazns de forma a minimizar a relao distncia
versus volume de material transportado.

O problema do planejamento de projeto com recursos limitados (resource-
constraint project-scheduling problem), definido como: dado um projeto com n

atividades distintas, cada uma composta de um tempo de execuo e um certo nmero de recursos. Existe um valor mximo para o uso simultneo de cada recurso, assim como relaes de dependncias entre as atividades. O objetivo minimizar a execuo de todas as tarefas (e, consequentemente, do tempo total do projeto).
O problema de determinao de rotas de veculos de entregas (vehicle routing
problem), definido como: dado um depsito e um conjunto de destinos,
37 determinar a melhor forma de distribuir uma frota de veculos para a entrega de modo a respeitar situaes de contorno, a saber: (a) mximo de carga disponvel por veculo; (b) mximo de tempo (ou distncia) de viagem por veculo; (c) situaes relacionadas janela de tempo, como por exemplo horrios prestabelecidos de liberao de mercadorias ou de entrega de mercadorias. Cunha et al. (2002) mostra a dificuldade de resoluo do problema do caixeiro viajante, ao afirmar que o esforo computacional para a sua resoluo cresce exponencialmente com o tamanho do problema. Stager (2001) quantifica esta afirmao ao dizer: Uma soluo para o problema do caixeiro viajante pode ser calculada comparando cada rota com as demais at que o menor caminho encontrado. O nmero de rotas que necessitam ser calculadas igual a (N-1)!, onde N representa o nmero de cidades. Se um computador pudesse calcular a distncia de cada rota em 1ms, a soluo para 10 cidades poderia ser encontrada em 3,63 s. Para 15 cidades, a soluo seria encontrada em 15 dias e para 20 cidades a soluo seria encontrada em 77146 anos (Stager, 2001) . O problema apresentado no Captulo 2 (que o problema de trajetria considerando as limitaes fsicas do ROV), mostra similaridades ao problema do TSP, pois:
ambos os problemas tratam de planejamento de rotas; no TSP o objetivo passar por todas as cidades conhecidas, e o ROV de inspeo deve passar por locais pr-determinados. Em um pior caso, o nmero de locais a serem inspecionados ser igual ao nmero de locais conhecidos.
So tambm adicionadas algumas novas condies de contorno ao problema do TSP:
a limitao do cabo umbilical; a necessidade de recalcular a rota em tempo hbil caso o rob perceba uma mudana no meio.
A seguir, algumas formas de resolver o problema do TSP so avaliadas na esperana que, com a adio de algumas heursticas, a transformao deste problema clssico no problema discutido at o momento seja apropriada.
38
4.2. Algoritmos para o problema do caixeiro viajante

Helsgaun (1998) classifica as respostas possveis do problema do caixeiro viajante em duas classes principais:
algoritmos exatos; algoritmos aproximados (ou heursticos). Os algoritmos exatos possuem a caracterstica de, aps um nmero determinado de
passos, obter a resposta tima para o problema. Hoje, possvel obter a resposta atravs destes algoritmos para formulaes do TSP com poucas centenas de cidades, embora existam relatos de solues com milhares de cidades. Helsgaun (1998) cita os algoritmos de plano de corte e descobrimento de facetas como os mais precisos. Porm, tambm mostra que so algoritmos complexos, de alto poder computacional (levou 3-4 anos aproximadamente de tempo de CPU em uma complexa rede de computadores para se determinar a soluo exata do problema de 7393 cidades (Helsgaun, 1998) ). Devido a sua complexidade, foi considerado um dos marcos no estudo deste algoritmo o trabalho de Dantzig, Fulkerson e Johnson em 1954, que publicaram o mtodo de plano de corte que resolve uma instncia do TSP de at 49 cidades (Applegate et al., 1998). Em contraste com os algoritmos exatos, os algoritmos heursticos visam obter uma resposta aceitvel em um tempo menor. Esta resposta, nem sempre a tima, porm o ganho de tempo de CPU normalmente compensa este diferena de apenas alguns pontos percentuais na mdia. Silver (2002) analisa trs circunstncias aonde o uso de um mtodo heurstico vantajoso:
quando um grande aumento no nmero de elementos observado no domnio da funo;
39
quando existe dificuldade em analisar a funo objetivo, muitas vezes pela presena de variveis estocsticas; quando se tem uma funo objetivo com comportamento diferenciado em relao ao tempo, necessitando uma anlise de sries histricas, no bastando uma nica anlise de uma nica soluo em um ponto do espao de busca.
Silver (2002) cita algumas razes que incentivam o uso de algoritmos heursticos:
implementao simples: de acordo com o autor, a aceitao e uso de regras de deciso pelos tomadores de deciso mais fcil quando, pelo menos de forma intuitiva, se compreende como as regras operam, em especial os efeitos dos parmetros do algoritmo na escolha de aes;
possibilidades fortes de melhorias frente mtodos tradicionais, quando gerentes podem escolher a modificao de processos consolidados visando o aumento de desempenho do processo produtivo;
resultados mais rpidos e razoveis (no necessariamente timos), podem ser obtidos atravs de algoritmos heursticos; robustez, pois os algoritmos heursticos so menos sensveis variaes do problema que os algoritmos exatos.
Blum (2003) enumera algumas caractersticas de algoritmos baseados em heursticas. Antes de tudo, o autor define que heursticas so estratgias que guiam o processo de busca, com a finalidade de explorar de forma eficiente as solues possveis para que se obtenha solues prximas ao timo. As tcnicas que constituem algoritmos heursticos podem variar de simples procedimentos de busca at processos complexos de aprendizado, e so normalmente no determinsticas. Tambm se enumera que esta classe de algoritmos no realizada para problemas especficos, embora possa ser previsto a influncia sobre condies de contorno do meio aonde est inserido sobre o mesmo. interessante notar que Blum (2003) destaca que as heursticas avanadas usam o conhecimento da busca incorporado em alguma forma de memria para guiar os passos do agente. Exemplos de conhecimento da busca so mostrados no item 4.3.3 (algoritmo de colnia de formigas) e no Captulo 5.
40 Indo mais alm, Helsgaun (1998) divide os algoritmos heursticos em trs classes principais:
algoritmos de construo de caminhos, onde os caminhos so adicionados rota gradualmente; algoritmos de melhoramento de caminhos, onde se tm uma rota e os caminhos so trocados para se obter a melhor rota; e algoritmos compostos (ou hbridos), que combinam as duas classes anteriores.
Laporte (2000) apresenta um estudo de heursticas para a resoluo do problema de descoberta de rotas para veculos. Segundo ele, existem trs categorias de resposta este problema:
heursticas construtivas, que constroem a soluo gradualmente, sempre observando o custo da soluo, porm sem obter uma fase exclusiva de otimizao; heursticas de duas fases, classificao dos vrtices em rotas possveis e a construo das rotas propriamente ditas; mtodos de melhoramento, que buscam melhorar cada soluo possvel ao realizar a troca de rotas nas rotas disponveis. Laporte (2000) ainda cita seis algoritmos principais para a resoluo desta variao
do problema do TSP: simulated annealing, deterministic annealing, busca tabu, algoritmos genticos, colnia de formigas e redes neurais artificiais. Outras propostas tambm so encontradas na literatura, como mapas auto-organizveis (Vieira, 2003), algoritmos memticos, scatter search, randomized greedy search (GRASP), busca em rvore, entre outras (Merz e Freisleben, 2000). Mills et al. (2004) faz a comparao entre os algoritmos heursticos de minimizao, enumerando cinco caractersticas principais quanto ao uso de:
movimentos aleatrios para escapar de mnimos locais; solues baseadas em populaes de agentes; modificao da vizinhana; pesos ou penalidades para a alterao da funo objetivo; modelos probabilsticos; memria, seja ela de longo ou de curto prazo.
41
4.2.1. GRASP (Greedy Randomized Adaptive Search Procedure)

Resende e Velarde (2003) definem o algoritmo GRASP como um mtodo multiprocesso, onde cada instncia GRASP consiste na construo de uma soluo individual aleatria seguida de uma busca local que se utiliza da soluo individual como ponto de partida. Este procedimento realizado repetidamente, sendo que a melhor soluo de todos os procedimentos GRASP executados definida como a melhor soluo encontrada.
4.2.2. Simulated annealing

Karlson (2002) define o algoritmo de simulated annealing atravs da sua origem fsica: o processo de annealing. Este procedimento, se d quando um metal aquecido resfriado. No incio, a estrutura cristalina do metal se encontra com um nmero considervel de imperfeies. Conforme se esfria o metal at a temperatura ambiente, notase um rearranjo da estrutura cristalina do mesmo. Visando obter uma estrutura cristalina perfeita, so realizados dois movimentos: um, de aquecimento, que visa buscar o rearranjo aleatrio das partculas; outro, de resfriamento, de forma a garantir que se estabelea a melhor estrutura cristalina. Ao se simular este procedimento, existem quatro pontos principais a serem tratados no caso (Kirkpatrick et al., 1983):
determinar a estrutura do elemento; determinar sua funo de reduo de temperatura; determinar a forma de rearranjo dos tomos; determinar uma funo objetivo a ser otimizada.
Atravs deste algoritmo, os pesquisadores tm conseguido resolver diversos problemas combinatrios, entre eles, o problema do caixeiro viajante (Kirkpatrick et al., 1983).
42
4.2.3. Algoritmo de Lin-Kernighan

Um mtodo clssico na literatura de algoritmos de melhoria de caminhos o algoritmo 2-opt. Helsgaun (1998) define este como: dado um caminho j fornecido, substitua duas de suas conexes de modo a formar um caminho mais curto. Continue at que no seja possvel nenhuma forma de melhoramento. A figura 4.1 mostra um exemplo desta operao com o caminho original (figura 4.1(a)) e com a substituio (figura 4.1(b))
(a)
(b)
Figura 4.1 Exemplo de aplicao do algoritmo 2-opt.
Uma vez definido o algoritmo 2-opt, pode-se definir o algoritmo 3-opt, citado por Morawek (2003) como uma continuao direta do algoritmo 2-opt. Este mtodo, usa princpios semelhantes otimizao 2-opt, com o diferencial de que so alterados trs conexes, e no mais duas. Um exemplo desta operao mostrado nas figuras 4.2(a) (caminho original) e 4.2(b) (caminho alterado).
43
(a)
(b)
Figura 4.2 Exemplo de aplicao do algoritmo 3-opt. Da mesma forma que o algoritmo 3-opt foi obtido atravs da evoluo do algoritmo 2-opt, pode-se obter um algoritmo mais genrico denominado algoritmo -opt. A otimizao definida como sendo: Um caminho dito -opt se for impossvel obter um caminho menor substituindo quaisquer de suas ligaes por outro conjunto de conexes (Helsgaun, 1998). Segundo Helsgaun (1998), a generalizao deste simples princpio forma a base de um dos mais eficientes algoritmos de aproximao para a resoluo do TSP simtrico, o algoritmo de Lin-Kernighan. fcil notar que, quanto maior o nmero de cidades, maior o nmero de iteraes necessrias para que a condio acima seja satisfeita. Lin e Kerninghan, conseguiram diminuir o custo computacional deste algoritmo ao incluir um -opt varivel (Lin e Kerninghan, 1973). Com isso, a cada iterao o algoritmo altera o valor de , visando o menor caminho. A cada iterao, o algoritmo considera um conjunto maior de elementos a serem trocados. Este algoritmo continua sua execuo at que uma condio de parada seja satisfeita (Helsgaun, 1998). O autor enumera algumas das caractersticas principais deste algoritmo:
sendo n o nmero de cidades, o algoritmo possui um tempo de execuo na ordem de n22 (Helsgaun, 1998);
44
capaz de determinar a soluo tima para a maioria dos problemas com menos de 100 cidades.
O esforo de codificao necessrio para a implementao do algoritmo de busca local de Lin-Kernighan, comentado em Helsgaun (1998) que afirma: os autores mostram que nenhuma outra implementao do algoritmo realizada at o momento havia mostrado uma eficincia to boa quanto a obtida por Lin e Kernighan.
3.2.4. Algoritmos genticos

A teoria de algoritmos genticos foi desenvolvida inicialmente por John Holland, se baseando no processo evolucionrio encontrado na natureza (Tomassini, 1995). O algoritmo gentico baseado em um procedimento iterativo que age sobre uma populao de indivduos (solues), cada uma representando uma soluo possvel no espao de busca. A cada ciclo do procedimento, estes indivduos so classificados segundo uma funo de aptido (fitness). Os indivduos mais aptos ou seja, os que possuem maior aptido, tm mais chances de passarem pelo operador de cruzamento (crossover) e probabilisticamente tm maior chance de sobreviver na prxima gerao. Em resumo, a heurstica dos algoritmos genticos pode ser detalhada pelas seguintes etapas:
Gerar aleatoriamente uma populao inicial de indivduos Para cada indivduo, obter o fitness de acordo com uma funo custo Enquanto um critrio de parada no for satisfeito { Selecionar os melhores indivduos para reproduo Recombinar os indivduos Aplicar o operador de mutao Avaliar o fitness de cada indivduo Gerar uma nova populao }
45 Assim, se percebe que os algoritmos genticos so estocsticos e baseados em populao. O desempenho de um algoritmo gentico depende dos operadores (Deb, 1999; Morawek, 2003):
Reproduo/seleo; Cruzamento; Mutao.
A reproduo objetiva enfatizar as melhores solues (candidatos) e penalizar as piores solues de uma populao. Para isso, escolhe-se os melhores resultados obtidos (normalmente aqueles classificados como sendo acima da mdia), realizam-se cpias dos resultados e substitui-se os piores resultados pelos novos. Deb (1999) cita vrios mtodos para que se realizem estas operaes: algumas abordagens usuais so a seleo por torneio, a seleo proporcional, a seleo por ranking, entre outros. Uma rpida anlise mostra que a reproduo no consegue gerar novas solues para o sistema (Deb, 1999). Para isso, so utilizados os operadores de cruzamento (crossover) e mutao. Deb (1999) analisa o uso do operador de cruzamento: como o operador de reproduo, existem na literatura uma srie de operadores de crossover, mas na grande maioria deles, duas strings (representando o genoma) so obtidas dos indivduos vencedores e tem uma poro trocada entre si.. Morawek (2003), caracteriza o propsito deste operador como sendo a forma do algoritmo conservar o material gentico de uma gerao para outra e ao mesmo tempo combin-lo de forma proveitosa visando a busca em novas reas do espao de busca. O operador de mutao o responsvel pela gerao da diversificao da populao (Deb, 1999). Sem ele, o cruzamento e a reproduo logo convergiriam e obteriam o melhor elemento da populao inicial, no do problema em si. Sua implementao consiste na mudana de alguma caracterstica de um indivduo, normalmente atravs de uma funo probabilstica. Deb (1999) resume a ao destes trs operadores: o operador de reproduo/seleo seleciona os melhores resultados e o operador de crossover recombina duas partes dos resultados esperando assim obter um melhor resultado. O operador de mutao altera o resultado localmente esperando assim criar um resultado ainda melhor.
46 Morawek (2003) exemplifica o uso dos operadores de mutao e crossover para a resoluo do problema do caixeiro viajante. De acordo com o autor, normalmente um gene representa uma lista de ns do caminho escolhido. O operador de mutao pode ser aplicado de vrias formas, entre as quais o autor cita:
troca de ns de um caminho (figura 4.3(a)); rotacionamento de um subtour (trecho de caminho) (figura 4.3(b)).
(a)
(b) Figura 4.3 Aplicao do operador de mutao (Morawek, 2003). A operao de crossover exemplificada por Morawek (2003), onde um conjunto de ns obtido do primeiro gene, e os demais ns so obtidos do segundo gene, mantendo sua ordem. Esta operao exemplificada na figura 4.4.
Figura 4.4 Aplicao do operador de crossover (Morawek, 2003)
47
Esta teoria uma alternativa vivel, na maioria das vezes, para vrios problemas, como seleo de rotas dinmicas (Kanoh e Nakamura, 2000), reconhecimento de padres (Lavine et al., 2003), planejamento de sistemas produtivos, descobrimento de regras (Romo, 2002), planejamento de sistemas de potncia (Coury, 2002), estudo de colnias de insetos (Lavine et al., 2003), gerao de rotas para robs (Morandi e Nazemi, 2003), entre outros.
4.2.5. Programao evolutiva

Assim como algoritmos genticos, a programao evolutiva (PE) utiliza conceitos de evoluo para gerar solues apropriadas atravs de um algoritmo iterativo (Coello, 2002). Embora seu pseudo-cdigo seja semelhante ao dos algoritmos genticos, existe uma diferena conceitual entre o alvo da anlise da fitness dos indivduos produzidos atravs de AG e PE. Tal diferena explicitada em Coelho e Coelho (1999): A PE, bem como as estratgias evolutivas (...) diferem dos AGs, pois so tcnicas que simulam a evoluo enfatizando a ligao comportamental (relao fenotpica) entre as populaes geradas (ancestrais e descendentes), mais que a ligao gentica.
4.3.6. Otimizao por colnia de formigas e outros modelos baseados em inteligncia coletiva
Kelly (1995) define duas formas extremas de abordar um problema. A primeira, como uma seqncia de operaes, da mesma forma que realizada a produo em uma linha de montagem. A outra, como um grande conjunto de operaes paralelas, como as encontradas em neurnios ou nas operaes realizadas por cada formiga de uma colnia. Ele define este ltimo, onde emergem do coletivo no uma srie de aes individuais crticas, mas sim uma coleo de aes simultneas aonde o padro coletivo de longe mais importante como sendo o modelo de enxame (swarm model).
48 Para Kelly (1995), as duas abordagens dos problemas atravs de um procedimento sequencial ou de um paralelo (mencionadas no pargrafo anterior) so vlidas. (...) todos os sistemas da vida so misturas destes dois extremos. Os modelos de inteligncia coletiva so baseados em dois ou mais agentes que comunicam para conseguir um comportamento emergente (Kazadi, 2000). Estes modelos, buscam se focar no comportamento de sistemas naturais constitudos por vrios agentes, como colnia de bactrias, colnias de formigas, enxame de peixes e bando de pssaros (Martinoli e Easton, 2002). Existem outros exemplos de aplicaes de sistemas cooperativos que imitam o funcionamento do sistema imunolgico (Taheri e Calva, 2001). Ojala (1998), apresenta uma estratgia para controle de robs inspirado em colnias de protozorios. Bourjot (2003) utiliza colnias de aranhas sociais para deteco de regies em imagens. Conforme exemplificado a seguir, no caso de colnia de formigas, as habilidades de tais sistemas parecem transcender as habilidades individuais de cada um dos componentes. na interao entre os indivduos da populao que o comportamento que desejamos emerge. Para este trabalho, usada a definio de agente realizada por Franklin (1996): Um agente autnomo um sistema situado em e como parte de um meio que percebe este meio e atua nele, durante o tempo, visando seus prprios objetivos de forma a mudar sua percepo futura do meio. O conceito de comunicao adotado neste trabalho o apresentado por Kazadi (2000) como qualquer ao de um agente que influencie o comportamento subseqente de um ou mais agentes do sistema seja esta influncia direta ou indireta. O conceito de comportamento emergente definido por Kazadi (2002) como: um comportamento do enxame que seja resultado das interaes do enxame com o meio ou entre si, mas que no seja resultado de um projeto direto. O autor vai alm, definindo que o comportamento emergente requer comunicao entre os agentes, no necessariamente comunicao direta. Brooks (1991), resume o conceito de comportamento emergente se um sistema multi-agente como a inteligncia emerge da interao dos componentes do sistema. Esta afirmao tambm sustentada por Zhong e Evans. (2002), que afirma sem um lder ou controle centralizado, uma colnia de insetos resolve problemas que esto alm da capacidade de um nico inseto, como achar comida ou construir a colnia. A
49 inteligncia dos grupos de insetos sociais ocorre por causa de suas interaes alcanadas com a alterao e a deteco da concentrao de feromnios qumicos no ambiente. Existem vrias tcnicas que se utilizam do conceito de inteligncia coletiva. Kazadi (2002) cita vrias pesquisas, como o mapeamento coletivo de terreno proposto por Cohen (1996), deteco de minas (Gage, 1995), construes atravs de conjuntos de robs (Parker
et al., 2003) e a resoluo de problemas do caixeiro viajante (Dorigo et al., 1996).

O algoritmo da colnia de formigas foi apresentado inicialmente por Dorigo et al. (1996), propondo um paradigma computacional para a resoluo de problemas combinatrios baseado no comportamento encontrado ao observar formigas se movendo entre a colnia e o ninho. Como indicado por Kelly (1995), este algoritmo no possui uma inteligncia centralizada. Conforme mostrado a seguir, a inteligncia da colnia de formigas que resolve o problema no emerge de um indivduo, mas sim da soma de todas as experincias de todos os indivduos da colnia. Fox (2004) evidencia esta caracterstica ao dizer se voc deseja entender a inteligncia de enxames no olhe para uma abelha ou formiga especfica. Voc observa padres de interao que emergem em um nvel macro, inclusive aqueles gerados no nvel micro aonde tudo parece catico. Algoritmos como este, inspirados em comportamentos de insetos sociais, vm permitindo a gerao de tcnicas de otimizao que geram resultados surpreendentes (Bonabeau et. al., 2000). Dorigo et al. (1996) e Lerman et al. (2001) enumeram algumas caractersticas adicionais do algoritmo de colnia de formigas:
escalvel, pois a arquitetura de controle de um rob a mesma de algumas unidades ou milhares de unidades (Lerman et al., 2001); verstil, pois pode ser usado por vrias verses do mesmo problema; por exemplo, uma variao do problema do caixeiro viajante conhecida como sendo o problema assimtrico do caixeiro viajante. (Dorigo et al., 1996; Lerman et al., 2001);
robusto, podendo ser aplicado com mudanas mnimas outros problemas de otimizao combinatria como o de atribuio quadrtica, o escalonador de turnos de loja (Dorigo et al., 1996; Lerman et al., 2001) e planejamento de trajetrias de robs mveis (Morawek, 2003). Como se trata de um sistema multi-agente, pertinente citar Koening (1999), que afirma que sistemas de
50 busca baseados em agentes so mtodos de planejamento de propsito geral (independentes de domnio), podendo lidar com incerteza, incluindo rudos de sensores e atuadores.. A robustez tambm relacionada tcnicas de enxames por Pettinaro et al. (2002).
dependente de populao, permitindo a explorao da realimentao positiva como um mecanismo de busca (Dorigo et al., 1996).
Pettinaro et al. (2002), afirma que tcnicas de enxames so baseadas na autoorganizao atravs da cooperao entre seus componentes. Desta forma, enxames de robs possuem uma grande plasticidade, sendo seu uso indicado em quaisquer aplicaes que necessitem de pouca interveno humana e mecanismos de adaptao. Tal algoritmo tem sido usado em pesquisas visando a otimizao na gerncia de redes de comunicao, conforme trabalho de Bieszczad et al. (1998). Bonabeau et al. (1998), tambm se utiliza deste algoritmo para o roteamento de pacotes de comunicao, explorando as caractersticas dinmicas e descentralizadas do ACS. Parpinelli et al. (2002) apresentam uma aplicao deste algoritmo no campo de minerao de dados (data mining). Boryczka e Wieczorek (2003), mostraram o uso deste algoritmo para a regresso de funes em problemas de aproximao. A fundamentao terica do algoritmo descrito por Dorigo et al. (1996), se encontra na capacidade das formigas de gerar uma trilha entre o ninho e uma fonte de comida. Boryczka e Wieczorek (2003), evidenciam a inspirao biolgica deste algoritmo ao citar trs exemplos de caractersticas do ACS: (a) a escolha da rota de uma formiga artificial depende da quantidade de feromnio uma substncia qumica depositada pela formiga, (b) formigas artificiais cooperam visando obter melhores resultados, e (c) formigas artificiais se movem de uma forma aleatria. A iterao entre os agentes do algoritmo da colnia de formigas explicado por Bevilacqua e Castano (1999): comportamentos globais complicados podem resultar da interao de sistemas dinmicos individuais simples. Esses comportamentos podem ser observados em vrios sistemas biolgicos, como, por exemplo, em colnias de insetos sociais. A viso tradicional sobre o comportamento desses insetos enxerga-os como pequenos seres autmatos que obedecem a um programa gentico estritamente
51 estabelecido. Assim, supe-se que os insetos possuem uma quantidade de inteligncia individual suficiente para cooperarem de modo organizado. Essa viso se origina da idia de que atividades complicadas esto necessariamente associadas a indivduos complicados. Atualmente, uma nova interpretao vem ganhando fora, segundo a qual os elementos aleatrios do meio ambiente e a maleabilidade do comportamento individual desempenham papis fundamentais na organizao do funcionamento da sociedade (Deneubourg et al., 1983). Talbi et al. (2001) confirmam a simplicidade do agente ao resumir como um conjunto de formigas consegue determinar o menor caminho entre cada ponto: Enquanto percorrem seu caminho, as formigas deixam uma trilha de feromnio no solo. O papel desta trilha guiar as outras formigas at o alvo. Para uma formiga, o caminho escolhido de acordo com a quantidade de feromnio. Posteriormente, a quantidade desta substncia qumica vai diminuindo com a ao do tempo e a quantidade de feromnio restante depende da quantidade de alimento encontrada e do nmero de formigas que se utilizaram desta trilha. Esta forma de comunicao indireta (atravs do meio), uma das caractersticas marcantes deste algortmo: ao contrrio de outros sistemas multi-agentes como por exemplo, o proposto por Ozaki et al. (1999) ou o trabalho de Byrne et al. (2002), um agente nunca se comunica com outro. Ele se comunica sim, mas atravs do meio. A dinmica deste algoritmo ilustrada na figura 4.5. Com o objetivo de ir do ponto A ao ponto B, inicialmente as formigas vo tanto para o caminho da esquerda quanto para o caminho da direita (figura 4.5(a)). Posteriormente, com a evaporao do feromnio, a trilha da esquerda se torna mais reforada, pois um nmero maior de formigas passa por ele em um menor espao de tempo (figura 4.5(b)). Aps algum tempo, o caminho da esquerda conter uma frao dominante de feromnios, o que levar as formigas a escolh-lo com maior freqncia.
52
(a)
(b)
(c)
Figura 4.5 Descoberta do menor caminho atravs de informaes de feromnio (Dorigo et al., 1996). Dorigo e Gambardela (1997) aplicaram o algoritmo da otimizao atravs da colnia de formigas no problema do caixeiro viajante, e compararam os resultados obtidos com outras tcnicas como algoritmos genticos, programao evolucionria, simulated
annaeling e annealing genetic algorithms. Os resultados obtidos por Dorigo e Gambardela

(1997) so reproduzidos na Tabela 4.1. Nesta tabela, foram aplicados os algoritmos mencionados em quatro problemas do caixeiro viajante, sendo registrados o tamanho do melhor percurso encontrado. Os resultados apresentados por Dorigo mostram que o algoritmo da colnia de formigas como sendo recomendvel para a resoluo do TSP de grande porte.
53
Nome do Problema Oliver30 (30 cidades) Eil50 (50 cidades) Eil75 (75 cidades) KroA100 (100 cidades)
ACS 420 425 535 21 282
AG 421 428 545 21 761
EP 420 426 542 N/A
SA 424 443 580 N/A
ANG 420 436 561 N/A
Melhor resultado 420 425 535 21 282
Tabela 4.1 Resultados da aplicao de vrios algoritmos distintos para problemas do TSP. (fonte: Dorigo e Gambardela, 1997).
54
Captulo 5. Escolha do mtodo

Nesta fase, a identificao de um mtodo para direcionar a pesquisa da soluo ao problema proposto no Captulo 2. Os critrios utilizados nessa escolha foram decididos como sendo:
a heurstica a ser desenvolvida deve ser baseada em um algoritmo que produza um resultado eficiente; o algoritmo-base deve, de preferncia, ser flexvel o bastante para permitir mudanas futuras como o aumento de funcionalidades de ROVs. Assim, com a anlise qualitativa realizada no item 3.2, e levando-se em conta a
anlise quantitativa de Dorigo e Gambardela (1997), foi escolhido o uso do mtodo da colnia de formigas. Em uma primeira anlise, mostrada em Tavares e Coelho (2003, 2004a), este mtodo pareceu promissor. A seguir, discutida a aplicao original do ACS em problemas do tipo caixeiro viajante, seguidas pelas modificaes de Tavares e Coelho (2003), e, por fim, as modificaes visando um aumento de desempenho do mtodo.
5.1. Algoritmo ACS original

Para aplicar este comportamento ao problema do caixeiro viajante, Dorigo et al. (1996) e Dorigo e Gambardela (1997), utilizam-se a seguinte abordagem: Seja bi(t) (i=1, ..., n) o nmero de formigas em um n de um grafo, ou, no caso desta dissertao, interseces de caminhos i no tempo t e m = bi (t ) o nmero total de
i =1 n
formigas no tempo t. Seja cada formiga um agente simples com as seguintes caractersticas: capacidade de escolher a prxima cidade j levando em considerao a distncia e a quantidade de feromnio presente no caminho entre as cidades (tambm chamadas de ns do grafo, ou, especificamente no caso da robtica de inspeo, objetivos a serem alcanados) i e j.
55 uma lista tabu, que probe uma formiga de visitar a mesma cidade duas vezes; uma vez que a formiga cumpriu seus objetivos visitar todas as cidades deposita uma substncia (feromnio) em cada caminho percorrido. Boryczka e Wieczorek (2003), tambm citam que, no ambiente onde as formigas artificiais atuam, o tempo discreto. Dorigo et al. (1996) tambm modelaram o comportamento do agente, mensurando a probabilidade de escolha da ida de um ponto i para outro ponto j como sendo representada pela equao:
ij (t ) ij , se j permitido k pik, j (t ) = [ ik (t )] [ ik ] k permitidok 0, caso contrrio
] [ ]
(5.1)
onde ij (t ) representa a quantidade de feromnio existente no caminho entre as cidades i e j
no instante t, ij representa a visibilidade da cidade j em i (definida como sendo o inverso da distncia entre i e j), e so constantes, tais que , R .
Alm disso, Dorigo et al. (1996) definiu que o feromnio atualizado seguindo a
k equao (5.2). O termo ij (t ) representa a parcela referente evaporao, sendo uma k constante de evaporao tal que 0 < < 1 . O termo ij
ij
se refere quantidade de
ferommio depositada pela formiga entre os instantes t e t + n.

k k k ij (t + n) = ij (t ) + ij
(5.2)
56 A quantidade de feromnio depositada pela formiga k em um caminho definida na equao (5.3), aonde Q representa uma constante e L o comprimento total percorrido pela formiga,
Q se a formiga k utiliza desta trilha em seu caminho = Lk 0, caso contrrio
k ij
(5.3)
razovel, ento, que a quantidade de feromnio depositada por todas as m formigas em um caminho de i a j possa ser definida como:
k ij = ij k =1
(5.4)
Baseado no proposto por Dorigo et al. (1996), o algoritmo original do ACS est mostrado na Figura 5.1.
57 1. Configurao do Algoritmo: t=0, NC=0 (t representa o tempo, NC representa o nmero de ciclos) Para cada caminho (i,j), selecione um valor inicial ij(t)=c para a intensidade do feromnio e ij= 0 Coloque m formigas nos n ns 2. s=1 (s representa o ndice da lista tabu) Faa de k=1 a m Selecione o ponto inicial da k-sima formiga em tabu(s) 3. Repita at que a lista tabu esteja cheia (n-1 vezes) s=s+1 Faa de k=1 a m Escolha o ponto j para mover a formiga, com a probabilidade dada pela equao (3.2). Mova a k-sima formiga para o ponto j Insira o ponto j na lista Tabu 4. Faa de k=1 a m Mova a k-sima formiga de tabu(n) a tabu(1) Determine o comprimento Lk do caminho percorrido Atualize o feromnio do ltimo caminho encontrado, de acordo com a equao (3.4). Figura 5.1 O algoritmo da colnia de formigas de acordo com Dorigo et al. (1996).
5.2. Anlise do algoritmo da colnia de formigas aplicado ao problema de planejamento de rotas de ROVs com cordo umbilical
Para a utilizao do ACS para a soluo do problema definido nesta pesquisa, so estabelecidas algumas novas heursticas (Tavares e Coelho, 2003, 2004a). a primeira diferena aparece no objetivo do sistema: embora no problema original se tenha como alvo passar por cidades que agora so tratadas como interseces de caminhos neste caso, o alvo so os caminhos entre as interseces; no TSP original, o objetivo a passagem por todas as cidades. Neste problema, pode-se ter rotas que no necessitam de inspeo. Assim, nem todos os caminhos existentes sero necessariamente os objetivos do problema;
58 o cordo umbilical mais uma limitao de movimento, conforme apresentado na seo 2.2.
A seguir, so mostradas as alteraes realizadas inicialmente no algoritmo ACS apresentado por Dorigo et al. (1996) visando a soluo deste problema.
Representao do cabo umbilical
Para a representao do cabo umbilical, utilizou-se o conceito de uma pilha FILO (First In Last Out Primeiro elemento a entrar o ltimo a sair) (Taub, 1984), aplicando as seguintes regras:
C(q) representa o vetor correspondente aos elementos da pilha FILO;
q max o nmero mximo de elementos que a fila pode possuir; q atual representa o nmero atual de elementos da fila.
O conceito da lista FILO representado na figura 5.2, onde so exemplificados uma fila vazia com qmax=3 (figura 5.7(a)), a incluso de 1, 2 e 3 itens (figuras 3.8(b), (c) e (d), respectivamente) e a remoo de um item (figura 5.2(e)).
(a)
(b)
(c)
(d)
(e)
Figura 5.2 Exemplo de operao de uma pilha FILO. A cada movimento da formiga, insere-se o novo destino no vetor C(q). Posteriormente, devem-se tomar medidas para evitar que q atual > q max .
59
Fim da lista tabu
Em casos de inspeo, possvel a necessidade de se passar pelo mesmo ponto vrias vezes. Assim, a lista tabu foi, em uma primeira instncia, removida.
Mudana na regra de movimento
Com a definio do cabo umbilical e o fim da lista tabu, deve-se redefinir a regra que rege a determinao dos possveis destinos para a formiga: Se o nico caminho existente for o caminho de volta, a formiga passa por este caminho. Caso contrrio, verifica-se o estado do cabo: Se qatual= qmax, o nico caminho possvel ser o caminho anterior; Se qatual < qmax, os caminhos possveis so todos menos o caminho anterior. importante notar que a condio q atual > q max nunca ocorre. Isso se deve ao fato de que, quando tomamos o caminho de volta foradamente devido condio q atual = qmax , retiramos um elemento da lista FILO, consequentemente decrementando q atual .
Critrio de parada
Sendo C o conjunto com todos os caminhos percorridos, i representa o nmero de elementos deste conjunto, t o tempo em que a formiga est em operao, t max o tempo mximo de vida de uma formiga e O o conjunto de objetivos da formiga: Se O C : formiga completou os objetivos, e tem o feromnio de seu caminho atualizado; Se t t max : a formiga morre e seu feromnio no adicionado no meio.
60
Resultados obtidos
O algoritmo apresentado anteriormente foi implementado em JAVA. Foi proposto um grafo de ensaio com 11 ns, conforme mostrado na Figura 5.3. Nesta figura, os crculos so ns, os traos caminhos e o campo Incio representa o ponto de sada da formiga.
Figura 5.3 Grafo de ensaio com 11 ns (Tavares e Coelho, 2003). Selecionou-se como objetivo a passagem pelos ns D e H, e com uma limitao devido corda de 10 movimentos. Foram enviadas 22 formigas sequencialmente a partir do ponto marcado incio (empiricamente, se determinou que, para este caso, a relao de duas formigas para cada n do problema suficiente para a convergncia do algoritmo). Aps alguns testes com o algoritmo implementado, os demais parmetros foram determinados empiricamente como sendo:
= 1; = 0 (com isso, o termo referente visibilidade dos ns, considerado constante no

problema ignorado);
= 0,9.
Nas Figuras 5.4(a) e 5.4(b) tm-se, respectivamente, os caminhos percorridos e uma
anlise grfica do nmero de passos necessrios para que cada formiga atinja os objetivos. Na Figura 5.4(a), tem-se os dados apresentados no formato f[x0,x1,x2,x3,...,xn], sendo que f
61 o nmero da formiga (coincidente com a ordem que o agente foi enviado), e x0...n os ns visitados aps o n inicial. A ao do cordo umbilical destacado com os ns em negrito. Quando isso corre, existe o retorno imposto pelas condies de contorno j apresentadas. Conforme ilustrado na figura 5.4(a), a ao do cordo umbilical torna vrios caminhos proibitivos devido ao retorno que causa na trajetria da formiga. Quando, mesmo tendo o cordo umbilical estendido, a formiga consegue atingir seu objetivo, o trao de feromnio estendido para mais ns, causando um distrbio no meio, percebido no grfico da figura 5.4(b) quando analisamos os caminhos das formigas 11 e 13. Mesmo assim, conseguiu-se determinar o caminho timo para o problema.
0. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. [C, Incio, C, F, H, I, G, D] [A, D, J, H] [A, B, A, D, I, H] ]C, E, H, I, G, D] [C, F, H, I, G, D] [C, F, C, E, H, F, C, E, H, I, G, I, H, E, C, Incio, A, D] [A, D, A, Incio, C, F, H] [A, Incio, A, D, I, H] [A, Incio, C, F, H, I, G, D] [A, B, A, D, I, H] [C, Incio, C, E, H, I, G, D] [A, B, A, Incio, C, E, H, F, C, E, H, E, C, Incio, A, Incio, C, F, H, E, C, Incio, A, B, E, H, I, G, D] [C, F, H, E, C, Incio, A, B, E, B, A, Incio, C, F, H, I, G, I, H, E, C, E, H, F, C, E, H, I, G, D] [A, D, A, Incio, C, F, H] [A, D, A, B, E, H] [A, B, A, Incio, C, F, H, I, G, D] [C, Incio, C, E, H, F, C, Incio, A, D] [A, D, A, Incio, C, F, H] [C, F, C, E, H, I, G, D] [A, D, A, B, E, H] [A, D, A, B, C, F] [A, D, J, H]
(a)
Execuo Mdia
Nmero de passos necessrios para cumprir o objetivo 35 30 25 20 15 10 5 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Formiga
(b) Figura 5.4 Resultados obtidos (Tavares e Coelho, 2003).
62
Este resultado tpico mostrou que o algoritmo possui a capacidade de obter o menor caminho rapidamente (neste caso, foi obtido j na segunda execuo). Porm, outras execues encontraram caminhos diferentes (e de comprimento maior), que geravam trilhas de feromnios em pontos fora da melhor rota. Tal comportamento, embora seja entendido quando se analisa a equao (5.1) que define a movimentao da formiga atravs de um procedimento aleatrio, causou distrbios pontuais no resultado da atuao de cada agente no meio. Nota-se, na execuo mostrada na Figura 5.4(b), que as formigas 5, 11 e 12 escolheram caminhos muito maiores (mais de trs vezes maior) que o caminho timo do algoritmo. Este comportamento foi notado em outras execues em diferentes formigas, o que causou uma dificuldade na anlise de vrias instncias do problema. Assim, escolheuse utilizar uma execuo em que se observou o comportamento mdio do algoritmo. Desta forma, o algoritmo mostrou a necessidade de que exista uma otimizao nas buscas pelos mnimos globais e locais do problema. Os resultados sugerem a necessidade de que seja controlada a influncia de agentes que consigam obter o caminho mnimo atravs de caminhos menos otimizados que os j encontrados. Visando realizar uma anlise dos algoritmos que permitam suprir estes requisitos, foram determinadas mudanas no conjunto de heursticas adotadas tendo em vista melhorar sua convergncia: um reforo negativo baseado na memria individual de cada formiga e a restrio do espao de busca pelos prprios agentes atravs de algoritmo cultural. Para isso, foi analisado apenas o problema sem o cordo umbilical e sem a lista tabu. A heurstica resultante e os resultados so mostrados a seguir.
5.3. Adaptao do ACS visando melhorar a convergncia

O algoritmo ACS original, no permite o planejamento de mltiplos objetivos quando estes compartilham um mesmo caminho. As passagens duplicadas em um mesmo corredor so proibidas pela lista tabu do algoritmo (Dorigo et al., 1996). Tal efeito, pode ser desastroso quando necessrio, por exemplo, voltar por um mesmo caminho (caminho de inspeo interrompido).
63 Assim, objetivando solucionar este problema, suprimiu-se a lista tabu. No seu lugar, foram colocados trs mecanismos de controle: um nvel mnimo inicial de reconhecimento de feromnio (feromBias), um parmetro relacionado memria da formiga (QBad), e um nvel mnimo de reconhecimento final de feromnio, aps a ao do reforo negativo (feromBiasFinal). A ao do reconhecimento do feromnio pelo agente, substituda pela heurstica apresentada na Figura 5.5. Esta heurstica, se utiliza de duas equaoes: a equao (5.5), aplica uma penalizao no valor de feromnio de um n de QBad unidades para cada vez que a formiga tenha passado nesse n. Para evitar valores negativos, a equao tambm garante que o patamar mnimo de feromnio, feromBias, ser respeitado. A equao (5.6), garante que um segundo patamar mnimo respeitado, evitando assim que o valor de feromnio de um ponto seja menor que o mnimo perceptvel pela formiga. 1. Determine quais os caminhos adjacentes vlidos e seu valor de feromnio 2. Normalize o valor do feromnio utilizando a equao (3.5), sendo x o feromnio da posio analisada 3. Sendo count(n) uma funo que retorna o nmero de vezes que a formiga passou pela posio n e g(n) a funo que mostra a quantidade de feromnio aps a atuao do parmetro relacionado memria da formiga, normalize o feromnio utilizando a equao (5.5). 4. Normalize o valor do feromnio utilizando a equao (5.6) Figura 5.5 Heurstica para reconhecimento do feromnio.
x QBad count ( x), se x > feromBias f ( x) = feromBias QBad count ( x), se x feromBias x, se x > BadFeromBias g ( x) = BadFeromBias, se x BadFeromBias
(5.5)
(5.6)
A seguir, algumas anlises usando este algoritmo so apresentadas. Inicialmente, o ACS com reconhecimento de feromnio foi testado com o mapa mostrado na Figura 5.6. Este mapa, foi escolhido por ser o exemplo mais simples no qual poderia ser testado a convergncia entre dois caminhos. Esta experincia, mostrada na Figura 5.6, possui apenas uma escolha entre duas rotas, no havendo interferncia de outras decises dos agentes.
64 Adicionalmente, as duas decises influenciam de forma diferente o comprimento do caminho por onde a formiga passa, tornando assim simples sua anlise. Para que se pudesse considerar apenas a variao do feromnio, considerou que cada quadrado da figura era um n do grafo. Ao aplicar a equao (5.1), novamente se optou por =0, eliminando assim o efeito deste parmetro no algoritmo.
Figura 5.6 Mapa analisado aps adicionar-se o reforo negativo.
5.3.1. Resultados obtidos atravs da aplicao do reforo negativo

Como o objetivo desta anlise verificar se existe uma melhor convergncia com este algoritmo, gerou-se 100 execues, sendo que cada execuo com 10 agentes, mantendo-se os valores de , e da execuo anterior. Para cada execuo, obteve-se o desvio padro do nmero de passos. Como o desvio padro uma medida da disperso dos dados em torno do valor mdio, pode-se seguramente analisar o desvio padro como sendo um ndice ligado convergncia do algoritmo. Se todos os agentes forem em um s caminho, o desvio padro nulo. Se cada agente for por um caminho diferente, o desvio padro alcana seu valor mximo. Foram alterados isoladamente os parmetros BadFeromBias e Qbad. Os resultados so mostrados nas Tabelas 5.1 e 5.2, respectivamente.
65
BadFeromBias 0,01 0,10 0,50 0,75 1,00
Mdia do desvio padro do nmero de passos por execuo 5,96 6,15 8,3 9,07 9,34
Desvio padro do desvio Padro do nmero de passos por execuo 5,49 5,49 8,21 8,95 9,31
Tabela 5.1 Anlise do movimento dos agentes com a alterao do parmetro BadFeromBias.
Qbad 0,01 0,10 0,50 0,75 1,00
mdia do desvio padro do nmero de passos por execuo 9,2 9,17 7,11 7,45 6,64
desvio padro do desvio padro do nmero de passos por execuo 9,33 9,46 7,33 6,64 5,53
Tabela 5.2 Anlise do movimento dos agentes com a alterao do parmetro QBad.
Nota-se que existe uma diminuio do desvio padro com o aumento do valor da varivel Qbad. Com isso, nesta anlise, mostrou-se uma influncia desta memria nas aes dos agentes e na eficincia da otimizao. Ou seja, para esta situao estudada, quanto maior a influncia da memria do agente, menor a chance de repetio de um caminho. O aumento do valor de BadFeromBias causou um efeito contrrio. Assim, notou-se que a convergncia do algoritmo, neste caso, foi melhor quando a normalizao imposta pela equao (3.5) foi menos influente. Este comportamento pode ser explicado pelo fato de que quando se toma um limite mnimo de feromnio alto, este encobre pequenas mas relevantes alteraes de valores dos feromnios, no permitindo que as formigas recebam o reforo positivo previsto. Buscando-se analisar padres de comportamento, foi repetida a anlise para o grfico mostrado na Figura 5.7. Este grfico possui um nmero maior de caminhos possveis e redundantes. Enquanto o mapa mostrado na Figura 3.11 possui dois caminhos
66 diretos possveis, o mapa mostrado na Figura 3.15 possui um nmero maior de rotas possveis. Os resultados obtidos so mostrados nas Tabelas 5.2 e 5.3.
Figura 5.7 Mapa analisado com o algoritmo da seo 5.3.

BadFeromBias 0,01 0,10 0,50 0,75 1,00 mdia do desvio padro do nmero de passos por execuo 30,18 31,14 31,05 30,17 42,06 desvio padro do desvio padro do nmero de passos por execuo 23,33 27,57 29,98 30,44 38,23
Tabela 5.3 Anlise do movimento dos agentes com a alterao do parmetro BadFeromBias.
Qbad 0,01 0,10 0,50 0,75 1,00 mdia do desvio padro do nmero de passos por execuo 37,08 38,47 33,33 32,44 32,93 desvio padro do desvio padro do nmero de passos por execuo 28,64 23,60 24,93 33,76 34,12
Tabela 5.4 Anlise do movimento dos agentes com a alterao do parmetro Qbad. Atravs dos resultados apresentados nas Tabelas 5.3 e 5.4, notou-se novamente que a variao entre os movimentos das formigas e os novos parmetros, BadFeromBias e
Qbad so relacionados, existindo um ponto de equilbrio entre eles em que se consegue
67 uma menor divergncia do algoritmo. Pelo que podemos notar, a variao de Qbad permitiu melhores resultados quando seu valor foi de 0,5, diferente do encontrado no exemplo da figura 5.5, onde o melhor resultado foi de 0,01. Com isso, conclui-se que a influncia entre a variao de Qbad estritamente relacionada com o grafo que o agente percorre, da mesma forma que os parmetros , e do algoritmo original.
5.4. Alterao do critrio de parada para reforo do caminho timo encontrado

Sutton (1992) denomina o tipo de reforo apresentado no tem anterior como de arquitetura de polticas somente (policy-only architectures). Esta arquitetura, ainda segundo Sutton (1992), requer que sejam claras as condies em que um alto reforo est presente (high rewards, normalmente de valor positivo) e um baixo reforo (low rewards, normalmente de valor negativo). No caso, analisando apenas o reforo referente memria do agente, existe um reforo negativo na probabilidade de escolha de um n proporcional ao nmero de visitas que o agente realizou neste n. Analisando apenas o agente, sem contar sua comunicao atravs de feromnios, no h reforo positivo. Este reforo positivo ocorre apenas na anlise dos feromnios mostrada nas sees 3.3.1 3.3.3. Para a melhor atuao das heursticas de reforo apresentadas, nota-se que necessrio substituir o critrio de parada mostrado na seo 5.3 pelas regras a seguir, que reforam ainda mais os caminhos timos encontrados durante a execuo do algoritmo: se O C : formiga completou os objetivos e tem o feromnio de seu caminho atualizado e se t t max : formiga assume o caminho timo encontrado at o momento. Com esta modificao, h o depsito de feromnio mesmo quando a formiga, de acordo com o critrio anterior, refora o melhor caminho encontrado at o momento.
68
5.5. Limitao do espao de busca atravs de algoritmo cultural

O algoritmo apresentado at o momento, foi dotado de heursticas que agiram sobre um indivduo isoladamente. Porm, todas as alteraes realizadas alteraram apenas o indivduo. Para aumentar a rapidez de convergncia, foi notada a importncia de aumentar as formas de cooperao entre os agentes, de modo que eles possam trocar informaes sobre trechos j reconhecidos como no pertencentes ao caminho timo. Com este fim, foi decidido usar utilizar variaes do algoritmo cultural (Reynolds, 1997; Iacoban et al., 2003). O algoritmo cultural foi usado por Jin e Reynolds (1999) para a soluo de problemas de otimizao no-linear. Reynolds e Zhu (2001) usaram algoritmos culturais em combinao com programao evolutiva. Ostrowski et al. (2002) evoluiram estratgias em modelos baseados em agentes para auxiliar o desenvolvimento de software usando algoritmos culturais. O princpio do algoritmo cultural pode ser abordado atravs da definio de cultura. Segundo Reynolds e Zhu (2001), o termo cultura pode ser entendido como um veculo de armazenamento de informaes acessveis globalmente por todos os membros da sociedade e que pode ser til em direcionar suas atividades para soluo de problemas. Na figura 5.8 se mostra o diagrama de funcionamento de um algoritmo cultural, onde temos uma populao de agentes que se altera de acordo com uma funo de performance, aceitando (e modificando) um espao de crenas comum. Este espao de crenas influencia toda a populao, alterando assim sua evoluo.
69
Figura 5.8 Configurao de um sistema evolutivo com algorimo cultural (Reynolds e Zhu, 2001). Os algoritmos culturais, ento, surgem como um algoritmo de suporte. Atravs da troca de experincias entre os vrios elementos de uma populao de agentes, so alteradas as crenas de toda uma populao. Estas crenas, muitas vezes referidas como espao de crenas (belief space), so utilizadas para direcionar a evoluo de toda a populao e de sua ao no meio. Pode-se, tomando o exemplo do planejamento de rotas, utilizar o algoritmo cultural para reduzir o espao de busca do agente, para que este possa concentrarse em buscas locais. Na Figura 5.9, apresentado um exemplo de agente que deve ir de um ponto a outro do espao. Inicialmente, como mostrado na Figura 5.9 (a), o agente busca o menor caminho por todo o espao. Em um segundo momento (Figura 5.9 (b)), o algoritmo cultural age, reduzindo o espao de busca do agente (os ns em preto simbolizam os ns eliminados). Em um terceiro momento, onde o agente se utiliza apenas do menor caminho, o espao de busca e o menor caminho so coincidentes (Figura 5.9 (c)).
70
(a)
(b)
(c)
Figura 5.9 Exemplo da alterao de um espao de busca por um algoritmo cultural. O pseudo-cdigo do algoritmo cultural mostrado na Figura 5.10.
Incio t=0 Inicialize a populao POP(t) Inicialize o espao de crenas BLF(t) Repita Avalie a populao POP(t) Determine a populao POP_Accepted(t) que contribui para o ajuste de BLF(t) Ajuste BLF(t) de acordo com POP_Accepted(t) t=t+1 Selecione POP(t) = POP(t-1) At que o critrio de parada seja alcanado Fim Figura 5.10 Pseudo-cdigo de um algoritmo cultural. Neste caso, tem-se os seguintes parmetros:
POP(t) representa a populao no instante t; BLF(t) representa o espao de crenas que se deseja alterar no instante t;
71
POP_Accepted(t) representa um subconjunto de POP(t), contendo os indivduos

mais significativos para o ajuste do espao amostral. interessante notar que as crenas so criadas e alteradas de acordo com a experincia de uma populao, no de um indivduo. Embora, em um momento inicial, todas as crenas possam ser as mesmas, espera-se que a interao desta populao entre si e entre o meio em que est envolvido traga novas informaes que diferenciem indivduos o bastante para a formao da populao POP_Accepted. E, atravs destas modificaes, resultantes de experincias de cada indivduo, possvel realizar ajustes em BLF de forma a guiar futuras evolues da populao. Durante a pesquisa bibliogrfica, no foi encontrada nenhuma abordagem que combinasse alguma abordagem baseada em colnia de formigas com algoritmo cultural. Para tal, foram tomadas as seguintes decises de implementao visando a combinao do algoritmo apresentado nas sees 3.3.1 a 3.3.4 com o algorimo cultural: (a) BLF(t) representa o conjunto de destinos (ns) que pertencem ao mapa; (b) POP(t) representa a unio de um conjunto de c colnias. Cada colnia constituda por f formigas; (c) POP_Accepted(t) representa um nmero majoritrio de colnias que possuem um nmero majoritrio de formigas que no utilizam um determinado n em seus percursos; (d) c_min representa o nmero mnimo de colnias que no devem utilizar um determinado n para que a colnia pertena POP_Accepted(t); (e) f_min representa o nmero mnimo de formigas que no devem utilizar um determinado n para que a colnia correspondente pertena POP_Accepted(t); (f) BLF(t+1) representa o conjunto BLF(t) excluindo-se os elementos identificados por
POP_Accepted(t).
Tambm deve-se notar as seguintes condies de contorno do problema: (a) c_min deve ser sempre maior que a metade no nmero de colnias pertencentes
POP(t). Desta forma, assegura-se que, tendo c caminhos ligando dois ns, pelo
menos um ser mantido sempre.
72 (b) c_min deve ser sempre maior ou igual ao nmero de colnias pertencentes POP(t). Se c_min no respeitar esta condio de contorno, POP_Accepted(t) sempre um conjunto vazio. (c) Da mesma forma, f_min deve ser maior que a metade do nmero de formigas de uma colnia e menor ou igual este valor. O pseudo-cdigo resultante mostrado na figura 5.11.
Incio t=0 Inicie a populao POP(t) com c colnias com f formigas cada. Inicie c_min e f_min Inicie o espao de crenas BLF(t) com o mapa inicial Repita Execute uma vez cada formiga de cada colnia de acordo com o algoritmo j mostrado em itens anteriores Determine a populao POP(t) como o conjunto de colnias executadas no instante de tempo t Para cada n n pertencente BLF(t) Faa F(n, c) igual ao nmero de formigas da colnia c pertencentes POP(t) que no utilizam o n n Faa POP_Accepted(t) igual ao nmero de colnias que possuem f_min ou mais formigas que no utilizam o n n no tempo t Se C(n) for maior que c_min, remova o n n de BLF(t). t=t+1 Selecione POP(t) = POP(t-1) At que o critrio de parada seja alcanado Fim Figura 5.11 Pseudo-cdigo do algoritmo cultural aplicado colnia de formigas. importante notar as condies de contorno propostas neste trabalho representadas nas equaes (5.7) e (5.8):
f f _ min > c c _ min > f 2 c 2 (5.7) (5.8)
Tais condies, determinam que:
73 f_min e c_min no devem ser maiores que o nmero total de formigas e de colnias respectivamente. Isso garante que, neste limite de operao, um n eliminado quando no for usado por nenhuma formiga (f_min = f) e por nenhuma colnia (c_min = c); f_min e c_min devem ser maiores que a metade do nmero de formigas e colnias respectivamente. Com isso, tem-se vrios caminhos ligando dois ns onde passam as formigas, estes nunca so eliminados simultaneamente.
5.5.1. Resultados obtidos usando o algoritmo cultural
Tavares e Coelho(2005) realizaram uma anlise do mesmo problema da seo 3.3.2, confrontando os dados encontrados com o respectivo algoritmo com dados obtidos atravs das variaes das heursticas at aqui descritas. O objetivo desta anlise determinar se, com um mesmo nmero de agentes, o algoritmo cultural traz benefcios na convergncia do problema. Para realizar esta tarefa, o nmero de formigas adotado foi mantido constante (27) e se buscou analisar o nmero de passos que cada formiga necessitou para completar seu objetivo. Ao introduzir a alterao mostrada na seo 5.4 e o reforo negativo, o algoritmo foi executado 30 vezes. Para o algoritmo mostrado na seo 5.2, tomou-se um resultado significativo e no uma mdia. Foram encontrados os resultados ilustrados nas Figuras 5.12(a) e 5.12(b). Os dados correspondentes so mostrados na Tabela 5.5.
74
35,00 30,00 Nmero de movimentos Algoritmo inicial 25,00 20,00 15,00 10,00 5,00 0,00 10 13 16 19 Formiga 22 1 4 7 Introduo das heursticas da seo 3.3.4 Introduo do reforo negativo
(a)
5,00 Nmero de movimentos 4,80 4,60 4,40 4,20 4,00 3,80 3,60 10 13 16 19 Formiga 22 1 4 7 Introduo das heursticas da seo 3.3.4 Introduo do reforo negativo
(b) Figura 5.12 Heursticas da seo 3.3.4 e do reforo negativo (seo 3.3.3) em comparao com o algoritmo mostrado na seo 3.3.2(a). Em (b), tem-se destacado apenas as heursticas das sees 3.3.3 e 3.3.4.
75
Mudana do Mdia de movimentos Algoritmo inicial critrio de parada formiga 0 8,00 4,80 formiga 1 4,00 4,80 formiga 2 6,00 4,80 formiga 3 6,00 4,57 formiga 4 6,00 4,57 formiga 5 17,00 4,57 formiga 6 7,00 4,53 formiga 7 6,00 4,53 formiga 8 7,00 4,53 formiga 9 6,00 4,53 formiga 10 8,00 4,53 formiga 11 28,00 4,53 formiga 12 30,00 4,53 formiga 13 6,00 4,53 formiga 14 6,00 4,43 formiga 15 10,00 4,43 formiga 16 10,00 4,43 formiga 17 7,00 4,43 formiga 18 8,00 4,43 formiga 19 6,00 4,43 formiga 20 6,00 4,43 formiga 21 4,00 4,43
Introduo do reforo negativo 4,67 4,50 4,17 4,17 4,17 4,17 4,17 4,17 4,13 4,10 4,10 4,10 4,10 4,10 4,10 4,10 4,10 4,10 4,10 4,10 4,10 4,10
Tabela 5.5 - Sries de dados referentes figura 5.12. Ao analisar os resultados obtidos, pode-se notar que a mudana na regra de parada tornou o algoritmo mais estvel. A explorao de novos caminhos de maior custo, principal dificuldade para se obter a convergncia do algoritmo inicial, foi interrompida. A introduo do reforo negativo trouxe melhorias ao algoritmo, conforme pode ser notado na Figura 5.12(b). Houve um aumento na rapidez de convergncia, promovido pelo aumento da convergncia da busca realizada por uma nica formiga do algoritmo. Alm desta melhora da formiga, foram analisados os efeitos da incluso do algoritmo cultural proposto no item (3.3.5). Para esta anlise, deve-se, inicialmente, levar em conta os seguintes aspectos: o objetivo desta anlise mostrar a capacitao de cada heurstica adicionada em aumentar a convergncia com o mesmo nmero de agentes. Assim, embora
76 o algoritmo cultural previsto leve em conta um nmero de formigas e de colnias, o somatrio do nmero de formigas do algoritmo no pode ser superior ao nmero de formigas j analisado (22 agentes). Para tal, tomou-se 3 colnias, com 2 formigas, sendo executadas 3 vezes (total de 18 execues). importante notar que as colnias so independentes, excluindo-se o espao de crenas comum. Existem feromnios diferentes para cada formiga. Quando se adiciona o algoritmo cultural, observado um comportamento de cooperao entre as colnias para a minimizao do espao de busca. Assim, para a anlise do algoritmo cultural, deve-se levar em conta que formigas de diferentes colnias podem no estar contidas em uma mesma srie de dados. Os resultados obtidos atravs do algoritmo cultural so mostrados na Figura 5.13. Os dados relacionados so apresentados na Tabela 5.6. Para a execuo, adotam-se as constantes c_min = f_min = 2.
14,00 12,00 Nmero de passos 10,00 8,00 6,00 4,00 2,00 0,00 0 1 execuo 2 Mdia Colnia 1 Mdia Colnia 2 Nmero de ns eliminados Mdia Colnia 0
Figura 5.13 Resultados obtidos com simulao atravs da incluso das heursticas do algortmo cultural mostradas no item 5.5.
77
Introduo do algoritmo cultural Mdia de movimentos da Colnia 0 Mdia de movimentos da Colnia 1 Mdia de movimentos da Colnia 2 Nmero de ns eliminados
Execuo 0 Execuo 1 Execuo 2 12,33 10,67 11,00 0 8,00 5,67 4,67 2 8,00 5,00 4,00 8
Tabela 5.6 Sries de dados referentes figura 5.12. Notou-se que a convergncia encontrada foi visivelmente melhor entre as execues das colnias quando heursticas do algoritmo cultural foram includas. observado tambm que o nmero de ns eliminados no passo final foi expressivo, sendo esta alterao no espao de crenas no aproveitado pelo algoritmo, pois no foram criados mais agentes com este espao de crenas reduzido. Em vista disso, uma nova anlise mantendo o nmero de formigas e colnias foi realizada, extendendo o nmero de execues para 5, e mudando o nmero de formigas por colnia para 3. O resultado obtido mostrado na Figura 5.14 e na Tabela 5.7, respectivamente.
16 14 12 Nmero de passos 10 8 6 4 2 0 1 2 3 execuo 4 5 Nmero de ns eliminados Mdia Colnia 0 Mdia Colnia 1 Mdia Colnia 2
Figura 5.14 Uma nova anlise obtida com simulao atravs da incluso das heursticas do algortmo cultural.
78
Mdia de movimentos da Execuo Colnia 0 0 14 1 5,5 2 4 3 4 4 4
Mdia de movimentos da Colnia 1 14,5 13 6 5 4
Mdia de movimentos da Colnia 2 6 6 5 4 4
Nmero de ns eliminados 0 6 6 6 6
Tabela 5.7 Sries de dados referentes Figura 5.13. Atravs da comparao dos resultados mostrados nas Figuras 5.12, 5.13 e 5.14 e nas Tabelas 5.5, 5.6 e 5.7, pode-se perceber que existe uma forte relao entre a eficincia do algoritmo cultural e a composio da populao de agentes. Para que seja possvel verificar seus efeitos, a seguir so trabalhados mapas de diferentes topologias. O prximo mapa de testes mostrado na Figura 5.15. Neste mapa, a formiga tm seu movimento originado no n 0 e possui como objetivo passar nos ns 9, 10 e 14.
Figura 5.15 Segundo campo de testes analisado atravs do algoritmo cultural. Inicialmente, foram executadas 10 vezes o algoritmo com 5 colnias simultneas, cada uma com 5 formigas (total de 250 agentes no total, 25 por execuo). A eliminao de um n ocorria quando todas as formigas de todas as colnias no o usavam. Os resultados so mostrados na Figura 5.16 e Tabela 5.4.
79
20 18 16 14 12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 9 10 Execuo
Mdia Colnia 0 Mdia Colnia 1 Mdia Colnia 2 Mdia Colnia 3 Mdia Colnia 4 Nmero de ns eliminados
Figura 5.16 Resultados da aplicao de heursticas de algoritmo cultural no mapa 3 atravs da incluso das heursticas do algoritmo cultural utilizando o campo de teste mostrando na figura 3.28 e c_min=f_min=5.
Mdia de Mdia de Mdia de Mdia de Mdia de movimentos movimentos movimentos movimentos movimentos da Colnia da Colnia da Colnia da Colnia da Colnia Nmero de ns Execuo 0 1 2 3 4 eliminados 0 16,2 11,4 13 18,6 9,8 0 1 9 9 13 9 7 0 2 9 9 12,6 7,4 7 1 3 7,8 9 8,4 7 7 3 4 7 9 6 7 7 4 5 7 8,2 6 7 7 5 6 7 5 6 7 7 6 7 7 5 6 7 7 6 8 7 5 6 7 6,2 6 9 7 5 6 7 5 6
Nmero de Passos
Tabela 5.8 Sries de dados referentes Figura 3.28.
80 Para fins de comparao, os mesmos 250 agentes foram executados, variando apenas as constantes c_min e f_min para o valor 3. Desta forma, a eliminao de um n ser realizada quando pelo menos trs colnias possurem 3 formigas que no utilizem o mesmo em seus caminhos. O resultado mostrado na Figura 5.17 e na Tabela 5.9.
18 16 14 12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 9 10 execuo
Mdia Colnia 0 Mdia Colnia 1 Mdia Colnia 2 Mdia Colnia 3 Mdia Colnia 4 Nmero de ns eliminados
Figura 5.17 Resultado da aplicao das heursticas com parmetros modificados de algoritmo cultural no mapa 3 com c_min=f_min=3.
Mdia de Mdia de Mdia de Mdia de movimentos movimentos Mdia de movimentos movimentos da Colnia da Colnia movimentos da Colnia Nmero de Execuo da Colnia 0 1 2 4 ns eliminados da Colnia 3 0 9 15,4 15,2 6 15,8 9 1 7 5,8 6 5 10,6 10 2 7 5 6 5 5,4 10 3 6,6 5 5 5 5 10 4 5 5 5 5 5 10 5 5 5 5 5 5 10 6 5 5 5 5 5 10 7 5 5 5 5 5 10 8 5 5 5 5 5 10 9 5 5 5 5 5 10
Nmero de ns
Tabela 5.9 Sries de dados referentes Figura 3.28 e c_min=f_min=3.
81
Ao confrontar os dados apresentados nas Figuras 5.13, 5.14 e 5.16, pode-se perceber que os parmetros c_min e f_min influenciam na rapidez de convergncia do algoritmo. Pelo que se pode constatar ao realizar estas duas comparaes, a convergncia foi mxima quando c_min e f_min eram o valor mnimo permitido pelas condies de contorno indicados no item 3.3.5. Com isso, pode-se concluir que, para o problema analisado, a convergncia mxima existe quando se tem a remoo de um n do espao de crenas possvel com o menor nmero de formigas e colnias.
82
6. Concluses e trabalhos futuros

A importncia de um planejamento autnomo de rotas para a automao de robs de servio mostrada neste trabalho j foi apontada em outros trabalhos. Esta pesquisa apresenta quatro conjuntos de heursticas que, adicionadas ao algoritmo apresentado por Dorigo et al. (1996), buscam resolver partes do problema do planejamento de rotas para robs de inspeo: um primeiro, onde a lista tabu removida, um segundo, onde temos um reforo negarivo referente memria de cada agente individual, um terceiro onde alterou-se o critrio de parada para aumentar a influncia de resultados melhores encontrados durante a execuo, e o quarto que combina todas os algoritmos anteriores com o algoritmo cultural. Os resultados obtidos ao se aplicar variaes do algoritmo de otimizao por colnia de formigas, mostraram-se promissores, sendo que dois problemas no cobertos pelo algoritmo original a existncia de um cabo umbilical e a necessidade de se passar vrias vezes pelo mesmo ponto foram resolvidos atravs das heursticas adicionais propostas. O ACS implementado confirmou as caractersticas citadas por Dorigo et al. (1996), no que diz respeito robustez e versatilidade do mesmo. A adio das mencionadas heursticas permitiu uma melhor convergncia do problema de planejamento de rotas. Parte das heursticas aqui apresentadas sejam elas as definidas por Dorigo et al. (1996), que so relacionadas com o reforo negativo ou com as derivadas da incluso do conceito de algoritmos culturais possuem uma caracterstica em comum: so compostas de um conjunto de parmetros cujo valor timo varia de acordo com o cenrio onde o algoritmo executado. Esta relao foi determinada neste trabalho apenas de forma emprica. Observa-se a importncia do estudo das relaes entre estes parmetros e a rapidez de convergncia do algoritmo. Espera-se, em trabalhos futuros, abordar tal tema atravs do uso de tcnicas evolutivas, permitindo que, desta forma, no apenas o algoritmo se adapte ao meio, mas tambm os valores dos parmetros possuam este comportamento adaptativo.
83 Deve-se frisar que a contribuio deste trabalho consistiu em combinaes inditas de heursticas de ao restrita ao indivduo (o reforo negativo que ocorre em funo da memria de cada agente), e abrangendo todo o conjunto de agentes (no caso do algoritmo cultural, que possibilita uma segunda forma de interao entre os agentes, modificando o espao de buscas global de acordo com as experincias individuais compartilhadas). As heursticas de ao restrita ao agente, se mostraram eficazes como forma de substituir a lista tabu em aplicaes que depende de vrias passagens em um mesmo ponto. Sua operao, em funo da memria individual, permite que o agente busque novas solues individuais ao problema, evitando assim uma interferncia indesejada na busca individual de cada agente. Ao adicionar o algoritmo cultural como heurstica que permita a modificao do espao de buscas de todos os agentes, adicionou-se uma segunda forma de cooperao. Esta cooperao, se mostrou eficaz para o aumento da convergncia do algoritmo, ao permitir que todo o conjunto de agentes defina o espao de buscas a ser considerado, descartando as regies de menor chance de uso. Por fim, nota-se que tais combinaes, entretanto, ainda deixaram espao para a insero de vrias outras tcnicas de inteligncia artificial amplamente encontrados na literatura cientfica. Os resultados, embora inicialmente previstos para um universo pequeno de dispositivos, podem ser aplicados em muitos outros problemas de otimizao combinatrios.
84
Referncias bibliogrficas
ALAMI R.; CHATILA R.; FLEURY, S.; GHALLAB, M.; INGRAND, F. (1998).
International Journal of Robotics Research, Edio Especial de Integrated Architectures for Robot Control and Programming'', Vol. 17, No. 4, Abril. pp. 315-337. ALAMI, R.; INGRAND, F.; PY, F. (2002). Dependability Issues in a Robot Control Architecture. 2nd IARP/IEEE-RAS Joint Workshop on Technical Challenge for Dependable Robots in Human Environments, LAAS-CNRS, Toulouse, France, 7-8 de outubro. APPLEGATE, D.; BIXBY, R.; COOK, W. (1998). On the Solution of Travelling Salesman Problems. Documenta Mathematica, Extra Volume Proceedings ICM III, pp. 645-656. 1998. BEVILACQUA, R..; CASTAO, M. C. (1999). Estratgias Adaptativas em Sociedades de Formigas. SBA Controle & Automao, vol. 10, pp. 167-175. BIESZCZAD, A.; PAGUREK, B; WHITE, T. (1998). Mobile Agents for Network Management. IEEE Communications Surveys, vol. 1, no. 1. Disponvel em citeseer.ist.psu.edu/article/bieszczad98mobile.html. BLUM, C. ROLI, A.(2003). Metaheuristics in Combinatorial Optimization: Overview and Conceptual Comparison. ACM Computing Surveys, vol. 35, no. 3, pp. 268-308. Setembro de 2003. BOCTOR, F. F.; LAPORTE, G.; RENAUD, J. (2003). Heuristics for the Traveling Purchaser Problem. Computers & Operations Research, vol. 30, no. 4, pp. 491-504. BORYCZKA, M.; WIECZOREK, W. (2003). Solving Approximation Problems Using Ant Colony Programming, Artificial Intelligence Methods, Polnia, 5-7 de novembro.
85 BONABEAU, E.; HENAUX, F.; GERIN, S.; SNYERS, D.; KUNTZ, P.; THERAULAZ, G. (1998). Routing in Telecommunications Networks with "Smart" Ant-like Agents. Intelligent Agents for Telecommunications Applications. Second International Workshop IATA '98. Vol. 1437. Julho de 1998. Disponvel em: http://citeseer.ist.psu.edu/bonabeau98routing.html BONABEAU, E.; THRAULAZ, G. (1998). Swarm Smarts. Scientific American, pp. 8290, Maro. Disponvel em http://dsp.jpl.nasa.gov/members/payman/swarm/. BONABEAU, E.; DORIGO, M.; THERAULAZ, G. (2000). Inspiration for Optimization from Social Insect Behaviour. Nature, vol. 406, pp. 39-42. BOTEE, H. M.; BONABEAU, E.(1999). Evolving Ant Colony Optimization. Advances in Complex Systems, vol. 1, no. 2/3, pp. 149-159. BOURJOT, C.; CHEVRIER, V.; THOMAS, V.(2003). A new Swarm Mechanism Based on Social Spiders Colonies: From Web Weaving to Region Detection. Web Intelligence and Agent Systems: An International Journal I. IOS Press. pp. 47-64. BROOKS, R. A.(1991). Intelligence Without Reason. Proceedings of the 12th International Joint Conference on Artificial Intelligence ({IJCAI}-91). Sydney, Australia. pp. 569-595. Agosto. BYRNE, R. H.; ADKINS, D. R.; ESKRIDGE, S. E.; HARRINGTON, J. J.; HELLER, E. J.; HURTADO, J. E. (2002). Miniature Mobile Robots for Plume Tracking and Source Localization Research. Journal of Micromechatronics, vol. 1, no. 3, pp. 253-261. CHOI, H. R.; RYEW, S. M. (2002); Robotic System with Active Steering Capability for Internal Inspection of Urban Gas Pipelines. Mechatronics, no. 12, pp. 713-736.
86 CHOSET, H.; KONUKSVEN, I.; RIZZI, A. (1996). Sensor Based Planning: A Control Law for Generating the Generalized Voronoi Graph. Proc. IEEE Int. Advanced Robotics, Washington, EUA. Disponvel em: http://citeseer.ist.psu.edu/article/choset96sensor.html CHOSET, H.; NAGATAMI, K. (2001). Topological simultaneous localization and mapping (SLAM): toward exact localization without explicit localization. IEEE Transactions on Robotics and Automation, vol. 17, no. 2, pp.125-137. Disponvel em http://voronoi.sbp.ri.cmu.edu/papers.english.html. COELHO, L. S.; COELHO, A. A. R.(1999); Algoritmos Evolutivos em Identificao e Controle de Processos: uma Viso Integrada e Perspectivas. Revista Controle e Automao. vol. 10. no. 01. pp 13-30. COELLO, C. A. C. (2002); Theoretical and Numerical Constraint-handling Techniques used with Evolutionary Algorithms: a Survey of the State of the Art. Computer Methods in Applied Mechanics and Engineering. no. 81, pp. 1245-1286. COELLO, C. A. C. C; BECERRA, R. L.(2003); A Cultural Algorithm for Constrained Optimization Second Mexican International Conference on Artificial Intelligence. pp. 98117. Merida, Mxico. COHEN, W. (1996). Adaptive Mapping and Navigation by Teams of Simple Robots. Robotics and Autonomous Systems. no. 18, pp. 411-434. COSTA, V. M. S. (1998). Integrao de Comportamentos Visuais para Robtica Mvel. Dissertao de mestrado. Universidade Tcnica de Lisboa, Portugal. Disponvel em http://vislab.isr.ist.utl.pt/theses.html COURY, D. V. (2002). Algoritmos Genticos: Uma Nova Abordagem Para a Resoluo de Problemas em Sistemas Eltricos de Potncia, Edital Universal CNPq 01/2002. Projeto de Pesquisa.
87 CUNHA, C.B; BONASSER, U.O. e ABRAHO, F.T.M. (2002) Experimentos Computacionais com Heursticas de Melhorias para o Problema do Caixeiro Viajante. In: Setti, J.R.A. e Santos, E.M., eds (2002) Panorama Nacional de Pesquisa em Transportes Anais do XVI ANPET, ANPET, Rio de Janeiro, RJ, Vol. 1, pp.105-117. DATTERI, E.; TETI, G.; LASCHI, C.; TAMBURRINI, G.; DARIO, P.;
GUGLIELMELLI, E. (2003) Expected perception in robots: a biologically driven perception-action scheme. ICAR 2003, 11th International Conference on Advanced Robotics, pp.1405-1410. DEB, K.(1999); An Introduction to Genetic Algorithms. Kanpur Genetic Algorithm Lab. http://www.iitk.ac.in/kangal/pub.htm. Acesso em 16/04/2004. DENEUBOURG, J. L.; PASTEELS, J. M.; VERHAEGHE, J. C. (1983). Probabilistic behaviour in ants: a strategy of errors? Journal of Theoretical Biology, no. 105, pp. 259271. DIXON, K. R.; STRAND, M.; KHOSLA, P. K.(2002). Predictive Robot Programming. IEEE/RSJ International Conference on Intelligent Robots and Systems, EPFL, Sua. Disponvel em http://chernoybl.ices.cmu.edu:8080/papers/. DORIGO, M.; MANIEZZO, V.; COLORNI, A. (1996). The Ant System: Optimization by a Colony of Cooperating Agents. IEEE Transactions on Systems, Man and Cybernetics Part B, vol. 26, no. 1, pp. 1-13. DORIGO, M.; GAMBARDELA, L. M.(1997) Ant Colonies for the Travelling Salesman Problem. BioSystems, vol. 43, pp. 73-81. DORIGO, M.; TRIANNI, V.; SAHIN, E.; GROB, R.; LABELLA, T. H.; BALDASSARE, G.; NOLFI, S.; DENEUBOURG, J. L.; MONDADA, F.; FLOREANO, D.; GAMBARDELLA, L. M. (2004) Evolving Self-Organizing Behaviors for a Swarm-Bot. Autonomous Robots, no. 17, pp. 223-245.
88
FIRA (2005). Federation of International Robot-soccer Association. Pgina HTML disponvel em http://www.fira.net/media/photo/read.html?indexnum=342&page=1& keyword=&depth1=1&depth2=&depth3= Acesso em 20 de fevereiro de 2005. FOX, S. (2004); Swarm Stupidity. IEE Manufacturing Engineer. Dezembro(2003)-Janeiro (2004), pp. 26-29. FRANKLIN, S.; GRAESSER, A. (1996). Is it an Agent or Just a Program? A Taxonomy for Autonomous Agents. 12.a European Conference on AI. Berlim, Alemanha. Disponvel em http://www.msci.memphis.edu/%7Efranklin/AgentProg.html FULLER, J. L.(1999); An Introduction to Robotics. Prentice Hall, Upper Saddle River, NT. GAGE, D. W. (1995); Many-Robot MCM Search Systems. Autonomous Vehicles in Mine Countermeasures Symposium. pp. 9.56-9.64. Abril de 1995. GASPAR, J; WINTERS, N.; GROSSMANN, E.; VITOR, J. S. (2004). Toward Robot Perception using Omnidirectional Vision, Innovations in Machine Intelligence and Robot Perception disponvel em http://www.lkl.ac.uk/niall/book_odv.pdf
GOOGLE (2004). Google. Pgina HTML disponvel em http://www.google.com em 7 de dezembro de 2004. HAGRAS, H.; CALLAGHAN, V.; COLLEY, M. (2001) Outdoor Mobile Robots Learning and Adaptation. IEEE Robotics & Automation Magazine. no. 53. pp. 53-69. Setembro. HELSGAUN, K.(1998). An Effective Implementation of the Lin-Kernighan Travelling Salesman Heuristic. DATALOGISKE SKRIFTER (Writings on Computer Science), No. 81. pp 106-130.
89 IACOBAN, R.; REYNOLDS, R. G.; BREWSTER, J. (2003). Cultural Swarms: Assessing the Impact of Culture on Social Interaction and Problem Solving. IEEE Swarm Intelligence Symposium. pp 205-211. Abril. INSTITUTO PARA A ROBTICA PRTICA (2005). BotBall Touch Sensors. Pgina HTML Disponvel em http://www.kipr.org/curriculum/touch.html. Acesso em 15 de fevereiro de 2005. INUKTUM (2005). Minitrac robotic propulsion units. Pgina HTML disponvel em http://www.inuktun.com/minitracs.htm. Acesso em 20 de fevereiro de 2005. JIANXU, M.; XIANG, L.; JIANHUA, M.; MINGDONG, L.; PEISUN, M. (2000). Microbionic and Peristaltic Robots in a Pipe. Chinese Science Bulletin. Vol. 45, No. 11, Junho. JIN, X.; REYNOLDS, R. G. (1999). Using Knowledge-Based System with Hierarchical Architecture to Guide the Search of Evolutionary Computation. IEE International Conference on Tools with Artificial Intelligence (ICTAI1999), pp 29-36. Chicago, Illinois, EUA. JULY, 2002, Sant`Angelo d`Ischia, Italy. Springer Tracts in Advanced Robotics 5, pp. 297306. KANOH, H.; NAKAMURA, T. (2000). Knowledge Based Genetic Algorithm for Dynamic Route Selection. IEE Fourth International Conference on Knowledge Based Intelligent Engineering Systems and Allied Technologies (KES2000), pp. 616-619. Brighton, Reino Unido. KARLSON, P. (2002). Simulated Annealing Applied to the Travelling Salesman Problem. Technical Report, Universidade de Upsala, Canad.
90 KAZADI, S. (2002). Swarm Engineering. Tese de Doutorado em Filosofia. Instituto de Tecnologia da Califrnia. Pasadena, Califrnia, EUA. KELLY, K. (1995). Out of Control: The New Biology of Machines, Social Systems and the Economic World. Perseus Publishing. Nova York, EUA. KIRKPATRICK, S.; GELATT, C. D.; VECCHI, M. P. (1983). Optimization by Simulated Annealing. Science. vol. 220, no. 4598, pp. 671-680. KITA, N.; DAVISON, A.; KUNIYOSHI, Y.; HARA, I.; MATSUI, T.; ROUGEAUX, S.; HORI, T.; HIRAI, S. (1999). Mobile Sensing Robots for Nuclear Power Plant Inspection. Advanced Robotics, vol. 13. no. 3. pp. 355-356. KLJAJIC, M., BRESKVAR, U., BERNIK, I. (2002). Production Planning Using a Simulation Model and Genetic Algorithms. IASTED International Conference Proceedings. Marina Del Rey, California, EUA. pp 54-58. KOENING, S. (1999). Robot Localization and Exploration with Agent-Centered Search. International Joint Conference on Artificial Intelligence. Disponvel em citeseer.ist.psu.edu/207440.html. Acesso em 27 de setembro de 2003. LAPORTE, G. (2000) Classical and modern heuristics for the vehicle routing problem. International Workshop on Vehicle Routing. Skodsborg, Dinamarca. Agosto. Disponvel em http://www.imm.dtu.dk/conferences/route2000/ Acesso em 27 de setembro de 2003. LAVINE, B. K.; DAVIDSON, C.; MEER, R. K. V.; LAHAV, S.; SOROKER, V.; HEFETZ, A. (2003). Genetic Algorithms for Deciphering the Complex Chemosensory Code of Social Insects. Chemiometrics and Intelligent Laboratory Systems. no. 66. pp. 5162.
91 LERMAN, K.; GALSTYAN, A.; MARTINOLI, A.; IJSPEERT, A. (2001). A Macroscopic Analytical Model of Collaboration in Distributed Robotic Systems. Artificial Life, no. 7, pp. 375-393. LIN, S.; KERNIGHAN, B. W. (1973). An Effective Heuristic Algorithm for the Travelling Salesman Problem. Operational Research, vol. 21, no. 2, pp. 498-516, 1973. LOCKHEED, M. (1997). Multisensor Inspection & Caracterization Robot for Small Pipes (MICROSPI). Technology Development Data Sheet. Federal Energy Technology Center. LOW, K. H.; LEOW, W. K., ANG, M. H. (2002). A Hybrid Mobile Robot Architecture with Integrated Planning and Control. I AAMAS' 02, pp. 219-226. Bolonha, Itlia. LYNXMOTION 2005. MARTINOLI, A.; EASTON, K. (2002). Modeling Swarm Robotic Systems. In B. Siciliano and P. Dario, editors, Proc. of the Eight Int. Symp. on Experimental Robotics ISER-02, JONES, J. L.; FLYNN, A. M.; SEIGER, B. A. (1998) Mobile Robots: Inspiration to Implementation. Ed. AK Peters Ltd; 2a. edio. MERZ, P.; FREISLEBEN, B. (2000). Fitness Landscapes, Memetic Algorithms and Greedy Operators for Graph Bi-Partitioning. IEEE Transactions on Evolutionary Computation, vol. 4, no. 4, 2000. Metropolitan Sewer District: What Happens When You Flush? Pgina HTML disponvel em http://www.msdlouky.org/programs/whenuflush/maintain.htm, acesso em 30 de janeiro de 2003. MEULEAU, N.; DORIGO, M. (2002). Ant Colony Optimization and Stochastic Gradient Descent, Artificial Life , no. 8, pp. 103-121. (2005). Sensors. Pgina HTML disponvel em
http://www.lynxmotion.com/Category.aspx?CategoryID=8. Acesso em 15 de fevereiro de
92
McKERROW, J. P. (1991). Introduction to Robotics. Livro, ISBN ISBN 0 201 18240 8. 811 pginas. MORANDI, M. B.; NAZEMI, E.; An Approach to Genetic Algorithm Path Planning Used in RobocupRescue. Disponvel em http://www.sbcee.net/rescueteams/sbceres2003.html Acesso em 15 de agosto de 2003. MILLS, P.; TSANG, E.; ZHANG, Q.; Ford, J. (2004); A Survey of AI-based Metaheuristics for Dealing with Local Optima in Local Search. Technical Report, disponvel em http://cswww.essex.ac.uk/technical-reports/index.htm Acesso em janeiro de 2005. MONTEIRO, S. T.; RIBEIRO, C. H. C.; Desempenho de Algoritmos de Aprendizagem por Reforo sob Condies de Ambiguidade Sensorial em Robtica Mvel. SBA Controle & Automao, vol. 15 no. 3, 2004. MORAWEK, R. (2003); Path Finding for Mobile Agents or the Travelling Salesman Problem under Incomplete Information. Tese de doutorado, Technischen Universitt Wien. pp. 65-83. NASA 2005. NEHMZOW, U. (2001). Mobile Robotics: Research, Applications and Challenges. Proc. Future Trends in Robotics, Institution of Mechanical Engineers, London. New York Gas Group (2001). EXPLORER: A Long Range Untethered Live Gasline Inspection Robot System. NYGAS Technology Brief, Abril/2001. Oldenburg, Universidade de; Marine Physics. Pgina HTML disponvel em (2005); sojourner.jpg. Imagem disponvel em
http://nssdc.gsfc.nasa.gov/image/spacecraft/sojourner.jpg. Acesso em 20 de fevereiro de
http://las.physik.uni-oldenburg.de/general/activities.html em 27 de setembro de 2003.
93
OJALA, J. (1998). Adaptative Behavior with Protozoa-Inspired Dynamics. Biological Cybernetics no. 79, pp. 403-411. OSTROWSKI, D. A.; TASSIER, T.; EVERSON, M. P.; REYNOLDS, R. G. (2002). Using Cultural Algorithms to Evolve Strategies in Agent-Based Models. Proceedings of the 2002 Congress on Evolutionary Computation, pp. 741-746. Honolulu, HI, EUA. OZAKI, K.; YOKOTA, K.; MATSUMOTO, A.; ASAMA, H. (1999). Communication System for Cooperative Mobile Robots Implementation of Communication Among Soccer Robots. Advanced Robotics. vol. 13, no. 3, pp 287-288. PANETTA, P.D.; DIAZ, A.A.; PAPPAS, R.A.; TAYLOR, T.T.; FRANCINI, R.B.; JOHNSON, K.I.; Mechanical Damage Characterization in Pipelines. U.S. Department of Energy. Outubro/2001. Disponvel em http://www.netl.doe.gov/scng/trans-dist/ngdel/techstatus.html em 27 de setembro de 2003. PARPINELLI, R.S.; LOPES, H.S.; FREITAS, A.A.(2002). An Ant Colony Algorithm for Classification Rule Discovery. In: H. Abbass, R. Sarker, C. Newton. (Eds.) Data Mining: a Heuristic Approach, pp. 191-208. London: Idea Group Publishing. PARKER, C. A. C.; ZHANG, H.; KUBE, C. R. (2003). Blind Bulldozing: Multiple Robot Nest Construction. Proc. IEEE/RSJ International Conference on Robotics and Intelligent Systems, Las Vegas, USA, Outubro 27-31. P.A.R.T.S. (2005). Accelerometer Kit. Portland Area Robotics Society. Pgina HTML disponvel em http://www.junun.org/MarkIII/Info.jsp?item=6#. Acesso em 20 de fevereiro de 2005. Paul Hayward Associates. (2003). Paul Hayward Associates. Pgina HTML disponvel em http://www.webcare.co.uk/pha/pha1.htm em 27 de setembro de 2003
94 PETTINARO, G. C.; KWEE, I. W.; GAMBARDELLA, L. M.; MONDADA, F.; FLOREANO, D.; NOLFI, S.; DENEUBOURG, J. L.; DORIGO, M. (2002). Swarm Robotics: A Different Approach to Service Robots. Proc. 33 International Symposium on Robotics. 7-11 de Outubro de 2002. Disponvel em http://gral.ip.rm.cnr.it/nolfi/nolfipub.html PFEIFER, R.; SCHEIER, C. (1994). From perception to action: the right direction ? Proc. From Perception to Action Conference, pp. 1-11. IEEE Computer Society Press, 1994. Disponvel em http://citeseer.ist.psu.edu/pfeifer94from.html. QUEIROZ, L. R.; BERGERMAN, M.; MACHADO, R. C.; BUENO, S. S.; ELFES, A. (1998). Educao a Distncia em Robtica e Viso Computacional. Revista Brasileira de Informtica na Educao, no. 3. Disponvel em http://www.inf.ufsc.br/sbc-ie/revista/nr3/ RANGANATHA, A.; KOEING, S (2003). A Reactive Robot Architecture with Planning on Demand; Intelligent Robots and Systems for Human Security, Health, and Prosperity. Outubro de 2003. Disponvel em http://citeseer.ist.psu.edu/682586.html RAVIKUMAR, C. N., GOWDA, K. C.; NAGABHUSHAN, P. (1998). An Efficient Technique to Solve TSP and its Extension to Spatially Spread Vertices. Current Science, vol. 75, no. 10, pp. 1046-1052. RESENDE, M. G. C.; VELARDE, J. L. G. (2003). GRASP: Greedy Randomized Adaptative Search Procedures. Revista Iberoamericana de Inteligncia Artificial. no. 9, pp 61-76. REYNOLDS, R. G.; CHUNG, C. J. (1997). Knowledge-Based Self Adaptation in Evolutionary Search, Proceedings of 1997 IEEE International Conference on Artificial Intelligence Tools, Newport Beach, Indianapolis, EUA
95 REYNOLDS, R. G.; Zhu, S. (2001). Knowledge-based Function Optimization using Fuzzy Cultural Algorithms with Evolutionary Programming. IEEE Transactions on Systems, Man and Cybernetics Part B: Cybernetics. vol. 31, no. 1, pp. 19-31. ROBOT BOOKS (2005). Robot Books.com Robot Kits, Robotics, and Toy Robots. Pgina HTML disponvel em http://www.robotbooks.com/. Acesso em 20 de fevereiro de 2005. ROBOPROBLE TECNOLOGIES INC. List of Robot Crawlers. Pgina HTML disponvel em http://www.roboprobe.com/CATALOGS/C38-LIST_ROBOTS_AND_ROVS.HTML em 27 de setembro de 2003. ROMAO, W.; FREITAS, A. A.; PACHECO, R. S. (2002). A Genetic Algorithm for Discovering Interesting Fuzzy Prediction Rules: Applications to Science and Technology Data Proceedings of Genetic and Evolutionary Computation Conference (GECCO-2002). So Francisco, EUA. Pp 1188-1195 Julho. SANDI, F. A.; HEMERLY, E. M.; LAGES, W. F. (1998). Sistema de Navegao e Guiagem de Robs Mveis e Autnomos, Revista SBA Controle e Automao, vol. 9, no. 3, pp. 107-118. SCHOONDERWOERD, R.; HOLLAND, O.; BRUTEN, J.; ROTHKRANTZ, L. (1996). Ant-Based Load Balancing in Telecommunications Networks. Adaptive Behavior. no. 2, pp. 169-207. SENSOR RESEARCH (2005). Sensors Research Consulting, Inc. Pgina html disponvel em http://www.sensors-research.com/, acesso em 06/10/2005. SILVER, E. A. (2002). An Overview of Heuristic Solution Methods. Working paper. Haskayne School of Business, University of Calgary, October, 2002.
96 SIM, K. M.; SUN, W. H.(2003) Ant Colony Optimization for Routing and Load-Balancing: Survey and New Directions. IEEE Transactions on Systems, Man and Cybernetics Part A: Systems and Humans, vol. 33, no. 5, pp. 560-572. Sony (2005). What is AIBO. Pgina HTML disponvel em http://www.aiboeurope.com/1_1_3_ers7_1.asp Acesso em 20 de fevereiro de 2005. SRI International. Industrial Products. Pgina HTML disponvel em
http://www.sri.com/ipet/indusprds.html#it em 27 de setembro de 2003 STAGER, B. (2001). The Solving of Real World Problems using Evolutionary Algorithms. Undergraduate Thesis. University of Queensland. Outubro. SIEGWART, R.; NOURBAKHSH, I. R. (2004). Introduction to Autonomous Mobile Robots. MIT Press. Cambridge, EUA. SUTTON, R. S. (1992). Reinforcement Learning Architectures. Proceedings of ISKIT'92 International Symposium on Neural Information Processing. Disponvel em http://www.cs.ualberta.ca/~sutton/publications.html. Acesso em 27 de setembro de 2003. TALBI, E. G.; ROUX, O. ; FONLUPT, C., ROBILLARD, D. (2001). Parallel Ant Colonies for the Quadratic Assigment Problem. Future Generation Computer Systems, no. 17, pp. 441-449. TAHERI, S. A.; CALVA, G.(2001). Imitating the Human Imune System Capabilities for Multi-Agent Federation Formation, Proceeding of the IEEE Internations Symposium on Intelligent Control. Cidade do Mxico, Mxico. pp 25-30. TAVARES NETO, R. F.; COELHO, L. S. (2003). Proposta de Planejamento de Rotas para Robs de Inspeo Usando um Algoritmo de Colnia de Formigas. VI SBAI Simpsito Brasileiro de Automao Inteligente. Bauru, SP. Disponvel em http://www.tavares.eng.br
97 TAVARES NETO, R. F.; COELHO, L. S. (2004). Planejamento de Rotas para Robs de Inspeo Usando uma nova abordagem de Swarm Intelligence. I NANOBIO - Workshop em Nanotecnologia e Computao Inspirada na Biologia. Rio de Janeiro, RJ. Disponvel em http://www.tavares.eng.br TAVARES NETO, R. F.; COELHO, L. S. (2004). Planejamento de Rotas de Entrega Usando uma Abordagem de Algoritmo de Colnia de Formigas com Lista Tabu Suprimida. XV Congresso Brasileiro de Automtica. Gramado, RS. Setembro. Disponvel em http://www.tavares.eng.br TAVARES NETO, R. F.; COELHO, L. S. (2004). Colnia de Formigas: Uma Abordagem Promissora para Aplicaes de Atribuio Quadrtica e Projeto de Layout. XXIV ENEGEP Encontro Nacional de Engenharia de Produo. Florianpolis. Disponvel em http://www.tavares.eng.br TAVARES NETO, R. F.; COELHO, L. S. (2005). Planejamento de rotas para Robs de Inspeo Usando um Algoritmo Hbrido de Colnia de Formigas e Algoritmo Cultural. VII SBAI Simpsito Brasileiro de Automao Inteligente. So Lus. Disponvel em http://www.tavares.eng.br TAUB, H. (1984) Circuitos Digitais e Microprocessadores. Editora McGraw-Hill do Brasil. Pp. 239. So Paulo. TERRA (2004). Terra Quem quer MAIS assina o Terra. Pgina HTML disponvel em http://www.terra.com.br em 7 de dezembro de 2004. THAKOOR, S.; CHAHL, J.; SRINIVASAN, M.V.; YOUNG, L., WERBLIN, F.; HINE, B.; ZORNETZER, S. (2002) Bioinspired Engineering of Exploration Systems for NASA and DoD, Artificial Life, No. 8, pp. 357-369. THOMAZ, C. E.; PACHECO, A. C.; VELLASCO, M. M. B. R. (1999). Mobile Robot Path Planning Using Genetic Algorithms. International Conference on Information Systems
98 Analysis and Synthesis, Image and Signal Processing. vol. 6, pp. 671-679, Alicante, Espanha. TOMASSINI, M. (1995). Genetic Algorithms: a Survey. Annual Reviews of Computational Physics Vol. III, World Scientific, pp. 87-117. NSAL, C. (1993). Self Organization in Large Population of Mobile Robots. Dissertao de mestrado. Blacksburg, Virginia. Maio. UOL (2004). UOL O Melhor Contedo. Pgina HTML disponvel em
http://www.uol.com.br em 7 de dezembro de 2004. VENUGOPAL, K. V.(2001) State-of-the-art Natural Gas Pipe Inspection. Oak Ridge National Laboratory. Novembro. Disponvel em http://www.netl.doe.gov/scng/transdist/ngdel/tech-status.html VIEIRA, F. C., DRIA Neto, A. D., e COSTA, J. A. F. (2003). An Efficient Approach To The Travelling Salesman Problem Using Self-Organizing Maps. International Journal of Neural Systems. Vol. 13, No. 2, pp. 59-66. WASSON, G.; KORTENKAMP, D.; HUBER, E. (1999). Integrating Active Perception with an Autonomous Robot Architecture. Robotics and Automation Journal, Vol. 29, pp. 175-186, 1999. WATTANASIN, C.; AIYAMA, Y.; KURABAYASHI, D.; OTA, J., ARAI, T. (2001). Hybrid Power Suply for Mobile Robots. Advanced Robotics, vol. 15, no. 6, pp. 695-710. WHITTAKER, W.; URMSON, C.; STARITZ, P.; KENNEDY, B.; AMBROSE, R. (2000). - Robotics for Assembly, Inspection, and Maintenance of Space Macrofacilities. AIAA Space 2000 Conference and Exposition. Setembro. Long Beach, Canad, EUA. Disponvel em http://www.ri.cmu.edu/centers/sri/pubs_text.html
99 ZAGROS ROBOTICS (2005). Welcome to Zagros Robotics. Pgina HTML disponvel em https://www.zagrosrobotics.com/shop/category.asp?catid=3. Acesso em 20 de fevereiro de 2005. ZIMMER, U. R. (1995). Adaptative Approaches to Basic Mobile Robot Tasks. Tese de doutorado. Universidade de Kaiserslautem, Alemanha. ZHONG, W.; EVANS, D. (2002). When Ants Attack: Security Issues for Stigmergic Systems. UVA CS Technical Report. Universidade de Virgnia, EUA, 2002. Disponvel em http://www.cs.virginia.edu/~evans/pubs/stigmergy.html. Acesso em 27 de setembro de 2003.

Roberto Tavares

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Roberto Tavares

Enviado por

Direitos autorais:

Formatos disponíveis

R O B E R T O F E R N A N D E S TAVA R E S N E T O

Keywords: Inspection, Preventive Maintanence, Ant Colony, Optimization.

Captulo 2. Descrio do problema

2.1. Limitaes fsicas do meio

2.2. Limitaes fsicas do ROV

Umbilical Transponder Sonda

2.3. Anlise de arquiteturas para autonomia de robs

2.4. Premissas do problema encontradas at agora

Captulo 3. Introduo robtica mvel

estruturado; realizar navegao, englobando duas tarefas, a de navegao global, que se

24 medir os parmetros do prprio rob para laos de controle (por exemplo, um

tornando um sinal condicionado, normalmente aps etapas de linearizao e amplificao;

25 o sinal condicionado passa por uma interface computacional, que o transforma

3.1. Sensores de uso comum na robtica mvel

3.1.1. Sensores de proximidade

Figura 3.2 O rob Nomad 200 (fonte: Queroz et al., 1996).

3.1.2. Sensores de deslocamento

3.1.4. Outros sensores e a ambiguidade sensorial

3.2. Morfologias de robs disponveis comercialmente

Figura 3.6 O rob Soujourner da NASA (fonte: NASA, 2005).

Figura 3.8 O rob co AIBO da Sony (fonte: Sony, 2005).

Nondeterministic-Polynomial-Hard, no determinstico-polinomial-difcil), indicando sua

versus volume de material transportado.

constraint project-scheduling problem), definido como: dado um projeto com n

O problema de determinao de rotas de veculos de entregas (vehicle routing

problem), definido como: dado um depsito e um conjunto de destinos,

So tambm adicionadas algumas novas condies de contorno ao problema do TSP:

4.2. Algoritmos para o problema do caixeiro viajante

quando um grande aumento no nmero de elementos observado no domnio da funo;

4.2.1. GRASP (Greedy Randomized Adaptive Search Procedure)

4.2.2. Simulated annealing

4.2.3. Algoritmo de Lin-Kernighan

Figura 4.1 Exemplo de aplicao do algoritmo 2-opt.

3.2.4. Algoritmos genticos

Reproduo/seleo; Cruzamento; Mutao.

Figura 4.4 Aplicao do operador de crossover (Morawek, 2003)

4.2.5. Programao evolutiva

et al., 2003) e a resoluo de problemas do caixeiro viajante (Dorigo et al., 1996).

annaeling e annealing genetic algorithms. Os resultados obtidos por Dorigo e Gambardela

ACS 420 425 535 21 282

AG 421 428 545 21 761

EP 420 426 542 N/A

SA 424 443 580 N/A

ANG 420 436 561 N/A

Melhor resultado 420 425 535 21 282

Captulo 5. Escolha do mtodo

5.1. Algoritmo ACS original

onde ij (t ) representa a quantidade de feromnio existente no caminho entre as cidades i e j

ferommio depositada pela formiga entre os instantes t e t + n.

Fim da lista tabu

= 1; = 0 (com isso, o termo referente visibilidade dos ns, considerado constante no

(b) Figura 5.4 Resultados obtidos (Tavares e Coelho, 2003).

5.3. Adaptao do ACS visando melhorar a convergncia

Figura 5.6 Mapa analisado aps adicionar-se o reforo negativo.

5.3.1. Resultados obtidos atravs da aplicao do reforo negativo

BadFeromBias 0,01 0,10 0,50 0,75 1,00

Qbad 0,01 0,10 0,50 0,75 1,00

Figura 5.7 Mapa analisado com o algoritmo da seo 5.3.

Qbad so relacionados, existindo um ponto de equilbrio entre eles em que se consegue

5.4. Alterao do critrio de parada para reforo do caminho timo encontrado

5.5. Limitao do espao de busca atravs de algoritmo cultural

POP_Accepted(t) representa um subconjunto de POP(t), contendo os indivduos

Tais condies, determinam que:

Mdia de movimentos da Execuo Colnia 0 0 14 1 5,5 2 4 3 4 4 4