Escolar Documentos
Profissional Documentos
Cultura Documentos
RESUMO: O artigo descreve o uso do método neuroevolucionário para evitar a colisão de duas embarcações
motorizadas que se aproximam de acordo com as regras do COLREG. Isso também pode ser visto como o
sistema de manuseio de navios que simula o processo de aprendizagem de um grupo de timoneiros artificiais -
unidades de controle autônomas, criadas com redes neurais artificiais. O timoneiro observa um ambiente por
seus sinais de entrada e de acordo com a regra CORLEG atribuída, ele calcula os valores dos parâmetros
necessários de manobras (rpm das hélices e deflexão do leme) em uma situação de prevenção de colisão. Na
neuroevolução, essas unidades são tratadas como indivíduos em uma população de redes neurais artificiais,
que, por meio de sensoriamento ambiental e algoritmos evolutivos, aprendem a executar determinada tarefa
com segurança e eficiência.
745
2 NEUROEVOLUÇÃO - movendo o navio para longe da
meta, alcançando uma meta.
Neuroevolução é um método de inteligência artificial
que usa algoritmos evolutivos (EA) para gerar redes Todos esses eventos devem ser avaliados
neurais artificiais (RNA), seus parâmetros, topologia e arbitrariamente, resultando em uma recompensa ao
regras. Tal combinação dá a vantagem de flexibilidade indivíduo avaliado, valorizando assim sua aptidão
e adaptabilidade, o que permite ajustar as estruturas importante no estágio evolutivo do algoritmo e
computacionais às condições dinamicamente consequentemente sua chance de reprodução e
mutáveis encontradas durante as manobras de navios sobrevivência para a próxima geração.
e são intensamente estudadas e implementadas em
O processo evolutivo do sistema consiste em três
muitos campos diferentes da ciência e da pesquisa,
etapas principais:
incluindo a robótica (Lee et al., 2013 ), processos de
seleção do melhor indivíduo ou indivíduos,
automação (Stanley et al., 2005), projetos e
- reprodução (com subprocessos de cruzamento e
diagnósticos de sistemas multiagentes (Nowak et al.,
mutação),
2008) (Larkin et al., 2006) e muitos mais.
- substituição (a prole substitui os piores
Algoritmos neuroevolucionários são métodos bem-
indivíduos).
sucedidos para otimizar topologias de redes neurais
para tarefas dinâmicas de aprendizado por reforço
contínuo. Sua vantagem significativa sobre os Para o propósito desta tarefa foi implementado o
algoritmos baseados em gradiente é a capacidade de método neuroevolutivo, o algoritmo NEAT
modificar topologias de rede junto com pesos de modificado, com codificação direta da topologia da
conexão, resultando em um espaço de pesquisa mais rede neural.
amplo de soluções possíveis. O NEAT (NeuroEvolution of Augmenting
As manobras adequadas de manobra do navio de Topologies) (Stanley e Risto, 2002) ajusta a topologia
acordo com as normas do COLREG são essenciais das RNA's com EA gradativamente, permite obter um
para a segurança das pessoas, equipamentos, carga e conjunto de indivíduos que melhor se ajustam a
meio ambiente. O aumento do poder computacional determinada tarefa.
dos dispositivos eletrônicos permite implementar Os sinais de entrada e saída das RNAs foram
algoritmos tão complexos quanto a neuroevolução em determinados no início da fase de projeto do sistema.
sistemas avançados de suporte à decisão (DSS) O conjunto de sinais corretamente projetado
também no campo da navegação marítima. considerado no modelo é crucial tanto para a
Por meio da observação contínua do ambiente e do eficiência do sistema quanto para sua fidelidade e
processo de aprendizagem, tal DSS deve prever o precisão em comparação com a situação real de
ângulo do leme e as rotações da hélice da embarcação navegação.
com a maior precisão possível para garantir a Os sinais de entrada no sistema, com três graus de
implementação segura da regra escolhida. É possível liberdade do movimento da embarcação, são os
calcular esses sinais de saída quando existe um seguintes:
modelo de simulação da embarcação disponível. - curso dos navios sobre o
Na neuroevolução, a RNA é tratada como um solo, velocidade angular
indivíduo em uma população de várias redes. dos navios,
Neuroevolution é capaz de encontrar uma solução - velocidade dos navios
para uma tarefa complexa e dinâmica com RNA sobre o solo, posição dos
criado e modificado com EA. As topologias básicas da navios,
população inicial são determinadas aleatoriamente no - distância dos navios e ângulo para o objetivo, - --
início do processo de aprendizagem. Cada indivíduo obstáculos e para o navio encontrado,
atua como um cérebro de timoneiro artificial e começa - rotações da hélice principal (atual e
o processo de encontrar uma solução com os mesmos predefinida),
parâmetros de partida (posição inicial do navio, curso, -deflexão dos lemes (atual e predefinida).
velocidade, ângulo do leme, rpm). A ação de cada Em pesquisas futuras, outros sinais do ambiente
indivíduo é geralmente avaliada com os algoritmos de podem ser levados em consideração, ou seja, vento,
aprendizagem por reforço (Stanley et al., 2005) e o correnteza, ondas, carga, trim and roll, se entregues
estágio evolutivo do sistema deve selecionar os
em um modelo de navio.
indivíduos mais adequados para a tarefa durante a
etapa de seleção, que determina toda a população Os sinais de saída de ANNs geram os valores para
para melhorar seu material genético ao longo Tempo. dirigir a embarcação:
A avaliação de cada indivíduo está sendo rpm da hélice
processada durante toda a simulação após a principal, deflexão
ocorrência de alguns eventos importantes, como por dos lemes.
exemplo: Todos os sinais de entrada e saída são
- mover a embarcação para fora da área ou no setor normalizados e codificados como valores reais entre 0
proibido, ou seja, o domínio de segurança de uma e 1.
embarcação encontrada,
- fazer manobras que mudam rapidamente e / ou Cada nó na RNA representa um neurônio que
frequentemente, ou seja, para alterações frequentes produz um valor real entre 0 e 1 como resultado da
de rpm, soma ponderada normalizada de suas entradas. A
- levando a valores de parâmetros de movimento
de navios impróprios, ou seja, velocidade linear e / normalização da soma ponderada é realizada com a
ou angular muito baixa ou muito alta, função sigmóide.
Os resultados da simulação são mostrados abaixo (b) Uma embarcação será considerada em
para o modelo de simulação do petroleiro VLCC de ultrapassagem ao aproximar-se de outra embarcação
três graus de liberdade “Esso Norway” com hélice de uma direção mais de 22,5 graus à ré de sua viga, ou
única e leme único (Figura 1). seja, em uma posição em relação à embarcação que
está ultrapassando, que à noite ela seria capaz de veja
apenas a luz de popa daquele navio, mas nenhuma de
suas luzes laterais.
(c) Quando uma embarcação tiver qualquer dúvida se
está ultrapassando outra, deve presumir que é esse o
caso e agir em conformidade.
(d) Qualquer alteração subsequente do rumo entre as
duas embarcações não tornará a embarcação que está
ultrapassando uma embarcação de travessia, na
acepção destas Regras, nem a isentará do dever de se
manter afastada da embarcação alcançada até que ela
finalmente tenha passado e esteja livre. ”
A situação de ultrapassagem é apresentada na
figura 3.
Figura 1. Navio petroleiro VLCC „Esso Noruega” (1969-
1986)
______________________________________________
Comprimento total 323,8 m
Comprimento entre
perpendiculares 304,8 m
Feixe 47,3 m
Máx. rascunho 18,46 m
Tonelagem de porte bruto 193048 t
Máx. revoluções da hélice
Máx. deflexão do leme
80 rpm
± 20 °
_____________________________________________
Nesta simulação, foi assumido que o “Esso
Noruega” encontrará um segundo navio de tamanho
semelhante e dirigindo-se para a frente em curso
constante. Seu domínio de segurança foi estabelecido
como um retângulo simplificado com 3 comprimentos
à frente de seu arco e um comprimento atrás da popa
(Figura 2). A largura deste domínio é de 2
comprimentos do navio.
Figura 11. Um exemplo de posições simultâneas de cada Figura 13. Percurso final do melhor
indivíduo na população de timoneiros durante a simulação indivíduo
Durante a simulação, cada timoneiro artificial tenta Os resultados da simulação são apresentados como
navegar com segurança pela área até um gol e, de rota final do melhor indivíduo e suas ações e
acordo com a regra 15, ele tenta evitar cruzar à frente parâmetros nas figuras 14 a 18.
da outra embarcação durante as manobras.
749
minimização da ocorrência de erros humanos,
redução do impacto prejudicial do transporte no
meio ambiente
encontrar algumas novas soluções relacionadas às
características heurísticas da neuroevolução.
É importante notar que todos esses benefícios na
neuroevolução dependem estritamente do ajuste
adequado dos parâmetros e processos evolutivos, do
Figura 17. Rotações sugeridas e reais [rpm] tamanho da população de RNAs e dos métodos de
codificação dos sinais considerados no ambiente
atendido.
Resultados de simulação bem-sucedidos encorajam
pesquisas adicionais dos métodos
neuroevolucionários com distúrbios adicionais da
influência das ondas do mar, correntes oceânicas e
ventos, para diferentes modelos de navios, que podem
ser implementados com sucesso em sistemas de
Figura 18. Curso sobre o solo navegação avançados para aumentar a segurança da
navegação.