Emails: alessandro@comp.ufla.br, paulogama@comp.ufla.br, ahmed@dcc.ufla.br, anapaula@dcc.ufla.br, joukim@ginux.ufla.br Abstract This paper describes the team of the Federal University of Lavras, called UFLA2D. Improve- ments have been made regarding the behavior of the team and was implemented a technique based on articial intelligence using fuzzy logic and neural networks. Keywords Robocup, 2D Simulation, Articial Inteligence, Fuzzy Logic, Neural Networks, Backpropaga- tion. Resumo Este artigo descreve a equipe da Universidade Federal de Lavras, que se chama UFLA2D. Foram feitas melhorias em relac ao ao comportamento do time base e implementada uma tecnica de inteligencia articial utilizando l ogica fuzzy e redes neurais articiais. Palavras-chave Robocup, Simulacao 2D, Inteligencia Articial, Logica Fuzzy, Redes Neurais Articiais, Backpropagation. 1 Introducao A Competicao Brasileira de Robotica (CBR) 1 que ocorre neste ano de 2011 juntamente com o Simposio Brasileiro de Automa cao Inteligente (SBAI) 2 e dividida em varias categorias, na qual o time do Departamento de Ciencia da Computa cao da Universidade Federal de Lavras(DCC-UFLA) 3 - UFLA2D 4 - almeja participar na categoria Ro- bocup Simulation 2D. O time UFLA2D criado no ano de 2010 com a aprovacao do projeto pela Fa- pemig no edital projeto Santos Dumont e desen- volvido no Laboratorio de Inteligencia Computaci- onal e Sistemas Avan cados (LICESA), sendo esta a primeira tentativa em participar da competi cao. Nesta categoria ocorrem partidas de simula- cao do futebol em duas dimensoes disputadas por dois times com 11 agentes inteligentes autonomos. Cada agente representa um jogador de futebol que recebe varios tipos de informacoes limitadas contendo situa coes de jogo. A partir disso, cada agente deve ser capaz de inferir sob a acao que de- vera tomar. Disputada no Brasil desde 2005, nesta simulacao as regras do jogo de futebol seguem as regras existentes em um jogo real mantidas pela Federation Internationale de Football Association (FIFA), e tambem algumas regras especcas da Robocup. Foi utilizado para o desenvolvimento do UFLA2D, o codigo base do time UvA Trilearn (Kok et al., 2003) por ter uma excelente documen- tacao e por conter algumas caractersticas interes- santes que facilitam o entendimento e altera cao do codigo. Neste artigo descrevem-se as caracte- rsticas do time, as modicacoes e a utilizacao da 1 http://www.cbr2011.org/ 2 http://www.ppgel.net.br/sbai2011/ 3 http://www.dcc.ufla.br 4 http://licesa.dcc.ufla.br/site/?page_id=81 tecnica de Inteligencia Articial para tomada de decisao conhecida por Sistema Hbrido. 2 Falhas Identicadas no Time Base Apos observacoes no comportamento do time base, vericou-se uma grande escassez de tomada de decisoes e comportamentos inteligentes. A unica decisao tomada pelos agentes de linha quando tem a bola sob seu domnio e mirar no gol adversario, e chutar a bola com a maior for ca possvel nessa direcao. Outra caracterstica frequentemente obser- vada era o grande n umero de bolas atrasadas ao goleiro sendo punido pela regra BACK PASS, pos- sibilitando ao time adversario uma grande opor- tunidade de marcar gol, pois essas faltas sempre sao dentro da area. Quando ha uma falta proxima ao gol adver- sario a ser cobrada por um agente do time base, este na maioria das vezes chuta a bola pra longe do gol devido `a for ca utilizada. Nenhuma analise da distancia ao alvo e feita. O goleiro originalmente pode se movimentar sobre uma area muito extensa, o que ocasional- mente atrapalha a a cao a ser tomada por este em um ataque adversario. 3 Tecnicas Utilizadas 3.1 Logica Fuzzy A logica fuzzy e a logica baseada na teoria dos conjuntos fuzzy. Ela difere dos sistemas logicos tradicionais em suas caractersticas e seus deta- lhes. Nesta logica, o raciocnio exato corresponde a um caso limite aproximado, sendo interpretado como um processo de composicao de relacoes ne- bulosas. (Gomide et al., 1995) Na logica fuzzy uma determinada armacao pode ser considerada quase certeza ou quase in- certeza, ao contrario da logica classica que ou a armacao e correta ou e incorreta. Diferentemente da logica classica que trabalha com graus de cer- teza exatos. Atraves de analises no ambiente futebolstico real e tambem por necessidades encontradas no ambiente simulado foram criadas variaveis lingus- ticas a m de suprir as necessidades. A primeira etapa foi a criacao de variaveis lingusticas de- nindo valores `a cada uma delas e representando-as como trapezios. Em seguida, sao passadas situacoes contidas em uma base no decorrer da partida `a essas va- riaveis para se obter o grau de pertinencia, arma- zenando esses valores que serao utilizados mais a frente como entrada na rede neural. Um exemplo de modelagem feita est a repre- sentada na gura 1. Esta imagem mostra a repre- senta cao fuzzy para a distancia do gol adversario. Quando a distancia e mnima, a pertinencia vale 1, pois o jogador esta muito proximo ao gol. Figura 1: Modelagem fuzzy usada para represen- tar a distancia do gol adversario 3.2 Redes Neurais Articiais Redes neurais articiais e uma tecnica de in- teligencia articial que visa a simula cao compor- tamental da rede neural humana como aprender, errar e realizar descobertas para a resolucao de problemas de uma forma inteligente. Sao divididas em duas categorias, de acordo com o seu tipo de aprendizado, podendo ser su- pervisionado ou nao-supervisionado. Uma rede neural supervisionada recebe alguns dados classi- cados e usa-os para classicar uma base de dados de acordo com o padrao que recebeu dos dados ja classicados. Uma rede neural nao-supervisionada vai classicar os dados apos encontrar padroes nos dados de entrada da rede, sem nenhum outro tipo de informacao. As redes neurais sao usadas neste trabalho para se obter as decisoes a serem tomadas pelo agente. 3.2.1 Algoritmo de aprendizado backpro- pagation Uma rede neural com o algoritmo de aprendi- zado backpropagation e atualmente a arquitetura mais aplicada em redes neurais articiais princi- palmente em torno da capacidade dessas redes de retropropagacao para aprender mapeamento mul- tidimensional complicado. (Hecht-Nielsen, 1988)
E um metodo de aprendizado de maquina
nao-supervisionado, sendo a generaliza cao da re- gra delta para redes de m ultiplas camadas. Os passos para o treinamento de uma rede utilizando este algoritmo sao: Propagacao dos padroes encontrados nos da- dos de treinamento. Retropropagacao dos erros encontrados na comparacao com os padroes. Atualiza cao dos pesos entre as conexoes dos neuronios. O algoritmo calcula o gradiente do erro na rede sobre os pesos modicaveis da rede. Na mai- oria das vezes usa-se este gradiente em um algo- ritmo de gradiente descendente estocastico sim- ples a m de encontrar pesos que minimizam o erro. (Werbos, 1994) 3.3 Sistema Hbrido No UFLA2D, foi utilizado uma tecnica h- brida de inteligencia artical. Esta tecnica baseia- se nas regras de um sistema fuzzy e no treinamento de redes neurais articiais. Apos obter os valores do grau de pertinencia na etapa da fuzzica cao, eles sao enviados para a entrada da rede neural previamente treinada para realizar a inferencia e assim tomar a decisao para cada momento do jogo. Decisoes essas que vao desde o comportamento dos zagueiros com posse de bola como mostrado na gura 2, ao comporta- mento dos atacantes frente a uma possvel situa- cao de gol, como mostrado na gura 3. Figura 2: Situacao para tomada de decis ao com agente zagueiro Figura 3: Situacao para tomada de decis ao com agente atacante A gura 4 mostra um exemplo de modelagem do sistema hbrido utilizado. Nela estao represen- tado as entradas, que sao os graus de pertinencia obtidos com as variaveis lingusticas do sistema fuzzy, os neuronios das camadas intermediarias, e as sadas, que sao as decisoes possveis a serem tomadas por um agente. Figura 4: Modelagem do sistema hbrido utilizado As variaveis lingusticas da gura 4 represen- tam: distGolAdv - Distancia relativa que um agente esta do gol adversario visaoLimpa - Se existem outros jogadores no cone de visao do agente em questao advProx - Se existe algum adversario proximo ao agente amigoProx - Se existe um amigo proximo ao agente intenMarcacao - Representa a intensidade da marca cao que o agente esta sofrendo 4 Conclusoes e Trabalhos Futuros Este trabalho apresenta o desenvolvimento do time UFLA2D utilizando um sistema hbrido (Lo- gica Fuzzy e Redes Neurais) para tomar as deci- soes e deste jeito inferir de uma forma inteligente no jogo. Este estudo atende o objetivo do projeto da CBR que visa incentivar estudos de Inteligencia Articial em problemas reais. Para o futuro pretende-se dar continuidade ao desenvolvimento do time, melhorando a inte- ligencia articial implementada nesta versao, e preocupando-se mais com a parte defensiva. Tam- bem e necessario uma melhora na implementacao do passe, pois claramente percebe-se um grande n umero de passes errados ao decorrer das parti- das. 5 Agradecimentos Agradecemos `a Fapemig pelo apoio nanceiro a este projeto e a Jelle Kok que disponibilizou o codigo do time base UvA Trilearn. Referencias Gomide, F., Gudwin, R. and Tanscheit, R. (1995). Conceitos fundamentais da teoria de conjun- tos fuzzy, logica fuzzy e aplicacoes, Procee- dings of 6th International Fuzzy Systems As- sociation World Congress-IFSA95, Tutorials, pp. 138. Hecht-Nielsen, R. (1988). Theory of the backpro- pagation neural network, Neural Networks, 1989. IJCNN., International Joint Confe- rence on, IEEE, pp. 593605. Kok, J., Vlassis, N. and Groen, F. (2003). Uva tri- learn 2003 team description, Proceedings CD RoboCup 2003. Werbos, P. (1994). The roots of backpropa- gation: from ordered derivatives to neural networks and political forecasting, Vol. 1, Wiley-Interscience.