UFLA2D

UFLA2D 2011: TEAM DESCRIPTION PAPER
Alessandro R. Alcantara
, Paulo H. Gama e Silva
, Ahmed A. A. Esmin
, Ana Paula
Piovesan Melchiori
, Joaquim Quintero Uch oa
Campus Universitario, Caixa Postal - 3037, CEP - 37200-000, Lavras - MG

Emails: alessandro@comp.ufla.br, paulogama@comp.ufla.br, ahmed@dcc.ufla.br,
anapaula@dcc.ufla.br, joukim@ginux.ufla.br
Abstract This paper describes the team of the Federal University of Lavras, called UFLA2D. Improve-
ments have been made regarding the behavior of the team and was implemented a technique based on articial
intelligence using fuzzy logic and neural networks.
Keywords Robocup, 2D Simulation, Articial Inteligence, Fuzzy Logic, Neural Networks, Backpropaga-
tion.
Resumo Este artigo descreve a equipe da Universidade Federal de Lavras, que se chama UFLA2D. Foram
feitas melhorias em relac ao ao comportamento do time base e implementada uma tecnica de inteligencia articial
utilizando l ogica fuzzy e redes neurais articiais.
Palavras-chave Robocup, Simulacao 2D, Inteligencia Articial, Logica Fuzzy, Redes Neurais Articiais,
Backpropagation.
1 Introducao
A Competicao Brasileira de Robotica (CBR)
1
que ocorre neste ano de 2011 juntamente com
o Simposio Brasileiro de Automa cao Inteligente
(SBAI)
2
e dividida em varias categorias, na qual o
time do Departamento de Ciencia da Computa cao
da Universidade Federal de Lavras(DCC-UFLA)
3
- UFLA2D
4
- almeja participar na categoria Ro-
bocup Simulation 2D. O time UFLA2D criado no
ano de 2010 com a aprovacao do projeto pela Fa-
pemig no edital projeto Santos Dumont e desen-
volvido no Laboratorio de Inteligencia Computaci-
onal e Sistemas Avan cados (LICESA), sendo esta
a primeira tentativa em participar da competi cao.
Nesta categoria ocorrem partidas de simula-
cao do futebol em duas dimensoes disputadas por
dois times com 11 agentes inteligentes autonomos.
Cada agente representa um jogador de futebol
que recebe varios tipos de informacoes limitadas
contendo situa coes de jogo. A partir disso, cada
agente deve ser capaz de inferir sob a acao que de-
vera tomar. Disputada no Brasil desde 2005, nesta
simulacao as regras do jogo de futebol seguem as
regras existentes em um jogo real mantidas pela
Federation Internationale de Football Association
(FIFA), e tambem algumas regras especcas da
Robocup.
Foi utilizado para o desenvolvimento do
UFLA2D, o codigo base do time UvA Trilearn
(Kok et al., 2003) por ter uma excelente documen-
tacao e por conter algumas caractersticas interes-
santes que facilitam o entendimento e altera cao
do codigo. Neste artigo descrevem-se as caracte-
rsticas do time, as modicacoes e a utilizacao da
1
http://www.cbr2011.org/
2
http://www.ppgel.net.br/sbai2011/
3
http://www.dcc.ufla.br
4
http://licesa.dcc.ufla.br/site/?page_id=81
tecnica de Inteligencia Articial para tomada de
decisao conhecida por Sistema Hbrido.
2 Falhas Identicadas no Time Base
Apos observacoes no comportamento do time
base, vericou-se uma grande escassez de tomada
de decisoes e comportamentos inteligentes.
A unica decisao tomada pelos agentes de linha
quando tem a bola sob seu domnio e mirar no
gol adversario, e chutar a bola com a maior for ca
possvel nessa direcao.
Outra caracterstica frequentemente obser-
vada era o grande n umero de bolas atrasadas ao
goleiro sendo punido pela regra BACK PASS, pos-
sibilitando ao time adversario uma grande opor-
tunidade de marcar gol, pois essas faltas sempre
sao dentro da area.
Quando ha uma falta proxima ao gol adver-
sario a ser cobrada por um agente do time base,
este na maioria das vezes chuta a bola pra longe
do gol devido à for ca utilizada. Nenhuma analise
da distancia ao alvo e feita.
O goleiro originalmente pode se movimentar
sobre uma area muito extensa, o que ocasional-
mente atrapalha a a cao a ser tomada por este em
um ataque adversario.
3 Tecnicas Utilizadas
3.1 Logica Fuzzy
A logica fuzzy e a logica baseada na teoria dos
conjuntos fuzzy. Ela difere dos sistemas logicos
tradicionais em suas caractersticas e seus deta-
lhes. Nesta logica, o raciocnio exato corresponde
a um caso limite aproximado, sendo interpretado
como um processo de composicao de relacoes ne-
bulosas. (Gomide et al., 1995)
Na logica fuzzy uma determinada armacao
pode ser considerada quase certeza ou quase in-
certeza, ao contrario da logica classica que ou a
armacao e correta ou e incorreta. Diferentemente
da logica classica que trabalha com graus de cer-
teza exatos.
Atraves de analises no ambiente futebolstico
real e tambem por necessidades encontradas no
ambiente simulado foram criadas variaveis lingus-
ticas a m de suprir as necessidades. A primeira
etapa foi a criacao de variaveis lingusticas de-
nindo valores à cada uma delas e representando-as
como trapezios.
Em seguida, sao passadas situacoes contidas
em uma base no decorrer da partida à essas va-
riaveis para se obter o grau de pertinencia, arma-
zenando esses valores que serao utilizados mais a
frente como entrada na rede neural.
Um exemplo de modelagem feita est a repre-
sentada na gura 1. Esta imagem mostra a repre-
senta cao fuzzy para a distancia do gol adversario.
Quando a distancia e mnima, a pertinencia vale
1, pois o jogador esta muito proximo ao gol.
Figura 1: Modelagem fuzzy usada para represen-
tar a distancia do gol adversario
3.2 Redes Neurais Articiais
Redes neurais articiais e uma tecnica de in-
teligencia articial que visa a simula cao compor-
tamental da rede neural humana como aprender,
errar e realizar descobertas para a resolucao de
problemas de uma forma inteligente.
Sao divididas em duas categorias, de acordo
com o seu tipo de aprendizado, podendo ser su-
pervisionado ou nao-supervisionado. Uma rede
neural supervisionada recebe alguns dados classi-
cados e usa-os para classicar uma base de dados
de acordo com o padrao que recebeu dos dados ja
classicados. Uma rede neural nao-supervisionada
vai classicar os dados apos encontrar padroes nos
dados de entrada da rede, sem nenhum outro tipo
de informacao.
As redes neurais sao usadas neste trabalho
para se obter as decisoes a serem tomadas pelo
agente.
3.2.1 Algoritmo de aprendizado backpro-
pagation
Uma rede neural com o algoritmo de aprendi-
zado backpropagation e atualmente a arquitetura
mais aplicada em redes neurais articiais princi-
palmente em torno da capacidade dessas redes de
retropropagacao para aprender mapeamento mul-
tidimensional complicado. (Hecht-Nielsen, 1988)
E um metodo de aprendizado de maquina

nao-supervisionado, sendo a generaliza cao da re-
gra delta para redes de m ultiplas camadas. Os
passos para o treinamento de uma rede utilizando
este algoritmo sao:
Propagacao dos padroes encontrados nos da-
dos de treinamento.
Retropropagacao dos erros encontrados na
comparacao com os padroes.
Atualiza cao dos pesos entre as conexoes dos
neuronios.
O algoritmo calcula o gradiente do erro na
rede sobre os pesos modicaveis da rede. Na mai-
oria das vezes usa-se este gradiente em um algo-
ritmo de gradiente descendente estocastico sim-
ples a m de encontrar pesos que minimizam o
erro. (Werbos, 1994)
3.3 Sistema Hbrido
No UFLA2D, foi utilizado uma tecnica h-
brida de inteligencia artical. Esta tecnica baseia-
se nas regras de um sistema fuzzy e no treinamento
de redes neurais articiais.
Apos obter os valores do grau de pertinencia
na etapa da fuzzica cao, eles sao enviados para a
entrada da rede neural previamente treinada para
realizar a inferencia e assim tomar a decisao para
cada momento do jogo. Decisoes essas que vao
desde o comportamento dos zagueiros com posse
de bola como mostrado na gura 2, ao comporta-
mento dos atacantes frente a uma possvel situa-
cao de gol, como mostrado na gura 3.
Figura 2: Situacao para tomada de decis ao com
agente zagueiro
Figura 3: Situacao para tomada de decis ao com
agente atacante
A gura 4 mostra um exemplo de modelagem
do sistema hbrido utilizado. Nela estao represen-
tado as entradas, que sao os graus de pertinencia
obtidos com as variaveis lingusticas do sistema
fuzzy, os neuronios das camadas intermediarias, e
as sadas, que sao as decisoes possveis a serem
tomadas por um agente.
Figura 4: Modelagem do sistema hbrido utilizado
As variaveis lingusticas da gura 4 represen-
tam:
distGolAdv - Distancia relativa que um
agente esta do gol adversario
visaoLimpa - Se existem outros jogadores no
cone de visao do agente em questao
advProx - Se existe algum adversario proximo
ao agente
amigoProx - Se existe um amigo proximo ao
agente
intenMarcacao - Representa a intensidade da
marca cao que o agente esta sofrendo
4 Conclusoes e Trabalhos Futuros
Este trabalho apresenta o desenvolvimento do
time UFLA2D utilizando um sistema hbrido (Lo-
gica Fuzzy e Redes Neurais) para tomar as deci-
soes e deste jeito inferir de uma forma inteligente
no jogo.
Este estudo atende o objetivo do projeto da
CBR que visa incentivar estudos de Inteligencia
Articial em problemas reais.
Para o futuro pretende-se dar continuidade
ao desenvolvimento do time, melhorando a inte-
ligencia articial implementada nesta versao, e
preocupando-se mais com a parte defensiva. Tam-
bem e necessario uma melhora na implementacao
do passe, pois claramente percebe-se um grande
n umero de passes errados ao decorrer das parti-
das.
5 Agradecimentos
Agradecemos à Fapemig pelo apoio nanceiro
a este projeto e a Jelle Kok que disponibilizou o
codigo do time base UvA Trilearn.
Referencias
Gomide, F., Gudwin, R. and Tanscheit, R. (1995).
Conceitos fundamentais da teoria de conjun-
tos fuzzy, logica fuzzy e aplicacoes, Procee-
dings of 6th International Fuzzy Systems As-
sociation World Congress-IFSA95, Tutorials,
pp. 138.
Hecht-Nielsen, R. (1988). Theory of the backpro-
pagation neural network, Neural Networks,
1989. IJCNN., International Joint Confe-
rence on, IEEE, pp. 593605.
Kok, J., Vlassis, N. and Groen, F. (2003). Uva tri-
learn 2003 team description, Proceedings CD
RoboCup 2003.
Werbos, P. (1994). The roots of backpropa-
gation: from ordered derivatives to neural
networks and political forecasting, Vol. 1,
Wiley-Interscience.

UFLA2D

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

UFLA2D

Enviado por

Direitos autorais:

Formatos disponíveis

UFLA2D 2011: TEAM DESCRIPTION PAPER

, Paulo H. Gama e Silva

, Joaquim Quintero Uch oa

Campus Universitario, Caixa Postal - 3037, CEP - 37200-000, Lavras - MG

E um metodo de aprendizado de maquina

Você também pode gostar